这一周的工作主要是对我负责的这一方面的工作的一个梳理,目前发现了许多的问题。这些问题主要集中在数据上云方面,目前的问题主要是如何安全上云、怎么改造目前的单地域部署方案、如何修复云下数据和云上数据之间的不一致。另外,发现还是有一些服务在使用云下的数据库,这些云下数据库按道理是要废弃的。但是,这些服务都是一些老服务,代码改动会带来一些风险,这就需要在行动前调查清楚。
调查的方面包括,现有的数据上云辅助服务的基本原理和相关的代码逻辑细节,最好能够尽早发现其中存在的问题并及时修复。另外一方面,是数据上云过程需要实时监控,尽量全面地对服务接口调用质量、超时率、写失败率、不一致率等等有个清晰的把握。这一方面最好能从上报监控和日志监控两方面来做。而多地部署方案,目前打算采用一主多从,主从之间单方面复制,只写主库,从库只读这几条原则入手。采用多地部署方案主要是提升服务稳定性,降低大多数请求的延迟,提升服务质量,消除跨地域的链路不稳定带来的影响。多地部署所带来的数据同步延迟不容忽视,必须有一个可以接受的延迟,这一块要从理论和监控两个方面来把握。
再就是,掌握一门脚本语言很重要。特别是当有大量重复的事情需要处理,或者需要分析一些数据来获得一个结论的时候。能够较为熟练地掌握类似Python这样的脚本语言,有很大的优势。但是,如果说拿Python来写一个大型程序的话,我觉得是不明智的。每种编程语言就像不同的刀,都可以拿来切菜,但是有些刀更适合用于切肉或切骨头。