Wöchentlicher technischer Bericht für die erste Woche im Dezember 2022

Zusammengefasst ging es in dieser Woche vor allem darum, einen Kerndienst in die Cloud zu bringen und dann die Knoten unter der Cloud kontinuierlich in Verkehrsweiterleitungsknoten umzuwandeln. Der erste Schritt in der Cloud ist die Bereitstellung des Serviceknotens in der Cloud-Umgebung: Migrieren Sie die Konfigurationsdateien, die Umgebung und kompilieren Sie dann das Image für die Cloud-Umgebung entsprechend der stabilen Version des Codes, und lassen Sie den Service in der Cloud-Umgebung hochlaufen. Nachdem der Dienst hochgefahren und der Test abgeschlossen ist, ist auf dem Knoten in der Cloud derzeit kein Datenverkehr zu verzeichnen. Jetzt müssen Sie einen Teil des Datenverkehrs unter der Cloud in die Cloud weiterleiten, indem Sie zunächst einige der Knoten unter der Cloud durch Weiterleitungsknoten ersetzen. Später kann dieser Teil des Datenverkehrs dazu verwendet werden, den Arbeitsstatus der Knoten in der Cloud zu beobachten und auf Anomalien zu prüfen, was als „Verkehrsgrauskala“ bezeichnet werden kann. Die Graustufe des Datenverkehrs wird in der Regel in der Rolle des Gesamtdatenverkehrs 1 %-5% kontrolliert, je nach Kritikalität des Dienstes, um das Verhältnis anzupassen, kann die Testumgebung angemessener sein, 25 %-50% sein kann. Verkehr grau ist, wenn ein Problem auftritt, oder wenn Sie ein Problemticket erhalten, müssen Sie nur den Verkehrsweiterleitungsknoten unter der Cloud herunterfahren. Natürlich muss alles oben Genannte zunächst in der Testumgebung betrieben werden. Testen Sie diese ordnungsgemäß und folgen Sie dann demselben Schema, um die Produktionsumgebung sorgfältig zu betreiben.

Einige der Backend-Systeme sind kompliziert, ein Aufruf mit mehreren Diensten, die Geschäftslogik ist verwirrend, versuchen Sie diesmal, die Variablen für eine gewisse Zeit zu kontrollieren, um nur eine Änderung vorzunehmen, und beobachten Sie eine gewisse Zeit, bis sich die Situation stabilisiert hat, und führen Sie dann die nächste Operation durch. Oder Sie können den großen Schritt in mehrere kleine Schritte aufteilen, eine Zeitspanne lang nur einen kleinen Schritt machen, nach einer Zeitspanne beobachten und dann den nächsten kleinen Schritt vorantreiben. Dies ist weniger anfällig für Fehler.

Als nächstes, wenn die Graustufenprüfung bestanden ist (dauert in der Regel eine Woche). Der nächste Schritt besteht darin, die Routen zu wechseln. Das Umschalten der Routen bedeutet, dass die Routen vom Dienstknoten in der Cloud direkt auf den On-Cloud-Knoten umgeschaltet werden, woraufhin der andere On-Cloud-Masterdienst direkt auf den On-Cloud-Knoten für diesen Dienst zugreift und den Off-Cloud-Knoten nicht mehr besucht. Bei der Umstellung des Routings ist besondere Vorsicht geboten, da ein großer Teil des Online-Verkehrs direkt auf den On-Cloud-Knoten zugreifen wird. Vor dem Betrieb müssen Sie zunächst die Anzahl der benötigten Knoten in den einzelnen geografischen Regionen der Cloud auf der Grundlage der üblichen Daten berechnen, in der Regel in Übereinstimmung mit dem Spitzenverkehrsaufkommen, wenn dies nicht ausreicht, um die Kapazität zu erweitern, damit es auf der Leitung nicht zu einer großen Anzahl von Timeouts aufgrund unzureichender Kapazität kommt. Zu diesem Zeitpunkt wäre es besser, wenn die Anzahl der Knoten in der Cloud höher wäre, da sie später langsam reduziert werden kann und die Kosten nicht hoch sind. Wenn es jedoch weniger Knoten gibt, die eine große Anzahl von Timeouts verursachen, braucht die Erweiterung der Knoten Zeit (vor allem die zeitaufwändige Planung der Ressourcen und der Start des Dienstes), was zu Beschwerden der Benutzer führen kann. Wenn die Zeitüberschreitung viele Client-Wiederholungsversuche auslöst, kann sie den gesamten Dienst zum Absturz bringen und Online-Unfälle verursachen. Damals habe ich eine Zeit gewählt, in der der Datenverkehr gering war, um die Auswirkungen des Umschaltjitters zu verringern.

Nach der Umschaltung der Route können die Knoten unter der Cloud nach und nach zu Weiterleitungsknoten werden und den gesamten Datenverkehr unter der Cloud zur Verarbeitung an die Cloud weiterleiten. Dann benachrichtigen Sie die für den primären Dienst zuständige Person, damit diese versucht, den Dienst in die Cloud zu bringen. Denn die Weiterleitung von Knoten an die Cloud ist mit Overhead verbunden und erhöht die Latenzzeit.