Also, hier ist die Sache mit SLAs und SLOs: Sie sind *Ziele.* Teams geben ihr Bestes, um sie zu erreichen, und historisch gesehen gelingt ihnen das oft. Wenn ein Ausfall das SLO überschreitet, muss das Unternehmen, das sie verspricht, möglicherweise vertraglich eine Strafe zahlen. Aber das ist Software... unerwartete Dinge können passieren!
Abhimanyu
Abhimanyu25. Okt., 01:48
Als Backend-Entwickler nehmen wir oft AWS DynamoDB/S3 und deren Verfügbarkeit von vier 9en als gegeben hin. Aber der 14-stündige Ausfall hat uns daran erinnert, dass die beworbenen Werte ≠ Realität sind. Entwerfen Sie immer Sicherheitsmechanismen für kritische Systeme!
Es geht letztendlich um Risikomanagement: 1. Wie viel Betriebszeit verspricht der Anbieter und wie sehr kannst du ihm vertrauen? 2. Wie stark würde dein Geschäft betroffen sein, wenn das SLO verletzt wird? Was ist dein Plan B, wenn dies passiert (Ausfall des Anbieters)? Hast du überhaupt einen Plan B?
Software wird im Vergleich zu anderen Branchen ziemlich unordentlich, und wir müssen in der Lage sein, mit dieser Unordnung umzugehen, sie zu akzeptieren, zu zähmen und darum herumzuarbeiten. Das liegt alles daran, dass Software ständig im Wandel ist! Ehrlich gesagt ist es etwas, das die Softwareentwicklung wirklich herausfordernd und spannend macht!!
42,44K