Apr 7, 2021
จริงๆถ้าโฟกัสที่เรื่องการใช้ spot instance นี้ งานหลักก็อยู่ที่ Ops อยู่แล้ว (DevOps, TechOps, SRE) ที่ต้องจัดการเรื่อง infrastructure developer ยังต้องเขียนโค้ดได้ QA ยังต้องเทสได้
สิ่งที่ต้องคุยกันจริงๆคือการกำหนด Availability ร่วมกัน ว่าระดับไหนที่รับได้ในแต่ละ environment
ถ้าพูดถึง OKR ก็เอา availability คู่กับ cost เนี่ยล่ะมาผูกกันเป็น metric ได้ เช่น ถ้าอยาก save cost เยอะ ก็ต้องตกลงร่วมกันว่าจะมี down time ได้เท่าไหร่ ยิ่ง save cost เยอะๆ โอกาสมี down time ก็มากขึ้น business กับ engineer team ต้องตกลงกันว่า trade off นี้ทั้งสองฝ่ายรับกันได้มากน้อยแค่ไหน