operational-excelence
Google Cloud Well-Architected Framework의 운영 우수성(Operational Excellence) 필러는 Google Cloud에서 워크로드를 효율적으로 운영하기 위한 권장 사항을 제공합니다. 클라우드에서의 운영 우수성이란 가치, 성능, 보안, 신뢰성을 제공하는 클라우드 솔루션을 설계, 구현, 관리하는 것을 의미합니다. 이 필러의 권장 사항은 클라우드 환경의 역동적이고 지속적으로 변화하는 요구사항에 대응하여 워크로드를 지속적으로 개선하고 적응할 수 있도록 돕습니다.
운영 우수성을 달성하기 위해서는 자동화(Automation), 오케스트레이션(Orchestration), 데이터 기반 인사이트(Data-driven insights)를 수용해야 합니다.
- 자동화는 반복적인 작업을 줄이고 작업의 가이드라인을 형성하여 운영 부담을 줄여줍니다.
- 오케스트레이션은 복잡한 프로세스를 체계적으로 조율할 수 있게 해줍니다.
- 데이터 기반 인사이트는 근거 중심의 의사결정을 가능하게 합니다.
이러한 실천을 통해 클라우드 운영을 최적화하고, 비용을 절감하며, 서비스 가용성을 높이고 보안을 향상시킬 수 있습니다.
클라우드에서의 운영 우수성은 단순한 기술 숙련도를 넘어서, 지속적인 학습과 실험을 장려하는 조직 문화의 전환을 포함합니다. 팀은 혁신하고 반복하고 성장하는 마인드셋을 가질 수 있도록 권한을 부여받아야 하며, 운영 우수성 문화는 사람들이 아이디어를 공유하고 가정을 검증하며 개선을 주도하는 협업 환경을 조성합니다.
핵심 원칙⚑
- CloudOps를 통한 운영 준비 및 성능 확보
서비스 수준 목표(SLO)를 정의하고, 포괄적인 모니터링, 성능 테스트, 용량 계획을 수행하여 클라우드 솔루션이 운영 및 성능 요구사항을 충족하도록 보장함. - 인시던트 및 문제 관리
광범위한 관측 가능성, 명확한 인시던트 대응 절차, 철저한 회고, 예방 조치를 통해 클라우드 인시던트의 영향을 최소화하고 재발을 방지함. - 클라우드 리소스 관리 및 최적화
리소스 적정화(right-sizing), 오토스케일링, 효과적인 비용 모니터링 도구 활용 등의 전략을 통해 클라우드 리소스를 최적화하고 효율적으로 관리함. - 변경 자동화 및 관리
프로세스를 자동화하고 변경 관리를 간소화하여 수작업 부담을 줄임. - 지속적인 개선과 혁신 추구
경쟁력을 유지하기 위해 새로운 솔루션을 도입하고 지속적으로 향상시킴.