ESG에서 새로운 연구 결과를 발표했습니다. 이번에 발표한 보고서는 Google Cloud Dataproc의 경제적 효과를 분석한 것입니다. 주요 내용을 말씀드리면 온프레미스 환경에서 하둡과 스파크 플랫폼을 운영하는 것과 비교했을 때 Cloud Dataproc을 사용하면 TCO가 57%까지 낮아집니다. 아마존이 제공하는 매니지드 서비스인 AWS EMR과 비교해도 Cloud Dataproc의 TCO가 32% 더 낮습니다. 이 정도면 뭐 비용 측면에서 따라올 서비스가 없네요.
Cloud Dataproc은 아파치 하둡과 스파크에 대한 설치와 운영 부담 없이 빅 데이터 클러스터를 효율적이고 경제적으로 이용할 수 있는 관리형(Managed) 서비스입니다
ESG는 공정한 비교를 위해 같은 조건에서 온프레미스 하둡과 스파크 환경과 Cloud Dataproc 그리고 AWS EMR에 대한 TCO 평가와 분석을 하였습니다. 여기서 말하는 같은 조건이란 클러스터 규모, 성능 등 인프라 측면에서 사양을 맞춘 것이라 보면 됩니다. TCO는 크게 스토리지, 운영, 인프라, 서버 그리고 클라우드로 나누어 평가했습니다. 각각 비용 구조가 눈에 띠게 표시가 잘 되어 있네요. 온프레미스에서 운영하면 스토리지와 운영 비용이 생각 이상으로 크게 나오는 것을 알 수 있습니다.
클라우드가 비용에서 유리한 것은 아무래도 인프라, 운영, 스토리지 비용이 상대적으로 낮기 때문입니다. 하드웨어에 대한 초기 투자가 필요 없고, 운영은 맡기면 되다 보니 비용이 크게 낮아지는 것이죠.
아무래도 관리자들은 운영이 어떻게 간소화되는지 궁금할 텐데요 ESG에서 완전 깔끔하고 명확하게 정리해 두었네요. 다음 표를 보면 빅 데이터 인프라와 플랫폼 관리에 필요한 일상적인 관리 작업이 나열되어 있습니다. 온프레미스에서 운영하면 이 모든 것을 내부 조직이 해야 합니다. 반면에 관리형 클라우드 서비스를 이용하면 일상적인 관리 업무가 크게 줄어들죠. 더 자세한 내용은 ESG 보고서를 참조하거나 메가존에 문의 바랍니다.
출처: Economic Value Audit: Analyzing the Economic Benefits of Google Cloud Dataproc Cloud-native Hadoop and Spark Platform