엔터프라이즈 클라우드 전략은 하이브리드, 멀티를 향하고 있습니다. 이는 업종, 규모를 떠나 보편적으로 관찰되는 트렌드입니다. 관련해 2021년 주목할 사항 중 하나는 개방형 인프라 구축 및 운영 그리고 여기에 어떻게 자유롭게 데이터를 연결할 것인가? 이에 대한 방향성입니다.
위치와 사업자 관계없이 인프라를 하나처럼 묶어 쓰려는 이유는 간단합니다. 낭비 요인을 없애고 속도를 높이기 위해서입니다. 인프라 통합은 오픈 소스 및 개방형 표준 기술과 적절한 도구로 하는 것이 일반적입니다. 오픈 소스 중심으로 예를 들어 보겠습니다. Terraform을 이용해 이기종 인프라 리소스 생성을 자동화합니다. 그리고 Ansible, Puppet, Chef 같은 구성 관리 도구로 공통 배포 및 구성 프로세스를 설정합니다. 모니터링은 Prometheus 및 Grafana 같은 솔루션으로 수행합니다. 이런 식으로 공통 도구 체인을 만들어 프로비져닝, 배포, 관리, 모니터링을 통합하는 시나리오를 생각해 볼 수 있습니다. 이를 도식화하면 다음과 같습니다.
인프라 통합은 이미 오랜 고민이 있었던 주제이고 관련해 도구도 다양합니다. 또한, 클라우드 서비스 사업자 역시 이를 염두에 두고 도구를 제시합니다. 물론 인프라 통합은 목표로 바라보고 접근할 사안이 아닙니다. 수단으로 봐야 합니다. 비즈니스, 개발, 운영 등 여러 측면에서 올라오는 요구 사항을 수용하기 위한 수단입니다. 통합 인프라를 수단으로 쓰고자 하는 수요 중 2021년 주목할 것은 바로 데이터입니다.
온프레미스, 하이브리드, 멀티 클라우드 인프라를 개방형 표준으로 통합했다면? 이를 가치 있게 활용하기 위해 해야 할 가장 중요한 과제는 데이터 소스가 어디에 있건 자유롭게 접근할 수 있어야 한다는 것입니다.
이 작업은 클라우드를 포괄하는 엔터프라이즈 데이터 통합, 거버넌스 체계 정립 등이 필요한 복잡하고 어려운 일입니다. 문제는 오늘날 기업이 원하는 데이터는 사내를 넘어 공공 데이터, 소셜 네트워크 데이터 등 외부에 있는 것도 많다는 것입니다.
아무리 어려운 일도 작은 단위로 문제를 나누어 보고 해결책을 내다보면 풀리게 마련이죠. 일단 사내 데이터를 중심으로 한 통합과 거버넌스 체계 마련은 중요 과제로 진행하십시오. 다만, 이 작업이 완료된 다음 무엇인가 하기보다는 지금 당장 사내, 사외 데이터를 자유롭게 접근해 활용하는 것도 시작하십시오. 오늘날 기업들이 추구하는 통합 인프라는 개방형 API 환경을 전제로 연계와 확장을 하는 구조입니다. 따라서 데이터 활용 역시 투 트랙 전략을 동시에 충분히 추진할 수 있습니다.
Google Cloud는 클라우드 스타일의 데이터 접근과 활용 방식을 명쾌하게 제시합니다. Looker를 이용하면 데이터 위치에 관계없이 가장 최신 버전에 접근할 수 있습니다. 현업 사용자는 Looker를 다양한 원천에 있는 최신 데이터를 접하는 인터페이스처럼 사용합니다. 그 대상은 전통적인 비즈니스 인텔리전스, 분석이 포함된 워크플로우, 분석을 기반으로 한 앱 등 다양합니다. 이 모든 것이 복잡한 데이터 관리 체계 구축 전에 시행 가능합니다. Looker는 BigQuery, Redshift, Snowflake, Oracle 등 데이터베이스를 직접 쿼리하고 결과를 신속히 반환합니다.
한편, BigQuery Omni를 이용하면 표준 SQL과 BigQuery API를 이용해 여러 공용 클라우드 서비스에 저장된 데이터를 활용할 수 있습니다. BigQuery를 이용하려면 Google Cloud에 데이터를 저장해야 합니다. 반면에 BigQuery Omni는 데이터를 일일이 복제할 필요 없이 다른 클라우드 서비스에 저장된 데이터를 쿼리할 수 있습니다. 따라서, 데이터 이동과 통합에 대한 추가 비용 없이 여러 데이터 소스를 분석에 활용할 수 있습니다.
이상으로 2021년 많은 기업이 관심을 가질 클라우드 전략 중 개방형 통합 인프라에서 어떻게 여러 데이터 원천을 활용할 수 있는지에 대해 알아보았습니다.