데이터 시각화, 방대한 데이터에서 통찰력을 찾아 의사결정을 하는 데 있어 매주 중요하죠. 관련해 최근 트렌드는 셀프서비스 BI입니다. 영업, 마케팅, 구매, 인사 등 다양한 현업 부서 사용자는 IT 전문가가 아니죠. 따라서 데이터웨어하우스가 잘 구축되어 있다 해도 원하는 분석 결과를 보려면 IT 부서의 손을 빌려야 합니다.
그러다 보니 보통 표 하나 보려고 며칠씩 기다리게 되는데요, 셀프서비스는 이런 불편이 없습니다. SQL 쿼리문을 작성할 줄 몰라도 딱 보면 어떻게 써야 할지 알 것 같은 사용자 화면과 기능을 제공하는 도구를 사용해 원하는 분석 및 데이터 시각화를 현업 사용자가 할 수 있도록 돕는 것이 바로 셀프서비스입니다. 시장에서 가장 널리 쓰이는 도구로 Tableau와 Power BI 정도를 꼽을 수 있는데요, 오늘 소개할 내용은 클라우드 기반 데이터웨어하우스와 Tableau를 연계 사용하는 것에 대한 것입니다.
“꽤 잘 맞는 한 쌍 – Tableau & BigQuery”
구글 BigQuery는 잘 아시죠! 머신 러닝이 내장되어 있는 빠르고 확장하기 편한 클라우드 기반 데이터웨어하우스 서비스입니다. 구글 BigQuery는 Ad-hoc 분석은 물론이고 웹 로그, 사물인터넷 데이터 세트, 각종 장치와 서버 로그, 전자상거래 사이트에서 발생하는 클릭 스트림 기반 사용자 행위 데이터, 모바일 앱이 생성하는 각종 데이터 등 대규모 실시간 데이터 처리에도 이상적입니다.
BigQuery 아키텍처는 대략 다음과 같습니다. 사용자가 관심 있게 볼 부분은 BI 도구 정도입니다. 나머지는 어떤 데이터를 어떤 용도로 쓸지만 신경 쓰면 됩니다. 기술은 구글이 맡아 해야 할 영역이니까요. BI 도구 부분을 보면 여러 선택지가 있습니다. 이중 오늘은 Tableau를 이야기하겠습니다.
“엔드유저 BI 도구의 활용 가치 극대화 방법”
Tableau를 현재 데이터 분석 및 시각화 도구로 사용하는 기업이 많죠. 이런 경우 사내에 직접 데이터웨어하우스를 구축하고 사용자 BI 도구로 Tableau를 씁니다. Tableau를 현재 잘 쓰고 있다면? 더 다양한 데이터 세트를 대상으로 사용자가 도구를 쓸 수 있도록 도울 수 있습니다. 시간이 오래 걸리고 비용도 많이 드는 방식으로 데이터웨어하우스를 직접 구축, 운영하는 식으로는 어렵겠지만 클라우드 기반 데이터웨어하우스를 쓰면 Tableau 같은 엔드유저 BI 도구의 사용 가치를 다양한 부문으로 확대할 수 있습니다. Tableau 측면에서 보면 구글 클라우드 플랫폼과 연계해 다음과 같이 플랫폼 그림을 그려볼 수 있습니다.
Tableau에서는 BigQuery와 연계 구성을 할 때 성능 향상을 위한 기술 팁을 제공합니다. 그 이유는 최적의 쿼리 처리 성능 확보를 Tableau Desktop과 Server 측면에서도 고려할 경우 클라우드 관련 비용 절감과 사용자가 체감하는 응답 속도 개선에 기여할 수 있기 때문이죠.
BigQuery와 Tableau를 연계해 수백만 개의 열로 구성된 데이터 세트를 어떻게 수초 내에 분석하고 대화형 분석 환경에서 원하는 보고서와 인사이트를 확보할 수 있는지는 관련 백서를 통해 확인해 볼 수 있습니다.