구글 클라우드의 다양한 데이터 서비스는 에이전트 시대에 어떻게 변할까?
AI 에이전트 분야의 발전 속도를 보면 입이 떡 벌어질 정도입니다. 작년만 해도 뭔가 실험적이라는 느낌이었다면? 올 해는 늘 옆에서 함께 하는 동료 수준으로 일취월장한 느낌입니다. 실제로 올해 열린 구글 클라우드 넥스트 ‘25의 데이터 관련 세션을 보면 클라우드 활용에 있어 에이전트가 앞으로 어떤 활약상을 펼칠지 잘 알 수 있었는데요. 관련해 이번 포스팅에서는 구글 클라우드의 데이터 플랫폼과 각종 도구와 서비스에 에이전트가 어떻게 녹아들고 있는지 알아보겠습니다.
BigQuery Notebook과 Colab 통합
먼저 살펴볼 것은 구글 클라우드하면 떠오르는 플랫폼인 BigQuery입니다. AI 에이전트를 잘 활요하면 앞으로 BigQuery의 잠재력을 100% 끌어낼 수 있을 것 같습니다. 일단 그 시작은 BigQuery 노트북(BigQuery Notebook입니다.
구글 클라우드는 BigQuery 환경에 Colab Enterprise Notebook 기능을 내장하여 데이터 분석가와 과학자들이 익숙한 Jupyter/Colab 스타일의 작업 환경을 BigQuery 콘솔 내에서 바로 사용할 수 있도록 하였습니다. BigQuery의 Colab Enterprise Notebook 통합을 통해 사용자는 SQL과 Python을 함께 사용하여 데이터 분석 및 머신러닝 작업을 한 곳에서 편리하게 수행할 수 있습니다. 이 통합 환경은 BigQuery 내에서 Colab 기반 런타임을 직접 실행하므로, 별도의 설정 없이 대화형 노트북을 통해 BigQuery 데이터를 쉽게 다룰 수 있다는 큰 이점이 있습니다.
예를 들어 보겠습니다. BigQuery 노트북을 사용하면 pandas나 scikit-learn과 같은 유용한 Python 라이브러리를 활용하여 BigQuery의 대용량 데이터를 효율적으로 분석할 수 있습니다. 또한, 노트북 작업 결과는 BigQuery 환경 내에 코드 자산 형태로 저장되어 팀원 간 공유 및 버전 관리가 용이합니다. 이러한 통합 덕분에 데이터 분석 프로세스가 BigQuery 콘솔 안에서 끊김 없이 진행될 수 있으며, 무료로 사용할 수 있는 Colab의 편리함과 BigQuery의 뛰어난 확장성을 동시에 누릴 수 있게 되었습니다.
여기에 에이전트가 가세하면서 BigQuery 노트북은 막강한 도구로 거듭나고 있습니다. Gemini를 활용하면 BigQuery Notebooks 환경에서 코드 작성에 도움을 받을 수 있습니다., SQL 쿼리나 Python 코드 작성 시 자동 완성이나 스마트 코드 생성 기능을 활용할 수 있습니다. 사용자가 분석에 필요한 코드를 자연어 프롬프트로 입력하면 Gemini 기반 도우미가 해당 코드를 자동으로 생성해주거나, SQL 쿼리를 작성할 때 다음에 입력할 가능성이 높은 구문을 제안해주는 방식입니다.
Gemini 기반 데이터 과학 에이전트
구글 클라우드는 Colab 노트북 환경에도 Gemini를 통합하였습니다. 구글 클라우드는 Gemini 기반의 데이터 과학 에이전트도 선보였습니다. 이 에이전트는 Colab 노트북에 내장되어 있으며, 기본적인 코드 생성부터 복잡한 모델 개발까지 광범위한 지원을 제공합니다. 예를 들어 볼까요. 데이터 과학자는 자연어로 “이 고객 데이터를 사용하여 다음 달 구매 가능성이 높은 상위 100명의 고객을 예측하는 모델을 만들어줘”와 같이 구체적인 지시를 내릴 수 있으며, Gemini 데이터 과학 에이전트는 필요한 코드 작성, 적절한 모델 선택, 모델 훈련 등의 과정을 자동으로 수행합니다.
이러한 능력은 실제 시연 데모를 통해 더욱 명확하게 확인할 수 있었습니다. 구글 클라우드 넥스트 ‘25의 한 세션에서 발표자인 Jeff Nelson은 Colab 노트북의 Gemini 데이터 과학 에이전트에게 과거 2년간의 온라인 판매 데이터를 기반으로 향후 3개월간의 제품별 수요 예측 생성하는 데모를 소개했습니다. 데모에서 데이터 과학 에이전트는 새로운 파운데이션 모델인 TimesFM을 활용해 제품 ID와 날짜에 따른 미래 매출 예측 테이블을 생성하고, 시계열 예측 차트를 시각적으로 표현했습니다.
Jeff Nelson은 데모에서 예측 모델을 생성하는 코드 작성뿐만 아니라 결과를 시각화하는 작업까지 자동으로 처리하여, 사용자가 결과를 즉시 확인하는 것도 보여주었습니다. 사용자가 자연어로 간단한 프롬프트만 입력하면 에이전트가 필요한 SQL/Python 코드를 자동으로 작성하여 예측 모델을 실행하고, 그 결과를 보기 쉬운 차트로 시각화까지 완료해주는 과정을 보면 입이 다물어 지지 않습니다.
TimesFM 모델과 서버리스 Spark 활용
앞서 언급한 TimesFM 모델은 구글 클라우드 데이터 플랫폼 내 AI 통합의 중요한 부분을 차지합니다. Google Research에서 개발한 시계열 데이터 분석에 특화된 파운데이션 모델인 TimesFM을 BigQuery에 내장하여 사용자는 복잡한 시계열 머신러닝 분석을 단 한 줄의 함수 호출만으로 간편하게 이용할 수 있게 되었습니다. 이는 해당 분야의 전문 지식이나 모델링 경험이 부족한 사용자도 수요 예측이나 추세 예측과 같은 고급 분석을 쉽게 시도해볼 수 있다는 점에서 매우 의미가 큽니다.
가령 제조 회사의 재고 관리 담당자가 과거 판매 데이터를 기반으로 향후 제품별 수요를 예측하고 싶다면, TimesFM을 호출하는 간단한 쿼리만으로 머신러닝 기반의 정확한 예측치를 얻을 수 있습니다. AI 에이전트와 TimesFM의 결합은 이러한 분석 과정을 더욱 단순화합니다. 앞서 설명한 Colab 노트북의 에이전트는 내부적으로 TimesFM 모델을 활용하여 사용자의 자연어 요청을 처리하고, 이를 통해 비전문가도 이해하기 쉬운 형태(표와 차트)로 예측 결과를 제공했습니다.
한편, 구글 클라우드는 널리 사용되는 오픈소스 데이터 처리 프레임워크와의 통합에도 AI를 적극적으로 적용하고 있습니다. 특히 Apache Spark를 서버리스 형태로 제공하기 시작했는데, 이는 데이터 엔지니어나 과학자가 Spark 클러스터 관리 부담 없이 필요한 대규모 데이터 처리를 효율적으로 수행할 수 있도록 도울 수 있을 것으로 보입니다.
Create Data App 기능과 데이터 앱 생성 프로세스
데이터 관련 에이전트의 활약은 애플리케이션 개발까지 이어집니다. 이번 구글 클라우드 넥스트 ‘25에서 단 한 번의 클릭만으로 데이터 애플리케이션을 생성할 수 있는 ‘Create Data App’ 기능이 많은 이들의 관심을 모았는데요. 그 이유는 단순합니다. 너무 편합니다.
Jeff Nelson은 자신이 진행한 세션에서 Create Data App도 소개했는데요. 그는 Colab 노트북 데모에서 Gemini 데이터 과학 에이전트가 생성한 예측 차트를 동료와 쉽게 공유하기 위해 Create Data App 버튼을 클릭했습니다. 그러자 해당 시각화 결과를 간편하게 공유할 수 있는 인터랙티브 예측 앱 링크가 자동으로 생성되었습니다. 이 애플리케이션 링크를 받은 동료들은 웹 브라우저를 통해 예측 차트와 관련 데이터를 직접 탐색하고, 특정 기간의 예측치를 확대해서 보거나, 다른 제품의 예측 추이를 비교하는 등 상호 작용적인 분석을 수행할 수 있습니다.
간단히 구글 클라우드의 주요 데이터 플랫폼과 도구에 에이전트가 어떻게 통합되고 있는지 동향을 살펴보았습니다. 내년에는 얼마나 더 놀라운 데모들이 속개될지 벌써부터 기대가 되네요.