Gemini와 같은 생성형 AI 기술이 데이터 분석에 새로운 패러다임을 제시하고 있습니다. 사용자는 이 기술을 통해 BigQuery와 자연어로 대화하여 SQL 쿼리 작성 없이 데이터 분석을 수행할 수 있습니다. 이로써 비전문가도 데이터 분석에 쉽게 접근할 수 있게 되며, 기업은 보다 신속하게 데이터 기반 의사결정을 내릴 수 있게 됩니다.
데이터 분석 도구는 오랜 기간 누구나 쉽게 데이터에 접근해 가공할 수 있도록 사용자 편의를 강화하여 왔습니다. 모든 분석 도구 기업이 한 목소리로 ‘셀프서비스’를 강조하던 시대가 빠르게 저물고 있습니다. 이제는 도구를 잘 몰라도 SQL 구문을 몰라도 방대한 데이터 세상에서 원하는 것을 바로 확인할 수 있는 시대가 코앞에 다가왔습니다. 이번 포스팅에서는 Gemini를 활용해 BigQuery에 담긴 데이터를 활용하는 방법을 간단히 알아보겠습니다.
😎 Gemini의 능력은?
Gemini의 도입으로 데이터 분석의 접근 방식이 크게 변화하였습니다. 과거에는 거대 언어 모델(LLM) 기반 서비스를 사용할 때 다음과 같은 제약이 있었습니다. 첫 번째는 최신 정보가 아니라 특정 시점 이전 정보를 토대로 답변을 받았던 기억들이 다들 있을 것입니다. 가령 환율 관련 질문을 하면 “제한된 지식으로는 2023년 4월까지, 항상 최신 환율은 신뢰할 수 있는 출처, 예를 들어 환전소나 은행에서 확인하는 것이 최선입니다.”라는 답변을 받습니다.
두 번째 제약은 외부 리소스를 참조할 때 발생합니다. 외부 웹사이트, 비디오, 또는 API 참조를 요청하면 “”죄송하지만, 언어 모델로서 외부 웹사이트나 비디오에 접근할 수 있는 능력이 없습니다. 따라서 제공하신 기사나 유튜브 비디오를 요약할 수 없습니다.”라는 답변을 받습니다.
세 번째는 일관된 출력에 대한 것입니다. 아래 그림과 같이 JSON 형식으로 된 데이터가 표시되며, 이름, 직업, 음악 취향 등 사용자 정보를 나타내고 있습니다. 그러나 ‘address’는 false로, ’email’은 잘못된 형식으로 표시되어 있어 데이터의 일관성과 정확성 문제도 있었습니다.
다행이 요즘은 최신 정보에 대한 목마름이 없어지는 추세입니다. Gemini는 이런 흐름을 앞장서서 이끌고 있습니다. Gemini를 사용하면 사용자가 자연어로 질문을 할 수 있고, 이 시스템은 실시간으로 데이터를 추출하여 가장 최신의 정보를 제공합니다. 뿐만 아니라, Gemini는 여러 데이터 소스에서 정보를 실시간으로 통합할 수 있는 능력을 가지고 있습니다. 이는 외부 API 호출을 통해 다양한 데이터 소스로부터 필요한 데이터를 수집하고, 이를 분석하여 일관된 데이터 뷰를 제공합니다. 예를 들어, 판매 주문의 경우, 판매 금액의 총합이 정확히 계산되어야 하는데, Gemini는 이러한 계산을 정확하게 수행하여 실시간으로 정확한 정보를 제공할 수 있습니다.
정리해 보자면 Gemini는 데이터 분석을 실시간으로 보다 정확하게 수행할 수 있게 해주는 도구로서, 과거의 데이터 제한적인 접근 방식에서 벗어나 현대적인 데이터 분석의 요구를 충족시키는 중요한 발전입니다. 이러한 기능은 비즈니스 사용자가 데이터에 기반한 의사결정을 보다 신속하고 효과적으로 내릴 수 있게 돕습니다.
👍 Gemini를 BigQuery와 함께 이용하기
Gemini는 Google의 BigQuery와 통합하여 사용되며, 사용자가 복잡한 SQL 쿼리 없이도 질문을 하고 데이터에 대한 답변을 받을 수 있도록 지원합니다. 사용자는 질문을 입력하고, Gemini는 이를 분석하여 적절한 BigQuery 함수를 호출, 필요한 데이터를 추출하고 결과를 사용자에게 제공합니다.
이를 지원하는 기능이 바로 Gemini의 ‘function calling’입니다. 이 기능을 통해, 사용자는 자연어로 질문을 하며, Gemini는 이를 해석하여 필요한 SQL 함수를 자동으로 호출합니다. 이는 특히 SQL에 익숙하지 않은 비즈니스 사용자들에게 매우 유용하며, 다양한 데이터베이스 시스템에서의 데이터 추출과 분석 작업을 단순화합니다.
👍 데모로 체감하는 새로운 분석 경험
이제 데모를 통해 Gemini가 분석에 대한 사용자 경험을 어느 수준까지 끌어 올릴 수 있는지 알아보겠습니다. 본 포스팅에서 소개하는 데모의 코드는 깃허브 페이지를 참조 바랍니다. Gemini를 활용한 파이썬 애플리케이션 예제는 데이터베이스와의 상호작용을 대폭 간소화하는 방법을 보여줍니다. 이 애플리케이션은 단 270줄의 코드로 구성되어 있으며, 사용자가 SQL 지식이 없어도 자연어로 데이터베이스 질의를 할 수 있게 해줍니다. 사용자가 입력하는 자연어 프롬프트를 받아서 BigQuery를 통해 데이터를 검색하고, 그 결과를 사용자에게 제공합니다. 이 과정은 Gemini의 기능을 통해 이루어지며, 복잡할 수 있는 데이터베이스 작업을 단순하고 직관적으로 처리할 수 있도록 합니다. 동작 과정은 다음과 같이 간단합니다.
*데모 코드 확인 : https://github.com/GoogleCloudPlatform/generative-ai/tree/main/gemini/function-calling/sql-talk-app
- 자연어 입력: 사용자는 예를 들어 “우리 주문의 몇 퍼센트가 반품되었나?”와 같은 질문을 자연어로 입력합니다.
- 질의 처리: Gemini는 이 입력을 분석하여 필요한 SQL 쿼리로 변환합니다. 이 변환 과정은 Gemini의 고급 AI 기능에 의해 자동으로 처리됩니다.
- BigQuery 실행: 변환된 SQL 쿼리는 Google의 BigQuery에 전송되어 실행됩니다. BigQuery는 대용량 데이터 처리에 최적화된 도구로, 빠르고 효율적인 데이터 검색을 가능하게 합니다.
- 결과 반환: 쿼리 실행 후, 결과는 Gemini를 통해 다시 사용자에게 전달됩니다. 이때 결과는 사용자가 이해하기 쉬운 형태로 제공됩니다.
✨ 무궁무진한 가능성
Gemini를 활용한 분석 시나리오는 무궁무진합니다. 몇 가지 예를 들어보겠습니다.
- 금융: Gemini를 사용하여 금융 시장의 실시간 데이터와 환율 정보를 추출할 수 있습니다. 예를 들어, 투자 은행이나 환전소에서는 Gemini를 이용하여 최신 환율을 실시간으로 확인하고, 이를 고객 서비스나 거래 결정에 적용할 수 있습니다.
- 비즈니스: Gemini를 활용해 비즈니스 사용자들은 Google Drive에 저장된 문서나 스프레드시트에 접근하여 데이터를 읽고 수정할 수 있습니다. 이를 통해 보고서 작성이나 데이터 분석 작업을 간편하게 처리할 수 있습니다.
- 여행: 여행사나 여행 관련 앱에서는 Gemini를 사용하여 실시간으로 항공편 상태와 호텔 예약 정보를 조회할 수 있습니다. 이 정보를 기반으로 고객에게 최신 여행 정보를 제공하거나, 여행 일정을 조정할 수 있습니다.
- 고객 관리: Gemini를 사용하여 고객 관리 시스템(CRM) 내의 데이터를 검색하고 분석할 수 있습니다. 이를 통해 고객 서비스 개선, 마케팅 전략 수립, 고객 세분화 등의 작업을 효율적으로 수행할 수 있습니다.
- 데이터베이스: 데이터 분석가는 Gemini를 사용하여 BigQuery에 저장된 데이터 세트에 대한 실시간 쿼리를 수행할 수 있습니다. 이를 통해 대규모 데이터 분석 작업을 신속하게 처리하고, 보다 정확한 인사이트를 도출할 수 있습니다.
- 문서: 수천 개의 문서 검색 및 요약: 연구원이나 법률 전문가 등은 Gemini를 사용하여 대량의 문서를 검색하고 요약함으로써 필요한 정보를 빠르게 찾을 수 있습니다. 이는 특히 법률 사례 연구나 학술 연구에 유용합니다.
- 지원: 고객 서비스 부서는 Gemini를 사용하여 지원 티켓 시스템에서 문의 사항이나 문제 해결을 위한 데이터를 신속하게 검색할 수 있습니다.
- 재고: 소매 업체는 Gemini를 활용하여 재고 시스템에서 실시간으로 재고 수준을 확인하고, 제품 주문이나 재고 관리를 보다 효과적으로 수행할 수 있습니다.
앞으로 Gemini가 어느 정도 수준까지 발전할지 기대되지 않으신가요. 2024년 5월 현재만 해도 Gemini를 통해 데이터 접근과 분석이 얼마나 간편해질 수 있는지 피부에 와닿을 만큼 생생하게 느껴집니다. 데이터 분석의 새로운 시대를 Gemini와 함께 열어 가고 싶다면 메가존소프트가 도움을 드리겠습니다.