작년까지만 해도 새롭게 느껴지던 생성형 AI에 대한 분위기가 요즘에는 조직의 시스템이나 서비스에 실제로 적용하는 쪽으로 바뀌었습니다.
이런 흐름으로 빠르게 전환한 것의 배경에는 ‘도구의 진화’가 자리하고 있습니다. 2024년 7월 현재 생성형 AI를 기존 애플리케이션이나 서비스에 적용하는 것은 의지의 문제입니다.
작업을 도울 도구는 이미 준비가 되어 있습니다. 이번 포스팅에 도구가 어느 정도 수준까지 발전했는지 가늠해 볼 수 있는 시나리오를 하나 공유하겠습니다.
🚛 플릿 매니지먼트(Fleet Management)
플릿 매니지먼트를 아시나요? 보통 물류 산업계에서 구축을 하는 시스템입니다. 이를 통해 물류 기업은 보유한 차량 자원을 효율적으로 관리합니다. 일반적으로 플릿 매니지먼트 시스템은 GPS 기반 차량 추적, 운전자 모니터링, 유지보수 관리, 연로 관리, 규정 준수, 보고 및 분석 등의 기능을 갖추고 있습니다. 생성형 AI가 등장하기 전까지 플릿 매니지먼트 시스템 구현에 있어서 가장 자주 등장한 개념은 “실시간 데이터 처리“였습니다. 운행 중인 차량 관련 데이터를 실시간으로 수집해 분석하는 것을 중요 구현 목표로 삼았습니다.
2024년 시점으로 보면 강조하는 부분이 다릅니다. 지금까지 플릿 매니지먼트 정보를 주로 대시보드로 사용자에게 제공되었습니다. 생성형 AI 시대에는 대시보드로는 확인할 수 없는 내용도 이제는 자연어로 질문을 해서 답을 받아 볼 수 있습니다. 이게 어떻게 가능한지 알아보겠습니다.
😎 데이터 수집과 분석에 생성형 AI를 활용하는 방법
살펴볼 시나리오는 구글 클라우드를 기반으로 쉽고 빠르게 구현할 수 있습니다. GPS나 차량에 장착한 센서에서 수집한 데이터는 BigTable에 담습니다. 이렇게 실시간으로 모아 놓은 데이터는 Dataproc로 처리하고 BigQuery로 분석합니다. 이렇게 기본 틀을 만들어 놓은 다음 LangChain을 활용해 플릿 매니지먼트 관련 정보를 누구나 쉽게 자연어로 질문을 하여 원하는 답을 확인할 수 있습니다. 대시보드에 없는 내용을 알아보려고 쿼리를 작성하지 않아도 됩니다. 예를 들어 “오늘 가장 많은 거리를 주행한 차량은 무엇인가요?“라고 질문하면, LangChain은 이 질문을 이해하고 BigQuery에 적절한 쿼리를 실행하여 답변을 제공합니다. 이렇게 간단하게 생성형 AI를 적용할 수 있는 이유를 구글 클라우드의 서비스별로 알아보겠습니다.
*Dataproc : Dataproc은 빠르고 사용하기 쉬운 구글 클라우드의 완전 관리형 클라우드 서비스로서 Apache Spark 및 Apache Hadoop 클러스터를 더욱 간단하고 비용 효율적인 방식으로 실행합니다.
✔️ 실시간으로 플릿 정보를 처리하는 데 이상적인 BigTable
BigTable은 수평 확장이 가능하도록 설계되어 있습니다. 시계열 데이터는 급속히 증가할 수 있는데, 예를 들어 차량 한 대가 초당 수십 개의 데이터 포인트를 생성할 수 있고 전체 차량 대수는 수천 대에 이를 수 있습니다. BigTable은 노드를 추가하여 처리량을 증가시킬 수 있기 때문에 데이터 양이 많아져도 성능 저하 없이 처리할 수 있습니다.
처리량도 상당합니다. 시계열 데이터는 실시간으로 처리해야 유용합니다. BigTable은 높은 처리량과 낮은 지연 시간을 제공하여, 초당 많은 읽기 및 쓰기 작업을 처리할 수 있습니다. 예를 들어 BigTable의 단일 노드는 초당 수천 개의 행을 처리할 수 있어 센서로부터 실시간으로 데이터를 받아 분석할 수 있습니다. 다음으로 유연한 스키마도 장점이라 할 수 있습니다. BigTable의 유연한 스키마는 새로운 유형의 데이터를 쉽게 수용할 수 있게 합니다. 이는 새로운 차량 모델과 센서 유형이 정기적으로 도입되는 환경에서 매우 유리합니다.
*Bigtable : NoSQL 데이터베이스 서비스로, 특히 수만 개의 열이 있는 매우 넓은 테이블을 허용하는 키-값 저장소입니다.
✔️ 분석 도구와 강력한 통합
BigTable은 관리형 Apache Spark 서비스인 Dataproc와 다재다능한 데이터웨어하우스인 BigQuery 같은 강력한 분석 도구와 잘 통합됩니다. Dataproc는 BigTable의 NoSQL 데이터에 대해 SQL 레이어를 제공하여 복잡한 집계 쿼리와 분석을 직접 수행할 수 있습니다. BigQuery는 이를 더욱 강화하여 대규모 분석 및 대시보드를 통해 인사이트를 제공합니다. 이러한 통합은 하이브리드 트랜잭션 및 분석 처리(HTAP)를 지원하여 시계열 데이터에서 인사이트를 도출하는 데 중요합니다. 두 서비스를 조합하면 각 차량의 평균 속도, 평균 경주 시간, 가장 빠르거나 느린 차량을 분석할 수 있습니다.
✔️ LangChain을 이용한 자연어 질의 및 분석
생성형 AI 기능은 LangChain을 매개체로 활용합니다. LangChain은 Google Gemini 모델과 BigQuery를 연동하여 사용자 질문을 구조화된 쿼리 형식으로 변환하는 도구입니다. 사용자는 SQL 쿼리를 작성하지 않고도 자연어로 데이터를 질의할 수 있으며, LangChain은 질문을 이해하고 BigQuery에 적절한 쿼리를 전달하여 답변을 제공합니다.
✔️ LLM 기반의 자연어 분석의 편의성
이번 포스팅에서 소개한 시나리오와 같이 LLM 기반 자연어 분석이 가능할 때 조직이나 사용자가 체감하는 혜택은 무엇일까요? 자연어를 통한 질의는 빠르고 직관적이어서, 필요한 정보를 즉시 얻을 수 있습니다. 복잡한 쿼리를 작성하고 실행하는 데 소요되는 시간을 절약할 수 있습니다. 그리고 데이터 분석의 접근성이 높아져, 조직 내 다양한 역할의 사람들이 데이터를 활용할 수 있습니다. 경영진, 운영 팀 등 다양한 부서의 사람들이 쉽게 데이터를 분석하고 인사이트를 도출할 수 있습니다. 플릿 매니지먼트의 한 예일 뿐입니다. 실시간으로 데이터를 수집하고 분석하는 시스템을 운영하고 있다면, 생성형 AI 기능으로 새로운 사용성을 경험할 수 있습니다.
구글 클라우드 더 자세한 내용은 메가존소프트에 문의해 주세요. 😎 [ 문의하기 ]