주어진 조건에 맞추어 최선의 도구와 방법을 선택하면 AI 프로젝트를 더 효율적으로 추진할 수 있습니다 🙂
가령 필요한 데이터 과학자와 개발자 인적 자원을 확보하지 못해, 팀을 꾸려 프로젝트를 할 수 없을 때가 있습니다. 이런 경우 API 기반 서비스를 이용하면 데이터 과학자와 개발자 인력이 충분하지 않아도 프로젝트를 성공적으로 끌어갈 수 있습니다. 물론 개발하려는 서비스에 사용할 수 있는 API가 있어야 합니다. 구글 클라우드의 서비스를 한번 둘러본 분은 API를 통해 이용할 수 있는 서비스가 꽤 다양하다는 사실을 아실 것입니다. 일손이 모자라지 않을 때도 이들 API 서비스를 이용하면 전체 프로젝트 일정을 앞당기고, 개발 생산성을 높이는 등의 효과를 거둘 수 있습니다. 그렇다면 구글 클라우드에서 이용할 수 있는 AI 관련 API 서비스에는 어떤 것들이 있을까요? 하나하나 알아보겠습니다. 😀
이미지 데이터 세트를 활용하는 AI를 준비 중이라면
먼저 소개할 것은 너무나도 유명한 Vision API와 AutoML Vision입니다. Vision API와 AutoML Vision을 사용하면 이미지에서 손쉽게 객체를 구분할 수 있습니다. 사람 얼굴 인지, 감정 인식, 문자 이해 등을 척척해냅니다. 준비 중인 서비스에 필요한 이미지 데이터 세트만 있거나, 엣지 컴퓨팅 환경을 구현하여 데이터를 수집할 경로를 확보했다면 Vision API와 AutoML Vision을 이용하여 원하는 서비스를 손쉽게 구현할 수 있습니다.
Vision API와 AutoML Vision의 차이가 궁금하실 것입니다. Vision API는 구글이 제공하는 학습을 마친 모델과 사전 정의된 라벨이 포함된 방대한 라이브러리에 REST API, RPC API로 접근해 사용하는 것입니다. 이를 이용하면 이미지에 포함된 객체를 인식하고 라벨을 부여해 분류하는 작업을 손쉽게 할 수 있습니다. Vision API 페이지에 가보면 사진을 업로드해 직접 체험해 볼 수 있습니다. 예를 들어 사람이 얼굴이 포함된 사진을 올리면 감정 분석 내용부터 눈, 코, 입 등에 라벨을 부여한 결과 등을 바로 확인할 수 있습니다.
자체 모델이 있다면 AutoML Vision이 좋은 선택이 될 수 있습니다. 딱 보면 사용법이 눈에 들어오는 GUI 화면을 제공합니다. 따라서 모델 학습과 최적화를 손쉽게 한 다음 이를 애플리케이션이나 엣지 장치로 배포하는 것까지 간편히 할 수 있습니다. 이외에도 AutoML Vision을 사용하면 객체 감지, 인쇄 및 필기 입력 텍스트 감지, 얼굴 감지, 명소 및 제품 로고 식별, 웹 항목 및 페이지 검색, 컨텐츠 검토 등을 따로 개발하지 않고 서비스 형태로 쓸 수 있는 고급 기능도 풍부히 제공합니다.
영상 기반 AI 서비스 개발도 척척
이미지를 데이터 세트로 이용하는 것 못지않게 활용 범위가 넓은 보편적인 AI 적용 분야가 있습니다. 바로 영상을 이용하는 것입니다. 구글 클라우드는 Video Intelligence API와 AutoML Video Intelligence를 통해 동영상 데이터 세트를 기반으로 한 AI 서비스 개발과 운영을 돕습니다.
영상 데이터 세트 활용 범위는 매우 다양합니다. 카메라로 촬영하는 모든 영상 정보를 데이터 세트로 참조하여 실시간으로 장소, 객체, 동작 등을 인식해 필요한 분석을 수행합니다. 또한, 실시간 촬영 영상에서 필요한 메타 데이터 추출을 간편하게 할 수 있습니다.
Video Intelligence API는 사전 훈련을 마친 머신 러닝 모델과 사전 정의된 라벨이 포함된 방대한 라이브러리를 API 방식으로 이용하는 것입니다. 이를 통해 보유하고 있는 동영상이나 스트리밍 영상에서 객체, 장소 등을 인식하여 영상 분석이나, 장면 변화 감지, 객체 추적 등의 기능을 이용할 수 있습니다. 자체 모델이 있다면 AutoML Viedeo Intelligence를 쓰면 됩니다. 이 역시 머신 러닝 경험이 많지 않아도 사용이 가능한데, 보유한 동영상이나 스트리밍 영상을 이용해 커스텀 모델을 학습하고 최적화할 수 있습니다. 참고로 AutoML Video Intelligence을 이용하면 영상 속 텍스트 감지와 추출, 유해 컨텐츠 감지, 자동 자막, 로고 인식, 유명인 인식, 얼굴 인식 등의 기능도 손쉽게 활용할 수 있습니다.
AI가 번역하는 것이 당연한 시대
다음으로 소개할 서비스는 번역과 자연어 처리입니다. 구글 클라우드는 Translation API, AutoML Translation, Media Translation API를 제공합니다. 이를 이용하면 언어 기반 서비스에 AI 기능을 간편하게 부여할 수 있습니다. Translation API를 이용하면 높은 품질의 번역 기능을 갖춘 다국어 앱이나 서비스를 더 빨리 만들 수 있습니다. 뭔가 특화된 기능이나 품질을 추구한다면 AutoML Translation을 이용하면 됩니다. 개발자가 아니라 언어에 밝은 번역자나 현지화 전문가들이 코드 한 줄 작성하지 않고 커스텀 모델을 만들 수 있을 정도로 사용성이 뛰어납니다. 실시간 오디오 번역이 필요하면 Media Translation API를 선택하면 됩니다.
구글의 AI 관련 API 서비스를 더 효과적으로 쓰는 방법
앞서 소개한 API 서비스를 MLOps 체계 아래에서 사용하고 싶다면? 이 또한 걱정할 필요가 없습니다. 구글 클라우드가 제공하는 Vertex AI 서비스를 이용하면 데이터 전문가의 도움 없이도 MLOps 파이프라인 상에서 다양한 API 서비스를 이용하는 가운데 모델 배포 시간과 효율을 끌어올릴 수 있습니다.
이상으로 AI 대중화를 선도하는 구글 클라우드의 API 서비스에 대해 알아보았습니다. 다음 포스팅에서는 구글 클라우드를 이용해 AI 프로젝트의 성과를 극대화한 국내외 주요 사례를 살펴보겠습니다. 😃
더 자세한 내용은 메가존으로 문의 바랍니다. 👉 메가존 문의 바로가기