MapD, GPU 기반 분석 및 시각화 솔루션으로 꽤 유명하죠. MapD는 GPU의 강력한 병렬 컴퓨팅과 GPU에 장착된 메모리 상에서 데이터를 처리하여 매우 역동적으로 분석을 수행하고, 실시간으로 그 결과를 시각화하여 보여줍니다. 엄청난 양의 데이터를 수집하고 분석해 다음 그림처럼 멋진 이미지와 그래프로 보여 주는 도구라 생각하면 이해가 쉬울 것입니다.
MapD는 클라우드 기반 GPU 인프라와 궁합이 좋다고 합니다. 고가의 GPU 클러스터를 직접 꾸미지 않고 클라우드의 GPU 자원을 써도 충분한 성능이 나온다는 소리죠. 데이터 과학자와 분석 전문가는 GPU 자원 제약 없이 수십억 개가 넘는 열로 구성된 데이터 세트를 마음껏 다룰 수 있습니다.
MapD를 클라우드에서 쓰는 방법은 여러 가지입니다. 그중 하나가 GCP 마켓플레이스를 통해 사용하는 것입니다. 참고로 MapD는 AWS에서 커뮤니티와 엔터프라이즈 에디션 이미지를 올려 쓸 수 있고, NVIDIA GPU 클라우드 환경에서는 MapD 도커 컨테이너를 올려 사용하면 됩니다.
데이터 집약적인 워크로드 운영에 있어 GCP는 독보적이죠. Cloud DataFlow, Cloud BigTable, Cloud AI 등 내놓는 서비스마다 데이터 과학자와 분석 전문가의 인기를 끌고 있습니다. 이들 서비스에 MapD를 연계해 쓴다고 상상해 보세요. 다양한 분석 요구 사항을 GCP의 여러 서비스로 수용하고, 최종 사용자를 위한 멋진 데이터 시각화는 MapD로 꾸며 보는 것도 좋은 선택이 아닐까 생각해봅니다.
한편 GCP에서 MapD를 이용할 때 필요에 따라 GPU 자원을 골라 쓸 수 있는 폭도 넓습니다. K80, 파스칼 아키텍처나 볼타 아키텍처 기반의 GPU 인스턴스를 자유롭게 선택해 가성비를 높이는 쪽으로 자원을 활용할 수 있습니다.
더 자세한 내용은 트라이얼을 통해 이런저런 테스트를 하면서 직접 확인해 보세요.