구글 클라우드는 의료 부문의 디지털 전환을 가속하는 다양한 서비스를 제공합니다.
이번에는 구글 클라우드를 통해 이룰 수 있는 의료 혁신에 대해 총 3회의 연재를 통해 알아보겠습니다. 😎
이번 포스팅은 마지막 세 번째 주제인 Biomedical Data Analysis 에 대해 소개합니다.
구글 클라우드는 의료 및 생명 과학 분야에서 ‘데이터’ 주도적인 디지털 전환을 가속할 수 있도록 다양한 서비스와 기술을 제공합니다.
예를 들어 알아보겠습니다.🙂
구글 클라우드는 Healthcare API를 통해 다양한 유형의 의료 정보 데이터의 수집, 통합, 저장을 지원합니다.
또한, Apigee 기반의 HealthAPIx를 통해 의료 정보 관련 상호운용성 확보 방안도 제시합니다.
그리고 BigQuery, TensorFlow, 머신 러닝 엔진 서비스로 방대한 의료 빅 데이터를 활용한 분석과 AI 적용 방안까지 친절히 안내합니다.
이들 서비스를 잘 활용하면 의료 및 연구 기관은 다양한 헬스케어 시스템 및 워크플로우를 클라우드 환경에서 손쉽게 구현하고 운영할 수 있습니다. 관련해 염기 서열 분석(Genomic sequence)을 예로 레퍼런스 아키텍처 구성 방안을 살펴보겠습니다.
유전자 분석을 위한 레퍼런스 아키텍처
염기 서열 분석 작업은 매우 강력한 컴퓨팅 파워가 필요합니다. 의료 기관이나 연구 기관에서 직접 IT 인프라를 구축해 운영하려면 GPU 가속 기반 클러스터, 분산 파일시스템 기반 스토리지, 고속 네트워킹 등 큰 비용과 노력이 뒷받침되어야 합니다.
반면에 클라우드를 요령껏 잘 활용하면 인프라 구축과 운영 부담 없이 바로 원하는 분석 작업을 할 수 있습니다. 시간, 비용, 효율 측면에서 클라우드의 이점에 대해서 따로 부연 설명할 필요가 없는 것이죠 😎
다음 레퍼런스 아키텍처를 보시죠. 딱 봐도 간결해 보이네요. 이 아키텍처는 연구 시설 내에 있는 시퀀싱 장비에서 쏟아져 나오는 데이터를 구글 클라우드로 보내 유전자 분석을 수행하고 그 결과를 JupyterLab Notebook에 전달해 연구원이 확인할 수 있는 구성입니다.
어떤 솔루션이 쓰였을까?
위 아키텍처 구성을 위해 활용한 서비스를 간단히 소개하겠습니다.
연구 시설 내에 있는 시퀀싱 장비에서 생성되는 대량의 데이터를 구글 클라우드로 보내기 위한 연결은 VPC 네트워크를 통해 이루어집니다.
데이터 수집 서버의 부하를 분산하기 위해 로드 밸런서가 배치됩니다.
시퀀싱 데이터는 구글 클라우드 스토리지에 저장되고, 메타 데이터는 CloudSQL에 담깁니다.
데이터 수집과 저장을 마치면 클라우드 상에 마련한 HPC 클러스터에서 분석이 이루어지고, 결과는 SAM(sequancing Alignment/MAP)의 이진 형태인 BAM 포맷 파일로 떨어집니다.
연구원은 JupyterLab Notebook을 통해 분석 결과를 보거나 BiqQuery를 이용해 원하는 분석 작업을 합니다.
연구원 측면에서 보면 원하는 작업을 JupyterLab Notebook 안에서 모두 다 하는 느낌을 받을 수 있습니다.🙂 사내 IT 부서에 의지해 데이터 수집, 처리 등의 작업을 하지 않아도 됩니다. 노트북이나 PC 앞에 앉아 JupyterLab Notebook을 띄워 놓는 것만으로 필요 작업을 할 수 있습니다.
이상으로 『 첨단 분석과 AI로 의료 정보 활용 가치 극대화하는 방안』을 예를 통해 알아 보았습니다.
🤩 구글 클라우드를 통해 이룰 수 있는 의료 혁신 😎
👉 Telehealth/Virtual Care 코로나19가 판 키운 원격 진료, 이제 새로운 의료 서비스의 시대가 온다
👉 Interoperability Accelerator 의료 정보 시스템 간 상호운용성 확보의 지름길 HEALTHAPIX
👉 Biomedical Data Analysis 첨단 분석과 AI로 의료 정보 활용 가치 극대화에 앞장서는 Google Cloud
더 자세한 내용은 언제든지 메가존으로 문의 바랍니다. 👉 메가존 문의 바로가기