스토리지는 IT 환경에서 가장 비용이 많이 드는 동시에 지속해서 늘어나고, 인프라 전반의 성능에 직접적인 영향을 주는 대표적인 자원입니다. 스토리지는 분석, 렌더링 같은 자원 집약적인 작업을 할 때 인프라 성능 저하의 원인이 되곤 합니다. 성능이 뒷받침되지 않으면 사이트 접속이나 서비스 이용에 지연이 생겨 고객 이탈이나 불만족이 생길 수 있습니다. 이런 이유로 회사의 브랜드 평판이나 수익에 나쁜 영향을 끼치는 것을 방지하기 위해 중요하거나 민감한 워크로드는 가장 빠른 속도를 내는 SSD에 연결합니다. 이때 온프레미스의 경우 올플래시 스토리지 어레이를 쓰고, 클라우드에서는 가상 머신에 직접 연결할 수 있는 로컬 SSD를 사용합니다.
최대 9TB까지 가상 머신에 직접 연결 가능한 로컬 SSD
구글 클라우드는 Compute Engine 가상 머신에 직접 연결할 수 있는 로컬 SSD 옵션을 제공합니다. 얼마 전까지 선택할 수 있는 용량은 3TB가 최대였습니다. 그러던 것이 이제 6TB, 9TB까지 선택지가 넓어졌습니다. 비교해볼까요. 3TB와 9TB 간의 쓰루풋 및 IOPS 차이는 가상 머신 당 3.5배에 이릅니다. 따라서 인스턴스를 늘려 성능 요구를 맞추기보다 9TB 옵션을 하나 쓰는 것이 관리 포인트와 비용을 모두 줄이는 데 효과적입니다.
로컬 SSD의 동작 방식
로컬 SSD는 가상 머신을 호스팅하는 서버에 물리적으로 연결된 저장 장치입니다. 네트워크를 거치는 것이 아니다 보니 쓰루풋은 높고, 레이턴시는 낮습니다. 보안을 위해 로컬 디스크는 상시 암호화를 유지합니다. 보통 분산된 클러스터를 대상으로 데이터를 저장하고 관리하는 NoSQL 계열 데이터베이스를 운영하거나, 실시간 분석 플랫폼같이 쿼리 처리를 위해 디스크 입출력이 빠르게 일어나는 시스템을 위한 임시 블록 스토리지 용도로 많이 씁니다.
먼저 분산 데이터 저장 용도로 쓸 때의 구성을 보겠습니다. 스토리지 계층으로 보면 핫 티어에 위치해 빠른 성능으로 대량의 입출력을 처리하는 역할을 로컬 SSD가 한다고 보면 됩니다. 이를 그림으로 표현하면 다음과 같습니다. 일반 스토리지 위 계층에서 높은 IOPS 처리 능력과 낮은 레이턴시 유지 성능을 바탕으로 제 몫을 합니다.
분산 환경에서의 데이터 저장 및 처리 외에 다음 그림과 같은 용도로도 로컬 SSD를 많이 사용합니다. 바로 분석 플랫폼에 직접 로컬 SSD를 연결하는 것입니다. 이 경우도 구성은 비슷합니다. 일반 스토리지의 윗단에 로컬 SSD가 위치하면 캐싱과 인덱싱을 통해 데이터 쿼리를 신속히 수행합니다. 구글 클라우드 고객 중 하나인 Mixpanel 은 Compute Engine의 로컬 SSD에 수백 테라바이트 규모의 데이터를 캐싱하여 초 단위로 쿼리 처리 속도를 유지합니다.
6TB, 9TB 로컬 SSD 옵션은 분산 컴퓨팅 아키텍처를 기본으로 하는 워크로드 운영 시 TCO 절감에 도움이 됩니다. 가령 실시간 분석 기능을 제공하는 SaaS 사업자는 더 큰 용량의 로컬 SSD로 성능은 높이고 비용은 낮출 수 있습니다. 데이터 분석과 미디어 렌더링같이 트랜잭션이 과도하게 일어나는 워크로드 역시 더 큰 로컬 SSD로 넉넉한 IOPS를 확보해 작업 생산성을 높일 수 있습니다.
구글 Compute Engine 인스턴스에 9TB 로컬 SSD를 연결하는 것은 다음 그림을 참조 바랍니다.
로컬 SSD 소개 및 연결 방법은 매뉴얼 페이지를 참조 바랍니다. 참고로 6TB, 9TB 로컬 SSD 모두 GB당 요금이 책정됩니다. 더 자세한 내용은 비용 안내 페이지를 참조 바랍니다.