본문 바로가기
디벨로퍼/데이터센터

데이터 센터 개발

by inniable 2023. 3. 21.

데이터 센터 개발

 

데이터 센터 개발에 필요한 자료들도 하나씩 모아보려 합니다. 많은 디벨로퍼들이 데이터센터에 관심을 가지고, 개발을 위해 노력하는 중입니다. 데이터센터(DC: Data Center)는 ICT장비를 건물·공간에 집결시키고 IT서비스 제공에 필요한 장비를 통합·관리해 24시간 365일 무중단으로 안정적인 서비스를 제공할 수 있도록 하는 시설을 말합니다. 2020년을 기준으로 국내 데이터센터는 156개이며, 2025년에는 188개에 달할 것으로 예상됩니다. 국내 시장 규모는 2조7,000억원 이상으로 추정됩니다. 매년 10% ~ 15% 이상의 성장이 기대된다고 합니다. 데이터센터의 기본개념과 컨셉을 위해 관련 기사들을 요약해 우선 몇 가지 적어보겠습니다. 

 

1. 삼성SDS 동탄데이터 센터

삼성SDS는 현재 전세계 17개의 데이터센터를 운영중입니다. 2022년 12월에 준공허가를 받고 올해 1월부터 가동에 들어간 동탄 데이터센터는 2019년 4월 1일 한국토지주택공사(LH)와 부지매입계약 약 229억 원, 2021년 한화건설과 공사비 800억원 및 기타 장비 포함 약 2,500여 억원을 투입한 프로젝트입니다. 지하 1층 지상 6층 규모로 건축면적은 6,081.39m2 입니다. 현재 약 1만대 가량의 서버가 설치되어 있지만, 향후 6만대에서 10만대 까지 증설이 가능한 상면공간을 확보한 상태입니다.   

삼성SDS의 동탄 데이터센터는 국내 최초의 고성능컴퓨팅(HPC) 데이터센터입니다. HPC 데이터센터로서 대용량의 전기를 필요로 하지만 폐열과 신재생 에너지를 활용해 전력사용효율(PUE)을 세계 최고 수준(1.1)으로 맞췄습니다. 데이터센터 옥상에는 750kw 규모의 태양광 발전 설비가 설치되어 있습니다. 이는 4인 가구 기준으로 약 260가구 정도가 사용할 수 있는 전력을 자체적으로 생산하는 셈입니다.

1층에는 수,배전설비가 자리해 있습니다. 2만2,900볼트로 공급되는 전기를 6,600볼트로 전환하는 변압기를 통해 전기실로 전기를 보내게 됩니다. 전기실에선 6,600볼트를 실제 장비에서 사용할 수 있는 380, 220볼트로 변압해 각 서버실 등으로 전송하게 됩니다. 삼성SDS는 전기설비와 전력계통을 이중화하여, 물리적 재난이 발생하더라도 다른 쪽에서 이를 모두 수용해서 시설에 이상이 없도록 구성했습니다. 또, 한국전력에서 공급되는 전기가 끊어질 경우에는 4대의 콜러사 디젤 엔진 발전기를 통해 18시간 이상 전기를 공급하게 됩니다. 

지하 1층으로 내려가면 기계실이 자리잡고 있습니다. 냉각 설비들이 설치되어 있으며, 여기서 냉동기 장비를 통해 차가운 물을 생성하고 이를 배관을 통해 서버룸까지 이동시킵니다. 서버룸에 설치된 항온항습기를 통해 차가운 바람을 서버에 보내주는 데 이 냉각 과정에 차가운 물이 사용되기 때문입니다. 이 냉동설비가 동탄 데이터센터에서 가장 많은 전력을 잡아먹고 있습니다. 


서버룸에는 무정전전원장치(UPS)와 배터리실이 있습니다. 슈나이더일렉트릭의 ‘갤럭시VX’ UPS가 설치돼 10분 정도의 정전까지 대응이 가능하도록 되어 있습니다. UPS는 옆 격실에 마련된 배터리를 충전하는 역할을 합니다. 동탄 데이터센터의 배터리는 내부에서 화재 확산 등을 막아주는 삼성SDI의 4세대 리튬이온 배터리가 채택되었습니다. UPS실도 이중화되어 있습니다. 배터리 화재 발생시 전원이 자동 차단되고 UPS실도 문제가 발생하면 다른 UPS실로 기능이 이관되게끔 설계되었습니다. 

HPC 전용 데이터센터로 고성능, 고전력을 사용하고 발열도 굉장히 심한 가혹한 컴퓨팅 환경에 대응해야 하는 동탄 데이터센터는 한 랙에 30대에서 40대까지 서버가 설치되도록 구성했습니다. 상면공간이 수익과 연결되는 데이터센터 측면에서 볼때 랙의 높이가 낮은 편입니다. 전력의 효율 문제로 보입니다. 

 

2. 마이크로소프트의 애저 데이터센터

마이크로소프트(MS)는 2019년 오픈AI 투자를 결정합니다. 10억달러 규모입니다. 2020년에 오픈AI의 연구를 위한 슈퍼컴퓨터를 애저(Azure)에 구축해 제공했습니다. 

MS 2023년 3월 13일 엔비디아 H100 텐서코어 GPU와 퀀텀2 인피니밴드 네트워킹을 통합한 새로운 AI용 가상머신(VM) '애저 ND H100 v5'를 공개하며 그동안의 인프라 구축 과정을 밝혔습니다. 구체적인 내용은 없었으나, 오픈AI의 대규모언어모델(LLM)과 달리(DALL-E) 2, 챗GPT 등을 개발하고 서비스하는데 엄청난 양의 GPU(엔비디아 GPU H100)와 이를 연결하기 위한 인피니밴드(엔비디아의 퀀텀2 인피니밴드) 사용중 일 것이라는 추측을 할 수 있습니다. 기존 컴퓨팅 자원보다 더 많은 인프라 사용을 위해 많은 투자가 필요했을 것으로 보입니다. 

또, 챗GPT를 위해 GPU 클러스터 용량을 점진적으로 추가하고 인피니밴드 네트워크 또한 점진적으로 확장하고 있어, 이를 위한 냉각 시스템, 무정전 전원 공급 장치 시스템 및 백업 생성기 등 GPU 클러스터의 운영을 유지하는 데 필요한 데이터센터 인프라를 어디까지 확장할 수 있는지 지속적으로 검토하였다고 밝혔습니다. 

 

 

반응형