3월 13일(현지 시각), 마이크로소프트는 블로그 게시글을 통해 마이크로소프트가 5년 전 엔비디아 GPU 수천 개로 인공지능(AI) 인프라를 개발한 사실을 밝혔다.
마이크로소프트와 오픈AI는 5년 전, 밀한 협업을 통해 OpenAI가 점점 더 강력해지는 AI 모델 제품군을 훈련할 수 있도록 설계되고 전용으로 사용되는 슈퍼컴퓨팅 자원을 애저에 구축하기 시작했다. 인프라에는 성능 컴퓨팅을 위해 엔비디아 퀀텀 인피니밴드 통신을 기반으로 하는 높은 처리량, 저지연 네트워크에 연결된 수천 개의 엔비디아 AI 최적화 GPU가 포함되었다.
마이크로소프트는 엔비디아 H100 텐서 코어 GPU(NVIDIA H100 Tensor Core GPUs)와 엔비디아 퀀텀2 인피니밴드(NVIDIA Quantum-2 InfiniBand) 네트워킹을 통합해 강력한 성능과 대규모 확장 가능성을 지닌 가상 머신 개발에 성공했다. 가상 머신은 마이크로소프트가 어떠한 AI 업무든 수행할 수 있는 규모로 고객 인프라 규모를 확장한다.
이 외에도 마이크로소프트는 AI 개발자에게 뛰어난 성능을 제공하고, GPU 수천 개로 규모를 확장하는 애저의 ND H100 v5 가상 머신을 공개했다. ND H100 v5 가상 머신은 차세대 NV스위치 및 NV링크 4.0을 통해 상호 연결된 '엔비디아 H100 텐서 코어 GPU' 8개, 4800MHz DDR5 DIM 16개 채널 등으로 구성되었다.
[저작권자ⓒ CWN(CHANGE WITH NEWS). 무단전재-재배포 금지]