Netris, AI 네오클라우드(Neocloud) 배포 가속화를 위해 a16z로부터 1,500만 달러 투자 유치

GPU 패권 경쟁이 심화됨에 따라, 새로운 AI 클라우드 제공업체들의 병목 현상은 칩 확보에서 이를 구동하는 데 필요한 복잡한 네트워크를 구성하는 단계로 옮겨갔습니다. 네트워크 자동화 스타트업인 Netris는 이러한 핵심 인프라 문제를 해결하기 위해 Andreessen Horowitz(a16z)가 주도하는 시리즈 A 펀딩에서 1,500만 달러를 확보했습니다.

네오클라우드 배포 병목 현상 해결

AI 추론 및 학습에 특화된 클라우드 제공업체인 "네오클라우드(neoclouds)"의 부상은 데이터 센터의 신속한 배포에 대한 막대한 수요를 창출했습니다. 전통적으로 고성능 컴퓨팅을 지원하기 위한 데이터 센터 구축에는 수개월이 소요될 수 있으며, 이 과정에서 엔지니어들이 수동 구성 문제로 고군분투하는 동안 값비싼 GPU는 유휴 상태로 방치되곤 합니다.

Netris는 네트워크 스위치에서 직접 실행되는 특화된 소프트웨어 플랫폼을 제공함으로써 이 문제를 해결합니다. 이들의 기술은 데이터 센터의 설치, 구성 및 일상적인 운영을 자동화합니다. 결정적으로, 이 플랫폼은 네트워크 추상화와 하드웨어 계층의 리소스 격리를 제공하여 멀티테넌시(multi-tenancy)를 가능하게 합니다. 이를 통해 네오클라우드 운영자는 동일한 하드웨어에서 여러 고객에게 안전하게 서비스를 제공할 수 있으며, 이는 과거 AWS나 Google과 같은 거대 엔지니어링 팀이 필요했던 작업입니다.

하드웨어 가속 vs. 전통적인 SDN

Netris의 핵심적인 기술적 차별점은 네트워킹 속도에 대한 접근 방식입니다. CEO Alex Saroyan은 전통적인 소프트웨어 정의 네트워킹(SDN)이 AI 워크로드의 막대한 트래픽 수요를 충족하기에는 불충분하다고 지적합니다. SDN은 기본적으로 소프트웨어 기반 기술이기 때문에 요구되는 처리량(throughput)을 따라갈 수 없기 때문입니다.

Netris는 Saroyan이 "하드웨어 가속 SDN(hardware-accelerated SDN)"이라고 설명하는 솔루션을 제공합니다. 지능형 기능을 하드웨어에 더 가깝게 배치함으로써, 이 플랫폼은 소프트웨어 전용 솔루션에서 발생하는 지연 시간(latency) 손실 없이 AI 클러스터의 극심한 데이터 볼륨을 처리할 수 있습니다. 이러한 벤더 중립적(vendor-agnostic) 접근 방식은 Nvidia와 AMD 서버 생태계 모두와 호환성을 보장하여, 다양한 하드웨어 스택에 활용할 수 있는 다재다능한 도구가 됩니다.

결정론적 알고리즘을 통한 신뢰성 확보

흥미롭게도, AI 인프라 분야에서 활동하고 있음에도 불구하고 Netris는 네트워크 관리에 AI를 사용하지 않습니다. Saroyan은 수천 개의 스위치 구성을 관리하는 데 있어 "창의성"은 오히려 위험 요소라고 설명합니다. AI는 비결정론적(non-deterministic)이어서 예측 불가능한 결과를 생성할 수 있는데, 이는 어떤 데이터 센터 운영자도 감수할 수 없는 리스크입니다.

대신 Netris는 지난 8년 동안 개발된 매우 지속적이고 반복 가능한 알고리즘에 의존합니다. 이러한 결정론적 접근 방식은 네트워크 변경 사항이 예측 가능하고 정확하도록 보장합니다. 이 방법의 효용성은 현재의 규모로 입증됩니다. Netris는 이미 전 세계 35개 이상의 GPU 클러스터에서 운영 중이며, Lightning AI, Foxconn, HPE, Tensorwave, Telus를 포함한 주요 기업들을 위해 약 100만 개의 GPU를 관리하고 있습니다.

AI 인프라의 미래를 위한 확장

이번 1,500만 달러의 신규 투자와 a16z 파트너인 Guido Appenzeller의 이사회 합류를 통해 Netris는 공격적인 확장을 계획하고 있습니다. 회사는 엔지니어링 및 영업 인력을 충원하고, 더 다양한 하드웨어 벤더를 지원하며, 핵심 자동화 알고리즘의 기능을 심화하는 것을 목표로 합니다. AI 산업이 실험적 클러스터에서 대규모 프로덕션 환경으로 이동함에 따라, "턴키(turnkey)" 방식의 네트워킹을 배포할 수 있는 능력은 차세대 클라우드 제공업체들의 결정적인 요소가 될 것입니다.

핵심 요약

  • 신속한 배포: Netris는 GPU 클러스터의 복잡한 구성을 자동화하여, 네오클라우드가 서비스를 시작하고 수익을 창출하기까지 걸리는 시간을 크게 단축합니다.
  • 하드웨어 가속 네트워킹: 전통적인 SDN과 달리, Netris는 AI 학습 및 추론의 극심한 트래픽 수요를 처리하기 위해 하드웨어 수준의 가속을 제공합니다.
  • 검증된 규모: 이 플랫폼은 이미 약 100만 개의 GPU에서 운영되고 있으며, Foxconn, HPE, Lightning AI와 같은 업계 리더들에게 서비스를 제공하고 있습니다.