Netris ระดมทุนได้ 15 ล้านดอลลาร์จาก a16z เพื่อเร่งการปรับใช้ AI Neocloud
ในขณะที่การแข่งขันเพื่อความเป็นหนึ่งด้าน GPU กำลังทวีความรุนแรงขึ้น อุปสรรคสำคัญสำหรับผู้ให้บริการ AI cloud รายใหม่ได้เปลี่ยนจากการจัดหาชิปไปเป็นการกำหนดค่าเครือข่ายที่ซับซ้อนซึ่งจำเป็นต่อการใช้งานชิปเหล่านั้น Netris สตาร์ทอัพด้าน network automation ประสบความสำเร็จในการระดมทุนระดับ Series A จำนวน 15 ล้านดอลลาร์ นำโดย Andreessen Horowitz (a16z) เพื่อแก้ไขความท้าทายด้านโครงสร้างพื้นฐานที่สำคัญนี้
แก้ไขอุปสรรคในการปรับใช้ Neocloud
การเติบโตของ "neoclouds"—ผู้ให้บริการ cloud เฉพาะทางที่มุ่งเน้นด้าน AI inference และการฝึกฝน (training)—ได้สร้างความต้องการมหาศาลในการปรับใช้ data center อย่างรวดเร็ว โดยปกติแล้ว การติดตั้ง data center เพื่อรองรับการประมวลผลประสิทธิภาพสูงอาจใช้เวลานานหลายเดือน ส่งผลให้ GPU ราคาแพงต้องถูกปล่อยทิ้งไว้โดยไม่ได้ใช้งาน ในขณะที่วิศวกรต้องเผชิญกับความยากลำบากในการกำหนดค่าด้วยตนเอง
Netris แก้ไขปัญหานี้ด้วยการนำเสนอแพลตฟอร์มซอฟต์แวร์เฉพาะทางที่ทำงานบน network switches โดยตรง เทคโนโลยีของพวกเขาช่วยให้การติดตั้ง การกำหนดค่า และการดำเนินงานรายวันของ data center เป็นไปอย่างอัตโนมัติ สิ่งสำคัญคือแพลตฟอร์มนี้มีคุณสมบัติ network abstraction และการแยกทรัพยากรในระดับฮาร์ดแวร์ (hardware-layer resource isolation) ซึ่งช่วยให้รองรับ multi-tenancy ได้ สิ่งนี้ช่วยให้ผู้ให้บริการ neocloud สามารถให้บริการลูกค้าหลายรายบนฮาร์ดแวร์ชุดเดียวกันได้อย่างปลอดภัย ซึ่งเป็นสิ่งที่ก่อนหน้านี้ต้องใช้ทีมวิศวกรจำนวนมหาศาลเหมือนอย่างที่ AWS หรือ Google ทำ
Hardware Acceleration เทียบกับ SDN แบบดั้งเดิม
จุดต่างทางเทคนิคที่สำคัญของ Netris คือแนวทางการจัดการความเร็วของเครือข่าย Alex Saroyan ซีอีโอของบริษัท ระบุว่า Software-Defined Networking (SDN) แบบดั้งเดิมนั้นไม่เพียงพอต่อความต้องการปริมาณข้อมูล (traffic) มหาศาลของ AI workloads เนื่องจาก SDN เป็นเทคโนโลยีที่เน้นซอฟต์แวร์เป็นหลัก จึงไม่สามารถทำ throughput ได้ตามที่ต้องการ
Netris นำเสนอสิ่งที่ Saroyan เรียกว่า "hardware-accelerated SDN" ด้วยการย้ายความฉลาด (intelligence) เข้าไปใกล้กับฮาร์ดแวร์มากขึ้น แพลตฟอร์มจึงสามารถจัดการกับปริมาณข้อมูลมหาศาลของ AI clusters ได้โดยไม่มีปัญหาเรื่องความหน่วง (latency) เหมือนกับโซลูชันที่ใช้ซอฟต์แวร์เพียงอย่างเดียว แนวทางแบบ vendor-agnostic นี้ช่วยให้มั่นใจได้ว่าจะสามารถใช้งานร่วมกับระบบนิเวศของเซิร์ฟเวอร์ทั้ง Nvidia และ AMD ได้ ทำให้เป็นเครื่องมือที่ใช้งานได้หลากหลายสำหรับ hardware stacks ที่แตกต่างกัน
ความน่าเชื่อถือผ่านอัลกอริทึมแบบ Deterministic
ที่น่าสนใจคือ แม้จะดำเนินธุรกิจในด้านโครงสร้างพื้นฐาน AI แต่ Netris กลับไม่ได้ใช้ AI ในการจัดการเครือข่ายของตนเอง Saroyan อธิบายว่าสำหรับการจัดการการกำหนดค่า switch นับพันรายการ "ความคิดสร้างสรรค์" ถือเป็นความเสี่ยง เนื่องจาก AI มีลักษณะเป็น non-deterministic ซึ่งหมายความว่ามันสามารถให้ผลลัพธ์ที่คาดเดาไม่ได้ ซึ่งเป็นความเสี่ยงที่ผู้ให้บริการ data center ไม่สามารถยอมรับได้
ในทางกลับกัน Netris อาศัยอัลกอริทึมที่มีความแม่นยำสูงและสามารถทำซ้ำได้ ซึ่งพัฒนาขึ้นตลอด 8 ปีที่ผ่านมา แนวทางแบบ deterministic นี้ช่วยให้มั่นใจได้ว่าการเปลี่ยนแปลงเครือข่ายจะเป็นไปตามที่คาดการณ์และมีความแม่นยำ ประสิทธิภาพของวิธีการนี้พิสูจน์ได้จากขนาดการใช้งานในปัจจุบัน โดย Netris ได้เปิดใช้งานใน GPU clusters มากกว่า 35 แห่งทั่วโลก และจัดการ GPU ประมาณหนึ่งล้านตัวให้กับผู้เล่นรายใหญ่ ได้แก่ Lightning AI, Foxconn, HPE, Tensorwave และ Telus
การขยายตัวเพื่ออนาคตของโครงสร้างพื้นฐาน AI
ด้วยเงินทุนใหม่จำนวน 15 ล้านดอลลาร์ และการเพิ่ม Guido Appenzeller พาร์ทเนอร์จาก a16z เข้ามาเป็นคณะกรรมการบริษัท Netris วางแผนที่จะขยายธุรกิจอย่างรวดเร็ว บริษัทตั้งเป้าที่จะเพิ่มจำนวนวิศวกรและพนักงานขาย รองรับผู้ผลิตฮาร์ดแวร์ที่หลากหลายมากขึ้น และเพิ่มขีดความสามารถของอัลกอริทึมการทำงานอัตโนมัติหลัก ในขณะที่อุตสาหกรรม AI กำลังเปลี่ยนผ่านจากคลัสเตอร์เพื่อการทดลองไปสู่สภาพแวดล้อมการผลิตขนาดใหญ่ ความสามารถในการปรับใช้เครือข่ายแบบ "turnkey" จะกลายเป็นปัจจัยตัดสินสำหรับผู้ให้บริการ cloud รุ่นต่อไป
สรุปประเด็นสำคัญ
- การปรับใช้ที่รวดเร็ว: Netris ช่วยให้การกำหนดค่า GPU clusters ที่ซับซ้อนเป็นไปอย่างอัตโนมัติ ซึ่งช่วยลดเวลาที่ neoclouds ต้องใช้ในการเปิดให้บริการและเริ่มสร้างรายได้อย่างมีนัยสำคัญ
- เครือข่ายแบบ Hardware-Accelerated: ต่างจาก SDN แบบดั้งเดิม Netris ให้การเร่งความเร็วในระดับฮาร์ดแวร์เพื่อรองรับความต้องการปริมาณข้อมูลมหาศาลของการฝึกฝน (training) และการประมวลผล (inference) ของ AI
- ขนาดการใช้งานที่พิสูจน์แล้ว: แพลตฟอร์มนี้เปิดใช้งานอยู่บน GPU ประมาณหนึ่งล้านตัว โดยให้บริการผู้นำในอุตสาหกรรมอย่าง Foxconn, HPE และ Lightning AI
