OpenAI และ Anthropic ออกแบบระบบ AI อย่างไร

Translated for your language. Read the original.

AI-assisted draft.

เมื่อวานซืน2min read

𝗛𝗼𝘄 𝗢𝗽𝗲𝗻𝗔𝗜 𝗮𝗻𝗱 𝗔𝗻𝘁𝗵𝗿𝗼𝗽𝗶𝗰 𝗗𝗲𝘀𝗶𝗴𝗻 𝗔𝗜 𝗦𝘆𝘀𝘁𝗲𝗺𝘀

หลายคนพยายามทำวิศวกรรมย้อนกลับ (reverse-engineer) บริษัท AI โดยการดูเอกสาร API หรือโพสต์ในบล็อก พวกเขามักจะมุ่งเน้นไปที่โมเดลหรือ endpoint ซึ่งนำไปสู่ข้อสรุปที่ผิดพลาด

OpenAI และ Anthropic ไม่ได้เพียงแค่สร้างโมเดลเท่านั้น แต่พวกเขาสร้างระบบนิเวศ (ecosystem) ทั้งหมดขึ้นมา

ระบบ AI ที่ใช้งานจริง (production AI system) คือระบบแบบกระจายตัวขนาดใหญ่ (large-scale distributed system) ซึ่งเป็นสถาปัตยกรรมแบบแบ่งเป็นชั้น (layered architecture) ที่ทุกส่วนต่างส่งผลกระทบต่อกันและกัน

หากคุณมองว่า AI เป็นเพียงส่วนประกอบเดียว คุณจะพลาดหัวใจสำคัญของการทำงาน ความมหัศจรรย์เกิดขึ้นจากวิธีการที่เลเยอร์เหล่านี้มีปฏิสัมพันธ์กัน

นี่คือเลเยอร์หลักของระบบ AI ขนาดใหญ่:

• Data Pipeline: รวบรวมและทำความสะอาดข้อมูลสำหรับฝึกฝน (training data) • Training Infrastructure: จัดการทรัพยากรการคำนวณ (compute) และคลัสเตอร์ GPU ขนาดมหาศาล • Model Layer: สถาปัตยกรรมหลักของ LLM • Inference Layer: ให้บริการคำตอบแก่ผู้ใช้ด้วยความหน่วง (latency) ต่ำ • Safety Layer: ควบคุมดูแลความปลอดภัย (guardrails) และการปรับจูนให้สอดคล้อง (alignment) • Observability: ตรวจสอบประสิทธิภาพและติดตามข้อผิดพลาด • Feedback Loop: ใช้ข้อมูลใหม่เพื่อพัฒนาโมเดลให้ดีขึ้นอย่างต่อเนื่อง

โมเดลเป็นเพียงส่วนหนึ่งของเครือข่ายนี้เท่านั้น

ตัวอย่างเช่น การทำ alignment ไม่ใช่สิ่งที่ทำเพียงครั้งเดียวจบ บริษัทต่างๆ ใช้กลยุทธ์ที่แตกต่างกันเพื่อให้โมเดลมีความปลอดภัย:

RLHF: ใช้การตอบรับจากมนุษย์ (human feedback) เพื่อชี้นำพฤติกรรม
Constitutional AI: ใช้การชี้นำตามกฎเกณฑ์ (rule-based) เพื่อรองรับการขยายตัว
Output Filtering: ใช้การประมวลผลหลังการสร้าง (post-processing) เพื่อปิดกั้นเนื้อหาที่ไม่เหมาะสม

เมื่อโมเดลพร้อมแล้ว ความท้าทายจะเปลี่ยนไปสู่ขั้นตอนการอนุมาน (inference) คุณต้องสร้างสมดุลระหว่างความเร็วและต้นทุน วิศวกรใช้เทคนิคต่างๆ เช่น batching, caching และ quantization เพื่อให้ระบบทำงานได้อย่างรวดเร็วและเชื่อถือได้

การขยายขนาด (scaling) ระบบเหล่านี้เป็นเรื่องยาก มันไม่ใช่แค่การเพิ่มฮาร์ดแวร์ แต่คือการจัดการกับความซับซ้อน เมื่อคุณขยายระบบ คุณจะเผชิญกับปัญหาใหม่ๆ ในด้านการประสานงาน (coordination) และความน่าเชื่อถือ (reliability)

ความสำเร็จเกิดจากการมองว่า AI คือระบบที่มีการพัฒนาอยู่ตลอดเวลา บริษัทเหล่านี้ไม่ได้สร้างผลิตภัณฑ์ที่หยุดนิ่ง แต่พวกเขาสร้างวงจรการเรียนรู้ (loops) ที่พัฒนาจากข้อมูลการใช้งานจริงในโลกปัจจุบัน

เลิกมองโมเดลแบบแยกส่วน แต่จงมองทั้งระบบ

Source: https://dev.to/stack_overflowed/how-companies-like-openai-and-anthropic-design-their-ai-systems-2537

OpenAI และ Anthropic ออกแบบระบบ AI อย่างไร

Continue reading

OpenAI และ Anthropic ออกแบบระบบ AI อย่างไร

อคติในระบบ AI

OpenAI พบว่าการฝึกฝนด้วยข้อมูลที่เป็นประโยชน์ในปริมาณเล็กน้อยช่วยเพิ่มความปลอดภัยให้กับ AI

การทำงานร่วมกับ AI หมายถึงการคิดให้มากขึ้น ไม่ใช่คิดให้น้อยลง

เทคโนโลยี AI ล้มเหลวในการใช้งานจริง: ปิดช่องว่างการประสานงานของ AI