Anthropic ลดขนาด System Prompt ของ Claude Code ลงถึง 80% เพื่อรองรับ Fable 5

Anthropic กำลังเผชิญกับการเปลี่ยนแปลงกระบวนทัศน์ (paradigm shift) ในวิธีการควบคุมโมเดลภาษาขนาดใหญ่ (LLM) โดยเปลี่ยนจากการใช้ชุดคำสั่งที่หนักอึ้ง ไปสู่การให้คำแนะนำที่เบาบางและเป็นธรรมชาติมากขึ้น วิวัฒนาการนี้ถูกขับเคลื่อนโดยการมาถึงของโมเดล Fable 5 (Mythos class) รุ่นใหม่ ซึ่งทำงานได้ดีขึ้นเมื่อมีข้อจำกัดน้อยลงและมีบริบท (context) มากขึ้น

จุดจบของ System Prompt ที่ยาวเหยียด

เป็นเวลาหลายปีที่มาตรฐานอุตสาหกรรมในการเพิ่มประสิทธิภาพ AI คือการทำ "prompt engineering" ผ่านคำสั่งระบบ (system instructions) จำนวนมหาศาลและตัวอย่างแบบ few-shot ที่ละเอียดถี่ถ้วน นักพัฒนาเชื่อว่าการมีกฎเกณฑ์มากขึ้นและข้อจำกัดประเภท "ห้ามทำสิ่งนี้" มากขึ้น คือกุญแจสำคัญสู่ความน่าเชื่อถือ อย่างไรก็ตาม Anthropic กำลังเปลี่ยนทิศทางนี้

Tariq Shihipar สมาชิกทีมเทคนิคของ Anthropic เปิดเผยว่าบริษัทได้ลดขนาด system prompt สำหรับ Claude Code ลงถึง 80 เปอร์เซ็นต์ การลดลงนี้ไม่ใช่สัญญาณของการทำให้โมเดลง่ายขึ้น แต่เป็นการตอบสนองต่อความสามารถทางพุทธิปัญญา (cognitive capabilities) ที่ซับซ้อนของโมเดล Fable 5 รุ่นใหม่ เมื่อโมเดลมีความก้าวหน้ามากขึ้น วิธีการแบบเดิมที่ต้อง "จูงมือทำ" (hand-holding) ผ่าน prompt ที่ยาวเหยียดกลับกลายเป็นการส่งผลเสียแทน

ทำไมโมเดล Fable 5 ถึงต่อต้านข้อจำกัด

การเปลี่ยนผ่านไปสู่โมเดล Fable 5 (หรือ Mythos class) แสดงถึงการเปลี่ยนแปลงพื้นฐานในพฤติกรรมของโมเดล ตามความเห็นของ Shihipar การให้ตัวอย่างจำนวนมากและกฎเกณฑ์ที่ตายตัวแก่โมเดลเฉพาะเหล่านี้กลับทำให้ประสิทธิภาพลดลง เหตุผลนั้นเหนือความคาดหมาย นั่นคือ โมเดลเหล่านี้มีความ "จินตนาการ" (imaginative) มากกว่าโมเดลรุ่นก่อนๆ โดยธรรมชาติ

เมื่อนักพัฒนาให้รายการตัวอย่างที่เฉพาะเจาะจงจำนวนมาก สิ่งนี้จะทำหน้าที่เป็นข้อจำกัดที่ปิดกั้นความสามารถในการใช้เหตุผลของโมเดล แทนที่จะสำรวจวิธีแก้ปัญหาที่มีประสิทธิภาพหรือสร้างสรรค์ที่สุด โมเดลกลับรู้สึกถูกบังคับให้เลียนแบบรูปแบบเฉพาะที่ระบุไว้ใน prompt เพื่อปลดล็อกศักยภาพที่แท้จริงของ Mythos class ทาง Anthropic จึงเปลี่ยนจากการใช้กฎที่เข้มงวดไปสู่การ "ควบคุมผ่านบริบท" (steering through context) ซึ่งช่วยให้โมเดลสามารถใช้ความสามารถในการใช้เหตุผลเพื่อจัดการกับงานต่างๆ ได้โดยไม่ถูกตีกรอบด้วยภาระของคำสั่งที่มากเกินไป

วิวัฒนาการที่เป็นวัฏจักรของ Prompt Engineering

เส้นทางของ prompt engineering มีรูปแบบที่เป็นวัฏจักรอย่างชัดเจนตามวิวัฒนาการของโมเดล ผลการศึกษาภายในของ Anthropic ได้ชี้ให้เห็นถึง 3 ระยะที่แตกต่างกันของการพัฒนาโมเดล:

  1. โมเดลยุคแรก (Early Models): ต้องการ prompt ที่สั้นและเฉพาะเจาะจงสูง เสริมด้วยตัวอย่างจำนวนมากและคำสั่งที่จำกัดอย่างเข้มงวดเพื่อให้โมเดลยังคงความสอดคล้องได้ในระดับหนึ่ง
  2. โมเดลยุคกลาง (Intermediate Models): เมื่อความเข้าใจดีขึ้น prompt ก็ยาวขึ้นอย่างมีนัยสำคัญ นักพัฒนาใช้ประโยชน์จากความสามารถในการ "ปฏิบัติตามคำสั่ง" (instruction following) ที่เพิ่มขึ้นนี้ เพื่อสร้าง system prompt ที่ใหญ่และซับซ้อนเพื่อควบคุมทุกแง่มุมของพฤติกรรมโมเดล
  3. ยุค Fable 5 (The Fable 5 Era): เราได้เข้าสู่ระยะที่ prompt เริ่มสั้นลงอีกครั้ง จุดเน้นได้เปลี่ยนจากการบอกโมเดลว่า ต้องทำอะไร (กฎเกณฑ์) ไปเป็นการจัดเตรียม สภาพแวดล้อม (บริบท) ที่จำเป็นเพื่อให้โมเดลสามารถทำงานได้อย่างเป็นอิสระ

การพัฒนานี้ถือเป็นก้าวสำคัญสำหรับวงการ AI ซึ่งบ่งชี้ว่าเมื่อเราก้าวไปสู่โมเดลที่มีความเป็นเอเจนต์ (agentic) และเน้นการใช้เหตุผลมากขึ้น บทบาทของนักพัฒนาจะเปลี่ยนจาก "ผู้สร้างกฎ" (rule-maker) ไปเป็น "ผู้จัดเตรียมบริบท" (context-provider) โดยให้ความสำคัญกับคุณภาพของข้อมูลมากกว่าปริมาณของคำสั่ง

สรุปประเด็นสำคัญ

  • ลดลง 80%: Anthropic ลดขนาด system prompt ของ Claude Code ลง 80% เพื่อให้สอดคล้องกับความสามารถของโมเดล Fable 5 (Mythos class) ได้ดียิ่งขึ้น
  • ข้อจำกัดปิดกั้นความคิดสร้างสรรค์: ตัวอย่างที่มากเกินไปและกฎ "ห้ามทำ" ที่ตายตัว สามารถจำกัดความสามารถในการใช้เหตุผลและจินตนาการของโมเดลขั้นสูงได้
  • บริบทสำคัญกว่ากฎเกณฑ์: พรมแดนใหม่ของการควบคุม AI คือการให้บริบทที่สมบูรณ์ แทนที่จะเป็นชุดคำสั่งที่ยาวและจำกัดสิทธิ์