เลิก Fine-Tuning โมเดลของคุณได้แล้ว ปัญหาอยู่ที่สถาปัตยกรรมของคุณต่างหาก

งานเดโมดูดีเสมอ แต่ระบบที่ใช้งานจริง (Production) นั้นต่างออกไป และมีช่องว่างระหว่างสองสิ่งนี้อยู่

เดี๋ยวนี้ใครๆ ก็เรียกทุกอย่างว่าเป็น Agent กันหมด แชทบอทที่มีหน่วยความจำก็เป็น Agent สคริปต์ที่มีลูปก็เป็น Agent ความเข้าใจผิดนี้ทำให้เกิดข้อผิดพลาดทางวิศวกรรม คุณจะลงเอยด้วยการทำ Over-engineering กับงานง่ายๆ และทำ Under-engineering กับงานที่ซับซ้อน

Agent จำเป็นต้องมีวัตถุประสงค์ มันไม่ได้แค่ทำตามคำสั่ง แต่มันตัดสินใจได้ว่าจะทำอะไรต่อไป มันจัดการกับความล้มเหลวได้ และมันรู้ว่าเมื่อไหร่ควรหยุด

ใช้กฎเหล่านี้เพื่อตรวจสอบระบบของคุณ:

  • หากมนุษย์ต้องคอยชี้นำในทุกขั้นตอน นั่นคือ Chat Interface
  • หากมันสามารถกู้คืนสถานะจากการเรียกใช้ Tool ที่ล้มเหลวได้ นั่นคือ Agent
  • หากมันสามารถย่อยเป้าหมายออกเป็นงานย่อยๆ (Subtasks) ได้ นั่นคือ Agent ที่แท้จริง

ทีมที่ประสบความสำเร็จไม่ได้วิ่งไล่ตามโมเดลใหม่ๆ แต่พวกเขาจะสร้าง Pipeline ที่เฉพาะเจาะจงและสร้างขึ้นเพื่อวัตถุประสงค์นั้นโดยเฉพาะ โดยมุ่งเน้นไปที่สามสิ่งนี้:

  • Tool design: อินเทอร์เฟซสะอาดแค่ไหน?
  • Failure handling: จะเกิดอะไรขึ้นเมื่อ Tool ไม่ส่งค่าใดๆ กลับมา?
  • Observability: คุณสามารถติดตาม (Trace) ทุกการตัดสินใจได้หรือไม่?

Framework ที่คุณใช้มีความสำคัญน้อยกว่า Pattern ที่คุณมี ผมเคยสร้างสถาปัตยกรรมใหม่ด้วย Framework ที่หลากหลาย และผลลัพธ์ก็ยังคงเหมือนเดิม Framework เป็นเพียงนั่งร้าน แต่สถาปัตยกรรมคือตัวอาคาร

ทำตาม Pattern เหล่านี้:

  • วางแผนแล้วค่อยลงมือทำ (Plan then execute): ใช้ขั้นตอนหนึ่งสำหรับการใช้เหตุผล (Reasoning) และอีกขั้นตอนหนึ่งสำหรับการลงมือทำ (Action)
  • แยกการดึงข้อมูล (Retrieval) ออกจากการใช้เหตุผล (Reasoning): การดึง Context และการใช้ Context เป็นงานที่ต่างกัน
  • ใช้การส่งต่องานที่ชัดเจน (Explicit handoffs): เมื่อ Agent ตัวหนึ่งส่งต่องานให้อีกตัวหนึ่ง ให้ใช้ Structured logs

RAG เป็นมาตรฐานทั่วไป แต่การทำ Chunking มักจะผิดพลาด หากคุณแบ่งเอกสารไม่ดี โมเดลจะสูญเสียบริบท (Context) ซึ่งนำไปสู่การเกิด Hallucination

หาก RAG Pipeline ของคุณให้ผลลัพธ์ที่ไร้ประโยชน์ ให้กลับไปดูที่การทำ Chunking และ Metadata อย่าไปโทษ Embedding model

ความท้าทายทางวิศวกรรมคือการสร้างระบบที่คุณสามารถไว้วางใจได้ ให้มุ่งเน้นไปที่ Governance, Observability และการใช้ Tool ที่เชื่อถือได้ อย่าเอาแต่ไล่ตาม Benchmark

วิศวกรที่เก่งที่สุดจะมุ่งเน้นไปที่การออกแบบระบบ พวกเขาจะสร้างระบบ AI ที่คนอื่นสามารถดูแลรักษาและไว้วางใจได้

Source: https://dev.to/aibughunter/stop-fine-tuning-your-model-your-architecture-is-the-problem-3kkg