Microsoft FastContext ช่วยลดจำนวน Token ของ Coding Agent ลงถึง 60%

Coding agent เสียเวลามากเกินไปกับการค้นหาโค้ด

เมื่อ agent ค้นหาใน repository มักจะดึงไฟล์ทุกไฟล์เข้ามาไว้ใน context window ของตัวเอง สิ่งนี้ทำให้ "โต๊ะทำงาน" เต็มไปด้วยข้อมูลดิบ ก่อนที่ agent จะเริ่มเขียนโค้ดเสียด้วยซ้ำ

นักวิจัยของ Microsoft ได้ศึกษาข้อมูลการทำงาน (traces) ของ GPT-5.4 และพบปัญหาใหญ่หลวง:

ข้อมูลส่วนใหญ่เป็นข้อมูลที่มีสัญญาณต่ำ (low signal) agent ต้องการเพียงไม่กี่บรรทัด แต่กลับต้องแบกไฟล์ทั้งไฟล์ไปด้วย

Microsoft จึงได้ปล่อย FastContext ออกมาเพื่อแก้ปัญหานี้

แทนที่ main agent จะเป็นคนค้นหาเอง มันจะใช้ subagent ที่ทำหน้าที่เป็น explorer โดยเฉพาะ ให้ลองนึกภาพว่าเหมือนกับบรรณารักษ์ คุณนั่งอยู่ที่โต๊ะทำงาน แล้วส่งบรรณารักษ์เข้าไปในชั้นวางหนังสือเพื่อหาข้อมูลแทน

วิธีการทำงาน:

main agent จะได้รับตำแหน่งที่แน่นอนโดยไม่ต้องรับข้อความจำนวนมหาศาล

ผลลัพธ์ที่ได้นั้นน่าทึ่ง:

โมเดล explorer (4B-30B) ผ่านขั้นตอนการฝึกฝนสองระยะ ระยะแรกคือ supervised fine-tuning เพื่อสอนวิธีการสำรวจ และระยะที่สองคือ task-grounded reinforcement learning เพื่อให้มั่นใจว่ามันจะค้นหาหลักฐานที่ช่วยให้ main agent แก้ปัญหาได้จริง ๆ

ด้วยการโยนภาระการค้นหาข้อมูลมหาศาล (haystack) ไปให้ subagent ทำให้ main agent สามารถรักษา context window ให้สะอาด เพื่อใช้สำหรับการใช้เหตุผล (reasoning) และการเขียนโค้ดจริง ๆ

แหล่งที่มา: https://dev.to/pueding/microsoft-fastcontext-a-repo-explorer-subagent-cuts-coding-agent-tokens-60-explorer-subagent-2lpk

ชุมชนแห่งการเรียนรู้เพิ่มเติม: https://t.me/GyaanSetuAi