𝗪𝗵𝗮𝘁 𝗔𝗿𝗲 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀?

ครั้งหนึ่งผมเคยขอให้ ChatGPT วางแผนการเดินทางไปอิสตันบูล มันให้แผนการเดินทางที่ยอดเยี่ยมมาก แต่ไม่สามารถจองเที่ยวบินได้ ไม่สามารถเช็คราคาโรงแรมได้ และไม่สามารถส่งอีเมลได้

โมเดลนั้นฉลาด แต่ไม่มีมือ มันสามารถคิดได้ แต่ไม่สามารถลงมือทำได้

AI agent คือคำตอบของปัญหานี้

LLM (Large Language Models) มาตรฐานทำงานเหมือนผู้ช่วยที่รอบรู้ คุณส่ง prompt ไป แล้วโมเดลก็จะส่งคำตอบกลับมา นั่นคือการสื่อสารแบบรอบเดียวจบ โมเดลไม่สามารถท่องเว็บ เช็คปฏิทินของคุณ หรือดำเนินการใดๆ ในโลกแห่งความเป็นจริงได้

AI agent นั้นแตกต่างออกไป Agent จะใช้ language model เพื่อตัดสินใจว่าจะใช้เครื่องมือต่างๆ อย่างไรเพื่อให้บรรลุเป้าหมาย

Agent สามารถ:

  • ค้นหาข้อมูลบนเว็บ
  • รันโค้ด
  • ค้นหาข้อมูลในฐานข้อมูล (Query a database)
  • ส่งอีเมล
  • ใช้ external APIs

ความแตกต่างที่สำคัญคือความเป็นอิสระ (autonomy) คุณแค่กำหนดเป้าหมายให้ agent แล้วมันจะคิดหาวิธีการทำงานในแต่ละขั้นตอนด้วยตัวเอง

การเปรียบเทียบ: • Regular LLM: ตอบคำถาม, ตอบกลับครั้งเดียว, ไม่มีเครื่องมือ, ทำงานเชิงรับ (reactive) • AI Agent: ลงมือทำ, มีการใช้เหตุผลหลายขั้นตอน, ใช้เครื่องมือได้, ขับเคลื่อนด้วยเป้าหมาย (goal-driven)

Agent ส่วนใหญ่ใช้รูปแบบที่เรียกว่า ReAct (Reason and Act) ซึ่งทำงานตามลูปง่ายๆ ดังนี้:

  1. Thought: ฉันต้องทำอะไรต่อไป?
  2. Action: ใช้เครื่องมือ
  3. Observe: ดูผลลัพธ์ที่ได้
  4. Repeat: ทำต่อไปเรื่อยๆ จนกว่าจะบรรลุเป้าหมาย

การสร้างลูปเหล่านี้เป็นเรื่องยาก คุณต้องจัดการกับข้อผิดพลาด บริหารจัดการหน่วยความจำ (memory) และเชื่อมต่อเครื่องมือต่างๆ เข้าด้วยกัน

นี่คือเหตุผลที่ต้องมี framework อย่าง LangChain โดย LangChain จะทำหน้าที่เป็นเหมือนระบบโครงสร้างพื้นฐาน (plumbing) ที่เตรียมเครื่องมือสำเร็จรูป หน่วยความจำ และวิธีการเชื่อมต่อโมเดลเข้ากับโลกแห่งความเป็นจริงไว้ให้คุณ

หาก workflow ของคุณมีความซับซ้อน คุณควรใช้ LangGraph ซึ่ง LangGraph จะช่วยให้คุณสร้าง agent ที่สามารถแยกออกเป็นเส้นทางต่างๆ ทำงานหลายอย่างพร้อมกัน (parallel) หรือย้อนกลับไปทำขั้นตอนก่อนหน้าได้

สรุป:

  • LLM ตอบสนองต่อข้อความ
  • Agent ใช้เครื่องมือเพื่อทำงานให้สำเร็จ
  • ลูป ReAct คือตัวขับเคลื่อนตรรกะของ agent
  • LangChain จัดการการเชื่อมต่อระหว่างโมเดลและเครื่องมือ
  • LangGraph จัดการ workflow ที่ซับซ้อนและมีการแยกสาขา

ในโพสต์หน้า ผมจะแสดงวิธีการตั้งค่า environment และการรัน agent ตัวแรกของคุณ

Source: https://dev.to/ikram_khan/what-are-ai-agents-a-plain-english-introduction-56nd

Optional learning community: https://t.me/GyaanSetuAi