𝗟𝗟𝗠𝘀 𝘃𝘀 𝗚𝗲𝗻𝗲𝗿𝗮𝘁𝗶𝘃𝗲 𝗔𝗜
Generative AI เป็นคำศัพท์ที่กว้างมาก ส่วน LLM เป็นโมเดลประเภทเฉพาะเจาะจงที่อยู่ในกลุ่มนั้น คุณจำเป็นต้องเข้าใจความแตกต่างทางเทคนิคเพื่อสร้างระบบที่มีประสิทธิภาพดียิ่งขึ้น
LLM ใช้ Transformers ในการทำนาย token ถัดไป โดยทำงานผ่านกระบวนการแบบ autoregressive
การทำงานของ LLM:
- โมเดลจะรับ prompt เข้ามา
- แปลงข้อความเป็น tokens
- คำนวณความน่าจะเป็นของ token ถัดไป
- ทำซ้ำลูปนี้เพื่อสร้างประโยค
Diffusion models ทำงานแตกต่างออกไป โดยการสร้างรูปภาพด้วยการย้อนกระบวนการ noise
การทำงานของ Diffusion model:
- ระบบจะเริ่มจาก random noise
- ค่อยๆ ลบ noise ออกทีละขั้นตอน
- ทำตามรูปแบบเพื่อเผยให้เห็นรูปภาพ
- ใช้ prompt เพื่อนำทางการ denoising
การเปรียบเทียบโดยสรุป: • LLM: ใช้ autoregressive Transformers ผลลัพธ์คือ text tokens • Diffusion: ใช้ iterative denoising ผลลัพธ์คือ pixels • GAN: ใช้ adversarial training ผลลัพธ์คือ synthetic data
ขอบเขตระหว่างโมเดลเหล่านี้กำลังเปลี่ยนแปลงไป ระบบสมัยใหม่ส่วนใหญ่ในปัจจุบันใช้ Transformer เป็น backbone สถาปัตยกรรมกำลังกลายเป็นแบบ compositional ซึ่งหมายความว่าโมเดลประเภทต่างๆ จะทำงานร่วมกันในระบบเดียว
แหล่งที่มา: https://dev.to/aljen_007/llms-vs-generative-ai-7gc
