ทำไมผมถึงสร้าง doll
AI ประสิทธิภาพสูงเข้าถึงได้ง่ายในตอนนี้ แต่การเข้าถึงนั้นไม่ได้รับประกัน
ราคาเปลี่ยนแปลงได้ ข้อจำกัดการใช้งานเพิ่มขึ้น ผู้ให้บริการอาจปิดตัวลงหรือเปลี่ยนนโยบาย คุณอาจสูญเสียสภาพแวดล้อม AI ของคุณไป แม้ว่าเมื่อวานมันจะยังใช้งานได้ดีอยู่ก็ตาม
ปัญหานี้ไม่ใช่เรื่องของความเชื่อใจ แต่เป็นเรื่องของการควบคุม ความต่อเนื่องของ AI ของคุณขึ้นอยู่กับสิ่งที่คุณไม่ได้เป็นเจ้าของ
ผมเริ่มสร้าง doll มันคือระบบสร้างความต่อเนื่องของ AI ส่วนบุคคลแบบโอเพนซอร์ส (open-source)
doll ไม่ใช่โมเดลใหม่ มันไม่ได้มาแทนที่เครื่องมืออย่าง Ollama หรือ LM Studio เป้าหมายของมันคือการปกป้องสภาพแวดล้อม AI ส่วนบุคคลของคุณ คุณต้องการให้ข้อมูลของคุณยังคงใช้งานได้ แม้ว่าโมเดลหรือแอปพลิเคชันจะเปลี่ยนไปก็ตาม
คนส่วนใหญ่คิดว่าโมเดลคือศูนย์กลางของ AI แต่มันไม่ใช่ โมเดลเป็นเพียงกลไกการใช้เหตุผล (reasoning engine) เท่านั้น และคุณสามารถเปลี่ยนมันได้
แกนหลักที่แท้จริงคือสถานะ (state) ของคุณ ซึ่งรวมถึง:
- ความจำระยะยาวและความชอบส่วนตัว
- ประวัติการสนทนาและแหล่งที่มา
- บันทึกการวิจัยและประวัติโครงการ
- การอนุญาตและนโยบาย
- บันทึกการสำรองข้อมูลและการย้ายข้อมูล
โมเดลใหม่อาจจะดีกว่า หรือโมเดลแบบ Local อาจจำเป็นเพื่อความเป็นส่วนตัว เมื่อคุณเปลี่ยนโมเดล คุณไม่ควรต้องสูญเสียประวัติการใช้งานของคุณไป
การประมวลผลแบบ Local นั้นดีต่อความเป็นส่วนตัวและเรื่องค่าใช้จ่าย แต่แอปแบบ Local ก็อาจทำให้เกิดการผูกขาด (lock-in) ได้เช่นกัน หากแอปหยุดทำงานหรือเปลี่ยนรูปแบบข้อมูล คุณก็จะสูญเสียข้อมูลของคุณไป
doll ไม่ได้พึ่งพาฟอร์แมตใดฟอร์แมตหนึ่งเพียงอย่างเดียว มันไม่ได้ใช้รูปแบบของ ChatGPT หรือ Ollama เป็นมาตรฐาน แต่จะใช้วิธีการแมป (map) ข้อมูลเข้าสู่รูปแบบที่มีการบันทึกไว้อย่างเป็นระบบ หากข้อมูลสูญหายระหว่างการนำเข้า doll จะแจ้งให้คุณทราบ
กฎนั้นง่ายมาก: Local-complete, cloud-optional
ระบบของคุณต้องทำงานได้โดยไม่ต้องใช้ API keys หรือการเชื่อมต่ออินเทอร์เน็ต โมเดลบน Cloud เป็นเพียงเครื่องมือเสริมเพื่อประสิทธิภาพที่ดีขึ้นเท่านั้น Cloud ไม่ควรเป็นแหล่งข้อมูลที่ถูกต้องที่สุด (source of truth) สำหรับตัวตน ไฟล์ หรือความจำของคุณ
ขณะนี้ doll อยู่ในขั้น pre-alpha มันยังไม่ใช่ผู้ช่วยประจำวัน ผมกำลังสร้างขอบเขต (boundaries) ก่อนที่จะเชื่อมต่อกับโมเดลต่างๆ
ผมกำลังมุ่งเน้นไปที่:
- การแยกความจำออกจากข้อมูลความลับ (secrets)
- การป้องกันข้อมูลความลับรั่วไหลใน logs
- การแยกแยะข้อเท็จจริงออกจากข้ออนุมาน (inferences)
- การบันทึกแหล่งที่มาของข้อมูล
- การกำหนดให้ผู้ใช้ต้องยืนยันสำหรับงานที่มีความเสี่ยงสูง
ผมต้องการกำหนดว่าอะไรคือสิ่งที่ต้องคงอยู่เมื่อเทคโนโลยีเปลี่ยนแปลงไป
หากคุณเป็นนักพัฒนา ผมต้องการคำวิจารณ์ของคุณมากกว่าการสนับสนุน
- สถานะของผู้ใช้สิ้นสุดลงตรงไหน และสถานะของโมเดลเริ่มต้นขึ้นตรงไหน?
- ข้อมูลอะไรบ้างที่สูญหายไปเมื่อมีการย้ายไปมาระหว่างเครื่องมือ AI ต่างๆ?
- ระบบจะสามารถกู้คืนกลับมาได้อย่างแท้จริงหรือไม่ หากเครื่องหลักหายไป?
- doll จะกลายเป็นรูปแบบใหม่ของการติดหล่ม (lock-in) หรือไม่?
เว็บไซต์โครงการ: https://doll.badjoke-lab.com/
ซอร์สโค้ด: https://github.com/badjoke-lab/doll
บทความฉบับเต็ม: https://dev.to/badjoke-lab/why-im-building-doll-a-personal-ai-continuity-system-1a1c
ชุมชนแห่งการเรียนรู้ (ทางเลือก): https://t.me/GyaanSetuAi