ทำไมผมถึงสร้าง doll

AI ประสิทธิภาพสูงเข้าถึงได้ง่ายในตอนนี้ แต่การเข้าถึงนั้นไม่ได้รับประกัน

ราคาเปลี่ยนแปลงได้ ข้อจำกัดการใช้งานเพิ่มขึ้น ผู้ให้บริการอาจปิดตัวลงหรือเปลี่ยนนโยบาย คุณอาจสูญเสียสภาพแวดล้อม AI ของคุณไป แม้ว่าเมื่อวานมันจะยังใช้งานได้ดีอยู่ก็ตาม

ปัญหานี้ไม่ใช่เรื่องของความเชื่อใจ แต่เป็นเรื่องของการควบคุม ความต่อเนื่องของ AI ของคุณขึ้นอยู่กับสิ่งที่คุณไม่ได้เป็นเจ้าของ

ผมเริ่มสร้าง doll มันคือระบบสร้างความต่อเนื่องของ AI ส่วนบุคคลแบบโอเพนซอร์ส (open-source)

doll ไม่ใช่โมเดลใหม่ มันไม่ได้มาแทนที่เครื่องมืออย่าง Ollama หรือ LM Studio เป้าหมายของมันคือการปกป้องสภาพแวดล้อม AI ส่วนบุคคลของคุณ คุณต้องการให้ข้อมูลของคุณยังคงใช้งานได้ แม้ว่าโมเดลหรือแอปพลิเคชันจะเปลี่ยนไปก็ตาม

คนส่วนใหญ่คิดว่าโมเดลคือศูนย์กลางของ AI แต่มันไม่ใช่ โมเดลเป็นเพียงกลไกการใช้เหตุผล (reasoning engine) เท่านั้น และคุณสามารถเปลี่ยนมันได้

แกนหลักที่แท้จริงคือสถานะ (state) ของคุณ ซึ่งรวมถึง:

  • ความจำระยะยาวและความชอบส่วนตัว
  • ประวัติการสนทนาและแหล่งที่มา
  • บันทึกการวิจัยและประวัติโครงการ
  • การอนุญาตและนโยบาย
  • บันทึกการสำรองข้อมูลและการย้ายข้อมูล

โมเดลใหม่อาจจะดีกว่า หรือโมเดลแบบ Local อาจจำเป็นเพื่อความเป็นส่วนตัว เมื่อคุณเปลี่ยนโมเดล คุณไม่ควรต้องสูญเสียประวัติการใช้งานของคุณไป

การประมวลผลแบบ Local นั้นดีต่อความเป็นส่วนตัวและเรื่องค่าใช้จ่าย แต่แอปแบบ Local ก็อาจทำให้เกิดการผูกขาด (lock-in) ได้เช่นกัน หากแอปหยุดทำงานหรือเปลี่ยนรูปแบบข้อมูล คุณก็จะสูญเสียข้อมูลของคุณไป

doll ไม่ได้พึ่งพาฟอร์แมตใดฟอร์แมตหนึ่งเพียงอย่างเดียว มันไม่ได้ใช้รูปแบบของ ChatGPT หรือ Ollama เป็นมาตรฐาน แต่จะใช้วิธีการแมป (map) ข้อมูลเข้าสู่รูปแบบที่มีการบันทึกไว้อย่างเป็นระบบ หากข้อมูลสูญหายระหว่างการนำเข้า doll จะแจ้งให้คุณทราบ

กฎนั้นง่ายมาก: Local-complete, cloud-optional

ระบบของคุณต้องทำงานได้โดยไม่ต้องใช้ API keys หรือการเชื่อมต่ออินเทอร์เน็ต โมเดลบน Cloud เป็นเพียงเครื่องมือเสริมเพื่อประสิทธิภาพที่ดีขึ้นเท่านั้น Cloud ไม่ควรเป็นแหล่งข้อมูลที่ถูกต้องที่สุด (source of truth) สำหรับตัวตน ไฟล์ หรือความจำของคุณ

ขณะนี้ doll อยู่ในขั้น pre-alpha มันยังไม่ใช่ผู้ช่วยประจำวัน ผมกำลังสร้างขอบเขต (boundaries) ก่อนที่จะเชื่อมต่อกับโมเดลต่างๆ

ผมกำลังมุ่งเน้นไปที่:

  • การแยกความจำออกจากข้อมูลความลับ (secrets)
  • การป้องกันข้อมูลความลับรั่วไหลใน logs
  • การแยกแยะข้อเท็จจริงออกจากข้ออนุมาน (inferences)
  • การบันทึกแหล่งที่มาของข้อมูล
  • การกำหนดให้ผู้ใช้ต้องยืนยันสำหรับงานที่มีความเสี่ยงสูง

ผมต้องการกำหนดว่าอะไรคือสิ่งที่ต้องคงอยู่เมื่อเทคโนโลยีเปลี่ยนแปลงไป

หากคุณเป็นนักพัฒนา ผมต้องการคำวิจารณ์ของคุณมากกว่าการสนับสนุน

  • สถานะของผู้ใช้สิ้นสุดลงตรงไหน และสถานะของโมเดลเริ่มต้นขึ้นตรงไหน?
  • ข้อมูลอะไรบ้างที่สูญหายไปเมื่อมีการย้ายไปมาระหว่างเครื่องมือ AI ต่างๆ?
  • ระบบจะสามารถกู้คืนกลับมาได้อย่างแท้จริงหรือไม่ หากเครื่องหลักหายไป?
  • doll จะกลายเป็นรูปแบบใหม่ของการติดหล่ม (lock-in) หรือไม่?

เว็บไซต์โครงการ: https://doll.badjoke-lab.com/

ซอร์สโค้ด: https://github.com/badjoke-lab/doll

บทความฉบับเต็ม: https://dev.to/badjoke-lab/why-im-building-doll-a-personal-ai-continuity-system-1a1c

ชุมชนแห่งการเรียนรู้ (ทางเลือก): https://t.me/GyaanSetuAi