วิธีที่ผมสร้างบันไดคุณภาพเนื้อหาแบบสามระดับ (Three-Tier Content Quality Ladder)

การขยายขนาดเว็บไซต์แบบ programmatic นั้นเป็นเรื่องยาก หากคุณพึ่งพาเพียง AI ในการเขียนเนื้อหา เว็บไซต์ของคุณจะพังทันทีเมื่อ API ขัดข้อง

ผมได้เปิดตัวเว็บไซต์ไดเรกทอรี 3 แห่ง ได้แก่ Top AI Tools, Find Games Like และ Open Alternative To โดยผมใช้บันไดคุณภาพเนื้อหาแบบสามระดับเพื่อให้แน่ใจว่าเว็บไซต์จะแสดงข้อมูลได้เสมอ แม้จะไม่มีการเชื่อมต่อกับ AI ก็ตาม

ระบบนี้ใช้คอลัมน์เดียวในฐานข้อมูลที่ชื่อว่า model_used เพื่อติดตามระดับคุณภาพ 3 ระดับ:

  • seeded-from-json: ข้อมูลพื้นฐานจากไฟล์ มีโครงสร้างแต่เนื้อหาบางเบา
  • fallback-template: เทมเพลตมาตรฐานที่จะใช้หาก AI ทำงานล้มเหลวหรือไม่มี API key ข้อมูลจะถูกต้องตามหลักการแต่ขาดความเป็นธรรมชาติ
  • claude-haiku-4-5: สถานะเป้าหมาย ซึ่งจะให้บทสรุปเชิงบรรณาธิการที่มีคุณภาพสูงและรายละเอียดที่ลึกซึ้ง

ผมใช้ SQL query เฉพาะเพื่อจัดการการอัปเกรด โดยสคริปต์จะมองหาสิ่งต่อไปนี้:

  1. รายการใหม่ที่ยังไม่มีเนื้อหา
  2. รายการที่มีอยู่แล้วซึ่งมีเพียงเนื้อหาแบบ seeded หรือ fallback ที่มีคุณภาพต่ำ

สคริปต์จะจัดลำดับสิ่งเหล่านี้ตามความนิยม โดยจะอัปเกรดหน้าที่มียอดเข้าชมสูงสุดก่อน เพื่อให้แน่ใจว่าหน้าที่มีทราฟฟิกสูงที่สุดจะได้รับเนื้อหาที่ดีที่สุดในทันที

กระบวนการนี้เป็นแบบอัตโนมัติเต็มรูปแบบและเป็น idempotent ผมใช้รูปแบบการทำ upsert หากการอัปเกรดสำเร็จ ฐานข้อมูลจะเขียนทับเนื้อหา fallback เดิมด้วยเนื้อหา AI ใหม่ และคอลัมน์ model_used จะอัปเดตตัวเอง

ผมยังใช้ Anthropic prompt caching ด้วย ซึ่งช่วยประหยัดเงินและโทเคนได้มาก เนื่องจาก system prompt ของผมเหมือนกันในทุกรายการ การเรียกใช้งานครั้งแรกจะเป็นการเตรียม cache ไว้ และการเรียกใช้งานอีก 99 ครั้งถัดไปในชุดข้อมูลจะอ่านจาก cache นั้นด้วยต้นทุนที่ต่ำกว่า

ทางเลือกสำคัญด้านสถาปัตยกรรม:

  • การจัดการข้อผิดพลาด (Error handling): หาก Claude ทำงานล้มเหลว ระบบจะไม่พัง แต่จะเขียน fallback template ลงไปแทนแล้วข้ามไปยังรายการถัดไป
  • ความปลอดภัยด้าน SEO: หากหน้าใดไม่มีเนื้อหาที่มีประโยชน์เลย ผมจะใช้แท็ก noindex เพื่อป้องกันไม่ให้ Google ทำการดัชนี (index) หน้าที่ว่างเปล่า
  • การสร้างแบบ Static (Static builds): ผมส่งออกฐานข้อมูลเป็นไฟล์ JSON สำหรับ Astro ซึ่งหมายความว่าเว็บไซต์ของผมจะยังคงออนไลน์อยู่ได้แม้ว่าฐานข้อมูลหรือ AI API จะขัดข้องก็ตาม

การตั้งค่านี้ช่วยให้ผมสร้างเว็บไซต์ได้อย่างรวดเร็วโดยไม่เสี่ยงต่อความเสถียรของไซต์

แหล่งที่มา: https://dev.to/morinaga/how-i-built-a-three-tier-content-quality-ladder-for-programmatic-directory-etl-483