ByteDance เปิดตัว Seedance 2.5: ยุคใหม่ของวิดีโอ AI ความยาวต่อเนื่อง

ByteDance กำลังก้าวข้ามขีดจำกัดของสื่อเชิงสร้างสรรค์ (generative media) ด้วยการประกาศเปิดตัว Seedance 2.5 ซึ่งเป็นโมเดลที่ก้าวล้ำความสามารถในการผลิตคลิปวิดีโอ AI ที่มีความยาวมากขึ้น โมเดลใหม่นี้เปิดตัวในงานประชุม Volcano Engine FORCE และถือเป็นการก้าวกระโดดครั้งสำคัญในด้านความต่อเนื่องของเวลา (temporal consistency) และการควบคุมเชิงสร้างสรรค์สำหรับครีเอเตอร์มืออาชีพ

ทลายกำแพง 30 วินาที

ความสำเร็จที่สำคัญที่สุดของ Seedance 2.5 คือความสามารถในการสร้างคลิปวิดีโอเดี่ยวที่มีความยาวสูงสุดถึง 30 วินาทีในการประมวลผลเพียงครั้งเดียว (single pass) ซึ่งแตกต่างจากโมเดลวิดีโอ AI รุ่นก่อนๆ ที่ต้องนำคลิปสั้นๆ หลายคลิปมา "เย็บต่อกัน" (stitching)—ซึ่งเป็นกระบวนการที่มักทำให้เกิดอาการภาพกระพริบหรือความผิดพลาดด้านความต่อเนื่อง—แต่ Seedance 2.5 สามารถจัดการการเปลี่ยนผ่านที่ซับซ้อนได้โดยตรง (natively) โมเดลนี้สามารถดำเนินการเปลี่ยนฉากและปรับจังหวะ (tempo) ตามความต้องการได้ภายในขั้นตอนการสร้างเพียงครั้งเดียว เพื่อให้มั่นใจว่าจะได้รับประสบการณ์ทางภาพยนตร์ที่ลื่นไหล

เพื่อเพิ่มความแม่นยำในการสร้างสรรค์ Seedance 2.5 รองรับอินพุตเพิ่มเติมพร้อมกันได้สูงสุดถึง 50 รายการ ช่วยให้ผู้ใช้สามารถป้อนรูปภาพอ้างอิง ไฟล์เสียงเฉพาะเจาะจง และข้อมูลแบบ multimodal อื่นๆ ให้กับโมเดลได้ สำหรับผู้สร้างภาพยนตร์และบริษัทโปรดักชัน ความสามารถนี้มีความสำคัญอย่างยิ่งในการกำกับฉากที่มีตัวละครหลายตัวหรือมีข้อกำหนดด้านสภาพแวดล้อมที่เฉพาะเจาะจง เนื่องจากมันให้การควบคุมที่ละเอียด (granular control) ในระดับที่ไม่เคยเห็นมาก่อนใน AI เชิงสร้างสรรค์ระดับผู้บริโภคทั่วไป

การยกระดับความสมจริงของภาพและการแก้ไขหลังการสร้าง

นอกเหนือจากระยะเวลาที่ยาวขึ้นแล้ว ByteDance ยังกำลังอัปเกรดมาตรฐานด้านภาพ โดยโมเดล Seedance 2.0 ที่มีอยู่เดิม ตอนนี้รองรับความละเอียด 4K แบบ native พร้อมความลึกสี 10-bit ซึ่งให้ช่วงไดนามิกสูง (high dynamic range) ตามที่จำเป็นสำหรับเวิร์กโฟลว์การแพร่ภาพกระจายเสียงและภาพยนตร์ระดับมืออาชีพ

นอกจากนี้ ByteDance ยังได้นำเสนอความสามารถในการแก้ไขหลังการสร้าง (post-generation editing) ที่ซับซ้อน ผู้ใช้สามารถปรับเปลี่ยนองค์ประกอบต่างๆ ภายในวิดีโอที่สร้างขึ้นได้ โดยที่ยังคงสไตล์ภาพและความสวยงามดั้งเดิมเอาไว้ สิ่งนี้ช่วยแก้ปัญหาใหญ่ที่สุดอย่างหนึ่งในการผลิตวิดีโอด้วย AI นั่นคือการไม่สามารถแก้ไขข้อผิดพลาดเล็กๆ น้อยๆ ได้โดยไม่ต้องสร้างลำดับภาพใหม่ทั้งหมด ซึ่งมักจะทำให้เสีย "ลุค" หรือลักษณะภาพดั้งเดิมไป

ระบบนิเวศ Multimodal ที่ครอบคลุม

การประกาศเปิดตัว Seedance เป็นส่วนหนึ่งของการเปิดตัวโมเดล AI ใหม่ 5 โมเดลผ่าน Volcano Engine ซึ่งเป็นธุรกิจคลาวด์สำหรับองค์กรของ ByteDance ระบบนิเวศนี้ได้รับการออกแบบมาเพื่อมอบชุดเครื่องมือแบบ full-stack สำหรับนักพัฒนาและธุรกิจต่างๆ:

  • Doubao 2.1 Pro: โมเดลภาษาประสิทธิภาพสูงที่มีรายงานว่ามีต้นทุนต่ำกว่า Claude Opus 4.6 ประมาณ 80% ซึ่งทำให้ ByteDance กลายเป็นคู่แข่งสำคัญในตลาด LLM ที่เน้นความคุ้มค่าด้านราคา
  • Seedream 5.0 Pro: โมเดลสร้างภาพขั้นสูงสำหรับสินทรัพย์ภาพที่มีความสมจริงสูง
  • Seed-Audio 1.0: โมเดลเสียงโดยเฉพาะเพื่อเสริมการทำงานร่วมกับวิดีโอและข้อความ

ด้วยการรวมโมเดลเหล่านี้เข้าด้วยกัน ByteDance ไม่ได้เพียงแค่ปล่อยเครื่องมือเพียงชิ้นเดียวออกมา แต่เป็นการสร้างเครื่องยนต์ multimodal ที่สอดประสานกัน ซึ่งออกแบบมาเพื่อขับเคลื่อนการสร้างคอนเทนต์อัตโนมัติในยุคถัดไป

สรุปประเด็นสำคัญ

  • ความต่อเนื่องที่ยาวขึ้น: Seedance 2.5 ทลายกำแพง 30 วินาที โดยสามารถสร้างวิดีโอความยาวต่อเนื่องพร้อมการเปลี่ยนฉากแบบ native โดยไม่จำเป็นต้องนำมาเย็บต่อกันภายหลัง
  • การควบคุมแบบ Multimodal: โมเดลรองรับอินพุตพร้อมกันได้สูงสุด 50 รายการ รวมถึงรูปภาพและเสียง ช่วยให้สามารถจัดการตัวละครและฉากที่ซับซ้อนได้
  • การขยายตัวในระดับองค์กร: ByteDance กำลังแข่งขันอย่างดุเดือดทั้งในด้านราคาและประสิทธิภาพ โดยมี Doubao 2.1 Pro LLM ที่ให้ความได้เปรียบด้านต้นทุนอย่างมากเมื่อเทียบกับผู้นำในอุตสาหกรรมอย่าง Anthropic