อาลีบาบาเปิดตัว Wan2.6 AI สร้างวิดีโอสมจริงระดับภาพยนตร์

17 ธ.ค. 2568 | 10:39 น.
อัปเดตล่าสุด :17 ธ.ค. 2568 | 10:47 น.

อาลีบาบาเปิดตัว Wan2.6 Series โมเดล AI สร้างวิดีโออัจฉริยะ ดันคุณภาพระดับภาพยนตร์สู่มือครีเอเตอร์ ช่วยผู้ใช้งานสามารถแทรกตัวเองเข้าไปเป็นตัวละครหลักในวิดีโอที่สร้างขึ้นด้วย AI ได้อย่างแนบเนียน ทั้งในด้านรูปลักษณ์และเสียง

KEY

POINTS

  • อาลีบาบา คลาวด์ เปิดตัว Wan2.6 Series เทคโนโลยี AI สำหรับสร้างวิดีโอและภาพถ่ายที่สมจริงระดับมืออาชีพ
  • มีจุดเด่นคือโมเดล Wan2.6-R2V ที่ให้ผู้ใช้สามารถนำวิดีโอต้นแบบมาสร้างเป็นตัวละครหลักในฉากใหม่ๆ ผ่านคำสั่งข้อความ โดยยังคงรูปลักษณ์และเสียงเดิมไว้
  • เพิ่มขีดความสามารถในการสร้างวิดีโอที่ซับซ้อน เล่าเรื่องได้หลายฉาก (Multi-shot) ยาวสูงสุด 15 วินาที และปรับปรุงการซิงค์ภาพและเสียงให้สมจริงยิ่งขึ้น

อาลีบาบา คลาวด์ ประกาศเปิดตัว Wan2.6 Series เทคโนโลยี AI ด้าน Visual Generation รุ่นล่าสุด ที่มุ่งเน้นการยกระดับการสร้างสรรค์วิดีโอและภาพให้มีความสมจริงในระดับมืออาชีพ โดยมีจุดเด่นที่ช่วยให้ผู้ใช้งานสามารถแทรกตัวเองเข้าไปเป็นตัวละครหลักในวิดีโอที่สร้างขึ้นด้วย AI ได้อย่างแนบเนียน ทั้งในด้านรูปลักษณ์และเสียง

เทคโนโลยีใหม่นี้ประกอบด้วยโมเดล Wan2.6-R2V ซึ่งเป็นโมเดลประเภท Reference-to-Video ตัวแรกของจีน ที่รองรับการอัปโหลดวิดีโอต้นแบบเพื่อใช้เป็นอ้างอิงด้านรูปลักษณ์และเสียง จากนั้นสามารถใช้คำสั่งข้อความ (Text Prompts) เพื่อสร้างฉากใหม่ที่มีตัวละครเดิมเป็นตัวดำเนินเรื่อง โดยยังคงเอกลักษณ์เฉพาะตัวไว้ได้อย่างครบถ้วน ไม่ว่าจะเป็นบุคคล สัตว์ หรือวัตถุ

อาลีบาบาเปิดตัว Wan2.6 AI สร้างวิดีโอสมจริงระดับภาพยนตร์ ซึ่งคาดว่าจะเข้ามามีบทบาทสำคัญในการผลิตคอนเทนต์ประเภทละครสั้นและงานวิดีโอที่ต้องการความรวดเร็ว

สำหรับการพัฒนาใน Series นี้ ยังรวมถึงการอัปเกรดประสิทธิภาพโมเดลเดิมอีก 4 รูปแบบ ได้แก่

  • Wan2.6-T2V: โมเดลแปลงข้อความเป็นวิดีโอ
  • Wan2.6-I2V: โมเดลแปลงภาพเป็นวิดีโอ
  • Wan2.6-image และ Wan2.6-T2I: โมเดลสำหรับการสร้างสรรค์ภาพ

อาลีบาบาเปิดตัว Wan2.6 AI สร้างวิดีโอสมจริงระดับภาพยนตร์

ขีดความสามารถที่เพิ่มขึ้นช่วยให้ AI สามารถเล่าเรื่องแบบ Multi-shot ที่มีความซับซ้อนและสื่ออารมณ์ได้ดีขึ้น รองรับการสนทนาที่มีตัวละครหลายตัวพร้อมกัน และสามารถสร้างวิดีโอที่มีความยาวสูงสุดได้ถึง 15 วินาที พร้อมทั้งมีการปรับปรุงระบบ Audio-visual Synchronization ให้ภาพและเสียงสอดคล้องกันอย่างสมจริง

ในส่วนของการสร้างภาพ Wan2.6 Series มีความสามารถด้านการใช้เหตุผลเชิงตรรกะขั้นสูง เพื่อสร้างผลลัพธ์ที่เป็นการผสมผสานระหว่างข้อความและภาพได้อย่างสอดคล้อง รองรับการเข้าใจคำสั่งภาษาจีนและภาษาอังกฤษที่มีรายละเอียดสูง ช่วยให้ครีเอเตอร์ควบคุมสไตล์ศิลปะและการสร้างภาพบุคคลได้แม่นยำยิ่งขึ้น

ปัจจุบันผู้ใช้งานสามารถเข้าถึงโมเดลเหล่านี้ได้ผ่าน Model Studio ซึ่งเป็นแพลตฟอร์มพัฒนา AI ของอาลีบาบา คลาวด์ รวมถึงเว็บไซต์อย่างเป็นทางการของ Wan และมีการรวมฟีเจอร์เข้ากับ Qwen App ซึ่งเป็นแอปพลิเคชัน AI หลักของกลุ่มอาลีบาบา โดยตระกูลโมเดล Qwen นั้นได้เปิดตัวครั้งแรกในปี 2566 และมีการพัฒนาอย่างต่อเนื่องเพื่อให้บริการแก่นักพัฒนาทั่วโลก