KEY
POINTS
อาลีบาบา คลาวด์ ประกาศเปิดตัว Wan2.6 Series เทคโนโลยี AI ด้าน Visual Generation รุ่นล่าสุด ที่มุ่งเน้นการยกระดับการสร้างสรรค์วิดีโอและภาพให้มีความสมจริงในระดับมืออาชีพ โดยมีจุดเด่นที่ช่วยให้ผู้ใช้งานสามารถแทรกตัวเองเข้าไปเป็นตัวละครหลักในวิดีโอที่สร้างขึ้นด้วย AI ได้อย่างแนบเนียน ทั้งในด้านรูปลักษณ์และเสียง
เทคโนโลยีใหม่นี้ประกอบด้วยโมเดล Wan2.6-R2V ซึ่งเป็นโมเดลประเภท Reference-to-Video ตัวแรกของจีน ที่รองรับการอัปโหลดวิดีโอต้นแบบเพื่อใช้เป็นอ้างอิงด้านรูปลักษณ์และเสียง จากนั้นสามารถใช้คำสั่งข้อความ (Text Prompts) เพื่อสร้างฉากใหม่ที่มีตัวละครเดิมเป็นตัวดำเนินเรื่อง โดยยังคงเอกลักษณ์เฉพาะตัวไว้ได้อย่างครบถ้วน ไม่ว่าจะเป็นบุคคล สัตว์ หรือวัตถุ
สำหรับการพัฒนาใน Series นี้ ยังรวมถึงการอัปเกรดประสิทธิภาพโมเดลเดิมอีก 4 รูปแบบ ได้แก่
ขีดความสามารถที่เพิ่มขึ้นช่วยให้ AI สามารถเล่าเรื่องแบบ Multi-shot ที่มีความซับซ้อนและสื่ออารมณ์ได้ดีขึ้น รองรับการสนทนาที่มีตัวละครหลายตัวพร้อมกัน และสามารถสร้างวิดีโอที่มีความยาวสูงสุดได้ถึง 15 วินาที พร้อมทั้งมีการปรับปรุงระบบ Audio-visual Synchronization ให้ภาพและเสียงสอดคล้องกันอย่างสมจริง
ในส่วนของการสร้างภาพ Wan2.6 Series มีความสามารถด้านการใช้เหตุผลเชิงตรรกะขั้นสูง เพื่อสร้างผลลัพธ์ที่เป็นการผสมผสานระหว่างข้อความและภาพได้อย่างสอดคล้อง รองรับการเข้าใจคำสั่งภาษาจีนและภาษาอังกฤษที่มีรายละเอียดสูง ช่วยให้ครีเอเตอร์ควบคุมสไตล์ศิลปะและการสร้างภาพบุคคลได้แม่นยำยิ่งขึ้น
ปัจจุบันผู้ใช้งานสามารถเข้าถึงโมเดลเหล่านี้ได้ผ่าน Model Studio ซึ่งเป็นแพลตฟอร์มพัฒนา AI ของอาลีบาบา คลาวด์ รวมถึงเว็บไซต์อย่างเป็นทางการของ Wan และมีการรวมฟีเจอร์เข้ากับ Qwen App ซึ่งเป็นแอปพลิเคชัน AI หลักของกลุ่มอาลีบาบา โดยตระกูลโมเดล Qwen นั้นได้เปิดตัวครั้งแรกในปี 2566 และมีการพัฒนาอย่างต่อเนื่องเพื่อให้บริการแก่นักพัฒนาทั่วโลก