
เปิด DeepSeek-V4 ท้าชน GPT-5.5 ปลุกศึก AI โลกเดือดปรอทแตก
DeepSeek สตาร์ทอัพจีนเปิดตัวโมเดล AI ใหม่ภายในไม่กี่ชั่วโมงหลัง GPT-5.5 ของ OpenAI สะท้อนการแข่งขัน AI โลกที่เร่งตัวแรง ท่ามกลางเกมชิงเทคโนโลยีและโครงสร้างพื้นฐาน
KEY
POINTS
- DeepSeek สตาร์ทอัพ AI จากจีน เปิดตัวโมเดลเรือธง "DeepSeek-V4" หลัง OpenAI ประกาศ GPT-5.5 เพียงไม่กี่ชั่วโมง เพื่อท้าชนโดยตรงและสะท้อนการแข่งขันที่รุนแรงขึ้นในตลาด AI โลก
- โมเดลใหม่มี 2 เวอร์ชัน (Pro และ Flash) ชูจุดเด่นด้าน Context Window ขนาดใหญ่ถึง 1 ล้านโทเคน และมีความสามารถสูงด้านการให้เหตุผล โดยทำงานบนโครงสร้างพื้นฐานคอมพิวติ้งของจีนร่วมกับ Huawei
- แม้จะเสนอราคาที่แข่งขันได้ แต่เวอร์ชัน Pro ยังมีข้อจำกัดด้านกำลังการประมวลผล และปัจจุบันยังไม่รองรับความสามารถแบบมัลติโหมด (multimodal) ซึ่งอาจเป็นผลจากข้อจำกัดด้านทรัพยากร
DeepSeek สตาร์ทอัพด้านปัญญาประดิษฐ์จากเมืองหางโจว เปิดตัวพรีวิวโมเดลเรือธง “DeepSeek-V4” ในช่วงเที่ยงของวันเดียวกัน หลัง OpenAI เปิดตัว GPT-5.5 เพียงไม่กี่ชั่วโมง สะท้อนความร้อนแรงของการแข่งขันอุตสาหกรรม AI ระดับโลกที่เร่งตัวขึ้นอย่างชัดเจน
โมเดลดังกล่าวทำงานบนโครงสร้างพื้นฐานคอมพิวติ้งของจีน ผ่านความร่วมมือกับ Huawei Technologies และแพลตฟอร์ม Ascend สะท้อนความพยายามของจีนในการลดการพึ่งพาเทคโนโลยีชิปจากต่างประเทศ
DeepSeek ก้าวขึ้นสู่เวทีโลกตั้งแต่เดือนมกราคมปีที่แล้ว ด้วยโมเดลลักษณะเดียวกับ ChatGPT ที่ผสานความสามารถด้านการให้เหตุผลเข้ากับต้นทุนการดำเนินงานที่ต่ำลงอย่างมีนัยสำคัญ โดย Marc Andreessen นักลงทุนเวนเจอร์แคปปิตอลในซิลิคอนแวลลีย์ เคยนิยามปรากฏการณ์นี้ว่าเป็น “AI Sputnik moment”
DeepSeek-V4 เปิดให้ใช้งาน 2 เวอร์ชัน ได้แก่ Pro และ Flash สอดคล้องกับโหมด Expert และ Fast บนเว็บไซต์และแอปของบริษัท โดยเวอร์ชัน Pro มีพารามิเตอร์รวม 1.6 ล้านล้าน (1.6 trillion) ใช้งานจริง 4.9 หมื่นล้านพารามิเตอร์ และฝึกด้วยข้อมูล 33 ล้านล้านโทเคน ขณะที่เวอร์ชัน Flash มีพารามิเตอร์ 2.84 แสนล้าน ใช้งานจริง 1.3 หมื่นล้าน และใช้ข้อมูลฝึก 32 ล้านล้านโทเคน
โมเดลรองรับ Context Window สูงถึง 1 ล้านโทเคน และมีรายงานระบุว่า ทำผลงานได้ในระดับแนวหน้าในจีน และในกลุ่มโมเดลโอเพนซอร์ซ โดยเฉพาะด้านความสามารถเชิงเอเจนต์ (Agentic Capabilities) ความรู้รอบโลก และการให้เหตุผล
บริษัทระบุว่า Context Window ระดับ 1 ล้านโทเคน จะกลายเป็นมาตรฐานของบริการ DeepSeek ทั้งหมดในอนาคต พร้อมเปิดตัวกลไก Attention รูปแบบใหม่ที่ช่วยบีบอัดโทเคน และเมื่อทำงานร่วมกับเทคโนโลยี DeepSeek Sparse Attention จะช่วยลดการใช้ทรัพยากรคอมพิวต์และหน่วยความจำได้อย่างมีนัยสำคัญเมื่อเทียบกับวิธีแบบดั้งเดิม
ด้านราคา DeepSeek ระบุว่า V4-Pro มีต้นทุนอินพุต 1 หยวนต่อ 1 ล้านโทเคน (0.15 ดอลลาร์สหรัฐ หรือราว 4.88 บาท) และเอาต์พุต 12 หยวน (1.80 ดอลลาร์สหรัฐ หรือราว 58.5 บาท) ส่วน V4-Flash คิดค่าอินพุต 0.2 หยวน และเอาต์พุต 2 หยวนต่อ 1 ล้านโทเคน
อย่างไรก็ตาม บริษัทระบุว่าเวอร์ชัน Pro ยังมีข้อจำกัดด้านปริมาณการให้บริการ เนื่องจากข้อจำกัดของกำลังประมวลผลระดับสูง โดยคาดว่าราคาจะลดลงหลังการติดตั้ง Atlas 950 SuperPoD ซึ่งเป็นคลัสเตอร์คอมพิวต์ AI ประสิทธิภาพสูงแบบระบายความร้อนด้วยของเหลวบนสถาปัตยกรรม Ascend ของ Huawei Technologies ในวงกว้างช่วงครึ่งหลังของปี
ก่อนการเปิดตัวไม่นาน มีรายงานว่า DeepSeek ได้เริ่มการระดมทุนภายนอกรอบแรก โดยคาดว่าเงินทุนเพิ่มเติมจะช่วยให้บริษัทเพิ่มทรัพยากรคอมพิวติ้ง เร่งการพัฒนาโมเดล และเสนอค่าตอบแทนที่แข่งขันได้เพื่อรักษาบุคลากรชั้นนำ
ทั้งนี้ DeepSeek-V4 ยังไม่รวมเวอร์ชันมัลติโหมด (multimodal) ทำให้เกิดการคาดการณ์ว่า ข้อจำกัดด้านกำลังประมวลผลและเงินทุนอาจส่งผลให้การพัฒนาความสามารถดังกล่าวล่าช้า แม้ฟีเจอร์มัลติโหมดกำลังกลายเป็นมาตรฐานของผู้พัฒนาโมเดล AI ชั้นนำทั่วโลก
ที่มา .Yicai







