Google เปิดตัว TranslateGemma โมเดลแปลภาษาอัจฉริยะ 55 ภาษา

18 ม.ค. 2569 | 10:57 น.
อัปเดตล่าสุด :18 ม.ค. 2569 | 11:09 น.

กูเกิลเปิดตัว TranslateGemma พัฒนาต่อยอดจาก Gemma 3 ชูจุดเด่นแปลภาษาแม่นยำกว่าเดิมแม้ใช้โมเดลขนาดเล็ก รองรับการทำงานแบบออฟไลน์บนมือถือและแปลข้อความจากรูปภาพได้ทันที

KEY

POINTS

  • กูเกิลเปิดตัว TranslateGemma โมเดลแปลภาษาแบบเปิด (Open Models) รุ่นใหม่ที่พัฒนาต่อยอดจาก Gemma 3 สำหรับการแปลภาษาโดยเฉพาะ
  • รองรับการแปล 55 ภาษา มีให้เลือก 3 ขนาดตามอุปกรณ์ใช้งาน (มือถือ, แล็ปท็อป, คลาวด์) และสามารถแปลข้อความจากรูปภาพได้
  • มีประสิทธิภาพสูง โดยโมเดลขนาดเล็กให้ความแม่นยำเทียบเท่าหรือดีกว่าโมเดลพื้นฐานที่มีขนาดใหญ่กว่า
  • เปิดให้นักพัฒนาและนักวิจัยดาวน์โหลดไปใช้งานได้ฟรี เพื่อสร้างแอปพลิเคชันที่สามารถรันบนเครื่องของผู้ใช้ได้โดยตรง (Local Deployment)

กูเกิล (Google) ประกาศเปิดตัว TranslateGemma ชุดโมเดลภาษาแบบเปิด (Open Models) รุ่นใหม่ล่าสุดที่ออกแบบมาเพื่อการแปลภาษาโดยเฉพาะ โดยพัฒนาต่อยอดจากพื้นฐานของโมเดล Gemma 3 เพื่อยกระดับประสิทธิภาพการแปลภาษาให้แม่นยำและเข้าถึงได้ง่ายในหลากหลายอุปกรณ์

Google เปิดตัว TranslateGemma โมเดลแปลภาษาอัจฉริยะ 55 ภาษา

เจาะลึก TranslateGemma พลังการแปลยุคใหม่

โมเดลชุดนี้ถูกฝึกฝนด้วยกระบวนการพิเศษที่ดึงเอา "ความชาญฉลาด" จากโมเดล Gemini รุ่นใหญ่มาถ่ายทอดลงในสถาปัตยกรรมแบบเปิด ทำให้ได้โมเดลที่มีขนาดเล็กลงแต่มีประสิทธิภาพการแปลที่สูงขึ้นอย่างก้าวกระโดด

 

TranslateGemma มีรายละเอียดที่น่าสนใจดังนี้:

ตัวเลือก 3 ขนาดตามการใช้งาน:

  •  ขนาด 4B (4 พันล้านพารามิเตอร์): ออกแบบมาเพื่อรันบนสมาร์ทโฟนและอุปกรณ์พกพา รองรับการแปลแบบออฟไลน์
  • ขนาด 12B (12 พันล้านพารามิเตอร์): เหมาะสำหรับใช้งานบนแล็ปท็อปทั่วไปหรือคอมพิวเตอร์ส่วนบุคคล
  • ขนาด 27B (27 พันล้านพารามิเตอร์): สำหรับการประมวลผลผ่านคลาวด์หรือเซิร์ฟเวอร์ที่ใช้ GPU เพียงตัวเดียว

ประสิทธิภาพที่เหนือกว่า: ผลการทดสอบ WMT24++ พบว่าโมเดลขนาด 12B สามารถแปลได้แม่นยำกว่าโมเดล Gemma 3 รุ่นพื้นฐานที่มีขนาดใหญ่ถึง 27B ขณะที่โมเดลขนาดเล็ก 4B ให้คุณภาพงานแปลเทียบเท่ากับรุ่น 12B เดิม

รองรับ 55 ภาษา: ครอบคลุมภาษาหลักทั่วโลกและภาษาที่มีทรัพยากรข้อมูลน้อย (Low-resource languages) รวมถึงมีการฝึกฝนเพิ่มเติมในคู่ภาษาอีกเกือบ 500 คู่ภาษา

 

ความสามารถด้าน Multimodal และการแปลจากภาพ

TranslateGemma ยังสืบทอดความสามารถในการเข้าใจรูปภาพจาก Gemma 3 ทำให้สามารถแปลข้อความที่ฝังอยู่ในรูปภาพ เช่น ป้ายบอกทาง เมนูอาหาร หรือเอกสาร ได้อย่างแม่นยำยิ่งขึ้น แม้จะเป็นการแปลจากภาพโดยตรงโดยไม่ต้องผ่านการพิมพ์ข้อความใหม่

เปิดให้นักพัฒนาใช้งานฟรี

กูเกิลเปิดให้เหล่านักพัฒนาและนักวิจัยสามารถดาวน์โหลดโมเดล Open Weights ไปใช้งานและพัฒนาต่อยอดได้ทันทีผ่านแพลตฟอร์มอย่าง Kaggle, Hugging Face และ Vertex AI บน Google Cloud เพื่อสนับสนุนการสร้างแอปพลิเคชันแปลภาษาที่มีประสิทธิภาพสูงแต่ใช้ทรัพยากรเครื่องต่ำ

การเปิดตัวครั้งนี้ถือเป็นก้าวสำคัญของกูเกิลในการรับมือกับการแข่งขันในตลาด AI หลังจากการเปิดตัว ChatGPT Translate ของ OpenAI โดยเน้นไปที่การสร้างโมเดลประสิทธิภาพสูงที่ทุกคนสามารถนำไปรันเองได้ในท้องถิ่น (Local Deployment) โดยไม่ต้องพึ่งพาเซิร์ฟเวอร์ขนาดใหญ่ตลอดเวลา