KEY
POINTS
กูเกิล (Google) ประกาศเปิดตัว TranslateGemma ชุดโมเดลภาษาแบบเปิด (Open Models) รุ่นใหม่ล่าสุดที่ออกแบบมาเพื่อการแปลภาษาโดยเฉพาะ โดยพัฒนาต่อยอดจากพื้นฐานของโมเดล Gemma 3 เพื่อยกระดับประสิทธิภาพการแปลภาษาให้แม่นยำและเข้าถึงได้ง่ายในหลากหลายอุปกรณ์
เจาะลึก TranslateGemma พลังการแปลยุคใหม่
โมเดลชุดนี้ถูกฝึกฝนด้วยกระบวนการพิเศษที่ดึงเอา "ความชาญฉลาด" จากโมเดล Gemini รุ่นใหญ่มาถ่ายทอดลงในสถาปัตยกรรมแบบเปิด ทำให้ได้โมเดลที่มีขนาดเล็กลงแต่มีประสิทธิภาพการแปลที่สูงขึ้นอย่างก้าวกระโดด
TranslateGemma มีรายละเอียดที่น่าสนใจดังนี้:
ตัวเลือก 3 ขนาดตามการใช้งาน:
ประสิทธิภาพที่เหนือกว่า: ผลการทดสอบ WMT24++ พบว่าโมเดลขนาด 12B สามารถแปลได้แม่นยำกว่าโมเดล Gemma 3 รุ่นพื้นฐานที่มีขนาดใหญ่ถึง 27B ขณะที่โมเดลขนาดเล็ก 4B ให้คุณภาพงานแปลเทียบเท่ากับรุ่น 12B เดิม
รองรับ 55 ภาษา: ครอบคลุมภาษาหลักทั่วโลกและภาษาที่มีทรัพยากรข้อมูลน้อย (Low-resource languages) รวมถึงมีการฝึกฝนเพิ่มเติมในคู่ภาษาอีกเกือบ 500 คู่ภาษา
ความสามารถด้าน Multimodal และการแปลจากภาพ
TranslateGemma ยังสืบทอดความสามารถในการเข้าใจรูปภาพจาก Gemma 3 ทำให้สามารถแปลข้อความที่ฝังอยู่ในรูปภาพ เช่น ป้ายบอกทาง เมนูอาหาร หรือเอกสาร ได้อย่างแม่นยำยิ่งขึ้น แม้จะเป็นการแปลจากภาพโดยตรงโดยไม่ต้องผ่านการพิมพ์ข้อความใหม่
เปิดให้นักพัฒนาใช้งานฟรี
กูเกิลเปิดให้เหล่านักพัฒนาและนักวิจัยสามารถดาวน์โหลดโมเดล Open Weights ไปใช้งานและพัฒนาต่อยอดได้ทันทีผ่านแพลตฟอร์มอย่าง Kaggle, Hugging Face และ Vertex AI บน Google Cloud เพื่อสนับสนุนการสร้างแอปพลิเคชันแปลภาษาที่มีประสิทธิภาพสูงแต่ใช้ทรัพยากรเครื่องต่ำ
การเปิดตัวครั้งนี้ถือเป็นก้าวสำคัญของกูเกิลในการรับมือกับการแข่งขันในตลาด AI หลังจากการเปิดตัว ChatGPT Translate ของ OpenAI โดยเน้นไปที่การสร้างโมเดลประสิทธิภาพสูงที่ทุกคนสามารถนำไปรันเองได้ในท้องถิ่น (Local Deployment) โดยไม่ต้องพึ่งพาเซิร์ฟเวอร์ขนาดใหญ่ตลอดเวลา