KEY
POINTS
สถาบันข้อมูลขนาดใหญ่ (องค์การมหาชน) หรือ BDI โดย ศ. ดร.ธีรณี อจลากุล ผู้อำนวยการสถาบันข้อมูลขนาดใหญ่ พร้อมด้วย นายฉาย บุนนาค ประธานกรรมการบริหารและประธานเจ้าหน้าที่บริหาร บริษัท เนชั่น กรุ๊ป (ไทยแลนด์) จำกัด (มหาชน) หรือ NATION GROUP ร่วมลงนามบันทึกข้อตกลงความร่วมมือ (MOU) โครงการสนับสนุนการพัฒนาโครงสร้างพื้นฐานปัญญาประดิษฐ์สำหรับภาษาไทย (ThaiLLM) โดยมี ดร.สุนทรีย์ ส่งเสริม รองผู้อำนวยการสถาบันข้อมูลขนาดใหญ่ (BDI) และ นางวรางคณา กัลยาณประดิษฐ ที่ปรึกษาประธานเจ้าหน้าที่บริหาร เนชั่น กรุ๊ป พร้อมด้วยคณะผู้บริหารทั้งสองหน่วยงาน เข้าร่วมเป็นสักขีพยาน ณ อาคาร เนชั่น ทาวเวอร์
ศ. ดร.ธีรณี อจลากุล ผู้อำนวยการสถาบันข้อมูลขนาดใหญ่ กล่าวว่า ปัจจุบันเทคโนโลยีปัญญาประดิษฐ์ หรือ AI กลายเป็นส่วนหนึ่งในชีวิตของคนไทย แต่กลับพบว่า AI ส่วนใหญ่ถูกฝึกจากข้อมูลภาษาอังกฤษจำนวนมหาศาล โดยมีสัดส่วนมากกว่า 40% ของข้อมูลทั้งหมด ขณะที่ข้อมูลภาษาไทยมีสัดส่วนเพียง 0.4% เท่านั้น ซึ่งถือว่ามีพื้นที่น้อยมาก สะท้อนให้เห็นว่าประเทศไทยขาด “โมเดลภาษา” ที่เข้าใจบริบทของคนไทยอย่างแท้จริง การพัฒนา ThaiLLM ไม่ได้เป็นเพียงการสร้างโมเดลภาษา แต่เป็นภารกิจของประเทศในการวาง “โครงสร้างพื้นฐานปัญญาประดิษฐ์ด้านภาษา” เพื่อให้ประเทศไทยสามารถพัฒนาและใช้งาน AI ได้อย่างสอดคล้องกับบริบทของตนเอง โดย BDI ทำหน้าที่เป็นหน่วยงานกลาง
บูรณาการร่วมมือวางมาตรฐานการพัฒนา AI ภาษาไทย
ความร่วมมือกับเครือเนชั่นในครั้งนี้ นับเป็นครั้งแรกที่ BDI ได้ร่วมมือกับภาคสื่อมวลชนอย่างเป็นทางการ เพื่อยกระดับการพัฒนาโครงสร้างพื้นฐานปัญญาประดิษฐ์สำหรับภาษาไทย (ThaiLLM) โดย BDI จะได้รับการสนับสนุนข้อมูลภาษาไทยจากภาคสื่อมวลชน ซึ่งครอบคลุมเนื้อหาข่าว บทวิเคราะห์ และข้อมูลเชิงบริบทที่สะท้อนเหตุการณ์ทางสังคม เศรษฐกิจ และนโยบายสาธารณะของประเทศอย่างต่อเนื่อง ข้อมูลดังกล่าวจะช่วยเสริมศักยภาพให้ ThaiLLM สามารถเรียนรู้ภาษาไทยจากสถานการณ์จริง และเข้าใจบริบทของสังคมไทยได้อย่างลึกซึ้งมากยิ่งขึ้น
อีกทั้ง ยังมีส่วนช่วยเสริมสร้างความมั่นคงด้านภาษาและอธิปไตยทางดิจิทัล (Digital Sovereignty) ตลอดจนสนับสนุนการพัฒนาคลังข้อมูลกลางเพื่อการพัฒนาปัญญาประดิษฐ์ของประเทศ (National Data Bank for AI) ซึ่งจะเป็นรากฐานสำคัญในการรวบรวม บูรณาการ และบริหารจัดการข้อมูลจากหลากหลายภาคส่วน นำไปสู่การสร้างและขับเคลื่อนระบบนิเวศปัญญาประดิษฐ์ของไทยให้เติบโตอย่างเข้มแข็ง และรองรับการพัฒนาเทคโนโลยีและนวัตกรรมดิจิทัลของประเทศอย่างมั่นคงและยั่งยืน
นายฉาย บุนนาค ประธานกรรมการบริหารและประธานเจ้าหน้าที่บริหาร เนชั่น กรุ๊ป กล่าวถึงความร่วมมือในครั้งนี้ว่า ท่ามกลางการเปลี่ยนแปลงด้านเทคโนโลยี ปัญญาประดิษฐ์ หรือ AI ถือเป็นความท้าทายที่สื่อทั่วโลกต้องเผชิญ เครือเนชั่นเราให้ความสำคัญกับการพัฒนาองค์ความรู้ด้าน AI ในองค์กรอย่างต่อเนื่อง ทั้งในมิติของฮาร์ดแวร์และซอฟต์แวร์ โดยนำ AI มาเป็นเครื่องมือในการยกระดับขีดความสามารถของบุคลากร การบริหารจัดการต้นทุน และเพิ่มศักยภาพการผลิตเนื้อหาเพื่อนำเสนอข่าวสารที่เป็นสาระประโยชน์สู่สาธารณะ ภายใต้กรอบจริยธรรมวิชาชีพสื่อ เพื่อรักษาความน่าเชื่อถือในฐานะสถาบันสื่อที่สังคมไทยไว้วางใจมากว่า 55 ปี
ความร่วมมือกับสถาบันข้อมูลขนาดใหญ่ BDI ในครั้งนี้ ถือเป็นก้าวสำคัญในการสนับสนุนโครงการ ThaiLLM ผ่านการส่งต่อองค์ความรู้ด้านข่าวสาร นโยบาย และประเด็นสาธารณะ ที่ผ่านการตรวจสอบและเรียบเรียงโดยกองบรรณาธิการมืออาชีพเครือเนชั่น ข้อมูลเหล่านี้จะเป็นฟันเฟืองหลักเพื่อสร้างโมเดล AI ภาษาไทย ที่ถูกต้อง เข้าใจบริบททางสังคม และวัฒนธรรมของไทยอย่างแท้จริง อันจะนำไปสู่การต่อยอดนวัตกรรมในด้านการสื่อสาร และบริการสาธารณะที่มีประสิทธิภาพสูงสุดเพื่อคนไทยทุกคน
สำหรับความคืบหน้าของโครงการ ThaiLLM ขณะนี้ได้ขยายผลสู่การใช้งานจริง ในเครือข่ายผู้พัฒนาโมเดลภาษาขนาดใหญ่ภาษาไทยจากทั้งภาครัฐและภาคเอกชน อาทิ Pathumma LLM โดย NECTEC, OpenThaiGPT โดย AIEAT, Typhoon โดย SCB 10X และ THaLLE โดย KBTG ต่างแสดงความสนใจในการนำไปทดลองพัฒนาต่อยอดผ่านแพลตฟอร์ม Hugging Face ที่ https://huggingface.co/ThaiLLM โดยได้เผยแพร่โมเดลพื้นฐานขนาด 8B พารามิเตอร์ และโมเดลขนาด 30B พารามิเตอร์ไปแล้ว และผู้ที่สนใจ หรือประชาชนทั่วไปสามารถทดลองใช้ ThaiLLM Playground ได้ภายในเดือนมกราคมนี้