
BDI ผนึก เนชั่น กรุ๊ป หนุนคลังข้อมูลข่าว พัฒนา ThaiLLM สร้างโมเดล AI ของชาติ
BDI ร่วมมือ เนชั่น กรุ๊ป ลงนาม MOU หนุนโครงการ ThaiLLM พัฒนาโครงสร้างพื้นฐาน AI ภาษาไทย ดึงคลังข้อมูลข่าวสารยกระดับโมเดลให้เข้าใจบริบทสังคมไทยอย่างลึกซึ้ง ลดการพึ่งพาเทคโนโลยีต่างชาติ มุ่งสร้างอธิปไตยทางดิจิทัล พร้อมเปิดทดลองใช้งาน Playground ภายในมกราคม 69
KEY
POINTS
- สถาบันข้อมูลขนาดใหญ่ (BDI) ลงนามความร่วมมือ (MOU) กับ เนชั่น กรุ๊ป เพื่อสนับสนุนการพัฒนาโมเดลปัญญาประดิษฐ์ภาษาไทย (ThaiLLM)
- เนชั่น กรุ๊ป จะสนับสนุนคลังข้อมูลข่าวและบทวิเคราะห์ เพื่อใช้เป็นข้อมูลในการฝึกฝน AI ให้สามารถเรียนรู้และเข้าใจบริบทของสังคมไทยได้อย่างลึกซึ้ง
- โครงการนี้มีเป้าหมายเพื่อสร้างโครงสร้างพื้นฐาน AI ของชาติ ลดการพึ่งพาเทคโนโลยีจากต่างประเทศ และสร้างโมเดลภาษาที่เข้าใจคนไทยอย่างแท้จริง
สถาบันข้อมูลขนาดใหญ่ (องค์การมหาชน) หรือ BDI โดย ศ. ดร.ธีรณี อจลากุล ผู้อำนวยการสถาบันข้อมูลขนาดใหญ่ พร้อมด้วย นายฉาย บุนนาค ประธานกรรมการบริหารและประธานเจ้าหน้าที่บริหาร บริษัท เนชั่น กรุ๊ป (ไทยแลนด์) จำกัด (มหาชน) หรือ NATION GROUP ร่วมลงนามบันทึกข้อตกลงความร่วมมือ (MOU) โครงการสนับสนุนการพัฒนาโครงสร้างพื้นฐานปัญญาประดิษฐ์สำหรับภาษาไทย (ThaiLLM) โดยมี ดร.สุนทรีย์ ส่งเสริม รองผู้อำนวยการสถาบันข้อมูลขนาดใหญ่ (BDI) และ นางวรางคณา กัลยาณประดิษฐ ที่ปรึกษาประธานเจ้าหน้าที่บริหาร เนชั่น กรุ๊ป พร้อมด้วยคณะผู้บริหารทั้งสองหน่วยงาน เข้าร่วมเป็นสักขีพยาน ณ อาคาร เนชั่น ทาวเวอร์
ศ. ดร.ธีรณี อจลากุล ผู้อำนวยการสถาบันข้อมูลขนาดใหญ่ กล่าวว่า ปัจจุบันเทคโนโลยีปัญญาประดิษฐ์ หรือ AI กลายเป็นส่วนหนึ่งในชีวิตของคนไทย แต่กลับพบว่า AI ส่วนใหญ่ถูกฝึกจากข้อมูลภาษาอังกฤษจำนวนมหาศาล โดยมีสัดส่วนมากกว่า 40% ของข้อมูลทั้งหมด ขณะที่ข้อมูลภาษาไทยมีสัดส่วนเพียง 0.4% เท่านั้น ซึ่งถือว่ามีพื้นที่น้อยมาก สะท้อนให้เห็นว่าประเทศไทยขาด “โมเดลภาษา” ที่เข้าใจบริบทของคนไทยอย่างแท้จริง การพัฒนา ThaiLLM ไม่ได้เป็นเพียงการสร้างโมเดลภาษา แต่เป็นภารกิจของประเทศในการวาง “โครงสร้างพื้นฐานปัญญาประดิษฐ์ด้านภาษา” เพื่อให้ประเทศไทยสามารถพัฒนาและใช้งาน AI ได้อย่างสอดคล้องกับบริบทของตนเอง โดย BDI ทำหน้าที่เป็นหน่วยงานกลาง
บูรณาการร่วมมือวางมาตรฐานการพัฒนา AI ภาษาไทย
ความร่วมมือกับเครือเนชั่นในครั้งนี้ นับเป็นครั้งแรกที่ BDI ได้ร่วมมือกับภาคสื่อมวลชนอย่างเป็นทางการ เพื่อยกระดับการพัฒนาโครงสร้างพื้นฐานปัญญาประดิษฐ์สำหรับภาษาไทย (ThaiLLM) โดย BDI จะได้รับการสนับสนุนข้อมูลภาษาไทยจากภาคสื่อมวลชน ซึ่งครอบคลุมเนื้อหาข่าว บทวิเคราะห์ และข้อมูลเชิงบริบทที่สะท้อนเหตุการณ์ทางสังคม เศรษฐกิจ และนโยบายสาธารณะของประเทศอย่างต่อเนื่อง ข้อมูลดังกล่าวจะช่วยเสริมศักยภาพให้ ThaiLLM สามารถเรียนรู้ภาษาไทยจากสถานการณ์จริง และเข้าใจบริบทของสังคมไทยได้อย่างลึกซึ้งมากยิ่งขึ้น
อีกทั้ง ยังมีส่วนช่วยเสริมสร้างความมั่นคงด้านภาษาและอธิปไตยทางดิจิทัล (Digital Sovereignty) ตลอดจนสนับสนุนการพัฒนาคลังข้อมูลกลางเพื่อการพัฒนาปัญญาประดิษฐ์ของประเทศ (National Data Bank for AI) ซึ่งจะเป็นรากฐานสำคัญในการรวบรวม บูรณาการ และบริหารจัดการข้อมูลจากหลากหลายภาคส่วน นำไปสู่การสร้างและขับเคลื่อนระบบนิเวศปัญญาประดิษฐ์ของไทยให้เติบโตอย่างเข้มแข็ง และรองรับการพัฒนาเทคโนโลยีและนวัตกรรมดิจิทัลของประเทศอย่างมั่นคงและยั่งยืน
นายฉาย บุนนาค ประธานกรรมการบริหารและประธานเจ้าหน้าที่บริหาร เนชั่น กรุ๊ป กล่าวถึงความร่วมมือในครั้งนี้ว่า ท่ามกลางการเปลี่ยนแปลงด้านเทคโนโลยี ปัญญาประดิษฐ์ หรือ AI ถือเป็นความท้าทายที่สื่อทั่วโลกต้องเผชิญ เครือเนชั่นเราให้ความสำคัญกับการพัฒนาองค์ความรู้ด้าน AI ในองค์กรอย่างต่อเนื่อง ทั้งในมิติของฮาร์ดแวร์และซอฟต์แวร์ โดยนำ AI มาเป็นเครื่องมือในการยกระดับขีดความสามารถของบุคลากร การบริหารจัดการต้นทุน และเพิ่มศักยภาพการผลิตเนื้อหาเพื่อนำเสนอข่าวสารที่เป็นสาระประโยชน์สู่สาธารณะ ภายใต้กรอบจริยธรรมวิชาชีพสื่อ เพื่อรักษาความน่าเชื่อถือในฐานะสถาบันสื่อที่สังคมไทยไว้วางใจมากว่า 55 ปี
ความร่วมมือกับสถาบันข้อมูลขนาดใหญ่ BDI ในครั้งนี้ ถือเป็นก้าวสำคัญในการสนับสนุนโครงการ ThaiLLM ผ่านการส่งต่อองค์ความรู้ด้านข่าวสาร นโยบาย และประเด็นสาธารณะ ที่ผ่านการตรวจสอบและเรียบเรียงโดยกองบรรณาธิการมืออาชีพเครือเนชั่น ข้อมูลเหล่านี้จะเป็นฟันเฟืองหลักเพื่อสร้างโมเดล AI ภาษาไทย ที่ถูกต้อง เข้าใจบริบททางสังคม และวัฒนธรรมของไทยอย่างแท้จริง อันจะนำไปสู่การต่อยอดนวัตกรรมในด้านการสื่อสาร และบริการสาธารณะที่มีประสิทธิภาพสูงสุดเพื่อคนไทยทุกคน
สำหรับความคืบหน้าของโครงการ ThaiLLM ขณะนี้ได้ขยายผลสู่การใช้งานจริง ในเครือข่ายผู้พัฒนาโมเดลภาษาขนาดใหญ่ภาษาไทยจากทั้งภาครัฐและภาคเอกชน อาทิ Pathumma LLM โดย NECTEC, OpenThaiGPT โดย AIEAT, Typhoon โดย SCB 10X และ THaLLE โดย KBTG ต่างแสดงความสนใจในการนำไปทดลองพัฒนาต่อยอดผ่านแพลตฟอร์ม Hugging Face ที่ https://huggingface.co/ThaiLLM โดยได้เผยแพร่โมเดลพื้นฐานขนาด 8B พารามิเตอร์ และโมเดลขนาด 30B พารามิเตอร์ไปแล้ว และผู้ที่สนใจ หรือประชาชนทั่วไปสามารถทดลองใช้ ThaiLLM Playground ได้ภายในเดือนมกราคมนี้

