BDI ผนึก เนชั่น กรุ๊ป หนุนคลังข้อมูลข่าว พัฒนา ThaiLLM สร้างโมเดล AI ของชาติ

21 ม.ค. 2569 | 10:41 น.
อัปเดตล่าสุด :21 ม.ค. 2569 | 10:53 น.

BDI ร่วมมือ เนชั่น กรุ๊ป ลงนาม MOU หนุนโครงการ ThaiLLM พัฒนาโครงสร้างพื้นฐาน AI ภาษาไทย ดึงคลังข้อมูลข่าวสารยกระดับโมเดลให้เข้าใจบริบทสังคมไทยอย่างลึกซึ้ง ลดการพึ่งพาเทคโนโลยีต่างชาติ มุ่งสร้างอธิปไตยทางดิจิทัล พร้อมเปิดทดลองใช้งาน Playground ภายในมกราคม 69

KEY

POINTS

  • สถาบันข้อมูลขนาดใหญ่ (BDI) ลงนามความร่วมมือ (MOU) กับ เนชั่น กรุ๊ป เพื่อสนับสนุนการพัฒนาโมเดลปัญญาประดิษฐ์ภาษาไทย (ThaiLLM)
  • เนชั่น กรุ๊ป จะสนับสนุนคลังข้อมูลข่าวและบทวิเคราะห์ เพื่อใช้เป็นข้อมูลในการฝึกฝน AI ให้สามารถเรียนรู้และเข้าใจบริบทของสังคมไทยได้อย่างลึกซึ้ง
  • โครงการนี้มีเป้าหมายเพื่อสร้างโครงสร้างพื้นฐาน AI ของชาติ ลดการพึ่งพาเทคโนโลยีจากต่างประเทศ และสร้างโมเดลภาษาที่เข้าใจคนไทยอย่างแท้จริง

สถาบันข้อมูลขนาดใหญ่ (องค์การมหาชน) หรือ BDI โดย ศ. ดร.ธีรณี อจลากุล ผู้อำนวยการสถาบันข้อมูลขนาดใหญ่ พร้อมด้วย นายฉาย บุนนาค ประธานกรรมการบริหารและประธานเจ้าหน้าที่บริหาร บริษัท เนชั่น กรุ๊ป (ไทยแลนด์) จำกัด (มหาชน) หรือ NATION GROUP ร่วมลงนามบันทึกข้อตกลงความร่วมมือ (MOU) โครงการสนับสนุนการพัฒนาโครงสร้างพื้นฐานปัญญาประดิษฐ์สำหรับภาษาไทย (ThaiLLM) โดยมี ดร.สุนทรีย์ ส่งเสริม รองผู้อำนวยการสถาบันข้อมูลขนาดใหญ่ (BDI) และ นางวรางคณา กัลยาณประดิษฐ ที่ปรึกษาประธานเจ้าหน้าที่บริหาร เนชั่น กรุ๊ป พร้อมด้วยคณะผู้บริหารทั้งสองหน่วยงาน เข้าร่วมเป็นสักขีพยาน ณ อาคาร เนชั่น ทาวเวอร์

ศ. ดร.ธีรณี อจลากุล ผู้อำนวยการสถาบันข้อมูลขนาดใหญ่ กล่าวว่า ปัจจุบันเทคโนโลยีปัญญาประดิษฐ์ หรือ AI กลายเป็นส่วนหนึ่งในชีวิตของคนไทย แต่กลับพบว่า AI ส่วนใหญ่ถูกฝึกจากข้อมูลภาษาอังกฤษจำนวนมหาศาล โดยมีสัดส่วนมากกว่า 40% ของข้อมูลทั้งหมด ขณะที่ข้อมูลภาษาไทยมีสัดส่วนเพียง 0.4% เท่านั้น  ซึ่งถือว่ามีพื้นที่น้อยมาก สะท้อนให้เห็นว่าประเทศไทยขาด “โมเดลภาษา” ที่เข้าใจบริบทของคนไทยอย่างแท้จริง การพัฒนา ThaiLLM ไม่ได้เป็นเพียงการสร้างโมเดลภาษา แต่เป็นภารกิจของประเทศในการวาง “โครงสร้างพื้นฐานปัญญาประดิษฐ์ด้านภาษา” เพื่อให้ประเทศไทยสามารถพัฒนาและใช้งาน AI ได้อย่างสอดคล้องกับบริบทของตนเอง โดย BDI ทำหน้าที่เป็นหน่วยงานกลาง

บูรณาการร่วมมือวางมาตรฐานการพัฒนา AI ภาษาไทย

BDI ผนึก เนชั่น กรุ๊ป หนุนคลังข้อมูลข่าว พัฒนา ThaiLLM สร้างโมเดล AI ของชาติ BDI ได้ร่วมมือกับหน่วยงานด้านวิจัยและพัฒนาเทคโนโลยีของประเทศ ได้แก่ ศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ (NECTEC) สถาบันวิทยสิริเมธี (VISTEC) สมาคมผู้ประกอบการปัญญาประดิษฐ์ประเทศไทย (AIEAT) และสมาคมปัญญาประดิษฐ์ประเทศไทย (AIAT) โดยได้รับการสนับสนุนจากกองทุนพัฒนาดิจิทัลเพื่อเศรษฐกิจและสังคม (DEF) ในการพัฒนาโครงสร้างพื้นฐานปัญญาประดิษฐ์ภาษาไทยในรูปแบบ Open Source/Open License เพื่อเปิดโอกาสให้นักพัฒนา หน่วยงานภาครัฐ และภาคเอกชน สามารถนำไปต่อยอดใช้งานได้อย่างกว้างขวาง ลดการพึ่งพาเทคโนโลยีจากต่างประเทศ และสนับสนุนการพัฒนา AI ภาษาไทยในหลากหลายบริบท

BDI ผนึก เนชั่น กรุ๊ป หนุนคลังข้อมูลข่าว พัฒนา ThaiLLM สร้างโมเดล AI ของชาติ

ความร่วมมือกับเครือเนชั่นในครั้งนี้ นับเป็นครั้งแรกที่ BDI ได้ร่วมมือกับภาคสื่อมวลชนอย่างเป็นทางการ เพื่อยกระดับการพัฒนาโครงสร้างพื้นฐานปัญญาประดิษฐ์สำหรับภาษาไทย (ThaiLLM) โดย BDI จะได้รับการสนับสนุนข้อมูลภาษาไทยจากภาคสื่อมวลชน ซึ่งครอบคลุมเนื้อหาข่าว บทวิเคราะห์ และข้อมูลเชิงบริบทที่สะท้อนเหตุการณ์ทางสังคม เศรษฐกิจ และนโยบายสาธารณะของประเทศอย่างต่อเนื่อง ข้อมูลดังกล่าวจะช่วยเสริมศักยภาพให้ ThaiLLM สามารถเรียนรู้ภาษาไทยจากสถานการณ์จริง และเข้าใจบริบทของสังคมไทยได้อย่างลึกซึ้งมากยิ่งขึ้น

อีกทั้ง ยังมีส่วนช่วยเสริมสร้างความมั่นคงด้านภาษาและอธิปไตยทางดิจิทัล (Digital Sovereignty) ตลอดจนสนับสนุนการพัฒนาคลังข้อมูลกลางเพื่อการพัฒนาปัญญาประดิษฐ์ของประเทศ (National Data Bank for AI) ซึ่งจะเป็นรากฐานสำคัญในการรวบรวม บูรณาการ และบริหารจัดการข้อมูลจากหลากหลายภาคส่วน นำไปสู่การสร้างและขับเคลื่อนระบบนิเวศปัญญาประดิษฐ์ของไทยให้เติบโตอย่างเข้มแข็ง และรองรับการพัฒนาเทคโนโลยีและนวัตกรรมดิจิทัลของประเทศอย่างมั่นคงและยั่งยืน

BDI ผนึก เนชั่น กรุ๊ป หนุนคลังข้อมูลข่าว พัฒนา ThaiLLM สร้างโมเดล AI ของชาติ

นายฉาย บุนนาค ประธานกรรมการบริหารและประธานเจ้าหน้าที่บริหาร เนชั่น กรุ๊ป กล่าวถึงความร่วมมือในครั้งนี้ว่า ท่ามกลางการเปลี่ยนแปลงด้านเทคโนโลยี ปัญญาประดิษฐ์ หรือ AI ถือเป็นความท้าทายที่สื่อทั่วโลกต้องเผชิญ เครือเนชั่นเราให้ความสำคัญกับการพัฒนาองค์ความรู้ด้าน AI ในองค์กรอย่างต่อเนื่อง ทั้งในมิติของฮาร์ดแวร์และซอฟต์แวร์ โดยนำ AI มาเป็นเครื่องมือในการยกระดับขีดความสามารถของบุคลากร การบริหารจัดการต้นทุน และเพิ่มศักยภาพการผลิตเนื้อหาเพื่อนำเสนอข่าวสารที่เป็นสาระประโยชน์สู่สาธารณะ ภายใต้กรอบจริยธรรมวิชาชีพสื่อ เพื่อรักษาความน่าเชื่อถือในฐานะสถาบันสื่อที่สังคมไทยไว้วางใจมากว่า 55 ปี

ความร่วมมือกับสถาบันข้อมูลขนาดใหญ่ BDI ในครั้งนี้ ถือเป็นก้าวสำคัญในการสนับสนุนโครงการ ThaiLLM ผ่านการส่งต่อองค์ความรู้ด้านข่าวสาร นโยบาย และประเด็นสาธารณะ ที่ผ่านการตรวจสอบและเรียบเรียงโดยกองบรรณาธิการมืออาชีพเครือเนชั่น ข้อมูลเหล่านี้จะเป็นฟันเฟืองหลักเพื่อสร้างโมเดล AI ภาษาไทย ที่ถูกต้อง เข้าใจบริบททางสังคม และวัฒนธรรมของไทยอย่างแท้จริง อันจะนำไปสู่การต่อยอดนวัตกรรมในด้านการสื่อสาร และบริการสาธารณะที่มีประสิทธิภาพสูงสุดเพื่อคนไทยทุกคน

สำหรับความคืบหน้าของโครงการ ThaiLLM ขณะนี้ได้ขยายผลสู่การใช้งานจริง ในเครือข่ายผู้พัฒนาโมเดลภาษาขนาดใหญ่ภาษาไทยจากทั้งภาครัฐและภาคเอกชน อาทิ Pathumma LLM โดย NECTEC, OpenThaiGPT โดย AIEAT, Typhoon โดย SCB 10X  และ THaLLE โดย KBTG ต่างแสดงความสนใจในการนำไปทดลองพัฒนาต่อยอดผ่านแพลตฟอร์ม Hugging Face ที่ https://huggingface.co/ThaiLLM โดยได้เผยแพร่โมเดลพื้นฐานขนาด 8B พารามิเตอร์ และโมเดลขนาด 30B พารามิเตอร์ไปแล้ว และผู้ที่สนใจ หรือประชาชนทั่วไปสามารถทดลองใช้ ThaiLLM Playground ได้ภายในเดือนมกราคมนี้