KEY
POINTS
OpenAI เปิดตัว ChatGPT Images เวอร์ชันใหม่ ที่ขับเคลื่อนด้วยโมเดลการสร้างภาพรุ่นเรือธงตัวใหม่อย่างเป็นทางการ ไม่ว่าเริ่มสร้างภาพขึ้นมาตั้งแต่ศูนย์หรือแก้ไขภาพที่มีอยู่ ก็จะได้ผลลัพธ์ตรงตามจินตนาการ
โมเดลใหม่ล่าสุดนี้สามารถแก้ไขภาพได้อย่างแม่นยำโดยยังคงรายละเอียดสำคัญไว้อย่างครบถ้วน และสร้างภาพได้เร็วขึ้นสูงสุดถึง 4 เท่า
นอกจากนี้ OpenAI ยังได้เปิดตัวฟีเจอร์สำหรับ Images ใหม่บน ChatGPT อีกด้วย ซึ่งออกแบบมาเพื่อทำให้การสร้างภาพเป็นเรื่องสนุก ช่วยจุดประกายแรงบันดาลใจ และทำให้การสำรวจความคิดสร้างสรรค์เป็นเรื่องง่ายและลื่นไหลขึ้น
การแก้ไขอย่างแม่นยำ พร้อมคงสิ่งที่สำคัญไว้
เมื่อให้คำสั่งขอแก้ไขภาพที่อัปโหลด โมเดลจะเข้าใจคำสั่งได้อย่างแม่นยำมากขึ้นขึ้น แม้ในรายละเอียดเล็กน้อย โดยจะเปลี่ยนเฉพาะสิ่งที่ถูกขอเท่านั้น พร้อมคงองค์ประกอบสำคัญ อย่าง แสง องค์ประกอบภาพ และลักษณะของบุคคล ให้สอดคล้องกันในทุก input, output และการแก้ไขแบบต่อเนื่อง
สิ่งนี้ช่วยให้ได้ผลลัพธ์ที่ตรงกับความตั้งใจมากขึ้น ไม่ว่าจะเป็นการแก้ไขภาพที่เป็นประโยชน์ การลอง try-ons เสื้อผ้าและทรงผมที่ดูสมจริง ไปจนถึงฟิลเตอร์สไตลิสต์ (Stylistic Filters) และการแปลงคอนเซปต์ออกมา (Conceptual Transformation) ที่ยังคงเอกลักษณ์ของภาพต้นฉบับไว้ การพัฒนาเหล่านี้ทำให้ ChatGPT สามารถทำหน้าที่เป็นสตูดิโอครีเอทีฟแบบพกพาที่รองรับทั้งงานแก้เชิงปฏิบัติและการตีความเชิงศิลป์ได้อย่างลงตัว
โมเดลนี้มีความโดดเด่นในการแก้ไขภาพหลากหลายรูปแบบ ไม่ว่าจะเป็นการเพิ่ม ลบ ผสาน ผสม หรือย้ายองค์ประกอบ ทำให้ปรับเปลี่ยนได้ตามต้องการ โดยไม่สูญเสียเสน่ห์และเอกลักษณ์ของภาพต้นฉบับ
การพัฒนาเชิงสร้างสรรค์
ความครีเอทีฟของโมเดลนี้ โดดเด่นเรื่องการแปลงภาพที่สามารถเปลี่ยนหรือเพิ่มองค์ประกอบต่าง ๆ ได้ ยกตัวอย่างเช่น ข้อความและการจัดวาง เพื่อทำให้ไอเดียมีชีวิตขึ้นมา พร้อมยังคงรายละเอียดสำคัญไว้อย่างครบถ้วน ความสามารถในการแปลงเหล่านี้ รองรับทั้งแนวคิดที่เรียบง่ายและซับซ้อน รวมถึงสามารถทดลองใช้ได้อย่างง่ายดาย ผ่านสไตล์และไอเดียสำเร็จรูปบนฟีเจอร์ ChatGPT Images ใหม่ โดยไม่จำเป็นต้องพิมพ์คำสั่ง Prompt
การทำตามคำสั่ง
โมเดลรุ่นนี้สามารถทำตามคำสั่งได้อย่างแม่นยำและสม่ำเสมอกว่าเวอร์ชันแรก ซึ่งช่วยให้การแก้ไขภาพมีความละเอียดมากขึ้น ไปจนถึงการสร้างภาพต้นฉบับที่ซับซ้อน โดยสามารถรักษาความสัมพันธ์ระหว่างองค์ประกอบต่าง ๆ ตามที่ตั้งไว้
การแสดงผลข้อความ
โมเดลนี้มีการก้าวขึ้นไปอีกขั้นในด้านการแสดงผลข้อความ สามารถจัดการข้อความที่มีความหนาแน่นสูงและขนาดเล็กได้ดียิ่งขึ้น
การปรับปรุงเพิ่มเติมด้านคุณภาพ
โมเดลได้รับการพัฒนาในด้านคุณภาพอื่นๆ ที่ช่วยเสริมให้ผลลัพธ์สามารถนำไปใช้งานได้จริงมากขึ้นทันที เช่น การเรนเดอร์ใบหน้าขนาดเล็กจำนวนมากในภาพเดียว และความเป็นธรรมชาติของภาพที่สร้างขึ้นโดยรวม
พื้นที่สร้างสรรค์ใหม่
นอกจากการสร้างภาพจากคำอธิบายจากสิ่งที่คุณต้องการผ่านข้อความแล้ว โมเดลใหม่นี้ยังเปิดตัวปุ่มเฉพาะสำหรับฟีเจอร์ Images บน ChatGPT ซึ่งสามารถเข้าถึงได้จากแถบด้านข้างบนแอปมือถือ และบนเว็บไซต์ chatgpt.com เพื่อให้การค้นหา ทดลอง และสร้างภาพทำได้รวดเร็วและง่ายดายยิ่งขึ้น ภายในมีฟิลเตอร์และ Prompt สำเร็จรูปหลายสิบรูปแบบ เพื่อช่วยจุดประกายแรงบันดาลใจ และรับการอัปเดตอย่างสม่ำเสมอให้สอดคล้องกับเทรนด์ใหม่ ๆ
การอัปเกรดทั้งหมดนี้ ช่วยให้คุณสามารถสร้างภาพที่สอดคล้องกับจินตนาการของผู้ใช้ได้ดียิ่งขึ้น ตั้งแต่การแก้ไขเล็กน้อยไปจนถึงการตีความใหม่ทั้งภาพ
การปรับปรุงและข้อจำกัด
OpenAI ได้นำตัวอย่างจำนวนมากจากการเปิดตัวระบบสร้างภาพครั้งแรกกลับมาทดสอบใหม่ เพื่อประเมินประสิทธิภาพ โดยโมเดลนี้ได้แสดงให้เห็นถึงพัฒนาการที่ชัดเจนในหลากหลายกรณี แม้ว่าผลลัพธ์จะยังไม่สมบูรณ์แบบทั้งหมด แต่การเปิดตัวครั้งนี้ถือเป็นความก้าวหน้าที่สำคัญ แต่ยังคงมีพื้นที่อีกมากสำหรับการพัฒนาในเวอร์ชันถัดไป
GPT Image 1.5 บน API
gpt-image-1.5 บน API มาพร้อมการปรับปรุงทั้งหมดเช่นเดียวกับ ChatGPT Images โดยมีความสามารถในการคงรายละเอียดของภาพต้นฉบับและการแก้ไขภาพที่เหนือกว่า GPT Image 1
โดยจะเห็นการคงเอกลักษณ์ของโลโก้แบรนด์และภาพหลักที่สม่ำเสมอมากขึ้นตลอดการแก้ไข ทำให้เหมาะสำหรับงานด้านการตลาดและแบรนด์เป็นอย่างยิ่ง เช่น การออกแบบกราฟิกและโลโก้ รวมถึงการใช้งานของทีมอีคอมเมิร์ซในการสร้างแคตตาล็อกภาพสินค้าทั้งชุด (หลายเวอร์ชัน หลายฉาก และหลายมุม) จากภาพต้นฉบับเพียงภาพเดียว
นอกจากนี้ ต้นทุนของ Input และ Output ภาพบน GPT Image 1.5 ยังถูกลง 20% เมื่อเทียบกับ GPT Image 1 ทำให้คุณสามารถสร้างและปรับแก้ภาพได้มากขึ้นภายใต้งบประมาณเท่าเดิม
ทดลองใช้งานโมเดลใหม่ได้ผ่าน OpenAI Playground ดูแกลเลอรี่ หรืออ่านคู่มือการใช้งานเพื่อหาแรงบันดาลใจเพิ่มเติม
องค์กรขนาดใหญ่และสตาร์ทอัพในหลากหลายอุตสาหกรรม ไม่ว่าจะเป็นเครื่องมือสร้างสรรค์ อีคอมเมิร์ซ ซอฟต์แวร์การตลาด และอื่น ๆ ได้เริ่มใช้งาน GPT Image 1.5 แล้ว
การเปิดให้ใช้งาน (Availability)
โมเดล ChatGPT Images ใหม่เริ่มทยอยเปิดให้ใช้งานแล้ววันนี้สำหรับผู้ใช้ ChatGPT ทุกคนและผู้ใช้ API ทั่วโลก ครอบคลุมทุกแพลตฟอร์ม โดยสามารถใช้งานได้กับทุกรุ่นโมเดล โดยไม่จำเป็นต้องเลือกการตั้งค่าใดเพิ่มเติม เวอร์ชันล่าสุดของ ChatGPT Images ที่เปิดตัวไปเมื่อต้นปีนี้ จะยังคงใช้งานได้สำหรับผู้ใช้ทุกคนในรูปแบบ Custom GPT
OpenAI ยังคงเชื่อว่านี่เป็นเพียงจุดเริ่มต้นของศักยภาพที่การสร้างภาพด้วย AI สามารถมอบให้ได้ การอัปเดตในวันนี้ถือเป็นก้าวสำคัญที่มีความหมาย และยังมีการพัฒนาเพิ่มเติมอีกมากมายในอนาคต ตั้งแต่การแก้ไขภาพในระดับที่ละเอียดขึ้น ไปจนถึงผลลัพธ์ที่สมบูรณ์และมีรายละเอียดมากยิ่งขึ้นในหลายภาษา
ไฮไลต์ฟีเจอร์ใหม่ ได้แก่:
หากต้องการทดลองใช้งาน ChatGPT Images สามารถไปที่แถบด้านซ้ายใน ChatGPT และเลือก “Images”
ฟิดจี ซิโม (Fidji Simo) ประธานเจ้าหน้าที่ฝ่ายแอปพลิเคชันของ OpenAI ยังได้เผยแพร่บทความ Substack post ซึ่งอธิบายถึงการเปลี่ยนผ่านจาก AI ที่เน้นข้อความ ไปสู่ประสบการณ์ AI ที่มีความไดนามิกมากยิ่งขึ้น
ทดลองใช้งานด้วยคำสั่งรูปภาพ (Image Prompts) แบบสำเร็จรูป
ChatGPT Images ช่วยให้สร้างรูปภาพได้ทันทีโดยไม่จำเป็นต้องเขียนคำสั่ง (Prompt) เองตั้งแต่ต้น โดยในแถบ "Images" ภายใต้หัวข้อ “ค้นหาสิ่งใหม่ๆ” (Discover something new) ผู้ใช้สามารถเลือกสไตล์การสร้างรูปภาพและไอเดียคำสั่งต่าง ๆ เพื่อเริ่มต้นใช้งานได้อย่างรวดเร็ว ไม่ว่าจะเป็นการสร้างรูปโปรไฟล์สมัครงานแบบมืออาชีพ, การลบคนออกจากพื้นหลัง, การสร้างการ์ดอวยพรวันหยุด, หรือแม้แต่การลองตกแต่งห้องใหม่ ไปจนถึงการดูว่าคุณจะมีหน้าตาเป็นอย่างไรหากเป็นซูเปอร์สตาร์ K-Pop ทั้งหมดนี้ทำได้โดยไม่ต้องเขียนคำสั่งที่ละเอียดซับซ้อนเลย