OpenAI เพิ่งเปิดตัวการอัปเกรดอันน่าทึ่งสำหรับความสามารถในการสร้างภาพ AI ใน ChatGPT อย่างเป็นทางการ ซึ่งถือเป็นก้าวสำคัญแทนที่จะใช้โมเดลการสร้างภาพแยกต่างหากเหมือน DALL-E รุ่นก่อนหน้า คุณลักษณะใหม่นี้ถูกรวมเข้าใน GPT-4o โดยตรง ส่งผลให้มีการปรับปรุงที่สำคัญ
การเอาชนะข้อจำกัดที่มีอยู่
แม้ว่าโมเดลการสร้างภาพ AI ในปัจจุบันจำนวนมากจะสามารถสร้างภาพศิลปะที่น่าประทับใจได้ แต่มักประสบปัญหากับองค์ประกอบอย่างข้อความ โลโก้ หรือวัตถุในชีวิตประจำวัน OpenAI อ้างว่า GPT-4o ใหม่สามารถเอาชนะข้อจำกัดเหล่านี้ได้ด้วยความสามารถในการ:
- แสดงข้อความอย่างถูกต้อง
- ปฏิบัติตามข้อกำหนดของผู้ใช้อย่างเคร่งครัด
- ใช้ประโยชน์จากความรู้พื้นฐานและบริบทการสนทนา
- ช่วยให้สามารถแก้ไขรูปภาพที่อัพโหลดหรือสร้างรูปภาพใหม่จากรูปภาพต้นฉบับได้
- มีจำหน่ายทั่วไป
ขณะนี้ฟีเจอร์ใหม่นี้กำลังเปิดให้ผู้ใช้ ChatGPT Free, ChatGPT Plus, Pro และ Team ใช้งาน และจะเปิดให้ใช้งานบน ChatGPT Enterprise และ Edu ในอีกไม่กี่สัปดาห์ข้างหน้านี้ ที่น่าสังเกตคือนี่จะเป็นเครื่องมือสร้างรูปภาพเริ่มต้นใน ChatGPT ช่วยให้ผู้ใช้เข้าถึงได้ง่ายโดยไม่ต้องมีตัวเลือกเพิ่มเติม ผู้ใช้สามารถปรับแต่งรูปภาพด้วย:
- อัตราส่วนภาพเฉพาะ
- สีที่แน่นอน (ใช้รหัสเลขฐานสิบหก)
- พื้นหลังโปร่งใส
- รองรับหลายแพลตฟอร์ม

นอกเหนือจาก ChatGPT แล้ว ฟีเจอร์ดังกล่าวยังจะพร้อมใช้งานบนแพลตฟอร์มต่างๆ เช่น Sora (การสร้างภาพ), DALL·E GPT เฉพาะ และ GPT-4o API (สำหรับนักพัฒนา เปิดตัวในอีกไม่กี่สัปดาห์ข้างหน้า)
แม้ว่าจะมีการสัญญาว่าจะมีการปรับปรุงมากมาย แต่รุ่นใหม่นี้ยังคงมีข้อจำกัดบางประการ:
- เวลาสร้างภาพอาจใช้เวลานานถึง 1 นาที เนื่องจากมีรายละเอียดสูง
- การครอบตัดที่ไม่ต้องการด้วยภาพแนวตั้ง
- บางครั้ง "การแต่งเรื่อง" ข้อมูลขึ้นมาโดยไม่จำเป็นต้องระบุบริบทมากนัก
- มีปัญหาในการประมวลผลแนวคิดมากกว่า 10-20 แนวคิดในครั้งเดียว
- ความยากลำบากกับภาษาที่ไม่ใช่ละติน
- การแก้ไขอย่างละเอียด (เช่น ข้อผิดพลาดในการสะกดคำ) ไม่ได้ผลมากนัก
- ยากต่อการแสดงข้อมูลรายละเอียดในขนาดเล็ก
รูปภาพทั้งหมดที่สร้างโดย GPT-4o จะมีข้อมูลเมตา C2PA ซึ่งช่วยให้สามารถตรวจสอบที่มาโดยใช้เครื่องมือภายในของ OpenAI
แม้จะมีข้อจำกัดบางประการ แต่ GPT-4o สัญญาว่าจะมอบภาพที่แม่นยำและปรับแต่งได้มากขึ้น OpenAI กล่าวว่าจะยังคงปรับปรุงโมเดลดังกล่าวต่อไปในอีกไม่กี่เดือนข้างหน้า ซึ่งจะเปิดโอกาสใหม่ๆ ให้กับการสร้างเนื้อหาภาพที่ขับเคลื่อนด้วย AI
ด้วยการอัปเดตครั้งสำคัญนี้ OpenAI ยังคงเสริมความแข็งแกร่งให้กับความเป็นผู้นำในด้าน AI เชิงสร้างสรรค์ โดยมอบประสบการณ์ที่ราบรื่นและทรงพลังยิ่งขึ้นให้กับผู้ใช้บนแพลตฟอร์มต่างๆ