OpenAI เปิดตัวโมเดลใหม่ 3 โมเดลอย่างเป็นทางการแล้ว ได้แก่ GPT-4.1, GPT-4.1 mini และ GPT-4.1 nano โมเดลเหล่านี้มาพร้อมความสามารถในการประมวลผลบริบทขนาดใหญ่ถึง 1 ล้านโทเค็นและขีดจำกัดความรู้ที่อัปเดตจนถึงเดือนมิถุนายน 2024
บริษัทกล่าวว่ารุ่นเหล่านี้มีประสิทธิภาพเหนือกว่า GPT-4o และ GPT-4o mini ที่เพิ่งเปิดตัวเมื่อเดือนกรกฎาคมปีที่แล้ว ปัจจุบัน GPT-4.1 มีให้บริการผ่าน API เท่านั้น ดังนั้นคุณจึงไม่สามารถใช้งานโดยตรงใน ChatGPT ได้
OpenAI ระบุว่า GPT-4.1 จะมีให้ใช้ได้ผ่าน API เท่านั้น ใน ChatGPT การปรับปรุงต่างๆ มากมายในการปฏิบัติตามคำสั่ง การเขียนโปรแกรม และปัญญาประดิษฐ์ ได้ถูกรวมเข้าไว้ใน GPT-4o เวอร์ชันล่าสุดอย่างต่อเนื่อง และบริษัทจะเพิ่มสิ่งใหม่ๆ เข้ามาอีกในเวอร์ชันต่อๆ ไป

เกณฑ์มาตรฐานแสดงให้เห็นถึงการปรับปรุงอันโดดเด่นที่ GPT-4.1 นำมาให้ แบบจำลองนี้มีคะแนน 54.6% บน SWE-bench Verified เพิ่มขึ้น 21.4 คะแนนจาก GPT-4o โมเดลดังกล่าวทำคะแนนได้ 38.3% ในการทดสอบ MultiChallenge ซึ่งเป็นเกณฑ์มาตรฐานที่ใช้วัดการปฏิบัติตามแนวปฏิบัติ และสร้างสถิติใหม่ในการทำความเข้าใจวิดีโอแบบยาวด้วยคะแนน 72.0% ในเกณฑ์มาตรฐาน Video-MME ซึ่งโมเดลจะวิเคราะห์วิดีโอที่มีความยาวสูงสุด 1 ชั่วโมง โดยไม่มีคำบรรยาย
OpenAI ยังได้ร่วมมือกับพันธมิตรระดับอัลฟ่าเพื่อทดสอบประสิทธิภาพของ GPT-4.1 ในกรณีการใช้งานจริง
	- Thomson Reutersทดสอบ GPT-4.1 ด้วย CoCounsel ผู้ช่วย AI ด้านกฎหมาย เมื่อเปรียบเทียบกับ GPT-4o แล้ว GPT-4.1 มีความแม่นยำเพิ่มขึ้น 17% ในการประเมินเอกสารหลายฉบับ งานประเภทนี้ต้องอาศัยความสามารถในการติดตามบริบทจากแหล่งต่าง ๆ มากมาย และระบุความสัมพันธ์ที่ซับซ้อน เช่น เงื่อนไขที่ขัดแย้งหรือการอ้างอิงที่ซ่อนอยู่ และ GPT-4.1 ได้แสดงให้เห็นถึงประสิทธิภาพที่แข็งแกร่งอย่างสม่ำเสมอ
 
	- Carlyleใช้ GPT-4.1 เพื่อดึงข้อมูลทางการเงินจากเอกสารที่ยาวและซับซ้อน เช่น ไฟล์ Excel และ PDF จากการทดสอบภายในของบริษัท พบว่าโมเดลนี้ทำงานได้ดีขึ้นกว่ารุ่นก่อนหน้าถึง 50% ในการค้นหาเอกสาร เป็นรุ่นแรกที่สามารถจัดการปัญหาต่างๆ ได้อย่างน่าเชื่อถือ เช่น การหา "เข็มในมหาสมุทร" การสูญเสียข้อมูลกลางเอกสาร และอาร์กิวเมนต์ที่ต้องเชื่อมโยงข้อมูลระหว่างไฟล์หลายไฟล์
 
ประสิทธิภาพเป็นสิ่งหนึ่ง แต่ความเร็วก็มีความสำคัญเท่าๆ กัน OpenAI กล่าวว่า GPT-4.1 คืนโทเค็นแรกในเวลาประมาณ 15 วินาทีเมื่อประมวลผลโทเค็น 128,000 โทเค็น และนานถึง 30 วินาทีเมื่อประมวลผลโทเค็นครบหนึ่งล้านโทเค็น GPT-4.1 mini และ nano เร็วขึ้นอีกด้วย
โดยทั่วไป GPT-4.1 nano ตอบสนองต่อข้อความแจ้งเตือนที่มีโทเค็นอินพุต 128,000 รายการในเวลาไม่ถึง 5 วินาที การแคชพร้อมท์สามารถลดเวลาแฝงและช่วยประหยัดต้นทุนได้
การทำความเข้าใจภาพก็มีความก้าวหน้าอย่างมากเช่นกัน โดยเฉพาะอย่างยิ่ง GPT-4.1 mini เหนือกว่า GPT-4o ในเกณฑ์มาตรฐานภาพต่างๆ
	- ในMMMU (รวมถึงกราฟ แผนผัง และแผนที่) GPT-4.1 mini ได้คะแนน 73% ซึ่งสูงกว่า GPT-4.5 และสูงกว่า GPT-4o mini ซึ่งอยู่ที่ 56% มาก
 
	- ในMathVista (ซึ่งทดสอบความสามารถในการแก้ปัญหารูปภาพ) ทั้ง GPT-4.1 และ GPT-4.1 mini ทำคะแนนได้ 57% ซึ่งสูงกว่า GPT-4o mini ที่ได้ 37% อย่างมาก
 
	- ในCharXiv-Reasoningซึ่งโมเดลตอบคำถามโดยอิงจากกราฟทางวิทยาศาสตร์ GPT-4.1 ยังคงเป็นผู้นำ
 
	- ในการ ทดสอบ วิดีโอแบบ Video-MME (วิดีโอขนาดยาวที่ไม่มีคำบรรยาย) GPT-4.1 ทำได้สำเร็จถึง 72% ซึ่งถือเป็นการปรับปรุงที่ดีขึ้นอย่างเห็นได้ชัดเมื่อเทียบกับ GPT-4o ที่ทำได้ 65%
 
เกี่ยวกับราคา:
	- GPT-4.1 มีค่าใช้จ่าย 2 ดอลลาร์ต่ออินพุต 1 ล้านโทเค็นและ 8 ดอลลาร์สำหรับเอาท์พุต
 
	- GPT-4.1 mini มีราคาอยู่ที่ 0.40 ดอลลาร์สำหรับอินพุตและ 1.60 ดอลลาร์สำหรับเอาท์พุต
 
	- GPT-4.1 nano มีราคาอินพุต 0.10 ดอลลาร์และเอาต์พุต 0.40 ดอลลาร์
 
การใช้แคชพร้อมท์หรือ Batch API สามารถลดต้นทุนเหล่านี้ได้อีก ซึ่งเหมาะอย่างยิ่งสำหรับแอปพลิเคชันขนาดใหญ่ OpenAI กำลังเตรียมยุติการรองรับ GPT-4.5 Preview ในวันที่ 14 กรกฎาคม 2025 โดยอ้างถึงประสิทธิภาพที่ดีกว่า ความหน่วงที่ต่ำกว่า และต้นทุนที่ต่ำกว่าของ GPT-4.1