OpenAI เพิ่งประกาศเปิดตัวโครงการ Pioneers ซึ่งเป็นโครงการที่มีวัตถุประสงค์เพื่อส่งเสริมการประยุกต์ใช้ AI ในสถานการณ์โลกแห่งความเป็นจริง โปรแกรมดังกล่าวมุ่งเน้นที่การปรับปรุงวิธีการประเมินโมเดล AI เนื่องจากนักพัฒนาและธุรกิจต่างๆ พึ่งพาเกณฑ์มาตรฐานมากขึ้นในการเลือกและเพิ่มประสิทธิภาพโมเดลที่เหมาะสม
การเคลื่อนไหวดังกล่าวเกิดขึ้นหลังจากที่ Meta ถูกกล่าวหาว่าจัดการเกณฑ์มาตรฐาน LMArena เพื่อเพิ่มอันดับของโมเดล Llama 4 ของพวกเขา โครงการผู้บุกเบิกมีเป้าหมายที่จะทำงานร่วมกับบริษัทต่างๆ และนักวิจัย OpenAI เพื่อพัฒนามาตรฐานการประเมินที่สะท้อนถึงความท้าทายในโลกแห่งความเป็นจริง มากกว่าแค่การแข่งขันกันเพื่อคะแนนบนกระดานผู้นำเท่านั้น
ตามที่ OpenAI ระบุ บริษัทที่ได้รับการคัดเลือกจะได้รับการสนับสนุนโดยตรงจากทีมวิจัยของตน โดยมุ่งเน้นที่เป้าหมายหลักสองประการ ได้แก่
- สร้างเกณฑ์มาตรฐานสำหรับแต่ละสาขา : พัฒนาวิธีการประเมินที่แยกจากกันสำหรับแต่ละสาขา (กฎหมาย การเงิน การแพทย์ การประกันภัย การบัญชี)
- ปรับแต่งการฝึกอบรมโมเดลให้เหมาะสม : พัฒนาโมเดล AI เชิงลึกที่ตอบโจทย์สามกรณีการใช้งานทางธุรกิจที่สำคัญที่สุด
OpenAI เน้นย้ำว่าขณะนี้ยังไม่มีมาตรฐานกลางในการวัดประสิทธิภาพของ AI ในหลายๆ ด้านเหล่านี้ ส่งผลให้เกิดความยากลำบากในการประเมินหรือปรับปรุงโมเดลอย่างยุติธรรม โดยการทำงานโดยตรง บริษัทหวังว่าจะสามารถกำหนดได้อย่างชัดเจนถึง "สิ่งที่มีประสิทธิผล" ในแต่ละอุตสาหกรรมและเผยแพร่เกณฑ์เหล่านี้เพื่อให้ชุมชนนำไปใช้
ในด้านการปรับแต่งโมเดล บริษัทที่เข้าร่วมจะได้รับการสนับสนุนในการฝึกอบรม AI เวอร์ชันที่กำหนดเองโดยใช้ Reinforcement Fine-Tuning (RFT) ซึ่งเป็นวิธีของ OpenAI ในการสร้างโมเดล "ผู้เชี่ยวชาญ" ที่โดดเด่นในชุดงานที่เฉพาะเจาะจง โมเดลเหล่านี้มุ่งมั่นที่จะเตรียมพร้อมสำหรับการปรับใช้ในระดับการผลิต
สำหรับแผนงานการดำเนินการระยะแรกจะมุ่งเน้นไปที่กลุ่มสตาร์ทอัพที่เลือกตามผลกระทบจริงของผลิตภัณฑ์เป็นหลัก OpenAI ให้ความสำคัญกับทีมงานที่มีปัญหาเกี่ยวกับเฉพาะเจาะจง โดยที่ AI เชิงลึกสามารถสร้างความแตกต่างได้อย่างเป็นรูปธรรม พร้อมขยายไปสู่กลุ่มองค์กรขนาดใหญ่และสาขาที่ซับซ้อนมากขึ้นในอนาคต