AI กำลังเรียนรู้ที่จะหลอกมนุษย์แม้จะได้รับการฝึกให้ซื่อสัตย์

AI ชั้นนำหลายตัวแม้จะได้รับการฝึกให้ซื่อสัตย์ แต่ก็เรียนรู้ที่จะหลอกลวงผ่านการฝึกฝนและ "ชักจูงผู้ใช้ให้มีความเชื่อที่ผิด ๆ อย่างเป็นระบบ" จากการศึกษาวิจัยใหม่ล่าสุด

ทีมวิจัยนำโดยดร. ปีเตอร์ เอส. ปาร์ค นักศึกษาระดับปริญญาตรีจากสถาบันเทคโนโลยีแมสซาชูเซตส์ (MIT) สาขาการเอาชีวิตรอดและความปลอดภัยของ AI และสมาชิกอีก 4 คน ในระหว่างการวิจัย ทีมงานยังได้รับคำแนะนำจากผู้เชี่ยวชาญหลายท่าน หนึ่งในนั้นคือ Geoffrey Hinton หนึ่งในผู้ก่อตั้งการพัฒนาด้านปัญญาประดิษฐ์

AI กำลังเรียนรู้ที่จะหลอกมนุษย์แม้จะได้รับการฝึกให้ซื่อสัตย์
ภาพประกอบ: สื่อ.

การวิจัยมุ่งเน้นไปที่ระบบ AI สองระบบ ซึ่งเป็นระบบวัตถุประสงค์ทั่วไปที่ได้รับการฝึกมาให้ทำงานหลายอย่าง เช่นGPT-4ของ OpenAI และระบบที่ออกแบบมาโดยเฉพาะเพื่อทำงานเฉพาะอย่าง เช่น Cicero ของ Meta

ระบบ AI เหล่านี้ได้รับการฝึกมาให้มีความซื่อสัตย์ แต่ระหว่างการฝึก พวกมันมักจะเรียนรู้กลอุบายที่หลอกลวงเพื่อให้ทำงานสำเร็จลุล่วง นายพาร์คกล่าว

การศึกษาพบว่าระบบ AI ที่ได้รับการฝึกฝนให้ "ชนะเกมด้วยองค์ประกอบทางสังคม" มีแนวโน้มที่จะหลอกลวงเป็นพิเศษ

ตัวอย่างเช่น ทีมงานได้พยายามใช้ Cicero ซึ่งได้รับการฝึกฝนจาก Meta เพื่อเล่น Diplomacy ซึ่งเป็นเกมกลยุทธ์คลาสสิกที่ต้องการให้ผู้เล่นสร้างพันธมิตรให้กับตัวเองและทำลายพันธมิตรที่เป็นคู่แข่ง เป็นผลให้ AI มักทรยศพันธมิตรและโกหกโดยตรง

การทดลองกับ GPT-4 แสดงให้เห็นว่าเครื่องมือของ OpenAI สามารถ "หลอกล่อ" พนักงานของ TaskRabbit ซึ่งเป็นบริษัทที่ให้บริการทำความสะอาดบ้านและประกอบเฟอร์นิเจอร์ได้สำเร็จ โดยอ้างว่าพนักงานคนนั้นเป็นมนุษย์จริงๆ และต้องการความช่วยเหลือในการผ่านรหัส Captcha โดยอ้างว่าเขามีปัญหาทางสายตาอย่างรุนแรง พนักงานรายนี้ช่วยให้ AI ของ OpenAI "ข้ามเส้น" ได้ แม้จะยังมีข้อสงสัยมาก่อน

ทีมของ Park อ้างอิงงานวิจัยจาก Anthropic ซึ่งเป็นบริษัทที่อยู่เบื้องหลัง Claude AI ซึ่งพบว่าเมื่อโมเดลภาษาขนาดใหญ่ (LLM) เรียนรู้ที่จะหลอกลวง วิธีการฝึกอบรมที่ปลอดภัยก็จะไร้ประโยชน์และ "ยากที่จะย้อนกลับ" กลุ่มเชื่อว่านี่คือปัญหาที่น่าเป็นห่วงในด้าน AI

ผลการวิจัยของทีมได้รับการตีพิมพ์ใน Cell Press ซึ่งเป็นแหล่งรวมรายงานทางวิทยาศาสตร์สหสาขาวิชาชั้นนำ

Meta และ OpenAI ไม่ได้แสดงความคิดเห็นเกี่ยวกับผลการวิจัยนี้

เนื่องจากเกรงว่าระบบปัญญาประดิษฐ์อาจก่อให้เกิดความเสี่ยงอย่างมาก ทีมงานจึงเรียกร้องให้ผู้กำหนดนโยบายนำกฎระเบียบด้านปัญญาประดิษฐ์ที่เข้มงวดยิ่งขึ้นมาใช้

ตามที่ทีมวิจัยระบุว่า มีความจำเป็นต้องมีการกำกับดูแลด้าน AI โมเดลที่มีพฤติกรรมฉ้อโกงจะถูกบังคับให้ปฏิบัติตามข้อกำหนดการประเมินความเสี่ยง และการควบคุมระบบ AI และผลลัพธ์อย่างเข้มงวด หากจำเป็นอาจจำเป็นต้องลบข้อมูลทั้งหมดและฝึกใหม่ตั้งแต่ต้น

Sign up and earn $1000 a day ⋙

Leave a Comment

ทุกสิ่งที่คุณต้องการเพื่อแทนที่แล็ปท็อปของคุณด้วยโทรศัพท์

ทุกสิ่งที่คุณต้องการเพื่อแทนที่แล็ปท็อปของคุณด้วยโทรศัพท์

คุณสามารถแทนที่แล็ปท็อปด้วยโทรศัพท์ของคุณได้จริงหรือไม่? ใช่ แต่คุณจะต้องมีอุปกรณ์เสริมที่เหมาะสมเพื่อเปลี่ยนโทรศัพท์ของคุณให้เป็นแล็ปท็อป

เร็วๆ นี้ ChatGPT จะสามารถมองเห็นทุกอย่างที่เกิดขึ้นบนหน้าจอของคุณได้

เร็วๆ นี้ ChatGPT จะสามารถมองเห็นทุกอย่างที่เกิดขึ้นบนหน้าจอของคุณได้

สิ่งสำคัญอย่างหนึ่งในวิดีโอเต็มรูปแบบของงานนี้คือมีการสาธิตฟีเจอร์แอป ChatGPT ที่กำลังจะเปิดตัว แต่ไม่ได้มีการเปิดเผยรายละเอียดที่แท้จริง ความสามารถของ ChatGPT คือการดูทุกสิ่งที่เกิดขึ้นบนหน้าจออุปกรณ์ของผู้ใช้

AI กำลังเรียนรู้ที่จะหลอกมนุษย์แม้จะได้รับการฝึกให้ซื่อสัตย์

AI กำลังเรียนรู้ที่จะหลอกมนุษย์แม้จะได้รับการฝึกให้ซื่อสัตย์

AI ชั้นนำหลายตัวแม้จะได้รับการฝึกให้ซื่อสัตย์ แต่ก็เรียนรู้ที่จะหลอกลวงผ่านการฝึกฝน และชักจูงผู้ใช้ให้มีความเชื่อที่ผิด ๆ อย่างเป็นระบบ จากผลการศึกษาวิจัยใหม่ล่าสุด

วิธีการเปลี่ยนคำถามใน ChatGPT

วิธีการเปลี่ยนคำถามใน ChatGPT

ขณะนี้ ChatGPT มีตัวเลือกการเปลี่ยนคำถามเพื่อให้ผู้ใช้สามารถแก้ไขคำถามหรือเนื้อหาที่พวกเขากำลังแลกเปลี่ยนกับ ChatGPT ได้

วิธีการระบุรหัส QR ปลอมและรักษาข้อมูลของคุณให้ปลอดภัย

วิธีการระบุรหัส QR ปลอมและรักษาข้อมูลของคุณให้ปลอดภัย

รหัส QR อาจดูไม่เป็นอันตรายจนกว่าคุณจะสแกนรหัส QR ที่ไม่ดีแล้วพบสิ่งที่ไม่น่าไว้ใจโยนเข้ามาในระบบของคุณ หากคุณต้องการรักษาโทรศัพท์และข้อมูลของคุณให้ปลอดภัย มีหลายวิธีในการระบุรหัส QR ปลอม

Qualcomm เปิดตัวโมเด็ม X85 5G พร้อมการปรับปรุงที่สำคัญหลายประการ

Qualcomm เปิดตัวโมเด็ม X85 5G พร้อมการปรับปรุงที่สำคัญหลายประการ

บนเวทีงาน MWC 2025 บริษัท Qualcomm สร้างความฮือฮาเมื่อเปิดตัวโมเด็ม 5G รุ่นที่ 8 ที่เรียกว่า X85 ซึ่งคาดว่าจะใช้ในสมาร์ทโฟนเรือธงที่เปิดตัวในช่วงปลายปีนี้

เทคโนโลยีใหม่ช่วยให้โทรศัพท์สามารถเปลี่ยนสีได้อย่างยืดหยุ่น

เทคโนโลยีใหม่ช่วยให้โทรศัพท์สามารถเปลี่ยนสีได้อย่างยืดหยุ่น

คุณมี iPhone 16 สี “Ultramarine” สุดเทรนด์ แต่เมื่อถึงวันดีคืนดี คุณก็รู้สึกเบื่อสีนั้นขึ้นมา คุณจะทำอย่างไร?

Microsoft รวม DeepSeek เข้ากับแพลตฟอร์ม PC Copilot+

Microsoft รวม DeepSeek เข้ากับแพลตฟอร์ม PC Copilot+

ในเดือนมกราคม Microsoft ได้ประกาศแผนที่จะนำเวอร์ชันที่ปรับแต่ง NPU ของรุ่น DeepSeek-R1 มาสู่คอมพิวเตอร์ Copilot+ ที่ทำงานบนโปรเซสเซอร์ Qualcomm Snapdragon X โดยตรง

ความแตกต่างระหว่างฟังก์ชัน IF และ Switch ใน Excel

ความแตกต่างระหว่างฟังก์ชัน IF และ Switch ใน Excel

คำสั่ง IF เป็นฟังก์ชันตรรกะทั่วไปใน Excel คำสั่ง SWITCH เป็นที่รู้จักน้อยกว่า แต่คุณสามารถใช้แทนคำสั่ง IF ได้ในบางกรณี

วิธีเพิ่มเอฟเฟกต์สปอตไลท์ด้านหลังตัวแบบโดยใช้ Adobe Camera Raw

วิธีเพิ่มเอฟเฟกต์สปอตไลท์ด้านหลังตัวแบบโดยใช้ Adobe Camera Raw

การเพิ่มเอฟเฟกต์สปอตไลท์ไว้ด้านหลังตัวแบบในภาพถ่ายเป็นวิธีที่ยอดเยี่ยมในการสร้างความแตกต่างระหว่างตัวแบบกับพื้นหลัง เอฟเฟกต์สปอตไลท์สามารถเพิ่มความลึกให้กับภาพถ่ายบุคคลได้

วิธีเพิ่มขีดจำกัดขนาดไฟล์แนบใน Outlook

วิธีเพิ่มขีดจำกัดขนาดไฟล์แนบใน Outlook

Outlook และบริการอีเมลอื่นๆ มีข้อจำกัดเกี่ยวกับขนาดของไฟล์แนบในอีเมล ต่อไปนี้เป็นคำแนะนำในการเพิ่มขีดจำกัดขนาดไฟล์แนบใน Outlook

เหตุใด Lightroom จึงดีกว่าแอปแก้ไขรูปภาพอื่น ๆ

เหตุใด Lightroom จึงดีกว่าแอปแก้ไขรูปภาพอื่น ๆ

แม้ว่าจะมีคู่แข่งจำนวนมาก แต่ Adobe Lightroom ยังคงเป็นแอปแก้ไขภาพที่ดีที่สุด ใช่ คุณต้องจ่ายเงินเพื่อเข้าใช้งาน แต่ชุดคุณสมบัติของ Lightroom ก็คุ้มค่า

วิธีใช้ Apple Invites เพื่อสร้างกิจกรรม

วิธีใช้ Apple Invites เพื่อสร้างกิจกรรม

Apple ได้เปิดตัวแอปพลิเคชันจัดการกิจกรรมของตัวเองชื่อว่า Invites แอปนี้ช่วยให้คุณสามารถสร้างกิจกรรม ส่งคำเชิญ และจัดการการตอบกลับ

สูตรโกง Heroes 3, รหัส Heroes 3 ทุกเวอร์ชัน

สูตรโกง Heroes 3, รหัส Heroes 3 ทุกเวอร์ชัน

นี่คือรหัส Heroes 3 ทั้งหมด, สูตรโกง Heroes 3 สำหรับทุกเวอร์ชัน เช่น สูตรโกง Heroes 3 WoG, Heroes 3 SoD, Heroes 3 of Might and Magic

รหัส Tay Du VNG ล่าสุดและวิธีการป้อนรหัส

รหัส Tay Du VNG ล่าสุดและวิธีการป้อนรหัส

รหัส Tay Du VNG ล่าสุดมอบรางวัลน่าดึงดูดมากมายให้กับผู้เล่น เช่น น้ำอมฤต, เงิน, แท่งทอง, หีบรางวัลและไอเทมอื่นๆ อีกมากมายเพื่อช่วยให้ผู้เล่นใหม่เปิดเทิร์นทั่วไปได้