AI กำลังเรียนรู้ที่จะหลอกมนุษย์แม้จะได้รับการฝึกให้ซื่อสัตย์

AI ชั้นนำหลายตัวแม้จะได้รับการฝึกให้ซื่อสัตย์ แต่ก็เรียนรู้ที่จะหลอกลวงผ่านการฝึกฝนและ "ชักจูงผู้ใช้ให้มีความเชื่อที่ผิด ๆ อย่างเป็นระบบ" จากการศึกษาวิจัยใหม่ล่าสุด

ทีมวิจัยนำโดยดร. ปีเตอร์ เอส. ปาร์ค นักศึกษาระดับปริญญาตรีจากสถาบันเทคโนโลยีแมสซาชูเซตส์ (MIT) สาขาการเอาชีวิตรอดและความปลอดภัยของ AI และสมาชิกอีก 4 คน ในระหว่างการวิจัย ทีมงานยังได้รับคำแนะนำจากผู้เชี่ยวชาญหลายท่าน หนึ่งในนั้นคือ Geoffrey Hinton หนึ่งในผู้ก่อตั้งการพัฒนาด้านปัญญาประดิษฐ์

AI กำลังเรียนรู้ที่จะหลอกมนุษย์แม้จะได้รับการฝึกให้ซื่อสัตย์
ภาพประกอบ: สื่อ.

การวิจัยมุ่งเน้นไปที่ระบบ AI สองระบบ ซึ่งเป็นระบบวัตถุประสงค์ทั่วไปที่ได้รับการฝึกมาให้ทำงานหลายอย่าง เช่นGPT-4ของ OpenAI และระบบที่ออกแบบมาโดยเฉพาะเพื่อทำงานเฉพาะอย่าง เช่น Cicero ของ Meta

ระบบ AI เหล่านี้ได้รับการฝึกมาให้มีความซื่อสัตย์ แต่ระหว่างการฝึก พวกมันมักจะเรียนรู้กลอุบายที่หลอกลวงเพื่อให้ทำงานสำเร็จลุล่วง นายพาร์คกล่าว

การศึกษาพบว่าระบบ AI ที่ได้รับการฝึกฝนให้ "ชนะเกมด้วยองค์ประกอบทางสังคม" มีแนวโน้มที่จะหลอกลวงเป็นพิเศษ

ตัวอย่างเช่น ทีมงานได้พยายามใช้ Cicero ซึ่งได้รับการฝึกฝนจาก Meta เพื่อเล่น Diplomacy ซึ่งเป็นเกมกลยุทธ์คลาสสิกที่ต้องการให้ผู้เล่นสร้างพันธมิตรให้กับตัวเองและทำลายพันธมิตรที่เป็นคู่แข่ง เป็นผลให้ AI มักทรยศพันธมิตรและโกหกโดยตรง

การทดลองกับ GPT-4 แสดงให้เห็นว่าเครื่องมือของ OpenAI สามารถ "หลอกล่อ" พนักงานของ TaskRabbit ซึ่งเป็นบริษัทที่ให้บริการทำความสะอาดบ้านและประกอบเฟอร์นิเจอร์ได้สำเร็จ โดยอ้างว่าพนักงานคนนั้นเป็นมนุษย์จริงๆ และต้องการความช่วยเหลือในการผ่านรหัส Captcha โดยอ้างว่าเขามีปัญหาทางสายตาอย่างรุนแรง พนักงานรายนี้ช่วยให้ AI ของ OpenAI "ข้ามเส้น" ได้ แม้จะยังมีข้อสงสัยมาก่อน

ทีมของ Park อ้างอิงงานวิจัยจาก Anthropic ซึ่งเป็นบริษัทที่อยู่เบื้องหลัง Claude AI ซึ่งพบว่าเมื่อโมเดลภาษาขนาดใหญ่ (LLM) เรียนรู้ที่จะหลอกลวง วิธีการฝึกอบรมที่ปลอดภัยก็จะไร้ประโยชน์และ "ยากที่จะย้อนกลับ" กลุ่มเชื่อว่านี่คือปัญหาที่น่าเป็นห่วงในด้าน AI

ผลการวิจัยของทีมได้รับการตีพิมพ์ใน Cell Press ซึ่งเป็นแหล่งรวมรายงานทางวิทยาศาสตร์สหสาขาวิชาชั้นนำ

Meta และ OpenAI ไม่ได้แสดงความคิดเห็นเกี่ยวกับผลการวิจัยนี้

เนื่องจากเกรงว่าระบบปัญญาประดิษฐ์อาจก่อให้เกิดความเสี่ยงอย่างมาก ทีมงานจึงเรียกร้องให้ผู้กำหนดนโยบายนำกฎระเบียบด้านปัญญาประดิษฐ์ที่เข้มงวดยิ่งขึ้นมาใช้

ตามที่ทีมวิจัยระบุว่า มีความจำเป็นต้องมีการกำกับดูแลด้าน AI โมเดลที่มีพฤติกรรมฉ้อโกงจะถูกบังคับให้ปฏิบัติตามข้อกำหนดการประเมินความเสี่ยง และการควบคุมระบบ AI และผลลัพธ์อย่างเข้มงวด หากจำเป็นอาจจำเป็นต้องลบข้อมูลทั้งหมดและฝึกใหม่ตั้งแต่ต้น

Sign up and earn $1000 a day ⋙

Leave a Comment

แล็ปท็อปที่ดีที่สุดสำหรับนักเรียนในปี 2025

แล็ปท็อปที่ดีที่สุดสำหรับนักเรียนในปี 2025

นักศึกษาจำเป็นต้องมีแล็ปท็อปเฉพาะทางสำหรับการเรียน ไม่เพียงแต่จะต้องมีพลังเพียงพอที่จะทำงานได้ดีในสาขาวิชาที่เลือกเท่านั้น แต่ยังต้องมีขนาดกะทัดรัดและน้ำหนักเบาพอที่จะพกพาไปได้ตลอดวัน

วิธีเพิ่มเครื่องพิมพ์ลงใน Windows 10

วิธีเพิ่มเครื่องพิมพ์ลงใน Windows 10

การเพิ่มเครื่องพิมพ์ลงใน Windows 10 เป็นเรื่องง่าย แม้ว่ากระบวนการสำหรับอุปกรณ์แบบมีสายจะแตกต่างจากอุปกรณ์ไร้สายก็ตาม

วิธีตรวจสอบ RAM และตรวจสอบข้อผิดพลาด RAM บนคอมพิวเตอร์ของคุณด้วยอัตราความแม่นยำสูงสุด

วิธีตรวจสอบ RAM และตรวจสอบข้อผิดพลาด RAM บนคอมพิวเตอร์ของคุณด้วยอัตราความแม่นยำสูงสุด

อย่างที่ทราบกันดีว่า RAM เป็นส่วนประกอบฮาร์ดแวร์ที่สำคัญมากในคอมพิวเตอร์ ทำหน้าที่เป็นหน่วยความจำในการประมวลผลข้อมูล และเป็นปัจจัยที่กำหนดความเร็วของแล็ปท็อปหรือพีซี ในบทความด้านล่างนี้ WebTech360 จะแนะนำวิธีการตรวจสอบข้อผิดพลาดของ RAM โดยใช้ซอฟต์แวร์บน Windows

ความแตกต่างระหว่างทีวีธรรมดากับสมาร์ททีวี

ความแตกต่างระหว่างทีวีธรรมดากับสมาร์ททีวี

สมาร์ททีวีเข้ามาครองโลกอย่างแท้จริง ด้วยคุณสมบัติที่ยอดเยี่ยมมากมายและการเชื่อมต่ออินเทอร์เน็ต เทคโนโลยีได้เปลี่ยนแปลงวิธีการชมทีวีของเรา

ทำไมช่องแช่แข็งไม่มีแสง แต่ตู้เย็นมี?

ทำไมช่องแช่แข็งไม่มีแสง แต่ตู้เย็นมี?

ตู้เย็นเป็นเครื่องใช้ไฟฟ้าที่คุ้นเคยในครัวเรือน ตู้เย็นโดยทั่วไปจะมี 2 ช่อง โดยช่องแช่เย็นจะมีขนาดกว้างขวางและมีไฟที่เปิดอัตโนมัติทุกครั้งที่ผู้ใช้งานเปิด ในขณะที่ช่องแช่แข็งจะแคบและไม่มีไฟส่องสว่าง

2 วิธีในการแก้ไขความแออัดของเครือข่ายที่ทำให้ Wi-Fi ช้าลง

2 วิธีในการแก้ไขความแออัดของเครือข่ายที่ทำให้ Wi-Fi ช้าลง

เครือข่าย Wi-Fi ได้รับผลกระทบจากปัจจัยหลายประการนอกเหนือจากเราเตอร์ แบนด์วิดท์ และสัญญาณรบกวน แต่ยังมีวิธีชาญฉลาดบางอย่างในการเพิ่มประสิทธิภาพเครือข่ายของคุณ

วิธีดาวน์เกรดจาก iOS 17 เป็น iOS 16 โดยไม่สูญเสียข้อมูลโดยใช้ Tenorshare Reiboot

วิธีดาวน์เกรดจาก iOS 17 เป็น iOS 16 โดยไม่สูญเสียข้อมูลโดยใช้ Tenorshare Reiboot

หากคุณต้องการกลับไปใช้ iOS 16 ที่เสถียรบนโทรศัพท์ของคุณ นี่คือคำแนะนำพื้นฐานในการถอนการติดตั้ง iOS 17 และดาวน์เกรดจาก iOS 17 เป็น 16

เมื่อกินโยเกิร์ตเป็นประจำทุกวัน จะเกิดอะไรขึ้นกับร่างกาย?

เมื่อกินโยเกิร์ตเป็นประจำทุกวัน จะเกิดอะไรขึ้นกับร่างกาย?

โยเกิร์ตเป็นอาหารที่ยอดเยี่ยม กินโยเกิร์ตทุกวันดีจริงหรือ? เมื่อคุณกินโยเกิร์ตทุกวัน ร่างกายจะเปลี่ยนแปลงไปอย่างไรบ้าง? ลองไปหาคำตอบไปด้วยกัน!

ข้าวประเภทไหนดีต่อสุขภาพมากที่สุด?

ข้าวประเภทไหนดีต่อสุขภาพมากที่สุด?

บทความนี้จะกล่าวถึงประเภทของข้าวที่มีคุณค่าทางโภชนาการสูงสุดและวิธีเพิ่มประโยชน์ด้านสุขภาพจากข้าวที่คุณเลือก

วิธีตื่นนอนให้ตรงเวลาในตอนเช้า

วิธีตื่นนอนให้ตรงเวลาในตอนเช้า

การกำหนดตารางเวลาการนอนและกิจวัตรประจำวันก่อนเข้านอน การเปลี่ยนนาฬิกาปลุก และการปรับเปลี่ยนการรับประทานอาหารเป็นมาตรการบางประการที่จะช่วยให้คุณนอนหลับได้ดีขึ้นและตื่นนอนตรงเวลาในตอนเช้า

เคล็ดลับสำหรับการเล่น Rent Please! การจำลองผู้ให้เช่าบ้านสำหรับมือใหม่

เคล็ดลับสำหรับการเล่น Rent Please! การจำลองผู้ให้เช่าบ้านสำหรับมือใหม่

ขอเช่าหน่อยคะ! Landlord Sim เป็นเกมจำลองมือถือบน iOS และ Android คุณจะเล่นเป็นเจ้าของอพาร์ทเมนท์และเริ่มให้เช่าอพาร์ทเมนท์โดยมีเป้าหมายในการอัพเกรดภายในอพาร์ทเมนท์ของคุณและเตรียมพร้อมสำหรับผู้เช่า

รหัสป้องกันหอคอยในห้องน้ำล่าสุดและวิธีการป้อนรหัส

รหัสป้องกันหอคอยในห้องน้ำล่าสุดและวิธีการป้อนรหัส

รับรหัสเกม Bathroom Tower Defense Roblox และแลกรับรางวัลสุดน่าตื่นเต้น พวกเขาจะช่วยคุณอัพเกรดหรือปลดล็อคหอคอยที่สร้างความเสียหายได้มากขึ้น

โครงสร้าง สัญลักษณ์ และหลักการทำงานของหม้อแปลงไฟฟ้า

โครงสร้าง สัญลักษณ์ และหลักการทำงานของหม้อแปลงไฟฟ้า

มาเรียนรู้เรื่องโครงสร้าง สัญลักษณ์ และหลักการทำงานของหม้อแปลงแบบแม่นยำที่สุดกันดีกว่า

4 วิธีที่ AI ช่วยทำให้สมาร์ททีวีดีขึ้น

4 วิธีที่ AI ช่วยทำให้สมาร์ททีวีดีขึ้น

ตั้งแต่คุณภาพของภาพและเสียงที่ดีขึ้นไปจนถึงการควบคุมด้วยเสียงและอื่นๆ อีกมากมาย คุณสมบัติที่ขับเคลื่อนด้วย AI เหล่านี้ทำให้สมาร์ททีวีดีขึ้นมาก!

เหตุใด ChatGPT จึงดีกว่า DeepSeek

เหตุใด ChatGPT จึงดีกว่า DeepSeek

ในตอนแรกผู้คนมีความหวังสูงกับ DeepSeek ในฐานะแชทบอท AI ที่ทำการตลาดในฐานะคู่แข่งที่แข็งแกร่งของ ChatGPT จึงรับประกันถึงความสามารถและประสบการณ์การแชทอันชาญฉลาด