AI กำลังเรียนรู้ที่จะหลอกมนุษย์แม้จะได้รับการฝึกให้ซื่อสัตย์

AI ชั้นนำหลายตัวแม้จะได้รับการฝึกให้ซื่อสัตย์ แต่ก็เรียนรู้ที่จะหลอกลวงผ่านการฝึกฝนและ "ชักจูงผู้ใช้ให้มีความเชื่อที่ผิด ๆ อย่างเป็นระบบ" จากการศึกษาวิจัยใหม่ล่าสุด

ทีมวิจัยนำโดยดร. ปีเตอร์ เอส. ปาร์ค นักศึกษาระดับปริญญาตรีจากสถาบันเทคโนโลยีแมสซาชูเซตส์ (MIT) สาขาการเอาชีวิตรอดและความปลอดภัยของ AI และสมาชิกอีก 4 คน ในระหว่างการวิจัย ทีมงานยังได้รับคำแนะนำจากผู้เชี่ยวชาญหลายท่าน หนึ่งในนั้นคือ Geoffrey Hinton หนึ่งในผู้ก่อตั้งการพัฒนาด้านปัญญาประดิษฐ์

AI กำลังเรียนรู้ที่จะหลอกมนุษย์แม้จะได้รับการฝึกให้ซื่อสัตย์
ภาพประกอบ: สื่อ.

การวิจัยมุ่งเน้นไปที่ระบบ AI สองระบบ ซึ่งเป็นระบบวัตถุประสงค์ทั่วไปที่ได้รับการฝึกมาให้ทำงานหลายอย่าง เช่นGPT-4ของ OpenAI และระบบที่ออกแบบมาโดยเฉพาะเพื่อทำงานเฉพาะอย่าง เช่น Cicero ของ Meta

ระบบ AI เหล่านี้ได้รับการฝึกมาให้มีความซื่อสัตย์ แต่ระหว่างการฝึก พวกมันมักจะเรียนรู้กลอุบายที่หลอกลวงเพื่อให้ทำงานสำเร็จลุล่วง นายพาร์คกล่าว

การศึกษาพบว่าระบบ AI ที่ได้รับการฝึกฝนให้ "ชนะเกมด้วยองค์ประกอบทางสังคม" มีแนวโน้มที่จะหลอกลวงเป็นพิเศษ

ตัวอย่างเช่น ทีมงานได้พยายามใช้ Cicero ซึ่งได้รับการฝึกฝนจาก Meta เพื่อเล่น Diplomacy ซึ่งเป็นเกมกลยุทธ์คลาสสิกที่ต้องการให้ผู้เล่นสร้างพันธมิตรให้กับตัวเองและทำลายพันธมิตรที่เป็นคู่แข่ง เป็นผลให้ AI มักทรยศพันธมิตรและโกหกโดยตรง

การทดลองกับ GPT-4 แสดงให้เห็นว่าเครื่องมือของ OpenAI สามารถ "หลอกล่อ" พนักงานของ TaskRabbit ซึ่งเป็นบริษัทที่ให้บริการทำความสะอาดบ้านและประกอบเฟอร์นิเจอร์ได้สำเร็จ โดยอ้างว่าพนักงานคนนั้นเป็นมนุษย์จริงๆ และต้องการความช่วยเหลือในการผ่านรหัส Captcha โดยอ้างว่าเขามีปัญหาทางสายตาอย่างรุนแรง พนักงานรายนี้ช่วยให้ AI ของ OpenAI "ข้ามเส้น" ได้ แม้จะยังมีข้อสงสัยมาก่อน

ทีมของ Park อ้างอิงงานวิจัยจาก Anthropic ซึ่งเป็นบริษัทที่อยู่เบื้องหลัง Claude AI ซึ่งพบว่าเมื่อโมเดลภาษาขนาดใหญ่ (LLM) เรียนรู้ที่จะหลอกลวง วิธีการฝึกอบรมที่ปลอดภัยก็จะไร้ประโยชน์และ "ยากที่จะย้อนกลับ" กลุ่มเชื่อว่านี่คือปัญหาที่น่าเป็นห่วงในด้าน AI

ผลการวิจัยของทีมได้รับการตีพิมพ์ใน Cell Press ซึ่งเป็นแหล่งรวมรายงานทางวิทยาศาสตร์สหสาขาวิชาชั้นนำ

Meta และ OpenAI ไม่ได้แสดงความคิดเห็นเกี่ยวกับผลการวิจัยนี้

เนื่องจากเกรงว่าระบบปัญญาประดิษฐ์อาจก่อให้เกิดความเสี่ยงอย่างมาก ทีมงานจึงเรียกร้องให้ผู้กำหนดนโยบายนำกฎระเบียบด้านปัญญาประดิษฐ์ที่เข้มงวดยิ่งขึ้นมาใช้

ตามที่ทีมวิจัยระบุว่า มีความจำเป็นต้องมีการกำกับดูแลด้าน AI โมเดลที่มีพฤติกรรมฉ้อโกงจะถูกบังคับให้ปฏิบัติตามข้อกำหนดการประเมินความเสี่ยง และการควบคุมระบบ AI และผลลัพธ์อย่างเข้มงวด หากจำเป็นอาจจำเป็นต้องลบข้อมูลทั้งหมดและฝึกใหม่ตั้งแต่ต้น

Sign up and earn $1000 a day ⋙

Leave a Comment

วิธีง่ายๆ ในการแก้ไขคอมพิวเตอร์ดับลงกะทันหัน

วิธีง่ายๆ ในการแก้ไขคอมพิวเตอร์ดับลงกะทันหัน

หากโชคร้ายคุณกำลังใช้งานมันแล้วคอมพิวเตอร์ก็ปิดลงกะทันหัน คุณสงสัยว่าคอมพิวเตอร์ของคุณมีปัญหาอะไรใช่ไหม? บทความนี้จะแนะนำวิธีแก้ไขข้อผิดพลาดนี้

วิธีการลบรายการอ่านบน Safari

วิธีการลบรายการอ่านบน Safari

เมื่อเวลาผ่านไป เมื่อคุณใช้รายการอ่านใน Safari บ่อยขึ้น รายการต่างๆ อาจมีจำนวนมากขึ้นและยุ่งเหยิง ต่อไปนี้เป็นคำแนะนำในการล้างรายการอ่านของคุณบน Safari

วิธีการสร้างหัวข้อกลุ่ม Telegram เพื่อการสนทนา

วิธีการสร้างหัวข้อกลุ่ม Telegram เพื่อการสนทนา

หัวข้อกลุ่ม Telegram จะแยกจากข้อความในกลุ่ม Telegram และคุณสามารถสร้างหัวข้อการสนทนาได้หลายหัวข้อ บทความด้านล่างนี้จะช่วยแนะนำคุณในการสร้างหัวข้อกลุ่ม Telegram

คอยล์เทสลาสามารถปล่อยกระแสไฟฟ้าและร้องเพลงได้

คอยล์เทสลาสามารถปล่อยกระแสไฟฟ้าและร้องเพลงได้

คอยล์เทสลาสร้างวงจรหม้อแปลงเรโซแนนซ์ ซึ่งเป็นสิ่งประดิษฐ์อันโด่งดังของอัจฉริยะผู้ชาญฉลาดอย่างนิโคลา เทสลา ใช้ในการผลิตกระแสไฟฟ้าสลับความถี่สูง ความเข้มข้นต่ำ ไม่เพียงแค่การคายประจุเท่านั้น ด้วยความฉลาดและความคิดสร้างสรรค์ มนุษย์ยังทำให้คอยล์เทสลาเปล่งเสียงได้อีกด้วย

ย้ายอาคารโบราณหนัก 220 ตัน พร้อมสบู่ 700 ก้อน

ย้ายอาคารโบราณหนัก 220 ตัน พร้อมสบู่ 700 ก้อน

เมื่อต้นเดือนธันวาคม บริษัทก่อสร้าง S. Rushton ประสบความสำเร็จในการเคลื่อนย้ายอาคารเก่าแก่ที่มีน้ำหนักถึง 220 ตัน ในเมืองแฮลิแฟกซ์ รัฐโนวาสโกเชีย ประเทศแคนาดา ได้เป็นระยะทาง 9 เมตร ด้วย "ความช่วยเหลือ" จากสบู่ก้อนประมาณ 700 ก้อน

เครื่องยนต์ความเร็วเหนือเสียงทำความเร็วได้ถึง 19,756 กม./ชม.

เครื่องยนต์ความเร็วเหนือเสียงทำความเร็วได้ถึง 19,756 กม./ชม.

นักวิจัยอาวุธความเร็วเหนือเสียงชาวจีนสร้างเครื่องยนต์โรตารีระเบิดที่ทรงพลังที่สุดในโลก ซึ่งทำให้เครื่องบินเดินทางได้ด้วยความเร็ว 19,756 กิโลเมตรต่อชั่วโมง (มัค 16) ที่ระดับความสูง 30 กิโลเมตร

สถานะอวยพรวันเกิดภาษาอังกฤษ

สถานะอวยพรวันเกิดภาษาอังกฤษ

ต่อไปนี้เป็นสถานะบางส่วนสำหรับอวยพรวันเกิดตัวเองเป็นภาษาอังกฤษ คำอวยพรวันเกิดเป็นภาษาอังกฤษสำหรับตัวเองที่ดีและมีความหมาย โปรดอ้างอิงถึงสถานะเหล่านั้น

1 ลิตร เท่ากับกี่มิลลิลิตร, กิโลกรัม, ลูกบาศก์เมตร?

1 ลิตร เท่ากับกี่มิลลิลิตร, กิโลกรัม, ลูกบาศก์เมตร?

1กก.เท่ากับกี่มล.? 1มิลลิลิตรเท่ากับกี่กิโลกรัม? มาเรียนรู้วิธีการแปลงหน่วยน้ำหนักเหล่านี้กันดีกว่า!

AI แปลภาษาสัตว์ช่วยให้มนุษย์เข้าใจเสียงสุนัขเห่า

AI แปลภาษาสัตว์ช่วยให้มนุษย์เข้าใจเสียงสุนัขเห่า

ต้องขอบคุณปัญญาประดิษฐ์ (AI) ที่ทำให้สิ่งที่ดูเหมือนเป็นความฝันในภาพยนตร์ - มนุษย์สามารถเข้าใจภาษาสัตว์ได้ - อาจกลายเป็นความจริงในเร็วๆ นี้

การตั้งค่ากล้องบนโทรศัพท์ของคุณทำอะไรได้บ้าง?

การตั้งค่ากล้องบนโทรศัพท์ของคุณทำอะไรได้บ้าง?

การรู้ว่าคุณลักษณะแต่ละอย่างทำหน้าที่อะไรสามารถสร้างความแตกต่างระหว่างภาพถ่ายที่ดีกับภาพถ่ายที่ยอดเยี่ยมได้

OpenAI เปิดตัวเครื่องมือใหม่เพื่อช่วยให้นักพัฒนาสร้างตัวแทน AI

OpenAI เปิดตัวเครื่องมือใหม่เพื่อช่วยให้นักพัฒนาสร้างตัวแทน AI

เมื่อมองว่าตัวแทน AI เป็นอนาคตของอุตสาหกรรมปัญญาประดิษฐ์ OpenAI ยอมรับว่าการสร้างตัวแทน "ระดับอุตสาหกรรม" อันทรงพลังด้วยเครื่องมือปัจจุบันเป็นเรื่องยากมาก

Pocket Casts: แอปพลิเคชั่น Podcast ที่ดีที่สุดบนเดสก์ท็อปที่ดาวน์โหลดฟรีได้แล้ว

Pocket Casts: แอปพลิเคชั่น Podcast ที่ดีที่สุดบนเดสก์ท็อปที่ดาวน์โหลดฟรีได้แล้ว

ข่าวดีสำหรับแฟนๆ พอดแคสต์ ปัจจุบันสามารถใช้งาน Pocket Casts ได้ฟรีบนเว็บ รวมถึงผ่านแอพ Mac และ Windows

ชมภาพแรกของยานลงจอด Blue Ghost บนพื้นผิวดวงจันทร์

ชมภาพแรกของยานลงจอด Blue Ghost บนพื้นผิวดวงจันทร์

ด้วยการมาถึงของยานลงจอด Blue Ghost บนดวงจันทร์ในสุดสัปดาห์นี้ นักดาราศาสตร์ทั่วโลกต่างตั้งตารอคอยชุดภาพใหม่ที่น่าทึ่งอย่างกระตือรือร้น ซึ่งจะทำให้คุณเข้าใจบรรยากาศของดาวบริวารธรรมชาติของโลกเราอย่างแท้จริง และไม่เคยเห็นมาก่อน

วิธีการใช้ค่าคงที่ใน Golang

วิธีการใช้ค่าคงที่ใน Golang

ค่าคงที่หรือ Const ใน Golang คืออะไร? นี่คือสิ่งที่คุณจำเป็นต้องรู้เกี่ยวกับการใช้ค่าคงที่ใน Go

วิธีรับรหัสผ่าน Facebook ที่ถูกแฮ็กและอีเมลลงทะเบียนที่สูญหายกลับคืนมา

วิธีรับรหัสผ่าน Facebook ที่ถูกแฮ็กและอีเมลลงทะเบียนที่สูญหายกลับคืนมา

บางครั้งขณะใช้ Facebook บัญชีของคุณอาจถูกแฮ็ก สูญเสียรหัสผ่าน หรือแม้กระทั่งอีเมลการลงทะเบียน Facebook ของคุณ แล้วคุณจะได้รับบัญชี Facebook ของคุณกลับคืนมาได้อย่างไรเมื่อคุณสูญเสียรหัสผ่านและอีเมลสำหรับการลงทะเบียน?