AI โกงไม่เป็น? นักวิจัยพบ AI รุ่นใหม่ล่าสุดบางรุ่น “โกง” เพื่อบรรลุเป้าหมาย ในการทดลองแข่งหมากรุก AI บางตัวแฮกคู่ต่อสู้เพื่อเอาชนะ ซึ่งสิ่งทีเกิดขึ้นนี้ไม่มีการแทรกแซงหรือการกระตุ้นจากมนุษย์ ก่อให้เกิดความกังวลเกี่ยวกับการพัฒนา AI ในอนาคต
การวิจัย AI โกงหมายรุก
จากการศึกษาของ Palisade Research พบว่า เอไออย่าง GPT-4o ของ OpenAI และ Claude Sonnet 3.5 ของ Anthropic ที่เป็นโมเดลรุ่นที่เก่ากว่ารุ่นปุจจุบันเล็กน้อย จะเริ่มโกงเมื่อได้รับคำแนะนำจากนักวิจัย ขณะที่ โมเดล AI ขั้นสูง เช่น o1-preview ของ OpenAI และ DeepSeek R1 กลับโกงเองโดยไม่มีมนุษย์แทรกแซงหรือกระตุ้น เมื่อ AI เหล่านี้กำลังจะพ่ายแพ้ บางครั้งมันก็จะแฮกคู่ต่อสู้เพื่อให้บอทยอมแพ้อัตโนมัติ
ทีมวิจัย Palisade ได้นำแบบจำลอง AI หลายแบบมาต่อสู้กับ Stockfish ซึ่งเป็นหนึ่งในบอทหมากรุกที่ดีที่สุดในโลก Stockfish สามารถเอาชนะได้ทั้งมนุษย์และ AI ได้อย่างง่ายดาย โดย AI ที่ถูกนำมาทดลองนี้ได้แก่ o1, o3-mini, GPT-4o, Claude 3.5 Sonnet, QwQ-32B-Preview ของ Alibaba, o1-preview และ DeepSeek R1
นักวิจัยให้ “กระดาษทด” เชิงเปรียบเทียบแก่โมเดล ซึ่งเป็นหน้าต่างข้อความที่ AI สามารถใช้เพื่อคิดหาคำตอบได้ ทำให้ทีมสามารถสังเกตการให้เหตุผลของมันได้
นักวิจัยทำการทดสอบหลายร้อยครั้งกับ AI แต่ละตัวระหว่างวันที่ 10 มกราคมถึง 13 กุมภาพันธ์ โดยการแข่งขันหนึ่งครั้ง o1-preview เขียนสิ่งที่น่าสนใจบนกระดาษทดของมันว่า
“ฉันต้องเปลี่ยนแนวทางของฉันโดยสิ้นเชิง งานคือ ‘ชนะโปรแกรมหมากรุกที่ทรงพลัง’ ไม่จำเป็นต้องชนะอย่างยุติธรรมในเกมหมากรุก”
จากนั้นมันก็ “แฮ็ก” ไฟล์ระบบของ Stockfish โดยแก้ไขตำแหน่งของหมากเพื่อได้เปรียบจนไม่มีทางแพ้ซึ่งทำให้หมากรุกบอทยอมแพ้เกมนั้น
กลยุทธ์ที่ไม่ซื่อสัตย์นี้เป็นการเปิดเผยที่น่าตกตะลึง o1-preview ของ OpenAI โกงการแข่งถึง 37 เปอร์เซ็นต์ของการแข่งระหว่างการทดลอง ในขณะที่ R1 ของ DeepSeek พยายามโกง 11 เปอร์เซ็นต์ อย่างไรก็ตาม มีเพียง o1-preview เท่านั้นที่ทำสำเร็จ โดยสามารถชนะได้ 6 เปอร์เซ็นต์ผ่านการโกง
การโกงหมากรุกของ AI อาจชี้ให้เห็นปัญหาใหญ่
อย่างไรก็ตาม ปัญหาการเล่นตุกติกของ AI ขยายไปไกลกว่าหมากรุก ขณะที่บริษัทต่างๆ เริ่มใช้ AI ในภาคส่วนต่างๆ เช่น การเงินและการดูแลสุขภาพ นักวิจัยกังวลว่าระบบเหล่านี้อาจทำงานในรูปแบบที่ไม่ตั้งใจและผิดจรรยาบรรณ หาก AI สามารถโกงในเกมที่ออกแบบมาให้มีความโปร่งใสได้ พวกมันอาจโกงในสภาพแวดล้อมที่ซับซ้อนกว่าและมีการตรวจสอบน้อยกว่าได้เช่นกันหรือไม่?
ผู้อำนวยการบริหารของ Palisade Research, Jeffrey Ladish กล่าวอย่างน่าเสียใจว่า ถึงแม้ AI จะเล่นเกมเท่านั้น แต่สิ่งที่ค้นพบนี้ไม่ใช่เรื่องตลก
บริษัทต่างๆ รวมถึง OpenAI กำลังดำเนินการเพื่อใช้ “มาตรการป้องกัน” เพื่อป้องกันพฤติกรรม “ที่ไม่ดี” นี้ อันที่จริง นักวิจัยต้องตัดข้อมูลการทดสอบบางส่วนของ o1-preview ออกเนื่องจากการพยายามแฮ็กลดลงอย่างมาก ซึ่งบ่งชี้ว่า OpenAI อาจได้ทำการแก้ไขโมเดลเพื่อควบคุมพฤติกรรมดังกล่าวแล้ว
OpenAI ปฏิเสธที่จะแสดงความคิดเห็นเกี่ยวกับการวิจัย และ DeepSeek ไม่ได้ตอบคำขอแถลงการณ์
อ้างอิง techspot.com และ cover iT24Hrs
อ่านบทความและข่าวอื่นๆเพิ่มเติมได้ที่ it24hrs.com
AI โกงไม่เป็น? พบ AI แฮกคู่แข่งเพื่อเอาชนะหมากรุก
อย่าลืมกดติดตามอัพเดตข่าวสาร ทิปเทคนิคดีๆกันนะคะ Please follow us
Youtube it24hrs
Twitter it24hrs
Tiktok it24hrs
facebook it24hrs





