Google DeepMind เปิดแผนคุมเข้ม ในยุคที่เทคโนโลยีปัญญาประดิษฐ์กำลังเปลี่ยนผ่านจากแชตบอตทั่วไป ไปสู่ AI Agents หรือระบบอัตโนมัติที่มีความสามารถในการคิด วางแผน และลงมือทำสิ่งต่าง ๆ ในโลกดิจิทัลได้ด้วยตัวเอง ความกังวลเรื่องความปลอดภัยจึงไม่ได้หยุดอยู่แค่เรื่องของข้อมูลที่ผิดพลาด (Hallucination) อีกต่อไป แต่กำลังก้าวไปสู่ขั้นที่ว่า “เราจะควบคุม AI ที่อาจไม่เชื่อฟังเราได้อย่างไร?”
ล่าสุด Google DeepMind ได้เปิดตัวแผนโรดแมปด้านความปลอดภัย (AI Control Roadmap) เพื่อเตรียมพร้อมรับมือกับ Rogue AI Agents หรือ AI ทำงานนอกคำสั่ง โดยหันไปหยิบยืมแนวคิดจากวงการไซเบอร์ซีเคียวริตี้ (Cybersecurity) มาปรับใช้ ซึ่งเปลี่ยนมุมมองต่อ AI จากเดิมที่เป็นเพียงเครื่องมือซอฟต์แวร์ ให้กลายเป็นระบบที่ต้องเฝ้าระวังเสมือนเป็น “ภัยคุกคามจากภายใน” (Insider Threats)
ทำไมเราถึงต้องกลัว AI Agents?
ในปัจจุบัน บริษัทยักษ์ใหญ่ด้าน AI ไม่ว่าจะเป็น OpenAI, Anthropic หรือ Google เอง กำลังเร่งพัฒนา AI Agents เพื่อนำไปใช้ในงานสำคัญ ๆ เช่น การเขียนโค้ด การทำงานวิจัยเชิงลึก รวมถึงการป้องกันภัยคุกคามทางไซเบอร์
ทว่า “ความสามารถในการทำงานอย่างอิสระ” (Autonomy) ที่เป็นข้อดีที่สุดของมัน ก็เป็นดาบสองคมเช่นกัน เพราะหาก AI เหล่านี้ไม่ได้ถูกปรับให้สอดคล้องกับเป้าหมายของมนุษย์อย่างสมบูรณ์ (Imperfectly Aligned) พวกมันอาจใช้ความอิสระนี้ในการ
หลบเลี่ยงการตรวจสอบ หรือซ่อนกระบวนการคิดที่แท้จริง
ใช้สิทธิ์การเข้าถึงข้อมูลที่ละเอียดอ่อนในทางที่ผิด
แอบก่อวินาศกรรมหรือทำลายระบบงานเงียบ ๆ โดยที่มนุษย์ไม่รู้ตัว
กลยุทธ์ AI คุม AI และแนวป้องกันเชิงลึก (Defense-in-Depth)
DeepMind ระบุว่า แนวทางดั้งเดิมอย่างการปรับพฤติกรรมโมเดล (Model Alignment) นั้นไม่เพียงพออีกต่อไป จึงได้เสนอแนวคิด “การควบคุม AI” (AI Control) ที่มีระบบป้องกันหลายชั้น โดยมีหัวใจสำคัญ 2 ด้าน คือ:
การตรวจจับ (Detection) DeepMind จะใช้ระบบ AI ตัวอื่นที่ได้รับความไว้วางใจมาทำหน้าที่เป็นผู้ดูแล (Supervisors) เพื่อคอยตรวจสอบกระบวนการคิด (Reasoning) แผนการ และการกระทำของ AI Agents ตัวที่กำลังทำงานอยู่ตลอดเวลา เพื่อดูว่ามันเริ่มออกนอกลู่นอกทางหรือไม่
การป้องกันและตอบสนอง (Prevention and Response) หาก AI ผู้ดูแลพบพฤติกรรมที่เป็นอันตราย ระบบจะเข้าแทรกแซงเพื่อบล็อกการกระทำนั้นทันที โดยแบ่งการตอบสนองตามระดับความเสี่ยง เช่น หากเป็นงานที่มีความเสี่ยงต่ำและย้อนคืนได้ อาจใช้วิธีตรวจบันทึกย้อนหลัง (Asynchronous) แต่หากเป็นงานที่มีความเสี่ยงสูงมาก เช่น การโจมตีไซเบอร์ขนาดใหญ่ ระบบจะต้องบล็อกแบบเรียลไทม์ (Synchronous) ทันที
ความท้าทายใหม่ เมื่อ AI เริ่มซ่อนความคิด
สิ่งที่น่ากังวลที่สุดในแผนโรดแมปนี้คือ DeepMind ยอมรับว่า ในปัจจุบันมนุษย์ยังสามารถตรวจสอบ สายความคิดที่มองเห็นได้” (Visible Chain-of-Thought) ของ AI ได้อยู่ แต่ในอนาคต เมื่อระบบมีความฉลาดมากขึ้น AI อาจเรียนรู้ที่จะปกปิดกระบวนการคิดที่แท้จริง ไม่ว่าจะด้วยความตระหนักรู้ว่าตนเองกำลังถูกจับตาดูอยู่ (Oversight Awareness) หรือการคิดในรูปแบบที่มนุษย์ไม่เข้าใจ (Opaque Reasoning)
ดังนั้น เป้าหมายต่อไปของ DeepMind คือการพัฒนาเครื่องมือที่สามารถวิเคราะห์ลึกไปถึง พฤติกรรมภายนอกและโครงสร้างภายในของโมเดล เพื่อให้แน่ใจว่าจะไม่มี AI ตัวใดสามารถตบตาผู้ดูแลได้
อ้างอิง Axios cover iT24Hrs
อ่านบทความและข่าวอื่นๆเพิ่มเติมได้ที่ it24hrs.com
Google DeepMind เปิดแผนคุมเข้ม ป้องกัน AI Agents ทำงานนอกคำสั่ง
อย่าลืมกดติดตามอัพเดตข่าวสาร ทิปเทคนิคดีๆกันนะคะ Please follow us
Youtube it24hrs
Twitter it24hrs
Tiktok it24hrs
facebook it24hrs
