
كشفت دراسة حديثة أجراها باحثون من جامعة كارنيغي ميلون بالتعاون مع شركة Anthropic المختصة بالذكاء الاصطناعي، عن أن نماذج اللغة الكبيرة (LLMs) تمتلك القدرة على التخطيط وتنفيذ هجمات سيبرانية متقدمة بشكل ذاتي، دون أي تدخل بشري.
وقد تم تنفيذ الدراسة من خلال محاكاة لهجوم Equifax الشهير عام 2017، الذي أسفر عن تسريب بيانات ما يقرب من 147 مليون عميل، وهو أحد أكبر اختراقات البيانات في تاريخ الولايات المتحدة. استخدم الفريق أداة هجومية باسم Incalmo، طُوّرت لتحويل الاستراتيجيات الهجومية إلى أوامر نظامية قادرة على تنفيذ مراحل الاختراق تلقائياً، بدءاً من استغلال الثغرات، مروراً بتنصيب البرمجيات الخبيثة، ووصولاً إلى استخراج البيانات.
ووفقاً لبريان سينغر، الباحث الرئيسي في المشروع ومرشح الدكتوراه في قسم الهندسة الكهربائية وعلوم الحاسوب، تم اختبار Incalmo في عشرة بيئات مؤسسية صغيرة، وقد أظهرت النتائج أن نماذج اللغة نجحت جزئياً في تنفيذ الهجمات في 9 من أصل 10 بيئات، بما يشمل تسريب بيانات حساسة.
وأشار الباحثون إلى أن LLM كانت مسؤولة عن توجيه استراتيجي عام للهجوم، في حين تولت مجموعة من الوكلاء، تتضمن وكلاء معتمدين على LLM وأخرى تقليدية، تنفيذ المهام الدقيقة مثل المسح والاستغلال.
وكانت شركة Anthropic قد ذكرت في يونيو أن LLMs تمكّنت من اختراق خمس بيئات اختبار بالكامل، واختراق أربع أخرى جزئياً، مستعينة بنماذج هجوم استندت إلى سيناريوهات حقيقية مثل هجوم فدية Colonial Pipeline عام 2021، الذي عطل إمدادات الوقود لعدة أيام.
وتم اختيار حادثة Equifax كمثال تطبيقي بسبب توفر معلومات عامة واسعة حول كيفية تنفيذه. أما عن مدى قدرة الدفاعات الحديثة على التصدي لهجمات من هذا النوع، فقد عبّر سينغر عن قلقه قائلاً: “ما يقلقني ليس فقط قابلية تنفيذ هذه الهجمات، بل مدى سرعة ورخص كلفتها.” وأضاف أن معظم أنظمة الدفاع السيبراني الحالية تعتمد على تشغيل بشري، ما قد لا يكون كافياً لمجاراة الهجمات التي تُنفّذ بسرعة الآلة.
وفي ضوء هذه النتائج، يجري الفريق البحثي حالياً دراسات إضافية تهدف إلى تطوير أنظمة دفاعية تعتمد على نماذج LLM نفسها، لمواجهة الهجمات الذاتية القادمة.