البيانات والذكاء الاصطناعي

تجربة بحثية تتفوق على Codex Security في تدقيق الثغرات بالذكاء الاصطناعي

دراسة حديثة تكشف أن تطوير كتيبات تدقيق ذاتية قد يحسن أداء وكلاء الذكاء الاصطناعي أمنياً.

تم النشر في يونيو. 23, 2026

تجربة بحثية تتفوق على Codex Security في تدقيق الثغرات بالذكاء الاصطناعي

أظهرت تجربة بحثية حديثة أن تطوير “كتيبات تدقيق” ذاتية التطور لوكلاء الذكاء الاصطناعي، يمثل نهجاً منخفض التكلفة نسبياً، ويمكن من تحقيق نتائج تفوق أداء OpenAI Codex Security في عدة مقاييس تتعلق باكتشاف الثغرات والتحقق منها. وجاء ذلك وفقاً لورقة بحثية على منصة arXiv في 15 يونيو 2026.

وتناقش الورقة البحثية، المعنونة بـ Transferable Self-Evolving Playbooks for Agentic Security Auditing، فكرة مفادها أن كفاءة وكلاء الذكاء الاصطناعي في التدقيق الأمني لا تتوقف على النموذج اللغوي بمفرده، وإنما تستند إلى تكامل ثلاثة عناصر رئيسية، هي النموذج اللغوي، وبيئة العمل أو الوكيل المسؤول عن تصفح الشيفرة البرمجية وتشغيل الأدوات، بالإضافة إلى “كتيب التدقيق” الذي يضم المعرفة الإجرائية الموجهة لاكتشاف الثغرات والتحقق من وجودها.

وفي هذا السياق، طور الباحثون إطار عمل يحمل اسم EvoHunt، يستهدف بناء هذه الكتيبات وتطويرها تلقائياً عبر بيئة اختبار تعتمد على مستودعات برمجية مفتوحة المصدر وتنبيهات أمنية موثقة. ويعمل هذا الإطار من خلال ثلاث حلقات متكاملة

وكيل تدقيق يختبر الكتيب الحالي ويستخرج النتائج.
مقيّم يقارن هذه النتائج بالبيانات المرجعية الدقيقة.
مراجع يتولى تحديث الكتيب وتطويره بناء على تحليل مواضع الإخفاق.

وأوضحت نتائج الدراسة أن تحسين الكتيبات ساهم في رفع معدل الوصول إلى استغلالات نهائية لدى النموذج Codex/GPT5.4-xhigh بنحو 6 أضعاف، ليرتفع من 1.1% إلى 6.2%. كما حقق كتيب مطور باستخدام OpenCode/GLM5.1 معدل مطابقة للأهداف بنسبة 11.3%، مقارنة بنسبة 9.2% سجلها OpenAI Codex Security، متفوقاً عليه في المقاييس التي رصدتها الورقة البحثية.

وتشير هذه المعطيات إلى أن ترقية إجراءات العمل وتنظيم المعرفة الموجهة يمثلان عاملاً حاسماً في تعزيز كفاءة أدوات التدقيق الأمني المعتمدة على الذكاء الاصطناعي، حتى عند استخدام نماذج أو بيئات تشغيل أقل تكلفة. ومع ذلك، تظل الدراسة محكومة بنطاق تجريبي يرتبط بمجموعات اختبار محددة، ولا تقدم بالضرورة حكماً عاماً وشاملاً على أداء هذه المنتجات في بيئات الإنتاج الفعلية كافة.

وتأتي هذه المؤشرات بالتزامن مع تنامي اهتمام شركات الذكاء الاصطناعي بتطوير أدوات الأمن السيبراني، ومنها ماسحات الشيفرة البرمجية، ومساعدات إصلاح الثغرات، وبرامج دعم المشاريع مفتوحة المصدر. وتطرح الدراسة سؤالاً عملياً أمام فرق الأمن حول ما إذا كانت القيمة الأكبر تكمن في قدرات النموذج اللغوي نفسه، أم في أسلوب توجيهه، وإدارته، وقياس مخرجاته ضمن مسار تدقيق منظم.