باحثون يطورون نظام ذكاء اصطناعي لاكتشاف المواقع الاحتيالية في نتائج البحث

يستخدم النموذج تعلماً تحت إشراف مزدوج لتوقع احتمالية الاحتيال في الاستعلامات دون الحاجة لبحث فعلي

باحثون يطورون نظام ذكاء اصطناعي لاكتشاف المواقع الاحتيالية في نتائج البحث
يربط نظام LOKI بين اللغة البشرية وأنماط الاحتيال لرصد المواقع المزيفة في نتائج البحث.

تتسبب المواقع الاحتيالية المرتبطة بالتجارة الإلكترونية، مثل متاجر الحيوانات أو العروض الاستثمارية المزيفة، بخسائر تقدر بملايين الدولارات سنوياً. ورغم قدرة أدوات الحماية الحالية على كشف المواقع الخبيثة بعد ظهورها الفعلي، يظل التعرف على المواقع الجديدة التي تظهر في نتائج البحث تحدياً بالغ التعقيد.

ولتضييق هذه الفجوة، طور باحثون من جامعة بوسطن نظاماً ذكياً يحمل اسم LOKI يرتب استعلامات البحث وفقاً لاحتمالية أن تكشف عن مواقع احتيالية. وبالاعتماد على مجموعة أولية من 1663 نطاقاً مزيفاً مؤكداً، تمكن النظام من اكتشاف 52,493 موقعاً احتيالياً جديداً، محققاً تحسناً بمقدار 20.58 ضعفاً في معدلات الكشف عبر عشرة أنواع مختلفة من الاحتيال الإلكتروني.

تقوم الفكرة الجوهرية للنظام على ما يسميه الباحثون “قياس السُمّية”، أي نسبة المواقع الاحتيالية التي تظهر بين نتائج البحث لاستعلام معين. فإذا أعاد محرك البحث 6 مواقع احتيالية من أصل 20 نتيجة، فإن درجة السُمّية تساوي 0.3. وكلما ارتفعت هذه النسبة، زادت احتمالية أن يقود الاستعلام إلى محتوى احتيالي. 

يقيس LOKI هذه العلاقة بين اللغة البشرية ومشهد الاحتيال في نتائج محركات البحث، ويعتمد على مصنف ذكي يسمى oracle لتحديد ما إذا كان الموقع احتيالياً أو شرعياً، باستخدام مجموعة من خصائص النطاق والمحتوى.

بعد حساب درجات السُمّية لعينة واسعة من الاستعلامات، يبدأ النظام في التنبؤ بمستويات السُمّية لاستعلامات جديدة لم يختبرها من قبل، مستخدماً نموذج تعلم آلي يربط بين صياغة العبارة واحتمال ارتباطها بمواقع احتيالية. 

ولبناء قاعدة لغوية شاملة، جمع الفريق نحو 1.5 مليون عبارة بحث من خلال واجهة Google Ads Keyword Planner التي تستند إلى بيانات الإعلانات. ومن أجل دراسة كيفية تعامل محركات البحث مع هذه الكلمات، استخدم الباحثون واجهة DataForSEO لجمع النتائج من محركات مثل Google وBing وBaidu وNaver.

قبل تطوير النموذج النهائي، اختبر الفريق أساليب تقليدية لتجميع الكلمات المفتاحية اعتماداً على مستوى المنافسة أو نية الشراء أو التعديلات اللغوية، لكن النتائج كانت متباينة وغير قابلة للتعميم على جميع أنواع الاحتيال، إذ فشلت القواعد اليدوية في مواكبة الأنماط الجديدة.

يعتمد LOKI على نهج تعلم يسمى Learning Under Privileged Information، حيث يستخدم نموذج المعلم بيانات إضافية أثناء التدريب مثل أوصاف النتائج، بينما يتعلم نموذج الطالب التنبؤ بالسُمّية لاحقاً من النص وحده دون الحاجة لتلك البيانات. وكلا النموذجين مبنيان على بنية DistilBERT الخاصة بفهم النصوص.

يدرب المعلم أولاً على أزواج من الاستعلامات والنتائج مع درجات السُمّية، ثم يتعلم الطالب محاكاة مخرجات المعلم، ما يسمح له بتوقع مستوى الاحتيال في أي استعلام نصي بسرعة ودون استدعاءات متكررة لمحركات البحث. 

وأظهرت الاختبارات أن النظام يتفوق بوضوح على النماذج التقليدية في جميع الفئات، محققاً نتائج قوية خصوصاً في مجالات الخدمات للبالغين والمقامرة، مع أداء ثابت في باقي أنواع الاحتيال. وكشف التحليل اللغوي أن العبارات التي تحتوي على مؤشرات سعرية أو كلمات مثل cheap أو without verification ترتبط بمعدلات احتيال أعلى، لأنها تستغل الدوافع البشرية نحو السرعة أو التوفير أو الضمان.

أتاح الباحثون نماذجهم وبياناتهم للعامة، لتوسيع نطاق البحث في هذا المجال. وبهذا، يقدم LOKI نموذجاً متقدماً يعلم الآلات التفكير مثل خبراء مكافحة الاحتيال الذين يفهمون سلوك المستخدمين وأنماط البحث، محولاً عملية معقدة كانت تعتمد على الحدس والخبرة إلى آلية مؤتمتة عالية الدقة.

الموثوقة والمعتمدة لدى خبراء الأمن السيبراني

تقرأ في نشرتنا التي تصلك كل أسبوع:

  • أحدث أخبار ومستجدات الأمن السيبراني محليًا وعالميًا.
  • تحليلات وتقارير دقيقة يقدمها خبراء المجال.
  • نصائح عملية لتطوير استراتيجياتك السيبرانية.
  • مراجعات شاملة لأهم الأحداث والتطورات التقنية
Go to Top