تلتقط الهواتف الذكية والنظارات الذكية وكاميرات المراقبة المحمولة مشاهد تضم في كثير من الأحيان أشخاصاً لم يبدوا موافقتهم على الظهور أو التسجيل. هذا الواقع اليومي دفع باحثين إلى التساؤل عن إمكانية منح المارة وسيلة مباشرة وسريعة للتعبير عن رغبتهم في عدم التصوير، بطريقة تحترم الخصوصية ولا تفرض عليهم الكشف عن هوياتهم أو مشاركة بيانات حساسة.
تجيب دراسة بحثية حديثة منشورة على منصة arXiv عن هذا التساؤل عبر اقتراح نظام يحمل اسم BLINDSPOT، صممه باحثون في University of California Irvine ليكون طبقة استجابة داخل الكاميرا تعمل محلياً على جهاز التصوير نفسه. يتيح النظام للمارة إرسال تفضيلهم المتعلق بطلب طمس الوجه (أو إلغاء الطمس عند الرغبة) إلى الكاميرا القريبة، بحيث ينفذ القرار قبل حفظ الفيديو أو مشاركته.
يعتمد BLINDSPOT على مبدأ التشغيل داخل الجهاز دون الحاجة إلى تسجيل هوية المستخدم، أو الاعتماد على مطابقة بصمات الوجه عبر السحابة؛ ما يقلل بدرجة كبيرة مخاطر إعادة التعرف على الأشخاص أو تتبعهم خارج سياق التصوير المباشر. تقنياً، يدمج النظام خط معالجة موحداً داخل جهاز التصوير يشمل كشف الوجوه، وتتبعها، ثم تطبيق الطمس بناء على الإشارة المستلمة.
نفذ الباحثون النموذج الأولي على هاتف Google Pixel 8 Pro مع معالجة فيديو بدقة 1280×960 وبمعدل 30 إطاراً في الثانية. وطبق الطمس باستخدام معالج الرسوميات عبر OpenGL ومرشح Gaussian blur كإثبات مفهوم، مع تأكيد الباحثين أن البنية تسمح باستبدال الطمس بوسائل أقوى وغير قابلة للعكس مثل البكسلة أو الحجب الكامل.
التحقق المكاني لمنع الانتحال والتلاعب
تتناول الدراسة تحدياً محورياً يتمثل فيما يعرف بـ”هجوم انتحال المارة”، حيث قد يحاول شخص آخر إرسال إشارة نيابة عن الضحية لتغيير حالة الطمس، أو يحدث تداخل غير مقصود في البيئات المزدحمة. لمواجهة ذلك، يعتمد BLINDSPOT على آلية تحقق مكاني تربط الإشارة بالوجه الصحيح داخل إطار الكاميرا، وترفض أي إشارة لا تتسق من حيث الموقع والمسافة المتوقعة مع هذا الموضع.
يقوم هذا التحقق على استخدام حجم مربع الوجه داخل الإطار كمرجع لتقدير المسافة، ثم مقارنته بمصدر الإشارة المتوقع في كل وسيلة مستخدمة. ويشمل ذلك حجم اليد في الإيماءة، أو حجم بقعة LED في الإشارة الضوئية، أو المسافة والاتجاه في حالة موجات UWB، ضمن هامش تسامح يقارب 10% في بعض الاختبارات.
3 وسائل للتعبير عن الخصوصية
1- إيماءة اليد أمام الوجه
تعتمد الوسيلة الأولى على تمرير اليد أمام الوجه دون الحاجة إلى أي عتاد إضافي. يستخدم النظام نموذج MediaPipe لاكتشاف معالم اليد وتتبعها عبر الإطارات، ويحدد حركة المسح بناء على السرعة والإزاحة ضمن نافذة زمنية تقارب 300 مللي ثانية، مع ضوابط للحد من التفعيل العرضي.
تمتاز هذه الطريقة بزمن استجابة منخفض يبلغ قرابة 160 مللي ثانية، لكنها تبقى محدودة بمدى عملي لا يتجاوز 3 أمتار، إلى جانب عبء ملحوظ على المعالج.
2- ضوء LED واتصال ضوئي VLC
تعتمد الوسيلة الثانية على ضوء LED واتصال ضوئي VLC، حيث يرسل LED صغير رسالة رقمية عبر نمط إضاءة بسيط. ولتقليل العبء الحسابي، يحدد النظام منطقة بحث مرتبطة بمربع الوجه ويفترض وجود الضوء أسفل الوجه عند مستوى الجذع. تُستخدم معالجة على GPU لرصد بقع الضوء وفك التشفير بخوارزمية تتحمل فقدان بعض الإطارات.
وقد اختار الباحثون رسالة بطول 18 بت تناسب حركة المشي، بزمن إرسال يقارب 600 مللي ثانية. تمتد فعالية هذه الطريقة حتى 10 أمتار، لكنها تتأثر بالإضاءة الشديدة التي قد تخلط بين LED والخلفيات الساطعة.
3- موجات UWB بالتكامل مع Bluetooth منخفض الطاقة
أما الوسيلة الثالثة فتعتمد على موجات UWB (Ultra-Wideband) بالتكامل مع Bluetooth منخفض الطاقة (BLE). يرسل الشخص المار طلب الطمس عبر BLE، ثم يُفعِّل عند الحاجة تحديد الموقع عبر UWB للحصول على المسافة والاتجاه وربط الإشارة بوجه محدد داخل إطار الكاميرا.
بعد التوثيق الأولي، يمكن استخدام مسار سريع يعتمد على الذاكرة المؤقتة لتقليل الطاقة والتأخير طالما أن الوجه ما زال ظاهراً. تتميز هذه الطريقة بثباتها في البيئات المزدحمة وتغير الإضاءة، لكنها الأعلى زمناً في الاستجابة بمتوسط يقارب ثانيتين.
ماذا تقول نتائج القياس
تقدم الدراسة مقارنة بين الوسائل الثلاث من حيث الدقة والكمون والإيجابيات الكاذبة. أظهرت الإيماءة دقة تراوحت بين 90 و100% ضمن مدى 3 أمتار وفي إضاءة طبيعية، مع كمون منخفض، لكنها تصبح غير عملية بعد هذا المدى.
وحافظت طريقة LED على دقة مرتفعة حتى 10 أمتار في الإضاءة الطبيعية، مع تراجع واضح في الإضاءة الساطعة كلما زادت المسافة. في المقابل، قدمت UWB أداءً ثابتاً عبر مختلف المسافات مع إيجابيات كاذبة معدومة، مقابل كمون أعلى.
وفي سيناريو يضم 6 أشخاص داخل المشهد، بقيت الدقة العامة مقبولة عبر جميع الوسائل، مع تأثر الإيماءة أكثر بالحركة والازدحام مقارنة بطريقة UWB.
حدود تقنية ترسم ملامح المستقبل
توضح الدراسة أن النظام لا يستطيع تنفيذ أي إشارة ما لم يتم كشف الوجه أولاً داخل إطار الفيديو. كما يرتبط المدى الفعال بحساسية كاشف الوجوه المستخدم؛ إذ يتطلب الكاشف المبني على نموذج YOLO وجهاً بحجم يقارب 20×20 بكسل، ما يضع سقفاً عملياً حول 10 أمتار على الهاتف المستخدم.
وتشير النتائج كذلك إلى أن خط كشف الوجوه مقيد بقدرات GPU، وأن تجاوز نحو 8 وجوه داخل المشهد يؤدي إلى تجاوز ميزانية الإطارات وظهور تأخير وسقوط في الأداء. وبما أن النظام يعمل عند 30 إطاراً/ثانية، فأي زيادة في زمن المعالجة لكل إطار تنعكس فوراً على السلاسة والكمون.
ومن جهة أخرى، تعتمد طريقتا LED وUWB في التجربة على وسوم مخصصة، ما يثير تحديات تتعلق بالانتشار الواسع، رغم إشارة الباحثين إلى إمكانية الاستفادة مستقبلاً من دعم UWB المدمج في بعض الهواتف الحديثة.
انطباعات المستخدمين وآفاق التوسع
في تجربة استخدام أولية شملت خمسة مشاركين، عبر المستخدمون عن تفضيل واضح لخيار UWB بوصفه أكثر تحفظاً وأقل لفتاً للانتباه، مع الإقرار بأن لكل وسيلة سياقاً مثالياً للاستخدام. كما تلمح الدراسة إلى إمكانية توسيع الفكرة لاحقاً لطمس عناصر حساسة أخرى مثل لوحات المركبات، وتطرح تحدياً بحثياً مرتبطاً بقدرة نماذج الرؤية واللغة على إعادة التعرف على الأشخاص من السياق حتى بعد طمس الوجه، وهو ما يستدعي تطوير وسائل إخفاء أقوى.







