جهاز Hanwha Vision SPS-A100M لتصنيف الصوت واكتشاف اتجاهه بالذكاء الاصطناعي

مقدمة
غالبًا ما يُغفل الصوت كأداة مراقبة فعّالة في ظلّ التهديدات الخفية. في حين ركّزت أنظمة المراقبة بالفيديو التقليدية على التقاط ما يحدث بصريًا، تطوّرت بيئة الأمن اليوم لتتعرّف ليس فقط على أنواع الأصوات، بل أيضًا على مصادرها الدقيقة. ومع اتّساع نطاق السلامة العامة وحماية الأصول، تمتلك تقنية تحليلات الصوت القدرة على المساهمة في ما هو أبعد من مجرد المساعدة في منع الجريمة والاستجابة السريعة للحوادث.
في هذا السياق، توفر تقنية تصنيف الصوت القائمة على التعلم العميق من هانوا فيجن وظائف ذكية تتعرف بدقة على أحداث صوتية محددة - مثل الصراخ المُدرَّب مسبقًا وكسر الزجاج - مما يُطلق تنبيهات فورية. علاوة على ذلك، تُحدد تقنية كشف اتجاه الصوت موقع مصدر الصوت، مُقدمةً معلومات حاسمة ليس فقط حول "نوع الصوت" بل أيضًا حول "مصدره". تعمل هاتان التقنيتان بتآزر لتعزيز قدرات الوعي الظرفي المتكامل، مما يضع معيارًا جديدًا لأنظمة الأمن من الجيل التالي.
يتطرق الكتاب الأبيض إلى هذه التقنيات، ويقدم إرشادات عملية للتنفيذ والاستخدام الأمثل في بيئات متنوعة.
تقنية تحليل الصوت القائمة على الذكاء الاصطناعي
- تصنيف الصوت
تعتمد تقنية تصنيف الصوت من هانوا فيجن على نموذج أساسي للتعلم العميق: الشبكة العصبية التلافيفية (CNN). تبدأ هذه التقنية بتحويل المعلومات الصوتية المجردة إلى شكل مرئي يُعرف باسم المخطط الطيفي1.
يعمل المخطط الطيفي كـ"بصمة صوتية"، إذ يعرض بوضوح الأنماط الفريدة لصوت معين. يتميز جهاز CNN بقدرته على التعلم والتعرف تلقائيًا على السمات والأنماط الصوتية الدقيقة في صور المخطط الطيفي، والتي غالبًا ما يصعب على الأذن البشرية تمييزها. تُمكّن هذه العملية من تحديد وتصنيف دقيق لمجموعة واسعة من الأصوات، بما في ذلك الصراخ، وكسر الزجاج، وأبواق السيارات، وانزلاق الإطارات.
بمجرد اكتشاف الصوت وتصنيفه، يستخرج النظام البيانات تلقائيًا من تدفق الصوت. ونظرًا لأن بيانات الصوت مُعالجة مسبقًا،ampيتم بعد ذلك إنشاء الصوت المصنف كمقطع صوتي file، كاملة مع البيانات الوصفية لسهولة التنزيل وإعادةview.
تتوفر هذه التقنية في منتجات Hanwha Vision المحددة. - اكتشاف اتجاه الصوت
تدعم تقنية هانوا فيجن لاكتشاف اتجاه الصوت استجابة سريعة من خلال تحديد اتجاه حدث صوتي محدد وإخطار المستخدمين به. تحدد التقنية هذا الاتجاه بقياس فارق التوقيت للوصول.
(TDoA) لإشارة الصوت أثناء وصولها إلى عدة ميكروفونات منفصلة فعليًا.
تعمل خوارزمية TDoA بتحليل فرق الطور في الزمن اللازم لوصول الصوت إلى كل ميكروفون، وبالتالي تقدير المسافة الفعلية إلى المصدر. تُستخدم هذه المعلومات بعد ذلك لحساب زاوية مصدر الصوت. كما هو موضح في الشكل 1، يُمكن لنظام متعدد الميكروفونات (MIC1، MIC2، MIC3، MIC4) مُرتب على شكل دائرة تحديد فروق المسافة (d1، d2، d3، d4) بين مصدر الصوت وكل ميكروفون. ويُعد حساب فرق زمن الوصول بناءً على هذه الفروقات في المسافة جوهر خوارزمية TDoA.
يوضح الشكل 2 بصريًا فارق التوقيت (τij) في وصول إشارة صوتية إلى ميكروفونين (موجات بنية وزرقاء). وبقياس فارق التوقيت بدقة، يمكن للنظام تحديد اتجاه مصدر الصوت بدقة. 
تنقسم عملية اكتشاف اتجاه الصوت إلى أربع خطوات رئيسية:
- جمع الإشارات: جمع إشارات الصوت في وقت واحد عبر ميكروفونات متعددة.
- معالجة الإشارات: تحليل الإشارات المجمعة باستخدام خوارزمية متخصصة.
- تقدير الاتجاه: قم بتقدير اتجاه الصوت استنادًا إلى الإشارة المعالجة.
- نتيجة الإخراج: عرض الاتجاه النهائي المكتشف كزاوية محمل.
تتوفر هذه التقنية في منتجات Hanwha Vision التي تدعم الميكروفونات المتعددة، مثل Audio Beacon (SPS-A100M) وبعض الكاميرات المجهزة بنظام Wisenet 9 SoC.

التثبيت والبيئة: دليل للأداء الأمثل
ترتبط فعالية حلول الصوت بالذكاء الاصطناعي من هانوا فيجن ارتباطًا وثيقًا ببيئة تركيبها. بمراعاة النقاط التالية، يمكنك تعظيم إمكانات النظام وضمان أداء مستقر.
اختيار موقع التثبيت الأمثل
للحصول على أداء موثوق به في تصنيف الصوت واكتشاف الاتجاه، يوصى بالشروط التالية:
تصنيف الصوت: يعمل النظام بكفاءة عالية عندما تكون المسافة بين المنتج ومصدر الصوت مترين على الأقل. تعتمد هذه المسافة على ارتفاع مصدر الصوت. إذا كانت المسافة قريبة جدًا (في حدود مترين)، فقد يصبح الصوت، حتى لو بدا منخفضًا كالتصفيق، مرتفعًا جدًا، مما يؤدي إلى نتائج إيجابية خاطئة. يُعد تركيب السقف في الأماكن المغلقة طريقة مثالية لتصنيف الصوت، إذ يقلل من الانعكاسات الصوتية ويسمح بكشف صوتي موحد على مساحة واسعة.
كشف اتجاه الصوت: لكشف دقيق للاتجاه، يُنصح بمساحة لا تقل عن 6.0 أمتار عرضًا و6.0 أمتار طولًا. هذا يُقلل من آثار انعكاسات الصوت وارتداداته، ويضمن مساحة كافية لتحليل الإشارة بين الميكروفونات المتعددة. 
الحفاظ على المسافة وزاوية السقوط المناسبتين: تُعدّ المسافة والزاوية بين مصدر صوت الحدث والمنتج أمرًا بالغ الأهمية لدقة الكشف. إذا كانت زاوية سقوط صوت الحدث كبيرة جدًا (تتجاوز ٢٠ درجة) أو كانت المسافة قصيرة جدًا، فقد تنخفض دقة الكشف. يُبيّن الجدول أدناه المسافات الدنيا الموصى بها بناءً على ارتفاع تركيب المنتج.
| ارتفاع تركيب المنتج | الحد الأدنى لمسافة اكتشاف الاتجاه |
| 2.3م | ≥ 2.2م |
| 2.5م | ≥ 2.7م |
| 2.7م | ≥ 3.3م |
| 2.9م | ≥ 3.8م |
| 3.1م | ≥ 4.4م |
| 3.3م | ≥ 4.9م |
| 3.5م | ≥ 5.5م |
| 3.8م | ≥ 6.3م |
| 4m | ≥ 6.9م |
| 5m | ≥ 9.6م |
ضمان مسار صوتي واضح: قد تُضعف العوائق المادية، كالجدران أو الزجاج أو الستائر السميكة، الإشارة أو تُشوّهها. لتحقيق أقصى أداء، تأكد من وجود مسار صوتي واضح ومباشر.
التحليل البيئي للكشف الفعال عن الصوت وتصنيفه
من أجل الكشف عن الصوت وتصنيفه بدقة، ضع في اعتبارك الظروف الصوتية والعوامل البيئية المحيطة التالية.
| نوع الصوت | عتبة ديسيبل | المسافة المتوقعة |
| صراخ | >70 ديسيبل | 2م~20م |
| كسر الزجاج، أبواق السيارات، انزلاق الإطارات | >80 ديسيبل | 2م~16م |
على سبيل المثالampيمكن تصنيف صوت الصراخ بدقة واكتشافه اتجاهيًا عندما يتجاوز مستواه 70 ديسيبل. يجب أن يكون مستوى صوت الحدث أعلى بكثير من ضوضاء الخلفية المحيطة (الموصى به: أعلى بـ 30 ديسيبل على الأقل). لقياس وتصنيف دقيقين، يُفضل ألا يتجاوز مستوى ضوضاء الخلفية 60 ديسيبل، مما يضمن تمييزًا واضحًا بين الحدث والضوضاء المحيطة.
نظرًا لأن الضوضاء المحيطة قد تؤثر على الأداء، فمن الجيد تحليل ما يلي مسبقًا:
- البيئات الخارجية: انتبه للضوضاء الطبيعية (الرياح، المطر، الرعد) والأصوات الاصطناعية (حركة المرور، الصدمات، اهتزازات السيارات). في البيئات غير المتوقعة، يُساعدك التحليل الدقيق على اختيار موقع التركيب الأمثل.
- البيئات الداخلية: قد تكون انعكاسات الصوت وارتداداته كبيرةً حسب المواد المستخدمة (الجدران، الأسقف، الأرضيات) وحجم الغرفة. الأصوات المشابهة لصوت حدثٍ مُستهدف، مثل انفجار بالون أو سقوط صندوق ثقيل، قد تُسبب ارتدادًا يُؤدي إلى إنذاراتٍ خاطئة. يجب مراعاة الخصائص الصوتية للمساحة الداخلية عند التركيب.
تكوين عتبات تصنيف الصوت بالديسيبل
لتحسين وظيفة تصنيف الصوت، يمكنك تكوين عتبة ديسيبل لتناسب بيئتك المحددة.
- في بيئة صاخبة، اضبط الحد الأقصى على مستوى أعلى لتقليل الإنذارات الكاذبة.
- في بيئة هادئة حيث تكون الأحداث دقيقة، اضبط الحد الأدنى على مستوى أقل لتجنب تفويت التنبيهات المهمة.
- بعد التحقق من متوسط الضوضاء الخلفية بالديسيبل، يوصى بتعيين حد أعلى من هذا المتوسط بما لا يقل عن 55 ديسيبل.
كما هو موضح في الشكل 6، يمكن تعديل عتبة الديسيبل بسهولة باستخدام شريط تمرير أو حقل إدخال رقمي، مما يؤثر بشكل مباشر على حساسية الكشف الفوري. يُظهر الرسم البياني بصريًا التغير في مستوى الصوت بالديسيبل بمرور الوقت (خط أسود) والعتبة المُعدّة (خط رمادي)، مما يُسهّل معرفة متى يتجاوز حدث صوتي (ذروة برتقالية) العتبة.
معايرة اتجاه الصوت وتكوين النظام
توفر منتجات Hanwha Vision الأحداث على شكل مقاطع صوتية، والتي تتضمن تصنيف الصوت ونتائج اكتشاف الاتجاه.
كما هو موضح في الشكل 7، تُعرض نتيجة تصنيف الصوت مع أيقونة بديهية في الأسفل، إلى جانب نتيجة كشف اتجاه الصوت. "الاتجاه (N+301.8∘)" يعني أن مصدر الصوت يقع على بُعد 301.8∘ في اتجاه عقارب الساعة من الشمال (N).
تشير قيمة "الثقة (0.74)" المرفقة إلى مستوى ثقة بنسبة 74%. هذا، إلى جانب مستوى ضغط الصوت (52 ديسيبل)، يُمكّن المستخدمين من تقييم الموقف بدقة والاستجابة بسرعة.
قد تنحرف معلومات اتجاه الصوت للنظام عن الشمال الحقيقي بمرور الوقت أو بسبب التركيب. ونظرًا لأهمية دقة معلومات الاتجاه، من الضروري معايرة نقطة الشمال المرجعية حسب الحاجة. ويمكن القيام بذلك باستخدام إحدى الطرق الثلاث التالية:
- قم بتثبيت المنتج بحيث يواجه الشمال الحقيقي كما تشير البوصلة.
- في قائمة المنتج، انتقل إلى [النظام] > [معلومات المنتج] > [وضع التركيب] وأدخل مباشرة الزاوية المقاسة في اتجاه عقارب الساعة من شمال البوصلة إلى نقطة مرجع الكاميرا.
- استخدم ميزة البوصلة المضمنة في أداة تثبيت Wisenet لإعداد أولي أكثر ملاءمة ودقة.
نصائح للبيئات الصوتية المعقدة
- البيئات الصوتية المعقدة: في بيئة تحتوي على أصوات متعددة متزامنة، قد يصنفها نموذج الذكاء الاصطناعي كصوت واحد أو يخطئ في تصنيفها. هذه ظاهرة طبيعية؛ لذا، سيساعد التحليل الشامل للمعلومات التي يوفرها النظام على ضمان دقة الوعي بالموقف.
التحليل البيئي لدقّة الإنذارات: قد يُصدر نموذج تصنيف الأصوات إنذاراتٍ لأصواتٍ تُشبه أصوات الأحداث، ولكنها لا تُصنّف ضمن فئات التصنيف، مثل احتكاك الأجسام المعدنية، أو أصوات الحيوانات، أو الآلات الموسيقية، أو غيرها من الأصوات المفاجئة والقوية. يُتيح فهم هذه الخاصية للنموذج توقع الإنذارات الصادرة عن هذه الأصوات الاستثنائية والاستعداد لها، مما يُقلّل بشكلٍ فعّال من الالتباس غير الضروري.
خاتمة
من خلال تجاوز حدود الملاحظة البصرية، يخلق حل AI Audio من Hanwha Vision نظامًا شاملًا للإنذار المبكر يحلل الصوت بذكاء.
يُعد هذا الكتاب الأبيض بمثابة دليل عملي، يمكّنك من تنفيذ التكنولوجيا وتحسينها لبيئتك المحددة - من التثبيت الأولي إلى الضبط الدقيق لتحقيق الأداء الأقصى.
مع تطور التحديات الأمنية، تظل شركة Hanwha Vision ملتزمة بتطوير قدراتها في تحليل الصوت، مما يضمن تجربة أمنية أكثر استقرارًا وكفاءة واستباقية في أي موقف.
رؤية هانوا
- 13488 مركز هانوا فيجن للبحث والتطوير،
- 6 بانجيو-رو 319-جيل، بوندانج-جو، سيونجنام-سي، جيونج جي دو، كوريا. www.HanwhaVision.com
- جميع الحقوق محفوظة لشركة هانوا فيجن © ٢٠٢٥.
المستندات / الموارد
![]() |
جهاز Hanwha Vision SPS-A100M لتصنيف الصوت واكتشاف اتجاهه بالذكاء الاصطناعي [بي دي اف] دليل المالك SPS-A100M تصنيف الصوت بالذكاء الاصطناعي وكشف اتجاه الصوت، SPS-A100M، تصنيف الصوت بالذكاء الاصطناعي وكشف اتجاه الصوت، التصنيف وكشف اتجاه الصوت، كشف اتجاه الصوت، كشف الاتجاه، الكشف |

