جمعه 31 مرداد 1404

شناسایی چهره در سامانه‌های نظارت تصویری

چکیده

فناوری شناسایی چهره به‌عنوان یکی از پیشرفته‌ترین شاخه‌های هوش مصنوعی و بینایی ماشین در سال‌های اخیر نقش مهمی در بهبود کارایی سامانه‌های نظارت تصویری ایفا کرده است. این فناوری امکان شناسایی، تأیید هویت و تحلیل الگوهای رفتاری افراد را با دقت بالا فراهم می‌کند. کاربردهای گسترده این فناوری در حوزه‌هایی مانند امنیت عمومی، کنترل دسترسی، مدیریت شهری و بازاریابی هوشمند اهمیت آن را دوچندان کرده است. در این مقاله، ضمن بررسی جامع ساختار و الگوریتم‌های شناسایی چهره، به مهم‌ترین کاربردها، چالش‌های پیاده‌سازی و روندهای آینده این فناوری پرداخته می‌شود.

کلمات کلیدی: شناسایی چهره، سامانه نظارت تصویری، یادگیری ژرف، چالش‌های شناسایی چهره، آینده‌پژوهی شناسایی چهره

1- مقدمه

شناسایی چهره یکی از فناوری‌های کلیدی در سامانه‌های نظارت تصویری است که بدون نیاز به دخالت انسان، امکان شناسایی و ردیابی افراد را فراهم می‌آورد.

با افزایش شهرنشینی و رشد جرائم، نیاز به سامانه‌های نظارت تصویری هوشمند بیش از پیش احساس می‌شود. در گذشته، این سامانه‌ها صرفاً برای ضبط تصاویر مورد استفاده قرار می‌گرفتند اما با توسعه فناوری‌های یادگیری ماشین (Machine Learning) و یادگیری ژرف (Deep Learning) قابلیت‌های جدیدی از جمله شناسایی چهره (Face Recognition)  به آن‌ها اضافه شده است [1].

تشخیص چهره، به‌عنوان یکی از مهم‌ترین ابزارهای احراز هویت غیرتماسی در محیط‌های مختلف از جمله اماکن عمومی، فرودگاه‌ها، بانک‌ها و سازمان‌های امنیتی به‌کار گرفته می‌شود. این فناوری ترکیبی از پردازش تصویر، تحلیل ویژگی‌های بیومتریک و الگوریتم‌های یادگیری ژرف است [2].

2- مراحل شناسایی چهره

شناسایی چهره معمولاً شامل مراحل ذیل است [3]:

الف) تشخیص ناحیه چهره (Face Detection):  شناسایی ناحیه چهره در تصویر یا ویدئو با استفاده از الگوریتم‌هایی مانند Haar Cascades یا MTCNN.

ب) استخراج ویژگی‌ها (Face Extraction):  استخراج ویژگی‌های متمایزکننده از تصویر با استفاده از الگوریتم‌های کلاسیک یا شبکه‌های عصبی ژرف مانند FaceNet  و ArcFace [4].

ج) تطبیق و شناسایی (Face Matching): مقایسه ویژگی‌های استخراج‌شده با پایگاه داده برای شناسایی یا احراز هویت.

 


شکل 1: مراحل شناسایی چهره

 

3- کاربردهای اصلی شناسایی چهره در سامانه‌های نظارت تصویری

1-3- امنیت عمومی و پیشگیری از جرم

در شهرهای هوشمند، این فناوری برای شناسایی افراد تحت تعقیب و مجرمان بالقوه مورد استفاده قرار می‌گیرد. تطبیق چهره افراد در زمان واقعی (Real-Time) با پایگاه داده پلیس امکان واکنش سریع به تهدیدات امنیتی را فراهم می‌کند[5].

2-3- کنترل دسترسی و احراز هویت

سازمان‌ها و مراکز حساس برای کنترل ورود و خروج پرسنل از شناسایی چهره به‌عنوان جایگزین کارت شناسایی یا اثر انگشت استفاده می‌کنند. این روش غیرتماسی، سرعت و امنیت بالاتری دارد [6].

3-3- تحلیل رفتار و بازاریابی هوشمند

در فروشگاه‌ها، این فناوری برای تحلیل سن، جنسیت و میزان حضور مشتریان استفاده می‌شود. این داده‌ها در طراحی کمپین‌های بازاریابی هدفمند نقش کلیدی دارند [7].

4-3- مدیریت حمل و نقل عمومی

در مترو، فرودگاه‌ها و ایستگاه‌های قطار، شناسایی چهره برای شناسایی افراد مفقود یا مدیریت ترافیک مسافران به‌کار می‌رود [8].

4- فناوری‌های شناسایی چهره در سامانه‌های نظارت تصویری

1-4- سامانه‌های مبتنی بر روش‌های کلاسیک

سامانه‌های مبتنی بر روش‌های کلاسیک برای شناسایی چهره عمدتاً از روش‌های آماری و هندسی برای استخراج ویژگی‌ها و تطبیق الگو استفاده می‌کنند. این سامانه‌ها معمولاً با استفاده از اطلاعات دو بعدی چهره مانند فاصله میان چشم‌ها، طول بینی و شکل دهان به شناسایی افراد می‌پردازند. روش‌های کلاسیک در مراحل اولیه بر مبنای ویژگی‌های هندسی و ساختاری طراحی شده بودند، اما بعدها با معرفی روش‌های آماری مانند تحلیل مؤلفه‌های اصلی (PCA) و تحلیل تفکیکی خطی (LDA)، دقت و کارایی این سامانه‌ها بهبود یافت [9]. این رویکردها در مقایسه با روش‌های یادگیری ژرف، نیاز به داده‌های کمتری داشته و نیز پیچیدگی محاسباتی کمتری دارند اما در نسبت به تغییرات شدت روشنایی، زاویه دید و حالات چهره حساس هستند.

یکی از متداول‌ترین الگوریتم‌های کلاسیک، روش Eigenfaces است که مبتنی بر PCA برای کاهش ابعاد داده و نمایش چهره‌ها در یک فضای ویژگی با ابعاد پایین‌تر طراحی شده است. این روش با انتخاب بردارهای ویژه (Eigenvectors) از ماتریس کوواریانس تصاویر چهره، داده‌ها را به مجموعه‌ای از ویژگی‌های اصلی تبدیل می‌کند. با این حال، این تکنیک در مواجهه با تغییرات شدت روشنایی عملکرد ضعیفی دارد. در ادامه، روش Fisherfaces که از LDA استفاده می‌کند، برای افزایش قدرت تفکیک بین کلاس‌ها ارائه شد [10]. گرچه این روش در شرایطی که تغییرات شدت روشنایی وجود دارد بهتر عمل می‌کند، اما با این وجود محدودیت‌هایی در برابر چرخش و تغییرات بزرگ حالت چهره دارد.

در کنار این روش‌ها، الگوریتم‌های مبتنی بر ویژگی‌های محلی مانند Local Binary Patterns (LBP) نیز در شناسایی چهره استفاده شده‌اند. LBP با تبدیل تصویر به یک الگوی دودویی بر اساس مقایسه شدت پیکسل‌ها، امکان استخراج ویژگی‌های مقاوم‌تر در برابر تغییرات شدت روشنایی را فراهم می‌کند [11]. این رویکردها در بسیاری از سامانه‌های کلاسیک به‌کار گرفته شده‌اند و تا پیش از ظهور یادگیری ژرف، در سیستم‌های نظارتی و کاربردهای امنیتی رایج بودند. با وجود محدودیت‌ها، سادگی و سرعت بالای این روش‌ها باعث شده است همچنان در برخی سامانه‌های سبک و کم‌هزینه مورد استفاده قرار گیرند.

2-4- سامانه‌های مبتنی بر یادگیری ژرف

سامانه‌های شناسایی چهره مبتنی بر یادگیری ژرف (Deep Learning) در سال‌های اخیر به دلیل دقت بالا و قابلیت تعمیم، جایگزین روش‌های کلاسیک شده‌اند. این سامانه‌ها عمدتاً بر اساس شبکه‌های عصبی ژرف (Deep Neural Networks)  به‌ویژه شبکه‌های عصبی پیچشی (CNN) توسعه یافته‌اند که توانایی استخراج ویژگی‌های پیچیده از تصاویر چهره را دارند. برخلاف روش‌های کلاسیک که وابسته به ویژگی‌های مهندسی‌شده مانند LBP یا PCA هستند، رویکردهای ژرف ویژگی‌ها را به‌صورت خودکار از داده‌ها یاد می‌گیرند که منجر به بهبود چشمگیر عملکرد در شرایط مختلف مانند تغییر شدت روشنایی، زاویه دید و حالت چهره شده است [12].

از مهم‌ترین مدل‌های مورد استفاده در این حوزه می‌توان به DeepFace، FaceNet و ArcFace اشاره کرد. مدل DeepFace با استفاده از CNN‌های چند لایه به دقتی نزدیک به انسان در  شناسایی چهره دست یافته است [13]. مدل FaceNet رویکرد جدیدی مبتنی بر بردارهای تعبیه (Embedding Vectors) ارائه داد که امکان مقایسه چهره‌ها با استفاده از فاصله برداری در یک فضای ویژگی را فراهم می‌کند [14]. همچنین ArcFace با استفاده از تابع هزینه مبتنی بر زاویه، موجب افزایش تفکیک‌پذیری کلاس‌های چهره شده است که این ویژگی برای سامانه‌های نظارتی بسیار اهمیت دارد [15].

این سامانه‌ها در کاربردهای متنوعی نظیر کنترل دسترسی، نظارت تصویری، تشخیص هویت در مرزها و احراز هویت در خدمات آنلاین به‌کار می‌روند. با این حال، چالش‌هایی همچون نیاز به داده‌های بزرگ برای آموزش، مسائل حریم خصوصی و حملات جعل (Spoofing Attacks)  همچنان پابرجا هستند. برای مقابله با این چالش‌ها، پژوهش‌های جدید به سمت استفاده از شبکه‌های سبک برای پردازش روی دستگاه، الگوریتم‌های مقاوم در برابر جعل و روش‌های حفظ حریم خصوصی مانند Federated Learning سوق پیدا کرده است [16].

 

شکل 2: شناسایی چهره با استفاده از شبکه‌های عصبی پیچشی عمیق

3-4- سامانه‌های مبتنی بر مادون‌قرمز

استفاده از تصویربرداری مادون‌قرمز (Infrared Imaging)  برای شناسایی چهره به‌عنوان روشی کارآمد برای غلبه بر مشکلات ناشی از تغییرات شدت روشنایی در شرایط محیطی مختلف مطرح شده است. این فناوری از طول‌موج‌های خارج از محدوده نور مرئی استفاده می‌کند که امکان ثبت الگوهای حرارتی و بازتابی پوست را فراهم می‌آورد. در محیط‌های با نور کم یا حتی تاریکی کامل، سامانه‌های مادون‌قرمز همچنان قادر به شناسایی چهره با دقت مناسب هستند. این ویژگی، استفاده از سامانه‌های مبتنی بر IR را برای نظارت تصویری شبانه و کنترل دسترسی در محیط‌های کم‌نور بسیار مناسب می‌سازد [17].

تصویربرداری مادون‌قرمز معمولاً به دو دسته اصلی نزدیک به مادون‌قرمز (Near-Infrared, NIR) و حرارتی (Thermal Infrared) تقسیم می‌شوند. سامانه‌های NIR با استفاده از منابع نور IR فعال و دوربین‌های حساس به این طول‌موج، الگوی بازتابی پوست را ثبت می‌کنند در حالی‌که سامانه‌های حرارتی بر اساس گرمای منتشرشده از بدن انسان عمل می‌کنند. این روش‌ها نسبت به تغییرات شدت روشنایی محیط مقاوم‌تر هستند اما همراه با چالش‌هایی مانند تغییرات دمای بدن، محیط پیرامون یا نیاز به تجهیزات تخصصی هستند [18].

استفاده از IR  در شناسایی چهره با محدودیت‌هایی مواجه است. تصاویر حرارتی به‌طور معمول جزئیات ساختاری کمتری نسبت به تصاویر مرئی دارند و این امر ممکن است دقت الگوریتم‌های شناسایی را کاهش دهد. برای بهبود عملکرد، پژوهش‌های اخیر به سمت ترکیب داده‌های IR و نور مرئی (روش‌های چندطیفی) و به‌کارگیری شبکه‌های عصبی ژرف برای همجوشی داده‌ها حرکت کرده‌اند [19]. این رویکردها توانسته‌اند مقاومت سامانه‌ها در برابر شرایط نوری متغیر و حملات جعل (Spoofing)  را به‌طور قابل توجهی افزایش دهند.

4-4- سامانه‌های مبتنی بر ظاهر

روش‌های مبتنی بر ظاهر (Appearance-based Methods) به‌جای استفاده از روابط هندسی، کل تصویر چهره یا بخش بزرگی از آن را برای استخراج ویژگی به کار می‌برند. این الگوریتم‌ها اغلب مبتنی بر کاهش ابعاد هستند تا از داده‌های با ابعاد بالا ویژگی‌های متمایزکننده استخراج کنند. روش‌هایی مانند تحلیل مؤلفه‌های اصلی (PCA) و تحلیل تفکیک خطی (LDA) از مشهورترین الگوریتم‌های این گروه هستند.

روش PCA با کاهش ابعاد تصویر، ویژگی‌هایی موسوم به Eigenfaces ایجاد می‌کند که اساس بسیاری از سامانه‌های اولیه تشخیص چهره بود [20]. در روش LDA با در نظر گرفتن کلاس‌های مختلف، ویژگی‌هایی انتخاب می‌شود که قابلیت تفکیک‌پذیری بالاتری دارند. این روش‌ها در شرایط شدت روشنایی کنترل‌شده و موقعیت ثابت، عملکرد خوبی دارند اما در مواجهه با تغییرات نور، زاویه، یا حالت چهره با افت دقت مواجه می‌شوند [21].

نسخه‌های بهبود یافته مانند روش‌های مبتنی بر Local Binary Patterns (LBP) با استفاده از بافت محلی تصویر، حساسیت به نور را کاهش داده‌اند. ترکیب LBP با تکنیک‌های یادگیری ماشین مانند SVM در بسیاری از سامانه‌های نظارتی سنتی به‌کار رفته است [22].

5- چالش‌ها و محدودیت‌های شناسایی چهره در سامانه‌های نظارت تصویری

چالش‌ها و محدودیت‌های شناسایی چهره در سامانه‌های نظارت تصویری را می‌توان در چهار طبقه اصلی به شرح ذیل طبقه‌بندی کرد:

الف) چالش‌های مرتبط با کیفیت تصویر و شرایط محیطی

ب) چالش‌های مربوط به تنوع بیومتریک و تغییرات ظاهری افراد

ج) تهدیدات امنیتی و حملات جعل

د) چالش‌های اخلاقی، حریم خصوصی و قانونی

1-5- چالش‌های مرتبط با کیفیت تصویر و شرایط محیطی

یکی از مهم‌ترین محدودیت‌های سامانه‌های شناسایی چهره در محیط‌های نظارتی، وابستگی به کیفیت تصاویر است. عواملی مانند نور نامناسب، وضوح پایین دوربین، نویز تصویری و زاویه دید نامطلوب به‌شدت بر دقت الگوریتم‌های شناسایی چهره تأثیر می‌گذارند. برای مثال، در شرایط نور کم یا نور پس‌زمینه شدید، ویژگی‌های چهره به‌درستی استخراج نمی‌شوند که این امر منجر به افزایش نرخ خطا می‌شود [23].

تغییر زاویه چهره نسبت به دوربین، یکی دیگر از چالش‌های اساسی برای شناسایی چهره در سامانه‌های نظارت تصویری است. بسیاری از سامانه‌ها در زاویه‌های غیرمستقیم یا نمای نیم‌رخ با افت شدید عملکرد مواجه می‌شوند. گرچه برای رفع این مشکل، در الگوریتم‌های جدید مبتنی بر یادگیری ژرف از تکنیک‌های Normalization و بازسازی سه‌بعدی چهره استفاده می‌شود ولی با این حال در یادگیری ژرف نیاز به منابع محاسباتی بالایی است [24].

علاوه بر آنچه که ارائه شد، وجود موانع جزئی مانند ماسک، عینک یا روسری در تصاویر نظارتی، تشخیص دقیق چهره را دشوار می‌سازد. حتی پس از همه‌گیری کووید-۱۹، پژوهش‌ها نشان داده‌اند که دقت بسیاری از مدل‌های تشخیص چهره در حضور ماسک بیش از ۲۰٪ کاهش می‌یابد [25].

2-5- چالش‌های مربوط به تنوع بیومتریک و تغییرات ظاهری افراد

چهره افراد به دلیل عوامل مختلف مانند پیری، تغییرات وزنی، مدل مو، آرایش، و حالت‌های احساسی دچار تغییر می‌شود. این تغییرات می‌توانند ویژگی‌های کلیدی و مهمی را که برای شناسایی استفاده می‌شوند به‌شدت تحت تأثیر قرار دهند. برای مثال، الگوریتم‌های کلاسیک مانند PCA و LDA در برابر این تغییرات بسیار آسیب‌پذیرند در حالی که روش‌های ژرف عملکرد بهتری دارند اما همچنان کامل نیستند [26].

عوامل بیومتریک طبیعی مانند جنسیت، قومیت و رنگ پوست نیز می‌توانند بر عملکرد شناسایی چهره در سامانه‌های نظارت تصویری اثرگذار باشند. مطالعات نشان داده است که برخی الگوریتم‌های شناسایی چهره در شناسایی افراد با رنگ پوست تیره‌تر دقت پایین‌تری دارند که این موضوع نگرانی‌های مربوط به سوگیری الگوریتمی را افزایش داده است [27].

برای مقابله با این چالش‌ها، روش‌های جدید از شبکه‌های عصبی چندحالته (Multimodal) و تکنیک‌های Data Augmentation استفاده می‌کنند تا مدل‌ها نسبت به تغییرات ظاهری مقاوم‌تر شوند. با این حال، این رویکردها به داده‌های گسترده و متنوع نیاز دارند که گردآوری آن‌ها هزینه‌بر و همراه با چالش‌های حریم خصوصی است [28].

3-5- تهدیدات امنیتی و حملات جعل

سامانه‌های نظارت تصویری در برابر حملات جعل مانند عکس‌های چاپی، ویدئوهای بازپخش‌شده و ماسک‌های سه‌بعدی آسیب‌پذیرند. چنین حملاتی می‌توانند الگوریتم‌های شناسایی چهره را فریب دهند به‌خصوص اگر سامانه فاقد مکانیزم تشخیص زنده بودن (Liveness Detection) باشد [29].

حملات پیشرفته‌تر شامل Deepfakeها هستند که با استفاده از شبکه‌های تقابلی مولد (GANs) تصاویر یا ویدئوهای بسیار واقعی از چهره ایجاد می‌کنند. این مساله تهدید جدی برای سامانه‌های احراز هویت مبتنی بر چهره به شمار می‌روند [30].

برای مقابله با این تهدیدات، پژوهش‌ها به سمت ترکیب روش‌های شناسایی چهره با تحلیل حرکتی، بررسی الگوهای حرارتی (IR) و استفاده از مدل‌های مبتنی بر یادگیری ژرف برای تشخیص جعل حرکت کرده‌اند. با این حال، این اقدامات هزینه و پیچیدگی سامانه را افزایش می‌دهند [31].

4-5- چالش‌های اخلاقی، حریم خصوصی و قانونی

استفاده گسترده از سامانه‌های شناسایی چهره در نظارت شهری، نگرانی‌های جدی در زمینه نقض حریم خصوصی ایجاد کرده است. ضبط و پردازش داده‌های بیومتریک بدون رضایت کاربران می‌تواند با قوانین حفاظت از داده‌ها مانند GDPR در اروپا مغایرت داشته باشد [32]. علاوه بر این، موضوع نظارت بیش از حد (Mass Surveillance) می‌تواند منجر به سوءاستفاده‌های دولتی یا سازمانی شود. مطالعات اجتماعی نشان می‌دهد که وجود این سامانه‌ها ممکن است بر آزادی‌های مدنی تأثیر منفی داشته باشد [33].

در حال حاضر، بسیاری از کشورها مقررات سخت‌گیرانه‌ای در خصوص ذخیره‌سازی، اشتراک‌گذاری و پردازش داده‌های بیومتریک وضع کرده‌اند. رعایت این قوانین و طراحی سامانه‌های با Privacy by Design یکی از مهم‌ترین الزامات برای توسعه فناوری شناسایی چهره در آینده است [34].

6- آینده‌پژوهی در شناسایی چهره در سامانه‌های نظارت تصویری

آینده‌پژوهی در حوزه شناسایی چهره در سامانه‌های نظارت تصویری را می‌توان در چهار محور اصلی طبقه‌بندی کرد که به شرح ذیل است:

الف) پیشرفت در الگوریتم‌های هوشمند و یادگیری ژرف

ب) استفاده از حسگرها و داده‌های چند طیفی (Multimodal)

ج) توسعه راهکارهای امنیتی و مقابله با جعل (Anti-Spoofing)

د) چالش‌های حقوقی، اخلاقی و فناوری‌های حفظ حریم خصوصی

1-6- پیشرفت در الگوریتم‌های هوشمند و یادگیری ژرف

در سال‌های آینده، پیشرفت الگوریتم‌های یادگیری ژرف به‌ویژه شبکه‌های عصبی پیچشی (CNN) و مدل‌های ترنسفورمری مانند Vision Transformers (ViTs) مسیر اصلی توسعه فناوری شناسایی چهره خواهد بود. این مدل‌ها با قابلیت پردازش داده‌های عظیم و یادگیری ویژگی‌های پیچیده، دقت شناسایی را در شرایط متغیر محیطی افزایش می‌دهند [35]. همچنین، ترکیب یادگیری ژرف با یادگیری تقویتی (Reinforcement Learning)  برای بهبود تصمیم‌گیری در محیط‌های پویا در حال گسترش است [36].

رویکرد یادگیری فدرال (Federated Learning) نیز به عنوان یکی از روندهای آینده مطرح است. این روش به جای ارسال داده‌های خام به سرورها، مدل‌ها را به‌صورت توزیع‌شده آموزش می‌دهد که علاوه بر بهبود امنیت و حفظ حریم خصوصی، امکان به‌روزرسانی الگوریتم‌ها در مقیاس گسترده را فراهم می‌کند [37]. پیش‌بینی می‌شود این فناوری نقش مهمی در شبکه‌های نظارتی شهری ایفا کند، زیرا داده‌های جمع‌آوری‌شده بسیار حساس هستند.

علاوه بر این، استفاده از مدل‌های سبک‌وزن (Lightweight Models) برای پردازش در لبه (Edge Computing) اهمیت بیشتری پیدا خواهد کرد. این رویکرد امکان پردازش آنی (Real-Time) را بدون نیاز به ارسال داده به سرورهای ابری فراهم می‌کند و در سامانه‌های نظارت تصویری با محدودیت پهنای باند، حیاتی است [38].

2-6- استفاده از حسگرها و داده‌های چند طیفی

آینده شناسایی چهره به سمت استفاده از داده‌های چند منبعی حرکت می‌کند. ترکیب اطلاعات مادون‌قرمز (IR)، حرارتی، عمق (Depth) و داده‌های سه‌بعدی با تصاویر RGB باعث بهبود عملکرد در شرایط نوری دشوار یا هنگام وجود موانع مانند ماسک می‌شود [39]. این روند در کاربردهای امنیتی، اهمیت ویژه‌ای دارد زیرا حملات جعل با عکس یا ویدئو در حالت چندطیفی بسیار سخت‌تر است.

یکی از فناوری‌های کلیدی آینده، استفاده از حسگرهای نوری سه‌بعدی (3D Sensors) است که امکان بازسازی هندسه چهره را فراهم می‌کند. ترکیب این داده‌ها با شبکه‌های عصبی ژرف دقت و پایداری سامانه را افزایش می‌دهد [40].

علاوه بر این، رویکرد Fusion-based Systems که چندین منبع داده را در سطوح مختلف (ویژگی یا تصمیم) ادغام می‌کند، می‌تواند مقاومت سامانه در برابر تغییرات ظاهری، نور و حملات جعل را بهبود دهد. با این حال، این راه‌کارها مستلزم توسعه استانداردهای سخت‌افزاری و نرم‌افزاری برای یکپارچه‌سازی داده‌ها هستند [41].

3-6- توسعه راهکارهای امنیتی و مقابله با جعل

با افزایش تهدیداتی مانند Deepfake و حملات پیشرفته، آینده شناسایی چهره مستلزم استفاده از تکنیک‌های پیشرفته مقابله با جعل است. در سال‌های اخیر، پژوهش‌ها به سمت تشخیص زنده بودن (Liveness Detection) با استفاده از تحلیل دینامیک حرکات چهره، سیگنال‌های فیزیولوژیکی (مانند ضربان قلب از ویدئو) و الگوریتم‌های مبتنی بر یادگیری ژرف حرکت کرده‌اند [42].

یکی از روندهای جدید، استفاده از شبکه‌های تقابلی مولد برای شبیه‌سازی حملات و آموزش مدل‌های مقاوم است. این رویکرد به مدل‌ها کمک می‌کند تا در برابر تهدیدات ناشناخته مقاوم‌تر شوند [43]. همچنین، استفاده از روش‌های Multi-modal Anti-Spoofing با ترکیب  داده‌های RGB، حرارتی و مادون‌قرمز در حال گسترش است زیرا جعل همزمان در چند طیف بسیار دشوار است.

در آینده، پیش‌بینی می‌شود سامانه‌های امنیتی علاوه بر تشخیص چهره، قابلیت تحلیل رفتار بیومتریک مانند الگوهای حرکت سر یا چشم را برای افزایش دقت احراز هویت داشته باشند. این رویکرد، سطح امنیتی سامانه‌های نظارت تصویری را به‌طور چشمگیری ارتقا خواهد داد [44].

4-6- چالش‌های حقوقی، اخلاقی و فناوری‌های حفظ حریم خصوصی

با گسترش استفاده از شناسایی چهره در شهرهای هوشمند و سامانه‌های امنیتی، نگرانی‌های مربوط به حریم خصوصی، سوگیری الگوریتمی و قوانین حفاظت از داده افزایش خواهد یافت. در آینده، توسعه فناوری‌های Privacy-preserving AI مانند رمزنگاری همگن (Homomorphic Encryption) و Differential Privacy نقش کلیدی در کاهش این نگرانی‌ها خواهد داشت [45].

قوانین بین‌المللی نیز به سمت محدودسازی یا تنظیم دقیق استفاده از فناوری تشخیص چهره حرکت می‌کنند. برای مثال، اتحادیه اروپا در حال تدوین مقرراتی برای محدودسازی استفاده از این فناوری در فضاهای عمومی است [46]. رعایت این الزامات برای تولیدکنندگان سامانه‌های نظارت تصویری حیاتی خواهد بود زیرا عدم انطباق می‌تواند منجر به جریمه‌های سنگین و ممنوعیت استفاده شود.

آینده شناسایی چهره به سمت توازن میان امنیت و حریم خصوصی حرکت می‌کند. فناوری‌هایی مانند فدرال لرنینگ، پردازش در لبه و رمزنگاری داده‌ها در کنار چارچوب‌های حقوقی می‌توانند اعتماد عمومی به سامانه‌های نظارت تصویری را افزایش دهند و استفاده از آنها را پایدار کنند [47].

7- نتیجه‌گیری

فناوری شناسایی چهره در سامانه‌های نظارت تصویری، تحولی چشمگیر در حوزه امنیت و مدیریت شهری ایجاد کرده و به یکی از ابزارهای کلیدی برای احراز هویت غیرتماسی، تحلیل رفتار و کنترل دسترسی تبدیل شده است. این فناوری با بهره‌گیری از پیشرفت‌های هوش مصنوعی و یادگیری ژرف، توانسته محدودیت‌های روش‌های سنتی را کاهش داده و امکان شناسایی دقیق در شرایط متنوع محیطی را فراهم کند. با این حال، توسعه و پیاده‌سازی این سامانه‌ها بدون در نظر گرفتن ملاحظات فنی، امنیتی و قانونی می‌تواند چالش‌های جدی ایجاد کند که در این مقاله به‌تفصیل بررسی شد.

نتایج بررسی‌ها نشان می‌دهد که هرچند الگوریتم‌های مبتنی بر یادگیری ژرف و فناوری‌های چندطیفی دقت و قابلیت اطمینان را به میزان قابل‌توجهی افزایش داده‌اند، اما همچنان مسائلی مانند کیفیت تصویر، تغییرات ظاهری افراد، تهدیدات جعل و محدودیت‌های محاسباتی پابرجاست. علاوه بر این، چالش‌های اخلاقی و نگرانی‌های مربوط به حریم خصوصی از مهم‌ترین موانع پذیرش اجتماعی این فناوری محسوب می‌شوند. در این راستا، به‌کارگیری رویکردهای نوین مانند یادگیری فدرال، مدل‌های سبک‌وزن برای پردازش در لبه و استفاده از تکنیک‌های ضدجعل می‌تواند تا حد زیادی این چالش‌ها را کاهش دهد.

با توجه به روندهای آینده، پیشرفت در الگوریتم‌های هوشمند، استفاده از داده‌های چندطیفی، توسعه فناوری‌های حفظ حریم خصوصی و تدوین مقررات حقوقی، مسیر تکامل سامانه‌های شناسایی چهره را شکل خواهد داد. تحقق این اهداف مستلزم همکاری میان پژوهشگران، توسعه‌دهندگان، قانون‌گذاران و نهادهای نظارتی است تا بتوان توازن میان امنیت، کارایی و حقوق شهروندی را برقرار کرد. در نهایت، موفقیت این فناوری در گرو طراحی سامانه‌هایی است که علاوه بر دقت و کارایی، بر اصول اخلاقی، شفافیت و احترام به حریم خصوصی استوار باشند.

مراجع

[1] W. Zhao, R. Chellappa, P. J. Phillips, A. Rosenfeld, “Face recognition: A literature survey,” ACM Computing Surveys, vol. 35, no. 4, pp. 399–458, 2003.

[2] J. Daugman, “How iris recognition works,” IEEE Transactions on Circuits and Systems for Video Technology, vol. 14, no. 1, pp. 21–30, 2004.

[3] S. Z. Li and A. K. Jain, Handbook of Face Recognition, Springer, 2011.

[4] F. Schroff, D. Kalenichenko, and J. Philbin, “FaceNet: A unified embedding for face recognition and clustering,” in Proc. CVPR, 2015.

[5] A. K. Jain and B. Klare, “Face recognition for security applications,” Biometric Recognition, Springer, 2014.

[6] ISO/IEC 19794-5:2011, Information technology – Biometric data interchange formats – Part 5: Face image data.

[7] J. Wilder, “Facial feature detection and face recognition for marketing analytics,” Journal of Retail Analytics, 2019.

[8] Y. Taigman, M. Yang, M. Ranzato, and L. Wolf, “DeepFace: Closing the gap to human-level performance in face verification,” in Proc. CVPR, 2014.

[9] M. Turk, A. Pentland, Face recognition using eigenfaces. Proceedings. IEEE Computer Society Conference on Computer Vision and Pattern Recognition, 1991, 586-591.

[10] P. N. Belhumeur, J. P. Hespanha, D. J. Kriegman, “Eigenfaces vs. Fisherfaces: Recognition using class specific linear projection”. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1997, 19(7), 711-720.

[11] T. Ahonen, A. Hadid, M. Pietikäinen, “Face description with local binary patterns: Application to face recognition”. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2006, 28(12), 2037-2041.

[12] Y. LeCun, Y. Bengio, G. Hinton, Deep learning. Nature, 2015, 521(7553), 436-444.

[13] Y. Taigman, M. Yang, M. Ranzato, L. Wolf, “DeepFace: Closing the gap to human-level performance in face verification”, IEEE CVPR, 2015.

[14] F. Schroff, D. Kalenichenko, J. Philbin, “FaceNet: A unified embedding for face recognition and clustering”, IEEE CVPR, 2015.

[15] J. Deng, J. Guo, N. Xue, S. Zafeiriou, “ArcFace: Additive Angular Margin Loss for Deep Face Recognition”, IEEE CVPR, 2015.

[16] W. Liu, “Deep learning in face recognition: A critical analysis”, arXiv preprint arXiv:2009.13290, 2020.

[17] S. G. Kong, J. Heo, B. R. Abidi, J. Parik, M. A. Abidi, “Recent advances in visual and infrared face recognition: a review”,

[18] X. Chen, P. J. Flynn, K. W. Bowyer, “IR and visible light face recognition”, Computer Vision and Image Understanding, 2005, 99(3), 332-358.

[19] S. Li, A. K. Jain, “Handbook of face recognition”, Springer, 2011.

[20] M. Turk, A. Pentland, “Eigenfaces for recognition”, Journal of Cognitive Neuroscience, 1991, 3(1), 71-86.

[21] P. N. Belhumeur, J. P. Hespanha, D. J. Kriegman, “Eigenfaces vs. Fisherfaces: Recognition using class specific linear projection”, IEEE Transactions on Pattern Analysis and Machine Intelligence, 1997, 19(7), 711-720.

[22] T. Ahonen, A. Hadid, M. Pietikäinen, “Face description with local binary patterns: Application to face recognition”, IEEE Transactions on Pattern Analysis and Machine Intelligence, 2006, 28(12), 2037-2041.

[23] S. Z. Li, A. K. Jain, “Handbook of Face Recognition”, Springer, 2011.

[24] W. Zhao, R. Chellappa, P. J. Phillips, A. Rosenfeld, “Face recognition: A literature survey”, ACM Computing Surveys, 2003, 35(4), 399-458.

[25] N. Damer, et al, “The effect of wearing a mask on face recognition performance: An exploratory study”, arXiv preprint arXiv:2008.11104, 2021.

[26] P. N. Belhumeur, J. P. Hespanha, D. J. Kriegman, “Eigenfaces vs. Fisherfaces: Recognition using class specific linear projection”, IEEE TPAMI, 1997.

[27] J. Buolamwini, T. Gebru, “Gender shades: Intersectional accuracy disparities in commercial gender classification”, Conference on Fairness, Accountability, and Transparency, 2018.

[28] C. Shorten, T. M. Khoshgoftaar, “A survey on image data augmentation for deep learning”, Journal of Big Data, 2019, 6(1), 60.

[29] K. Patel, H. Han, A. K. Jain, “Secure face unlock: Spoof detection on smartphones”, IEEE Transactions on Information Forensics and Security, 2016, 11(10), 2268-2283.

 [30] P. Korshunov, S. Marcel, “Deepfakes: A new threat to face recognition?”, arXiv preprint arXiv:1812.08685, 2018.

[31] W. Liu, et al, “Deep learning in face anti-spoofing: A survey”, arXiv preprint arXiv:2009.06081, 2020.

[32] P. Voigt, A. Von dem Bussche, “The EU general data protection regulation (GDPR)”, Springer, 2017.

[33] D. Brin, “The Transparent Society: Will Technology Force Us to Choose Between Privacy and Freedom?”, Perseus Books, 1998.

[34] European Union Agency for Fundamental Rights (FRA), “Facial recognition technology: Fundamental rights considerations”, 2020.

[35] M. Wang, W. Deng, “Deep face recognition: A survey”, Neurocomputing, 2021, 429, 215–244.

[36] S. Z. Li, A. K. Jain, “Handbook of Face Recognition”, Springer, 2021.

[37] P. Kairouz, “Advances and open problems in federated learning”, Foundations and Trends in Machine Learning, 2021, 14(1-2), 1-210.

[38] A. Howard, et al, “Searching for MobileNetV3”, ICCV, 2019.

[39] S. G. Kong, et al, “Recent advances in visual and infrared face recognition: A review”, CVIU, 2005, 97(1), 103-135.

[40] X. Li, et al, “3D face recognition in the deep learning era: A survey”, Pattern Recognition, 2020, 98, 107032.

[41] W. Liu, et al, “Deep learning for face anti-spoofing: A survey”, IEEE TIFS, 2020.

[42] K. Patel, et al, “Secure face unlock: Spoof detection on smartphones”, IEEE TIFS, 2016, 11(10), 2268-2283.

[43] A. Jourabloo, et al, “Face de-spoofing: Anti-spoofing via noise modeling”, ECCV, 2018.

[44] R. Corsini, et al, “Biometric behavior analysis for security systems”, IEEE Access, 2022.

[45] M. Abadi, et al, “Deep learning with differential privacy”, ACM CCS, 2016.

[46] “Proposal for Artificial Intelligence Act”, European Commission, 2021.

[47] P. Voigt, A. Von dem Bussche,”The EU general data protection regulation (GDPR)”, Springer, 2017.

درباره نویسنده

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *