سامانه ‏های غیرخطی در مهندسی برق

سامانه ‏های غیرخطی در مهندسی برق

مکان یابی نقاط راهنمای چهره با مقداردهی اولیه نقاط راهنما از طریق آموزش ویژگی‌های باینری محلی و هیستوگرام گرادیان جهت‌ دار

نوع مقاله : مقاله پژوهشی

نویسندگان
دانشگاه صنعتی سهند
چکیده
چهره نقش مهمی در برقراری ارتباط بصری ایفا می­کند. با نگاه به چهره، انسان می­تواند به طور خودکار بسیاری از پیام­های غیر­کلامی، مانند هویت، قصد و احساسات انسان را استخراج کند. در بینایی کامپیوتر، برای استخراج خودکار اطلاعات چهره، مکان­یابی نقاط کلیدی چهره معمولأ یک مرحله کلیدی است و بسیاری از روش­های تحلیل چهره بر روی آشکارسازی دقیق این نقاط برجسته ساخته می­شوند. مکان­یابی و تنظیم نقاط راهنمای چهره در تصاویر با انسداد یک کار بسیار مهم و چالش برانگیز در بسیاری از کارهای بینایی و پردازش تصویر می­باشد. در این تحقیق، روش جامع برای مقداردهی اولیه نقاط راهنمای چهره از طریق آموزش ویژگی­های باینری محلی(LBP) و هیستوگرام گرادیان جهت­دار(HOG) و یک روش آشکارسازی نقاط راهنمای چهره با استفاده از رگرسیون حالت آبشاری قوی نقاط راهنما که به صورت ویژگی­های تفاوت پیکسل نقاط راهنما مشخص می­شود، معرفی شده است. ابتدا از طریق آنالیز همبستگی هیستوگرام الگوی­های باینری محلی(LBP) و سپس با استفاده از هیستوگرام گرادیان جهت­دار، ویژگی­های چهره­های آموزشی بدست می­آید. با استفاده از این ویژگی­های تصاویر آموزشی، نقاط راهنمای بهینه برای تصویر تست تخمین زده می­شود. در مرحله تست با توجه به مقدار­دهی اولیه تصویر، از انتخاب ویژگی مناسب برای تصویر استفاده می­گردد تا سرعت انجام فرآیند بیشتر شود. یعنی تعداد مراحل با توجه به انتخاب ویژگی بهتر برای هر تصویر کمتر شود. سپس برای تنظیم چهره، از رگرسیون حالت آبشاری قوی استفاده می­شود و یک اصل محلی برای یادگیری ویژگی­های نقاط راهنما به­کار گرفته می­شود. اصل محلی کمک می­کند تا مجموعه­ای از ویژگی­های باینری بسیار متمایز­کننده برای نقاط راهنمای چهره به صورت مستقل یاد گرفته شود. ویژگی­های باینری محلی بدست آمده برای یادگیری مشترک رگرسیون حالت آبشاری برای خروجی نهایی مورد استفاده قرار می­گیرد. نتایج نشان می­دهد که مقداردهی اولیه مورد استفاده در این کار دقت ارزیابی را در رگرسیون حالت آبشاری بیشتر کرده است و به نتایج بهتری نسبت به مقداردهی اولیه تصادفی دست یافته است.
کلیدواژه‌ها

[1] G. A. Baxes, Digital image processing: principles and applications. Wiley New York, 1994.
[2] R. Klette, Concise computer vision. Springer, 2014.
[3] Y. Wu and Q. Ji, "Facial landmark detection: A literature survey," International Journal of Computer Vision, vol. 127, no. 2, pp. 115-142, 2019.
[4] E. Hjelmås and B. K. Low, "Face detection: A survey," Computer vision and image understanding, vol. 83, no. 3, pp. 236-274, 2001.
[5] N. Wang, X. Gao, D. Tao, H. Yang, and X. Li, "Facial feature point detection: A comprehensive survey," Neurocomputing, vol. 275, pp. 50-65, 2018.
[6] M. Pantic and L. J. Rothkrantz, "Automatic analysis of facial expressions: The state of the art," IEEE Transactions on Pattern Analysis & Machine Intelligence, no. 12, pp. 1424-1445, 2000.
[7] E. Murphy-Chutorian and M. M. Trivedi, "Head pose estimation in computer vision: A survey," IEEE transactions on pattern analysis and machine intelligence, vol. 31, no. 4, pp. 607-626, 2008.
[8] D. W. Hansen and Q. Ji, "In the eye of the beholder: A survey of models for eyes and gaze," IEEE transactions on pattern analysis and machine intelligence, vol. 32, no. 3, pp. 478-500, 2009.
[9] Y. Taigman, M. Yang, M. A. Ranzato, and L. Wolf, "Deepface: Closing the gap to human-level performance in face verification," in Proceedings of the IEEE conference on computer vision and pattern recognition, 2014, pp. 1701-1708.
[10] I. Matthews and S. Baker, "Active appearance models revisited," International journal of computer vision, vol. 60, no. 2, pp. 135-164, 2004.
[11] D. Cristinacce and T. F. Cootes, "Feature detection and tracking with constrained local models," in Bmvc, 2006, vol. 1, no. 2, p. 3: Citeseer.
[12] J. M. Saragih, S. Lucey, and J. F. Cohn, "Deformable model fitting by regularized landmark mean-shift," International Journal of Computer Vision, vol. 91, no. 2, pp. 200-215, 2011.
[13] M. Dantone, J. Gall, G. Fanelli, and L. Van Gool, "Real-time facial feature detection using conditional regression forests," in 2012 IEEE Conference on Computer Vision and Pattern Recognition, 2012, pp. 2578-2585: IEEE.
[14] Y. Sun, X. Wang, and X. Tang, "Deep convolutional network cascade for facial point detection," in Proceedings of the IEEE conference on computer vision and pattern recognition, 2013, pp. 3476-3483.
[15] Z. Zhang, P. Luo, C. C. Loy, and X. Tang, "Facial landmark detection by deep multi-task learning," in European conference on computer vision, 2014, pp. 94-108: Springer.
[16] V. Kazemi and J. Sullivan, "One millisecond face alignment with an ensemble of regression trees," in Proceedings of the IEEE conference on computer vision and pattern recognition, 2014, pp. 1867-1874.
[17] P. Dollár, P. Welinder, and P. Perona, "Cascaded pose regression," in 2010 IEEE Computer Society Conference on Computer Vision and Pattern Recognition, 2010, pp. 1078-1085: IEEE.
[18] X. P. Burgos-Artizzu, P. Perona, and P. Dollár, "Robust face landmark estimation under occlusion," in Proceedings of the IEEE International Conference on Computer Vision, 2013, pp. 1513-1520.
[19] M. Ozuysal, M. Calonder, V. Lepetit, and P. Fua, "Fast keypoint recognition using random ferns," IEEE transactions on pattern analysis and machine intelligence, vol. 32, no. 3, pp. 448-461, 2009.
[20] X. Xiong and F. De la Torre Frade. Supervised descent method and its applications to face alignment. In IEEE International Conference on Computer Vision and Pattern Recognition (CVPR), May 2013
[21] T. F. Cootes, G. J. Edwards, and C. J. Taylor. Active appearance models. IEEE Transactions on Pattern Analysis and Machine Intelligence, 23(6):681–685, June 2001.

  • تاریخ دریافت 21 تیر 1404
  • تاریخ اولین انتشار 21 تیر 1404
  • تاریخ انتشار 01 مهر 1400