تخمین حالت سه بعدی انسان از تک تصویر با استفاده از شبکه‌ی عصبی غیرخطی کانولوشنی مبتنی بر اطلاعات شکل

شمسافر, فرانک; ابراهیم نژاد, حسین

دوره 5، شماره 1 - ( جلد 5 - شماره 1 1397 )

جلد 5 شماره 1 صفحات 103-83

برگشت به فهرست نسخه ها

تخمین حالت سه بعدی انسان از تک تصویر با استفاده از شبکه‌ی عصبی غیرخطی کانولوشنی مبتنی بر اطلاعات شکل

فرانک شمسافر

، حسین ابراهیم نژاد^*

دانشگاه صنعتی سهند ، ebrahimnezhad@sut.ac.ir

چکیده: (9469 مشاهده)

تخمین حالت سه بعدی انسان یکی از مسائل پراهمیت و پرکاربرد در بینایی ماشین است. تخمین حالت انسان، از اسکلت دو بعدی و با استفاده از اطلاعات چندگانه آغاز و طی یک روند تکاملی، به تخمین اسکلت سه بعدی با بهره‌گیری از حداقل اطلاعات ورودی سوق یافته است. در این مقاله، مسئله‌ی تخمین حالت سه بعدی انسان با استفاده از اطلاعات یک تصویر رنگی بررسی شده است. روش پیشنهادی جزء آن دسته از روش‌هایی محسوب می‌شود که ابتدا حالت دو بعدی را استخراج و سپس، با ارتقاء حالت دو بعدی تخمینی به فضای سه بعدی، حالت سه بعدی پیش‌بینی می‌شود. به دلیل آن‌که در این نوع روش‌ها، منشاء بیشتر خطاها ناشی از تخمین نادرست حالت دو بعدی است، در این مقاله، با ارائه‌‌ی روشی برای تخمین دقیق‌تری از حالت دو بعدی، خطای کمتری برای حالت سه بعدی به دست آمده است. روش پیشنهادی برای تخمین حالت دو بعدی، از یادگیری عمیق و اطلاعات نقشه‌ی لبه بهره برده است. به عبارتی دیگر، در این مقاله از ویژگی لبه که یک ویژگی طراحی شده است، برای هدایت یادگیری شبکه‌ی عصبی عمیق و یادگیری ویژگی‌ها در راستای هدف تعیین شده، استفاده شده است. آزمایش‌های انجام شده نشان می‌دهد که روش پیشنهادی به خطای کمتری در تخمین حالت دو بعدی و متعاقباً، به خطای کمتری در پیش‌بینی حالت سه بعدی تصاویر پایگاه داده‌ی Human3.6M و HumanEva-I منجر شده است.

واژه‌های کلیدی: تخمین حالت انسان، یادگیری عمیق، شبکه‌های عصبی کانولوشنی، نقشه‌ی لبه

متن کامل [PDF 2014 kb] (2193 دریافت)

نوع مطالعه: پژوهشي | موضوع مقاله: بینایی ماشین
دریافت: 1396/11/16 | پذیرش: 1397/5/17 | انتشار: 1397/11/8

بازنشر اطلاعات
	این مقاله تحت شرایط Creative Commons Attribution-NonCommercial 4.0 International License قابل بازنشر است.

دوره 5، شماره 1 - ( جلد 5 - شماره 1 1397 )

برگشت به فهرست نسخه ها