:: دوره 5، شماره 1 - ( جلد 5 - شماره 1 1397 ) ::
جلد 5 شماره 1 صفحات 83-103 برگشت به فهرست نسخه ها
تخمین حالت سه بعدی انسان از تک تصویر با استفاده از شبکه‌ی عصبی غیرخطی کانولوشنی مبتنی بر اطلاعات شکل
مهندس فرانک شمسافر1، دکتر حسین ابراهیم نژاد*
1- دانشکده‌ی مهندسی برق - دانشگاه صنعتی سهند -
دانشگاه صنعتی سهند، دانشکده‌ی مهندسی برق - دانشگاه صنعتی سهند - ، ebrahimnezhad@sut.ac.ir
چکیده:   (758 مشاهده)

 تخمین حالت سه بعدی انسان یکی از مسائل پراهمیت و پرکاربرد در بینایی ماشین است. تخمین حالت انسان، از اسکلت دو بعدی و با استفاده از اطلاعات چندگانه آغاز و طی یک روند تکاملی، به تخمین اسکلت سه بعدی با بهره‌گیری از حداقل اطلاعات ورودی سوق یافته است. در این مقاله، مسئله‌ی تخمین حالت سه بعدی انسان با استفاده از اطلاعات یک تصویر رنگی بررسی شده است. روش پیشنهادی جزء آن دسته از روش‌هایی محسوب می‌شود که ابتدا حالت دو بعدی را استخراج و سپس، با ارتقاء حالت دو بعدی تخمینی به فضای سه بعدی، حالت سه بعدی پیش‌بینی می‌شود. به دلیل آن‌که در این نوع روش‌ها، منشاء بیشتر خطاها ناشی از تخمین نادرست حالت دو بعدی است، در این مقاله، با ارائه‌‌ی روشی برای تخمین دقیق‌تری از حالت دو بعدی، خطای کمتری برای حالت سه بعدی به دست آمده است. روش پیشنهادی برای تخمین حالت دو بعدی، از یادگیری عمیق و اطلاعات نقشه‌ی لبه بهره برده است. به عبارتی دیگر، در این مقاله از ویژگی لبه که یک ویژگی طراحی شده است، برای هدایت یادگیری شبکه‌ی عصبی عمیق و یادگیری ویژگی‌ها در راستای هدف تعیین شده، استفاده شده است. آزمایش‌های انجام شده نشان می‌دهد که روش پیشنهادی به خطای کمتری در تخمین حالت دو بعدی و متعاقباً، به خطای کمتری در پیش‌بینی حالت سه بعدی تصاویر پایگاه داده‌ی Human3.6M و HumanEva-I منجر شده است.

واژه‌های کلیدی: تخمین حالت انسان، یادگیری عمیق، شبکه‌های عصبی کانولوشنی، نقشه‌ی لبه
متن کامل [PDF 2014 kb]   (304 دریافت)    
نوع مطالعه: پژوهشي | موضوع مقاله: بینایی ماشین
دریافت: ۱۳۹۶/۱۱/۱۶ | پذیرش: ۱۳۹۷/۵/۱۷ | انتشار: ۱۳۹۷/۱۱/۸


XML   English Abstract   Print



دوره 5، شماره 1 - ( جلد 5 - شماره 1 1397 ) برگشت به فهرست نسخه ها