1404/02/01
محرم منصوری زاده

محرم منصوری زاده

مرتبه علمی: دانشیار
ارکید:
تحصیلات: دکترای تخصصی
اسکاپوس: 25923564500
دانشکده: دانشکده فنی و مهندسی
نشانی: همدان، دانشگاه بوعلی سینا، دانشکده مهندسی، گروه مهندسی کامپیوتر
تلفن: 08131406381

مشخصات پژوهش

عنوان
توصیف خودکار تصویر با مکانیسم توجه و مدل زبانِ تکراری
نوع پژوهش
مقاله ارائه شده کنفرانسی
کلیدواژه‌ها
توصیف تصویر ، مکانیسم توجه ، تشخیص اشیاء
سال 1399
پژوهشگران الهام حیدری ، مرضیه عبدالملکی ، علیرضا طاهری طجر ، میرحسین دزفولیان ، محرم منصوری زاده

چکیده

در مسائل کاربردی بینایی ماشین و فهم زبان ، نمایش دقیق تصویر از اهمیت بالایی برخوردار است. بیش تر سیستم های فعلی از ویژگی-های بصری و مفاهیم متنی به عنوان طرح کلی از تصویر استفاده می کنند. بااین حال ، بازنمایی های کاملاً استنباطی معمولاً از این نظر نامطلوب هستند که از مؤلفه های جداگانه ای تشکیل شده اند و روابط بین آن ها قابل محاسبه نیست علاوه بر این نمی توانند مفاهیم مهم تصویر را در توصیفات تولیدشده جای دهند . در این مقاله یک فرایند تکرارشونده جهت رسیدن به توصیف پیشنهادشده است . ما تصاویر ورودی را با مجموعه ای از مناطق بصری و مفاهیم متنی متناظر که منعکس کننده مفاهیم معنایی خاص هستند، پردازش می کنیم . برای این منظور ، دو ماژول توجه را ایجاد می کنیم که به ترتیب با به روزرسانی متقابل ، ویژگی های بصری و مفاهیم متنی استخراج شده از تصویر را ادغام می-کنند . خروجیِ دو ماژول قبل به مدل زبانی ارسال شده و این فرایند تکراری تا رسیدن به توصیف مطلوب ادامه می یابد . جهت انتخاب بهینه هایپرپارامترهای مدل ، از الگوریتم ژنتیک استفاده شده است . آزمایش ها بر روی مجموعه داده عظیم MS COCO انجام شده است . نتایج نشان می دهد که روش ما مؤثر است و بسیار سریع همگرا می شود . مدل پیشنهادی می تواند به طیف گسترده ای از مدل ها برای کاربردهای مربوط به تصویر و زبان تعمیم یابد.