ایجاد توص یف برای تص ویر 1 ، یک زمینه تحقیق بینرش تهای بینایی ماشین و پردازش زبان طبیعی اس ت که تو ه بس یاری را به خود لب کرده اس ت. برای تولید توص یف تص ویر نیاز به تش یص اش یا مهم و ویژگیها و ارتباط آنها در یک تص ویر اس ت و هم نین باید ملاتی تولید شودکه از لحاظ معنایی و نحوی صحیح باشند. براساس نتایج مطالعات و دقتهای گزارش شده این کار برای ماش ین، کار دش واری است که مانند انسان توانایی درک تصویر را داشته باشند. بااینحال هوش مص نوعی زمینه اکتش ااات هوشمند را در این زمینه نیز اراهم کرده است. در این مطالعه، ما روشهای پیش راته عمیق را به دس تههای م تلف ش ام معماری مبتنی بر اض ای دند حالته، ش بکههای مولد و ش بکه های مبتنی بر مکانیزم تو ه، طبقه بندی کرده ایم. سپس با بررسی نقاط ض عف و قوت آنها نش ان داده میش ود که ش بکههای مولد همراه با مکانیزم تو ه عملکرد بهتری خواهند داش ت. هم نین مجموعهدادههای مرتبط و معیارهای ارزیابی اس تااده شده برای مدلهای توصیف تصویر مورد بحث قرار میگیرند.