1404/02/01
احمد احمدی

احمد احمدی

مرتبه علمی: استادیار
ارکید:
تحصیلات: دکترای تخصصی
اسکاپوس: 56640730100
دانشکده: دانشکده کشاورزی
نشانی: همدان، دانشگاه بوعلی سینا، دانشکده کشاورزی، گروه علوم دامی
تلفن: 081 34424195

مشخصات پژوهش

عنوان
مقایسه روش های مبتنی بر درخت تصمیم در ارزیابی ژنومی
نوع پژوهش
پایان نامه
کلیدواژه‌ها
انتخاب ژنومی، ارزش های اصلاحی ژنومی، یادگیری ماشین، SNP، QTL
سال 1399
پژوهشگران سحر عاشوری بنائی(دانشجو)، فرهاد غفوری کسبی(استاد راهنما)، احمد احمدی(استاد مشاور)

چکیده

هدف از انجام تحقیق حاضر مقایسه سه روش یادگیری ماشین درخت رگرسیونی (Regression Tree)، جنگل تصادفی (Random Forest) و Boosting در ارزیابی ژنومی بود. . اگرچه تا کنون روش های جنگل تصادفی و Boosting در ارزیابی ژنومی مورد استفاده قرار گرفته بودند اما اطلاعاتی در مورد عملکرد درخت رگرسیونی در پیش بینی ارزش های اصلاحی در دسترس نبود. در ضمن بین این سه روش نیز از نظر صحت پیش بینی و مدت زمان انجام محاسبات و میزان حافظه مورد نیاز نیز مطالعه جامعی صورت نگرفته بود. بدین منظور ژنومی متشکل از 5 کروموزوم هریک به طول 1مورگان شبیه سازی شد که روی آن 5000 نشانگر تک نوکلئوتیدی (SNP) با فراوانی اولیه 5/0 در دو سناریوی 10 و 100 QTL به طو یکنواخت پخش شد. اثر جایگزینی QTLها با استفاده از توزیع نرمال استاندارد، یکنواخت وگاما در سه سطح از وراثت پذیری (1/0، 3/0 و 5/0) مدل سازی شدند. در ادامه عملکرد سه روش مورد نظر در سناریوی های مختلف از نظر تعدادQTL ، سطوح وراثت پذیری و توزیع اثرات QTL مورد مقایسه قرار گرفت. همبستگی بین ارزش های اصلاحی ژنومی پیش بینی شده و ارزش های اصلاحی ژنومی شبیه سازی شده به عنوان شاخص صحت پیش بینی ارزیابی ژنومی جهت مقایسه روش ها مورد استفاده قرار گردید. نتایج بدست آمده برتری روش جنگل تصادفی را نسبت به روش درخت رگرسیونی نشان داد و همچنین برتری این روش بر روش Boosting در غالب سناریوی های بررسی شده مشاهده شد، اگرچه تفاوت های دو روش فقط در برخی سناریوها معنی دار بود) 05/0p<). در هر سه روش با افزایش وراثت پذیری و کاهش تعداد QTL صحت پیش بینی ارزش های اصلاحی افزایش یافت. توزیع اثرات QTL در اکثر سناریوها تاثیری بر افزایش صحت پیش بینی ارزش های اصلاحی ژنومی نداشت و فقط توزیع گامای اثرات QTL در برخی سناریوها صحت پیش بینی را افزایش داد. درخت رگرسیونی اگرچه سرعت بالایی داشت و حافظه کمی را صرف انجام آنالیزها کرد اما صحت پیش بینی ارزش های اصلاحی آن بسیار پایین یود و لذا جهت ارزیابی ژنومی پیشنهاد نمی شود. روش Boosting از نظر سرعت محاسباتی بسیار کند بود و در ضمن به حافظه زیادی جهت انجام آنالیزها احتیاج داشت. از آنجا که صحت روش روش جنگل تصادفی نسبت به دو روش دیگر بیشتر بود و از نظر سرعت محاسباتی و میزان حافظه مورد نیاز نیز عملکرد خوبی از خود نشان داد، ما این روش را جهت ارزیابی ژنومی پیشنهاد م