عنوان
|
چالش ابرداده و پردازش موازی
|
نوع پژوهش
|
مقاله ارائه شده کنفرانسی
|
کلیدواژهها
|
پردازش موازی-ابرداده-انتخاب ژنومی-پردازشگر مرکزی
|
چکیده
|
اصلاح نژاد دام وارد "عصر اَبرداده" شده است. تجزیه و تحلیل چنین داده هایی چالشی جدی برای مدل ها و نرم افزارهای رایج است. محاسبات ابری، پردازش موازی و روش های یادگیری ماشین برای تجزیه تحلیل اَبرداده پیشنهاد شده اند. هدف از تحقیق حاضر بررسی کارایی تلفیق استراتژی پردازش موازی با یکی از روش های یادگیری ماشین (جنگل تصادفی) در ارزیابی ژنومی است. به این منظور، در چهارچوب تئوری انتخاب ژنومی، جمعیت رفرنس و کاندید انتخاب شبیه سازی شدند و برای آنها در سناریوهای مختلف از اندازه اطلاعات، ژنوم شبیه سازی شد. سه سناریو داده کوچک (S1)، داده متوسط (S2 و S3) و داده بزرگ (S4) در نظر گرفته شد. با استفاده از برنامه نویسی در نرم افزار R، پردازش موازی روی هسته های CPU فعال شد. در مقایسه با پردازش سریالی، پردازش موازی به طور معنی داری (p<0.05) سرعت انجام محاسبات را افزایش داد، به نحوی که در سناریو داده بزرگ (S5)، مدت زمان انجام محاسبات از 98/49 دقیقه به 73/2 دقیقه کاهش یافت. نتایج نشان داد که با افزایش اندازه اطلاعات، کارایی پردازش موازی افزایش می یابد، به صورتی که در سناریو S1، پردازش موازی زمان انجام محاسبات را 75% کاهش داد اما در سناریو S4، زمان محاسبات 95% کاهش یافت. با افزایش تعداد هسته های درگیر در محاسبات، زمان انجام محاسبات کاهش یافت که خصوصا در مورد فایل داده بزرگ روند کاهشی تقریباً خطی بود که نشان داد که در زمان استفاده از داده های بزرگتر، پردازش موازی بهره برداری بیشتری از توان محاسباتی CPU انجام می دهد.
|
پژوهشگران
|
فرهاد غفوری کسبی (نفر اول)، مسلم کریمی (نفر دوم)
|