1404/02/01
مرتضی یوسف صنعتی

مرتضی یوسف صنعتی

مرتبه علمی: استادیار
ارکید:
تحصیلات: دکترای تخصصی
اسکاپوس: 56155088100
دانشکده: دانشکده فنی و مهندسی
نشانی:
تلفن:

مشخصات پژوهش

عنوان
تحلیل کلان داده ها برای پیش بینی بیماری عفونی
نوع پژوهش
پایان نامه
کلیدواژه‌ها
کلانداده، طبقه بندی، بیماری عفونی، بیماری هپاتیت، یادگیری ماشین، آپاچی اسپارک، آپاچی کافکا، پیش پردازش، تجزیه و تحلیل
سال 1401
پژوهشگران فاطمه محسنی(دانشجو)، مرتضی یوسف صنعتی(استاد راهنما)

چکیده

امروزه پیشبینی سلامت در زندگی مدرن به دلیل حجم گسترده، تنوع و به روزرسانی مداوم دادههای پزشکی امری بسیار ضروری است که تجزیه و تحلیل کلاندادهها فرصتهای جدیدی را برای بهبود بخشیدن به مراقبتهای بهداشتی، پیشبینی وضعیت سلامت، بهینهسازی منابع و کارآیی سازمانها در بخش بهداشت ارائه میدهد که برای این منظور، ما به چارچوبهای پیشرفته تحلیلی نیاز داریم تا دادهها را ذخیره، فیلتر و تجزیه و تحلیل کنیم تا بتوانیم تصمیمگیری سریع و بموقع انجام دهیم. با ذخیره و ثبت معاینه و ویزیتهای بیماران و مراجعهکنندگان به مراکز درمانی، حجم اطلاعاتی که جمعآوری میشود رو به رشد است بنابراین تجزیه و تحلیل درست و بموقع از میزان دادههای تولید شده در سلامتی میتواند به پیشبینی بیماری منجر شود که این امر موجب نجات جان انسانها میشود و از آنجا که بیماریهای عفونی در زمره شایعترین علل مرگ و میر قرار دارد پیشبینی زود هنگام با استفاده از تحلیل کلاندادهها میتواند از شیوع بعضی از بیماریها جلوگیری نموده و بعضا در مورد یک بیماری خاص میتوان به طور زودهنگام بیماری را تشخیص و درمان آن را شروع نمود که به تبع آن در هزینههای درمان صرفهجویی بسیار زیادی خواهد شد. در این پژوهش از طبقهبندی جنگل تصادفی در یادگیری ماشین که یک روش متداول مجموعه درختی است و کلانداده را به خوبی مدیریت میکند؛ استفاده شده است. با این حال، اجرای جنگل تصادفی در MLlib برای آموزش مدلهای درخت تصمیم عمیق، که برای دستیابی به عملکرد پیشبینی خوب در دادههای ما مورد نیاز است، بسیار ناکارآمد است. براین اساس ما بر بهبود عملکرد آموزش جنگل تصادفی در کتابخانه MLlib از اسپارک تمرکز می کنیم. سپس از این مدل برای کار در زمان واقعی برای طبقهبندی توییت به عنوان اینکه فرد دارای بیماری هپاتیت است یا خیر، استفاده شده است. در این روش پیشنهادی، سیستم پیشبینیکننده بیماری هپاتیت در زمان واقعی حاوی سه بخش اصلی: ساخت مدل در زمان آفلاین، روش پردازش جاری و پیشبینی آنلاین است. این سیستم براساس تلفیق چارچوبهای کلانداده مانند: آپاچی اسپارک و کافکا توسعه یافت.