1404/02/01
محرم منصوری زاده

محرم منصوری زاده

مرتبه علمی: دانشیار
ارکید:
تحصیلات: دکترای تخصصی
اسکاپوس: 25923564500
دانشکده: دانشکده فنی و مهندسی
نشانی: همدان، دانشگاه بوعلی سینا، دانشکده مهندسی، گروه مهندسی کامپیوتر
تلفن: 08131406381

مشخصات پژوهش

عنوان
ارائه چارچوبی جهت طبقه بندی کلان داده با استفاده از شبکه های عصبی ELM
نوع پژوهش
پایان نامه
کلیدواژه‌ها
کلان داده، شبکه عصبی ELM، مجمع رده بندها، طبقه بندی
سال 1400
پژوهشگران روح اله صفایی(دانشجو)، محرم منصوری زاده(استاد راهنما)، میرحسین دزفولیان(استاد مشاور)

چکیده

در سالهای اخیر رشد انفجاری داده ها به قدری شدید بوده است که هر دو سال مقدار داده ها تقریبا دو برابر می شود. تحت تاثیر این رشد انفجاری داده های جهانی، عبارت کلان داده جهت توصیف داده های بسیار حجیم، داری سرعت رشد بالا و تنوع زیاد مورد استفاده قرار می گیرد. بنابراین می توان گفت روش ها، الگوریتم ها و چارچوب های کلاسیک یادگیری ماشین برای مدیریت و پردازش این مقدار داده ناتوان می باشند. الگوریتمهای یادگیری ماشین تا زمانی که با کلان داده به چالش کشیده نشوند نوید بهبودی نخواهند داد. طبقه بندی یکی از روشهایی است که در تحلیل داده ها به ما کمک می کند، از جمله تحلیل داده های ساخت یافته، تحلیل داده های متنی، تحلیل داده های وب سایت، تحلیل داده های چندرسانه ای، تحلیل داده های شبکه، تحلیل داده های تلفن همراه. بنابراین می توان گفته مساله طبقه بندی امروزه روی کلان داده بسیار حایز اهمیت می باشد. رسیدن به راهکاری جهت طبقه بندی، در مواردی با حجم داده های بالا چون شبکه های اجتماعی، تراکنش های مالی، تشخیص نفوذ در شبکه، بسیار راه گشا خواهد بود. در این پژوهش سعی بر آن شد تا به روشی دست پیدا کنیم که با استفاده از شبکه عصبی ELM ، با سرعت بالا و منابع کمتر بتوانیم طبقه بندی کلان داده را انجام دهیم. کلان داده به علت حجم بالا به طور کامل در حافظه اصلی بارگذاری نمی شود بنابراین ما روشی ارائه دادیم که با بخش بندی مجموعه داده، و آموزش هر بخش بطور مجزا و در نهایت با استفاده از یک مجمع رده بندها که هدف آن استفاده از خرد جمعی یعنی استفاده از نظر همه رده بندهای آموزش دیده می باشد، با حداقل منابع سخت افزاری و در زمانی مناسب به دقتی قابل قبول برسیم که هم قابلیت موازی سازی داشته باشد و هم با روشهای مبتنی بر معماریهای موازی چون نگاشت کاهش و آپاچی اسپارک قابل رقابت باشد. نتایج روش پیشنهادی روی مجموعه داده MNIST دارای نرخ خطای 5.62 درصد می باشد که تفاوت آن با روش هایی که از معماریهای موازی و توزیع شده مانند آپاچی اسپارک و نگاشت کاهش استفاده می کنند، چندان معنادار نمی باشد.