عنوان
|
ارائه چارچوبی جهت طبقه بندی کلان داده با استفاده از شبکه های عصبی ELM
|
نوع پژوهش
|
پایان نامه
|
کلیدواژهها
|
کلان داده، شبکه عصبی ELM، مجمع رده بندها، طبقه بندی
|
چکیده
|
در سالهای اخیر رشد انفجاری داده ها به قدری شدید بوده است که هر دو سال مقدار داده ها تقریبا دو برابر می شود. تحت تاثیر این رشد انفجاری داده های جهانی، عبارت کلان داده جهت توصیف داده های بسیار حجیم، داری سرعت رشد بالا و تنوع زیاد مورد استفاده قرار می گیرد. بنابراین می توان گفت روش ها، الگوریتم ها و چارچوب های کلاسیک یادگیری ماشین برای مدیریت و پردازش این مقدار داده ناتوان می باشند. الگوریتمهای یادگیری ماشین تا زمانی که با کلان داده به چالش کشیده نشوند نوید بهبودی نخواهند داد. طبقه بندی یکی از روشهایی است که در تحلیل داده ها به ما کمک می کند، از جمله تحلیل داده های ساخت یافته، تحلیل داده های متنی، تحلیل داده های وب سایت، تحلیل داده های چندرسانه ای، تحلیل داده های شبکه، تحلیل داده های تلفن همراه. بنابراین می توان گفته مساله طبقه بندی امروزه روی کلان داده بسیار حایز اهمیت می باشد. رسیدن به راهکاری جهت طبقه بندی، در مواردی با حجم داده های بالا چون شبکه های اجتماعی، تراکنش های مالی، تشخیص نفوذ در شبکه، بسیار راه گشا خواهد بود. در این پژوهش سعی بر آن شد تا به روشی دست پیدا کنیم که با استفاده از شبکه عصبی ELM ، با سرعت بالا و منابع کمتر بتوانیم طبقه بندی کلان داده را انجام دهیم. کلان داده به علت حجم بالا به طور کامل در حافظه اصلی بارگذاری نمی شود بنابراین ما روشی ارائه دادیم که با بخش بندی مجموعه داده، و آموزش هر بخش بطور مجزا و در نهایت با استفاده از یک مجمع رده بندها که هدف آن استفاده از خرد جمعی یعنی استفاده از نظر همه رده بندهای آموزش دیده می باشد، با حداقل منابع سخت افزاری و در زمانی مناسب به دقتی قابل قبول برسیم که هم قابلیت موازی سازی داشته باشد و هم با روشهای مبتنی بر معماریهای موازی چون نگاشت کاهش و آپاچی اسپارک قابل رقابت باشد. نتایج روش پیشنهادی روی مجموعه داده MNIST دارای نرخ خطای 5.62 درصد می باشد که تفاوت آن با روش هایی که از معماریهای موازی و توزیع شده مانند آپاچی اسپارک و نگاشت کاهش استفاده می کنند، چندان معنادار نمی باشد.
|
پژوهشگران
|
محرم منصوری زاده (استاد راهنما)، روح اله صفایی (دانشجو)، میرحسین دزفولیان (استاد مشاور)
|