عنوان
|
کاوش زمانی موضوع با استفاده از روش FCA
|
نوع پژوهش
|
پایان نامه
|
کلیدواژهها
|
کاوش موضوع، مدل موضوعی، تجزیه وتحلیل مفاهیم رسمی، داده های توییتر
|
چکیده
|
امروزه اطلاعاتی که در سطح وب وجود دارد، بسیار زیاد است و هرروز این اطلاعات در حال افزایش است، پیدا کردن موضوعات و اطلاعات موردنیاز مشکلی هست که سازمان ها با آن روبه رو هستند، دراین بین یکی از مهم ترین داده ها در سطح وب، داده های سایت توییتر محسوب میشود و علت آن به روز بودن و فراگیر بودن آن است. درنتیجه نیاز به روش هایی که این داده ها را به اطلاعات مفیدتری تبدیل کنند رو به افزایش است. البته این داده ها به علت کوتاه بودن ابعاد برخلاف اسناد معمولی استخراج اطلاعات را با چالش مواجه کرده است. در بین روش های موجود برای کاوش موضوع مدل های موضوعی به خصوص مدل موضوعی دیریکله یکی از محبوب ترین و موفق ترین روش ها محسوب میشود. گرچه این مدل برای اسناد معمول ارائه شده است اما کاوش موضوع با این روش عملکرد مطلوبی ندارد. به همین دلیل اکثر محققان روش های دیگری را برای کاوش موضوع از توییتر ارائه می کنند. درحالی که این روش با محاسبه مقادیر پنهان در داده ها می تواند روابط بین توییت ها را استخراج کند. در این پایان نامه مسئله کاوش زمانی داده های توییتر با ترکیب روش های آماری و منطق ریاضی موردبررسی قرارگرفته اند. در ابتدا داده ها از سایت توییتر جمع آوری شده و سپس برای دقت بهتر اطلاعات وابسته به متن توییت، انتخاب موضوعات را در هر بازه ی زمانی موردتوجه قرار می دهیم. سپس داده هایی که دارای اطلاعات مفید و موردنیاز هستند پالایش می شوند و به عنوان ورودی مدل موضوعی مورداستفاده قرار می گیرند. به منظور افزایش دقت کاوش موضوعات، دیگر روش های کاوش موضوعات برای انتخاب موضوعات برتر مورداستفاده قرار می گردد و سپس برای هر موضوع از روش های مبتنی بر تجزیه وتحلیل مفاهیم رسمی، موضوعات مختلف در هر بازه زمانی به دست می آید. برای ارزیابی کار آیی روش پیشنهادی ابتدا وابستگی بین موضوعات و داده ها بررسی می شوند و سپس نتایج حاصل با دیگر روش های مطرح در مجموعه دادگان مقایسه می گردد. نتایج حاصل از پیاده سازی نشان می دهد که روش پیشنهادی برای کاوش زمانی موضوع به دقت و عملکرد قابل قبولی دست پیداکرده است.
|
پژوهشگران
|
محرم منصوری زاده (استاد راهنما)، امیرحسین زند (دانشجو)، میرحسین دزفولیان (استاد مشاور)
|