1404/02/01
مهدی سخائی نیا

مهدی سخائی نیا

مرتبه علمی: استادیار
ارکید:
تحصیلات: دکترای تخصصی
اسکاپوس:
دانشکده: دانشکده فنی و مهندسی
نشانی:
تلفن:

مشخصات پژوهش

عنوان
تشخیص سرقت ادبی از نوع نقل به مضمون
نوع پژوهش
پایان نامه
کلیدواژه‌ها
تسرقت ادبی نقل به مضمون متن کاوی
سال 1397
پژوهشگران محمدهادی محمدی(دانشجو)، محرم منصوری زاده(استاد راهنما)، مهدی سخائی نیا(استاد مشاور)

چکیده

سرقت ادبی استفاده دوباره با کپی کردن متنی بدون ارجاع به نویسنده ی اصلی است. تشخیص سرقت ادبی به مجموعه راهکارهایی گفته می شود که استفاده از آن ها به کشف دستبرد علمی منجر می شود. استفاده از تکنیک های یادگیری ماشین و شبکه عصبی مصنوعی یکی از روش های مرسوم جهت تشخیص سرقت ادبی است و این روش ها سرعت کشف و بازدهی خوبی دارند ولی چیزی که تشخیص سرقت ادبی را مشکل می کند وقتی است تشخیص سرقت ادبی از نوع نقل به مضمون ، paraphrase plagiarisim، اتفاق می افتد . برای تشخیص سرقت ادبی از نوع نقل به مضمون در این پژوهش از ترکیب روش های واژگانی، نگارشی، معنایی استفاده شده است، با پیش پردازش اسناد مورد بررسی و تبدیل برداری رشته های لغوی جملات اصلی و غیر اصلی داده های خود را جهت بررسی آماده کردیم، ازالگوریتم jaccard و الگوریتم lcs در سه حالت برای تشخیص سرقت ادبی از نوع واژگانی و ساختاری استفاده شده است،تابع lcs متقاطع و lcs معکوس برای به دست آوردن سرقت ادبی از نوع نقل به مضمون ارائه شده است واز آنجاکه هر چه پایگاه دانش غنی تر شود تشخیص سرقت ادبی معنایی بهبود می یابد، از تبدیل های برداری word2vec و glove استفاده شده است، برای ساخت پایگاه دانش شبکه در glove از همان داده های آموزش خود این پایگاه را ساختیم و بردارهای عددی جملات را جهت بررسی استخراج کردیم ولی در word2vec از پایگاه دانشی که گوگل آن را با داده های متنی گسترده ای آموزش داده بود استفاده کردیم و داده های عددی را از آن استخراج کردیم. در مجموع تعداد نه ویژگی بدست آمده از روش های مختلف را جهت آموزش به شبکه دادیم و در طبقه بندی شبکه از طبقه بنده های مختلف مثل svm,naive bayse,rbf استفاده کردیم و به بررسی آنها روی داده های متنی پرداختیم و به این نتیجه رسیدیم که بهترین حالت ترکیب طبقه بندها بوده است که در این حالت توانستیم تشخیص سرقت ادبی را بهبود ببخشیم و به بازدهی 75.8 برسیم.