1404/02/01
محمد نصیری

محمد نصیری

مرتبه علمی: دانشیار
ارکید:
تحصیلات: دکترای تخصصی
اسکاپوس: 24725089600
دانشکده: دانشکده فنی و مهندسی
نشانی:
تلفن: +989188070601

مشخصات پژوهش

عنوان
تشخیص تقلب متون علمی به کمک روابط معنایی و ساختاری
نوع پژوهش
پایان نامه
کلیدواژه‌ها
سرقت ادبی، تشخیص تقلب متون، روابط معنایی بین مفاهیم، روابط ساختاری بین مفاهیم، تشابه متون
سال 1393
پژوهشگران زهرا طاهری(دانشجو)، محرم منصوری زاده(استاد راهنما)، محمد نصیری(استاد مشاور)

چکیده

یکی از معضلات موجود در عصر حاضر مبحث تقلب متون است. افراد بسیاری با استفاده از نوشته جات دیگران برای خود مطالبی تهیه و به نام خود ارائه می دهند. تشخیص تقلب می تواند ما را در بررسی صداقت آنان یاری نماید. تقلب متون به شکل های مختلفی چون کپی و جایگزینی، بازگردانی، کپی و ادغام از منابع مختلف، درج متن اضافی، ترجمه، نقل قول، دادن مرجع اشتباه، سرقت ایده و خلاصه سازی باشد. آشکارسازی تقلب توسط روش ها و الگوریتم هایی بسیاری پیگیری می شود که هر کدام با بهره گیری و بررسی متن از جنبه های مختلف در صدد شناسایی شباهت متون برآمده اند. می توان روش ها را در روش های مبتنی بر شباهت رشته ای، مبتنی بر خوشه بندی، مبتنی بر ساختار و قالب متن، مبتنی بر نحو، مبتنی بر معنا، مبتنی بر بردار، مبتنی بر منطق فازی و غیره دسته بندی نمود. در این پایان نامه یک روش مبتنی بر ساختار و نحو و دو روش مبتنی بر معنا معرفی شده اند. در روش ساختاری از LexParser برای مشخص نمودن وابستگی نحوی بین کلمات استفاده شده است، تعداد وابستگی مشترک را استخراج نموده و شباهت حاصل می شود.در روش های مبتنی بر معنا از پایگاه داده وردنت استفاده شده است. (وردنت پایگاه داده ای شامل مفاهیم انگلیسی و روابط معنایی بین آن ها است. در این پایگاه داده روابط معنایی عام و خاص، جز و کل، استلزام، علیت، شباهت، تضاد، هم چنین، خصلت، گروه بندی افعال، اشتقاق، وجه وصفی، صفت وابسته، دامنه و عضو دامنه، Domain و Member تعریف شده است). در روش پیشنهادی اول، کلمات دو جمله را در وردنت پیدا می کنیم سپس اجداد آن ها را با توجه به رابطه Hypernym، پدران کلمات مشخص می شود، در ادامه اولین پدر مشترک کلمات را پیدا نموده با توجه به فاصله کلمه از پدر مشترک و تعداد اجداد مشترک شباهت کلمات تعیین می گردد. حال با استفاده از الگوریتم DTW می توان شباهت دو جمله را مشخص نمود. نتایج آزمایش روش های پیشنهادی و مقایسه آن با سایر روش ها حاکی از کارایی روش پیشنهادی دارد.در روش معنایی پیشنهادی دوم ما به هر کدام از روابط معنایی موجود در وردنت، عددی اختصاص داده ایم. این اعداد میزان نزدیکی یا تفاوت معنایی آن ها را بیان می کند، برای مثال به رابطه تشابه عدد کوچک و به رابطه تضاد عدد بزرگتری اختصاص داده ایم. حال بعد از دریافت ورودی کلمات جمله ها را از لحاظ روابط معنایی بررسی کرده و نتایج را