امروزه با پیشرفت روز افزون اینترنت و گسترش مقالات برخط دستبردهای علمی راحت تر شده است. سرقت ادبی استفاده دوباره یا کپی کردن متنی بدون ارجاع به نویسنده ی اصلی است. سرقت علمی یا تقلب در مدارس و دانشگاهها می تواند به عنوان یک فاکتور محرک برای معلمان، دانش آموزان، دانشجویان و اساتید به حساب آید. اگر سرقت علمی و ادبی به درستی شناسایی نشود، متقلبان و سارقان می توانند به نتایجی برسند که مستحق آن نیستند. در این مقاله روشی جهت شناسایی سرقت ادبی بر مبنای برچسب گذاری نقش معنایی و الگوریتم ژنتیک ارائه می شود. روش پیشنهادی بر روی متون انگلیسی عمل پردازش را انجام می دهد. نتایج آزمایش بر روی مجموعه داده های PAN-PC-09 نشان می دهد که روش پیشنهادی، مقدار پارامترهای ارزیابی مانندRecall، Precisionو F-measureرا نسبت به روش های قبلی ارائه شده در زمینه شناسایی سرقت ادبی بهبود می دهد.