با توسعه وب 2 و شبکه های اجتماعی، مشتریان و کاربران نظرات، دیدگاه ها و یافته های تجربی خود را درباره ی محصولات مختلف با یکدیگر به اشتراک می گذارند. این نظرها به عنوان یک منبع ارزشمند، جهت تعیین جایگاه کالا و موفقیت در بازاریابی، می تواند مورداستفاده قرار گیرد. استخراج نواقص گزارش شده از میان حجم انبوه و متنوع نظرات کاربران چالشی جدی در زمینه متن کاوی و استخراج اطلاعات است. در این مقاله روشی موثر و کارا برای استخراج نظرهای حاوی گزارش نقص محصول ازنظرهای آنلاین کاربران ارائه گردیده است. بدین منظور طبقه بند جنگل تصادفی برای تشخیص گزارش نقص و تکنیک بدون ناظر مدل سازی موضوعی تخصیص پنهان دیریکله برای ارائه ی خلاصه ای از گزارش نقص بکار گرفته شدهاند. نتایج آزمون روش پیشنهادی روی مجموعه نسبتا بزرگی از دادگان بدست آمده از وب سایت آمازون نشان می دهد که جنگل تصادفی حتی با تعداد کم داده های آموزشی عملکرد قابل قبولی برای کشف گزارش نقص دارد. نتایج و خروجی های استخراج شده از اسناد حاوی گزارش نقص، شامل خلاصه ی گزارش نقص جهت سهولت در تصمیم گیری تولیدکنندگان، یافتن الگوهای وجود گزارش نقص در متن به صورت خودکار و کشف جنبه هایی از محصول که بیشترین گزارش نقص مربوط به آنها می باشد، نشان دهنده توانایی روش پیشنهادی است.