یکی از مهمترین داراییهای هر سازمانی به خصوص در صنایع ، وجود دادههای فراوان ثبت شده است. سازمانها میتوانند باتحلیل دادهها به اهداف بسیار ارزشمندی دست پیدا کنند. یکی از مهمترین ابزارهای تحلیل این دادهها دانش دادهکاوی است.هدف دادهکاوی بهدستآوردن دانش مفید و استخراج الگوهای پنهان دادههای موجود است. در صنعت فولاد میتوان با پیشبینی به موقع خرابیها، از وقوع خرابیهای ناگهانی جلوگیری کرده و توقفهای غیرضروری تولید را به حداقل رساند.دراین پژوهش دادههای توقفات ثبت شده مربوط به سالهای 1397تا1401 شش کورهی فولادسازی شرکت فولادخوزستان مورد بررسی قرار گرفت.ویژگیهای مناسب انتخاب و بعد از شناخت دادهها، پیشپردازش دادهها انجام شد.جهت پیشپردازش دادهها، رکوردهای پرت وناهماهنگ حذف و با تبدیل داده ویژگیهای جدید ایجادگردید.درمرحله ی بعد مشخصههای تاثیرگذار بر میزان توقفات انتخاب گردید.ویژگی هایی که به عنوان مهمترین عوامل شناسایی شدند برای مدلسازی انتخاب شدند. مرحلهی مدلسازی در دو بخش طبقهبندی و خوشهبندی انجام شد.درمرحلهی طبقهبندی ازالگوریتمهای SVM, D.T, KNN, ANN Adaboost,Bagging که از پرکاربردترین الگوریتمها در زمینهی پیشبینی هستند استفاده شد.برای ارزیابی مدلها معیار های صحت، حساسیت و دقت استفاده گردید و بهترین تکنیکها با ویژگی هدف مدت توقف KNN, SVM و Adaboostوجهت ویژگی فاصله توقف Adaboost,Ann,Svm تعیین گردید. دربخش خوشهبندی با استفاده ازمشخصههای منتخب از سه الگوریتم کیمینز، تواستپ و کوهنن دادهها به خوشههایی باویژگیهای مشابه تقسیمبندی شدند وتعداد مناسب خوشه در هر روش با توجه به شاخص سیلهوت تعیین گردید.با این تکنیک میتوان تجهیزات را بر اساس شباهتها خوشهبندی کرد.