امروزه در اکثر سازمان ها، داده ها به سرعت در حال جمع آوری و ذخیره شدن می باشد، اما می توان ادعا کرد که علی رغم این حجم انبوه داده ها، سازمان ها با فقر دانش در تصمیم گیری روبرو هستند. با علم داده کاوی می توان پاسخگوی نیاز مدیران در تصمیم گیری ها بود. داده کاوی علم و فنی است که در سال های اخیر و با گسترش استفاده از فناوری اطلاعات و سیستم های اطلاعاتی مورد توجه قرار گرفته و کاربردهای متنوع ای در حوزه های مختلف پیدا نموده است. با کمک داده کاوی می توان از درون داده های حجیم الگوها و مدل های پنهان را شناسایی و استخراج نمود و به دانش نهفته در آنها دست یافت. داده کاوی یک حوزه میان رشته ای است که در آن از علوم آمار، یادگیری ماشین، هوش مصنوعی، مدیریت پایگاه های داده، تشخیص الگو، الگوریتم ها و مصورسازی استفاده می شود. مراحل اصلی یک فرآیند داده کاوی شامل جمع آوری داده ها، پاک سازی داده ها، یکپارچه سازی و تخلیص داده ها، مدل سازی و ارزیابی مدل می باشد.