مشخصات پژوهش

صفحه نخست /ارزیابی روش‌های یادگیری ماشین ...
عنوان ارزیابی روش‌های یادگیری ماشین (ML) برای پردازش داده‌ها و ردیابی ذخایر معدنی گرمابی
نوع پژوهش مقاله ارائه شده کنفرانسی
کلیدواژه‌ها یادگیری ماشینی، گرمابی، ذخایر معدنی، الگوریتم
چکیده ادغام الگوریتم‌های یادگیری ماشینی (ML) با شیمی کانی‌ها به طور گسترده در درک پیدایش کانسار و کمک به اکتشاف مواد معدنی مورد استفاده قرار گرفته است. با این حال، یک بررسی سیستماتیک در مورد تأثیر پردازش داده‌ها و مدل‌های ژنتیکی بر عملکرد روش‌های ML کافی نیست. این مطالعه بر اساس یک مجموعه داده نامتوازن واقعی بر روی اسفالریت از انواع مختلف ذخایر گرمابی، عملکرد طبقه‌بندی هشت الگوریتم ML، از جمله تجزیه و تحلیل مؤلفه‌های اصلی بدون نظارت (PCA) و جاسازی همسایه تصادفی توزیع‌شده (t-SNE)، و تجزیه و تحلیل تفکیک خطی تحت نظارت (LDA)، تجزیه و تحلیل تفکیک حداقل مربعات جزیی (PLS-DA)، جنگل تصادفی (RF)، ماشین بردار پشتیبان (SVM) و تقویت درخت بسیار حریص (XGBoost) را بررسی کرد. روش‌های مختلف پردازش، از جمله انتساب مقادیر گمشده، تبدیل داده‌ها و انتخاب ویژگی، ارزیابی شدند. این مطالعه در درجه اول از هفت الگوریتم مختلف یادگیری ماشین برای طبقه‌بندی داده‌های اسفالریت جمع‌آوری‌شده از انواع مختلف ذخایر استفاده کرد. برای داده‌های توزیع چوله، روش‌های جایگذاری KNN،Mode و Median برای به حداقل رساندن ورود بایاس غیرضروری به داده‌ها مناسب‌تر هستند. الگوریتم‌های PCA، t-SNE، LDA،PLS-DA و SVM در داده‌هایی با تبدیل Clr یا Log عملکرد بهتری داشتند. الگوریتم‌های RF و XGBoost قابلیت‌های طبقه‌بندی خوبی را برای داده‌های تبدیل نشده نشان دادند. با وجود مجموعه داده‌های محدود، انتخاب ویژگی همچنان به شناسایی ویژگی‌های کلیدی در فرآیند طبقه‌بندی کمک می‌کند. از طریق جستجوی شبکه‌ای و اعتبارسنجی متقابل، پارامترهای الگوریتم را می‌توان بهینه کرد.
پژوهشگران ابراهیم طالع فاضل (نفر اول)