|
عنوان
|
ارزیابی روشهای یادگیری ماشین (ML) برای پردازش دادهها و ردیابی ذخایر معدنی گرمابی
|
|
نوع پژوهش
|
مقاله ارائه شده کنفرانسی
|
|
کلیدواژهها
|
یادگیری ماشینی، گرمابی، ذخایر معدنی، الگوریتم
|
|
چکیده
|
ادغام الگوریتمهای یادگیری ماشینی (ML) با شیمی کانیها به طور گسترده در درک پیدایش کانسار و کمک به اکتشاف مواد معدنی مورد استفاده قرار گرفته است. با این حال، یک بررسی سیستماتیک در مورد تأثیر پردازش دادهها و مدلهای ژنتیکی بر عملکرد روشهای ML کافی نیست. این مطالعه بر اساس یک مجموعه داده نامتوازن واقعی بر روی اسفالریت از انواع مختلف ذخایر گرمابی، عملکرد طبقهبندی هشت الگوریتم ML، از جمله تجزیه و تحلیل مؤلفههای اصلی بدون نظارت (PCA) و جاسازی همسایه تصادفی توزیعشده (t-SNE)، و تجزیه و تحلیل تفکیک خطی تحت نظارت (LDA)، تجزیه و تحلیل تفکیک حداقل مربعات جزیی (PLS-DA)، جنگل تصادفی (RF)، ماشین بردار پشتیبان (SVM) و تقویت درخت بسیار حریص (XGBoost) را بررسی کرد. روشهای مختلف پردازش، از جمله انتساب مقادیر گمشده، تبدیل دادهها و انتخاب ویژگی، ارزیابی شدند. این مطالعه در درجه اول از هفت الگوریتم مختلف یادگیری ماشین برای طبقهبندی دادههای اسفالریت جمعآوریشده از انواع مختلف ذخایر استفاده کرد. برای دادههای توزیع چوله، روشهای جایگذاری KNN،Mode و Median برای به حداقل رساندن ورود بایاس غیرضروری به دادهها مناسبتر هستند. الگوریتمهای PCA، t-SNE، LDA،PLS-DA و SVM در دادههایی با تبدیل Clr یا Log عملکرد بهتری داشتند. الگوریتمهای RF و XGBoost قابلیتهای طبقهبندی خوبی را برای دادههای تبدیل نشده نشان دادند. با وجود مجموعه دادههای محدود، انتخاب ویژگی همچنان به شناسایی ویژگیهای کلیدی در فرآیند طبقهبندی کمک میکند. از طریق جستجوی شبکهای و اعتبارسنجی متقابل، پارامترهای الگوریتم را میتوان بهینه کرد.
|
|
پژوهشگران
|
ابراهیم طالع فاضل (نفر اول)
|