1404/06/16
مرتضی یوسف صنعتی

مرتضی یوسف صنعتی

مرتبه علمی: استادیار
ارکید:
تحصیلات: دکترای تخصصی
اسکاپوس: 56155088100
دانشکده: دانشکده فنی و مهندسی
نشانی:
تلفن:

مشخصات پژوهش

عنوان
خوشه‌بندی جریان داده‌ها با استفاده از ترکیب الگوریتم‌های Kmeans و AutoCloud
نوع پژوهش
مقاله ارائه شده کنفرانسی
کلیدواژه‌ها
خوشه‌بندی، جریان داده، تشخیص ناهنجاری، Typicality، Eccentricity
سال 1403
پژوهشگران مهسا مرادی ، مرتضی یوسف صنعتی

چکیده

الگوریتم AutoCloud یکی از الگوریتم‌های آنلاین و تک‌مرحله‌ای بازگشتی برای خوشه‌بندی جریان داده‌ها بر مبنای فاصله اقلیدسی است. این الگوریتم بر اساس مفهوم تجزیه‌وتحلیل داده Typicality و Eccentricity است که عمدتاً برای کارهای تشخیص ناهنجاری استفاده می‌شود. اما دقت انجام عمل در AutoCloud در مورد برخی از مجموعه‌داده‌ها خیلی مناسب نیست. در AutoCloud، تشکیل خوشه‌ها می‌تواند در جذب نمونه داده‌ها تأثیرگذار باشد؛ بنابراین در این مقاله سعی شده است با اضافه‌کردن الگوریتم Kmeans به ابتدای AutoCloud، چک شود که آیا استفاده از Kmeans می‌تواند منجر به بهبود الگوریتم شود یا خیر. در این روش، تعدادی از نمونه داده‌های اول به‌صورت آفلاین و بقیه داده‌ها به‌صورت آنلاین پردازش می‌شوند. با این کار خوشه‌هایی توسط Kmeans ایجاد می‌شوند و بعد از آن، نمونه داده‌ها با Eccentricity جذب خوشه‌ها خواهند شد. نتایج نشان می‌دهد که AutoCloud، در بیشتر موارد بهتر از روش پیشنهادی عمل می‌کند. لذا فرضیه اینکه استفاده از Kmeans در AutoCloud می‌تواند منجر به بهبود الگوریتم شود رد می گردد و عملا نمی‌توان از این ایده برای افزایش کارایی الگوریتم بهره برد.