مشخصات پژوهش

صفحه نخست /خوشه‌بندی جریان داده‌ها با ...
عنوان خوشه‌بندی جریان داده‌ها با استفاده از ترکیب الگوریتم‌های Kmeans و AutoCloud
نوع پژوهش مقاله ارائه شده کنفرانسی
کلیدواژه‌ها خوشه‌بندی، جریان داده، تشخیص ناهنجاری، Typicality، Eccentricity
چکیده الگوریتم AutoCloud یکی از الگوریتم‌های آنلاین و تک‌مرحله‌ای بازگشتی برای خوشه‌بندی جریان داده‌ها بر مبنای فاصله اقلیدسی است. این الگوریتم بر اساس مفهوم تجزیه‌وتحلیل داده Typicality و Eccentricity است که عمدتاً برای کارهای تشخیص ناهنجاری استفاده می‌شود. اما دقت انجام عمل در AutoCloud در مورد برخی از مجموعه‌داده‌ها خیلی مناسب نیست. در AutoCloud، تشکیل خوشه‌ها می‌تواند در جذب نمونه داده‌ها تأثیرگذار باشد؛ بنابراین در این مقاله سعی شده است با اضافه‌کردن الگوریتم Kmeans به ابتدای AutoCloud، چک شود که آیا استفاده از Kmeans می‌تواند منجر به بهبود الگوریتم شود یا خیر. در این روش، تعدادی از نمونه داده‌های اول به‌صورت آفلاین و بقیه داده‌ها به‌صورت آنلاین پردازش می‌شوند. با این کار خوشه‌هایی توسط Kmeans ایجاد می‌شوند و بعد از آن، نمونه داده‌ها با Eccentricity جذب خوشه‌ها خواهند شد. نتایج نشان می‌دهد که AutoCloud، در بیشتر موارد بهتر از روش پیشنهادی عمل می‌کند. لذا فرضیه اینکه استفاده از Kmeans در AutoCloud می‌تواند منجر به بهبود الگوریتم شود رد می گردد و عملا نمی‌توان از این ایده برای افزایش کارایی الگوریتم بهره برد.
پژوهشگران مهسا مرادی (نفر اول)، مرتضی یوسف صنعتی (نفر دوم)