خانه / مقاله های ترجمه شده کامپیوترIT / مقاله داده بزرگ Big Data / مقاله داده کاوی بزرگ هزینه ی بهره وری در ابر یک مطالعه ی موردی با K-means

مقاله داده کاوی بزرگ هزینه ی بهره وری در ابر یک مطالعه ی موردی با K-means

سال : 2017                              ژورنال : University of Wollongong Research Online                           تعداد صفحات انگلیسی : 10           تعداد صفحات فارسی:  15

عنوان انگلیسی مقاله :

Cost-effective Big Data Mining in the Cloud: A Case Study with K-means

عنوان فارسی مقاله :

داده کاوی بزرگ هزینه ی بهره وری در ابر یک مطالعه ی موردی با K-means

چکیده فارسی :

کاوش داده ی بزرگ، اغلب نیازمند منابع محاسباتی فوق العاده است.  این امر به یک مانع عمده برای استفاده ی وسیع از تجزیه و تحلیل داده های بزرگ تبدیل شده است. محاسبات  ابری به محققان داده،  اجازه ی دسترسی به منابع محاسباتی  را بر اساس تقاضای ساخت راه حل های تحلیلی داده ای بزرگ آنان در ابر داده است. هر چند، هزینه ی پولی کاوش داده ی بزرگ در ابر،  هنوز هم می تواند بر خلاف انتظار مان،  بالا  باشد.

برای مثال،  اجرای مثال EC2  Amazon  100 m4- xlarge  برای یک ماه، هزینه در حدود ۱۷،۴۹۵،۰۰ دلار  را به دنبال دارد. در این زمینه، مسئله ی حیاتی  به منظور تجزیه و تحلیل هزینه ی بهره وری  داده کاوی بزرگ در ابر، چگونگی دستیابی به یک  نتیجه ی رضایت بخش کافی  در حداقل هزینه ی محاسباتی ممکن است. در سناریو های  داده کاوی بزرگ حقیقی، دقت ۱۰۰٪ غیر ضروری است. در عوض، اغلب دستیابی به یک دقت کافی برای مثال ۹۹٪ ، یا هزینه ی کمتر مانند ۱۰٪ نسبت به هزینه ی دستیابی به دقت ۱۰۰٪ ،  ترجیح داده می شود.

در این مقاله ، ما به کشف و نمایش  داده کاوی بزرگ هزینه ی بهره وری  به همراه یک مطالعه ی موردی با استفاده از K-means  شناخته شده می پردازیم.  با استفاده از مطالعه ی موردی، در می یابیم که  دست یابی به دقت ۹۹٪ تنها نیاز به  هزینه ی محاسبتی  ۴۶.۱۷٪-۰.۳۲٪  مربوط به دقت ۱۰۰٪  دارد.  این یافته، سنگ بنای لازم را برای  داده کاوی هزینه ی بهره وری در انواع دامنه ها فراهم می کند.

کلمات کلیدی : محاسبات ابری  ; داده کاوی ; هزینه ی بهره وری  ; داده بزرگ ; K- means

چکیده انگلیسی:

Mining big data often requires tremendous computational resources. This has become a major obstacle to broad applications of big data analytics. Cloud computing allows data scientists to access computational resources on demand for building their big data analytics solutions in the cloud. However, the monetary cost of mining big data in the cloud can still be unexpectedly high. For example, running 100 m4-xlarge Amazon EC2 instances for a month costs approximately $17,495.00. On this ground, it is a critical issue to analyze the cost effectiveness of big data mining in the cloud, i.e., how to achieve a sufficiently satisfactory result at the lowest possible computation cost. In certain big data mining scenarios, 100% accuracy is unnecessary. Instead, it is often more preferable to achieve a sufficient accuracy, e.g., 99%, at a much lower cost, e.g., 10%, than the cost of achieving the 100% accuracy. In this paper, we explore and demonstrate the cost effectiveness of big data mining with a case study using well known k-means. With the case study, we find that achieving 99% accuracy only needs 0.32%-46.17% computation cost of 100% accuracy. This finding lays the cornerstone for cost-effective big data mining in a variety of
domains.
Keywords-Cloud Computing ; Data Mining ; Cost-Effective ; Big Data ; K-Means

دانلود رایگان فایل انگلیسی مقاله

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

چهارده + هفده =