جمعه 30 تیر 1396 | Friday 21 st of July 2017 صفحه اصلی گروه الکترونیکی کامپیوتر
2-6- داده‌کاوی

در دو دهه قبل توانایی‌های فنی بشر در تولید و جمع‌اوری داده‌‌ها به سرعت افزایش یافته است. عواملی نظیر استفاده گسترده از بارکد برای تولیدات تجاری، به خدمت گرفتن کامپیوتر در کسب‌و‌کار، علوم، خدمات دولتی و پیشرفت در وسائل جمع‌اوری داده، از اسکن کردن متون و تصاویر تا سیستم‌های سنجش از دور ماهواره‌ای، در این تغییرات نقش مهمی دارند.

به طور کلی استفاده همگانی از وب و اینترنت به عنوان یک سیستم اطلاع رسانی جهانی ما را با حجم زیادی از داده و اطلاعات مواجه می‌کند. این رشد انفجاری در داده‌های ذخیره‌شده، نیاز مبرم وجود فناوری‌های جدید و ابزارهای خودکاری را ایجاد کرده که به صورت هوشمند به انسان یاری رسانند تا این حجم زیاد داده را به اطلاعات و دانش تبدیل کند، داده‌کاوی به عنوان یک راه حل برای این مسائل مطرح می‌باشد. در یک تعریف غیر رسمی داده‌کاوی فرایندی است، خودکار برای استخراج الگوهایی که دانش را بازنمایی می‌کنند که این دانش به صورت ضمنی در پایگاه داده‌های عظیم، انباره داده و دیگر مخازن بزرگ اطلاعات، ذخیره‌شده است. داده کاوی به طور همزمان از چندین رشته علمی بهره می‌برد: فناوری پایگاه داده، هوش مصنوعی، یادگیری ماشین، شبکه‌های‌ عصبی، امار، شناسایی الگو، سیستم‌های مبتنی بر دانش[1]، حصول دانش[2]، بازیابی اطلاعات[3]، محاسبات سرعت بالا[4] و بازنمایی بصری داده[5].

واژه‌های «داده‌کاوی» و «کشف دانش در پایگاه داده»[6] اغلب به صورت مترادف یکدیگر مورد استفاده قرار می‌گیرند.

کشف دانش در پایگاه داده فرایند شناسایی درست، ساده، مفید، و نهایتا الگوها و مدل‌های قابل فهم در داده‌ها می‌باشد. داده‌کاوی مرحله‌ای از فرایند کشف دانش می‌باشد و شامل الگوریتم‌های مخصوص داده‌کاوی است، به طوری‌که محدودیت‌های مؤثر محاسباتی قابل قبول، الگوها و یا مدل‌ها را در داده کشف می‌کند. به بیان ساده‌تر، داده‌کاوی به فرایند استخراج دانش ناشناخته، درست،و بالقوه مفید از داده اطلاق می‌شود.

تعریف دیگر این است که داده‌کاوی گونه‌ای از تکنیک‌ها برای شناسایی اطلاعات و یا دانش تصمیم‌گیری از قطعات داده می‌باشد، به نحوی که با استخراج انها، در حوزه‌های تصمیم‌گیری، پیشبینی، پیش‌گویی و تخمین مورد استفاده قرار گیرند. داده‌ها اغلب حجیم اما بدون ارزش می‌باشند، داده به تنهایی قابل استفاده نیست، بلکه دانش نهفته در داده‌ها قابل استفاده می‌باشد. به این دلیل اغلب به داده‌کاوی، تحلیل داده‌ای ثانویه[7] گفته می‌شود.

 



[1]Knowledge-Based System

[2]Knowledge-Acquisition

[3]Information Retrieval

[4]High-Performance Computing

[5]Data Visualization

[6]Knowledge Discovery in Database

[7]Secondary Data Analysis 

Compatability by:
آخرین به روز رسانی سایت: سه شنبه, 22 اسفند 1391 - 00:26