پنج شنبه 5 اسفند 1395 | Thursday 23 rd of February 2017 صفحه اصلی گروه الکترونیکی کامپیوتر
2-6-2- مراحل کشف دانش

کشف دانش دارای مراحل تکراری زیر است:

  • پاکسازی داده‌ها[1] (از بین بردن نویز و ناسازگاری داده‌ها)
  • یکپارچه‌سازی داده‌ها[2] (چندین منبع داده ترکیب می‌شوند)
  • انتخاب داده‌ها[3] (داده‌های مرتبط با انالیز از پایگاه داده بازیابی می‌شوند)
  • تبدیل کردن داده‌ها[4] (تبدیل داده‌ها به فرمی که مناسب برای داده‌کاوی باشد مثل خلاصه‌سازی[5] و همسان‌سازی[6])
  • داده‌کاوی (فرایند اصلی که شامل روال‌های هوشمند برای استخراج الگوها از داده‌ها است)
  • ارزیابی الگو (برای مشخص کردن الگوهای صحیح و مورد نظر به وسیله معیارهای اندازه‌گیری)
  • ارائه دانش[7] (یعنی نمایش بصری، تکنیک‌های بازنمایی دانش برای ارائه دانش کشف شده به کاربر استفاده می‌شود)

هر مرحله داده‌کاوی باید با کاربر یا پایگاه دانش تعامل داشته باشد. الگوهای کشف شده به کاربر ارائه می‌شوند و در صورت خواست او به عنوان دانش به پایگاه دانش اضافه می‌شوند. توجه شود که بر طبق این دیدگاه داده‌کاوی تنها یک مرحله از کل فرایند است، البته به عنوان یک مرحله اساسی که الگوهای مخفی را اشکار می‌سازد. با توجه به مطالب عنوان شده، دراینجا تعریفی از داده‌کاوی ارائه می‌دهیم:

"داده‌کاوی عبارتست از فرایند یافتن دانش از مقادیر عظیم داده‌های ذخیره‌شده در پایگاه داده، انبار داده ویا دیگر مخازن اطلاعات."

 

شکل 2-5- معماری یک نمونه سیستم داده‌کاوی

 

بر اساس این دیدگاه یک سیستم داده‌کاوی به طور نمونه دارای اجزای اصلی زیر است که در شکل هم نمایش داده شده‌است.

  • پایگاه داده، انباره داده یا دیگر مخازن اطلاعات که از مجموعه‌ای از پایگاه داده‌ها، انبار داده، صفحه گسترده[8] یا دیگر انواع مخازن اطلاعات تشکیل شده‌است. پاکسازی داده‌ها و تکنیک‌های یکپارچه‌سازی روی این داده‌ها انجام می‌شود.
  • سرویس‌دهنده پایگاه داده یا انبار داده که مسئول بازیابی داده‌های مرتبط بر اساس نوع درخواست داده‌کاوی کاربر می‌باشد.
  • پایگاه دانش
  • موتور داده‌کاوی[9] قسمت اصلی از سیستم داده‌کاوی است و به طور ایده‌ال شامل مجموعه‌ای از پیمانه[10] نظیر توصیف[11]، تداعی[12]، کلاس‌بندی[13]، انالیزخوشه‌ها[14] و انالیز تکامل وانحراف[15] است.
  • پیمانه ارزیابی الگو[16] معیارهای جذابیت[17] را به کار می‌بندد و با پیمانه داده‌کاوی تعامل می‌کند، بدین‌صورت که تمرکز ان بر جستجو بین الگوهای جذاب می‌باشد و از یک حد استانه جذابیت استفاده می‌کند تا الگوهای کشف شده را ارزیابی کند.
  • واسط کاربرگرافیکی[18] بین کاربر و سیستم داده‌کاوی ارتباط برقرار می‌کند، به کاربر اجازه می‌دهد تا با سیستم داده‌کاوی از طریق پرس‌و‌جو[19] ارتباط برقرار کند و شمای پایگاه داده یا انباره داده را مرور کرده، الگوهای یافته‌شده را ارزیابی کرده و الگوها را در فرم‌های بصری گوناگون بازنمایی کند.

با انجام فرایند داده‌کاوی، دانش، ارتباط یا اطلاعات سطح بالا از پایگاه داده استخراج می‌شود و قابل مرور از دیدگاه‌های مختلف خواهد بود. دانش کشف شده در سیستم‌های تصمیم‌یار، کنترل فرایند، مدیریت اطلاعات و پردازش پرس وجو[20] قابل استفاده خواهد بود.

بنابراین داده‌کاوی به عنوان یکی از شاخه‌های پیشرو در صنعت اطلاعات مورد توجه قرار گرفته و به عنوان یکی از نوید‌بخش‌ترین زمینه‌های توسعه بین رشته‌ای در صنعت اطلاعات است.


[1]Data Cleaning

[2]Data Integration

[3]Data Selection

[4]Data Transformation

[5]Summary

[6]Aggregation

[7]Knowledge Presentation

[8]Spread sheets

[9]Data Mining Engine

[10]Module

[11]Characterization

[12]Association

[13]Classification

[14]Cluster analysis

[15]Evolution and Deviation Analysis

[16]Pattern Evaluation Module

[17]Interesting Measures

[18]Graphical User Interface (GUI)

[19]Query

[20]Query Processing 

Compatability by:
آخرین به روز رسانی سایت: سه شنبه, 22 اسفند 1391 - 00:26