سه شنبه 29 خرداد 1397 | Tuesday 19 th of June 2018 صفحه اصلی گروه الکترونیکی کامپیوتر
4-6-2- خلاصه سازی و به تصویر دراوردن داده ها

قبل از اینکه بتوان روی مجموعه­ای از  داده­ها، داده­کاوی انجام بدهیم و یک مدل پیش­بینی مناسب       ایجاد کنیم، باید بتوان داده­ها را به خوبی شناخت که برا ی شروع این کار می­توان از پارامترهایی مثل میانگین , انحراف معیار، استفاده کرد.

ابزارهای تصویرسازی داده­ها و گراف­سازی برای شناخت داده­ها بسیار مفید می­باشند و نقش انها در     اماده­سازی داده­ها بسیار مفید و غیر قابل انکار است، مثلا با استفاده از این ابزار می­توان توزیع مقادیر مختلف داده­ها را در یک نمودار مشاهده کرد و میزان داده­های دارای خطا را به طور تقریبی حدس زد.

مهمترین مشکل این ابزار این است که معمولا تحلیل­ها دارای تعداد زیادی پارامتر هستند که به هم      مربوط­اند و باید رابطه این پارامترها را که چند بعدی می­باشد در دو بعد نمایش دهند که این کار اگر هم عملی باشد برای استفاده از انها نیاز به افراد خبره می­باشد.

خوشه­ بندی:

هدف از خوشه­بندی این است که داده­های موجود را به چند گروه  تقسیم کنند و در این تقسیم­بندی      داده­های گروه­های مختلف باید حداکثر تفاوت ممکن را به هم داشته باشند و داده­های موجود در یک گروه باید بسیار به هم شبیه باشند. خوشه­بندی یکی از مهمترین ابزارهای کشف داده­ها است که در کشف­های تصادفی به کار گرفته می­شود. الگوریتم­های یادگیری ماشین و داده­کاوی با هدف استخراج دانش از داده­ها، به عنوان روشی برای حل این مشکل مطرح می­باشند. یک روش متداول در این زمینه خوشه­بندی است که برای      تصمیم­گیری یا دسته­بندی یا کلاس­بندی می­تواند تصمیمات نمادینی را به نمونه­های جدید با استفاده از        نمونه­های موجود منتسب کنند.

خوشه­بندی عملی است که در طی ان گروهایی از داده­ها و یا اقلام وجود دارند به طوریکه هر مورد به یک خوشه نسبت داده می­شوند و اعضای داخل خوشه نیز باید دارای شباهت ذاتی با هم باشند و معیار اندازه­گیری شباهت باید کاملا مشخص باشد و برای هر جفت از موارد قابل محاسبه باشد. بنابراین در هر خوشه یک شباهت بین اقلام ان خوشه وجود دارد.

خوشه­بندی یک روش داده­کاوی غیر مستقیم است. برای اکثر روش­های داده­کاوی مثل درخت         تصمیم­گیری و شبکه­های عصبی، با یک مجموعه اموزشی شروع کرده و به کمک این مجموعه سعی می­شود یک مدل برای بخش­بندی داده­ها، ایجاد گردد. سپس از ان مدل برای پیش­بینی داده­های جدید استفاده شود.

در روش خوشه­بندی هیچ دسته­ای از قبل وجود ندارد و در واقع متغیرها به صورت مستقل و وابسته تقسیم نمی­شوند. بلکه در اینجا به دنبال گروه­هایی از داده­ها هستیم که به هم شباهت دارند و با کشف این شباهت­ها  می­توان رفتارها را بهتر شناسایی کرد و بر مبنای ان­ها طوری عمل کرد که نتیجه بهتری حاصل شود.

پس از اینکه داده­ها به چند گروه منطقی و توجیه­پذیر تقسیم شدند از این تقسیم­بندی می­توان برای کسب اطلاعات در مورد داده­ها یا تقسیم داده­های جدید استفاده کنیم.

از مهمترین الگوریتم­هایی که برای خوشه­بندی استفاده می­شوند می توان Kohnenو الگوریتم K-میانگین[1] را نام برد.

تحلیل روابط و وابستگی[2]:

همزمان با پیدایش علم داده­کاوی در اوایل دهه 90 الگوریتم­های استخراج قوانین وابستگی از پایگاه داده­ها نیز پا به عرصه گذاشت. اساسا ارتباط میان مجموعه اشیا، وابستگی­های جالب توجهی هستند که منجر به امکان اشکارسازی الگوهای مفید و قوانین وابستگی برای پشتیبان تصمیم، پیش­بینی­های مالی، سیاست­های بازاریابی، وقایع پزشکی و خیلی کاربردهای دیگر می­شود. در حقیقت توجهات زیادی را در تحقیقات اخیر به خود جلب کرده است.

تحلیل وابستگی یک حالت غیر نظارتی داده­کاوی می­باشد که به جستجو برای یافتن ارتباط در مجموعه  داده­ها می­پردازد. یکی از کاربردی­ترین حالات تحلیل وابستگی تجزیه تحلیل سبد بازار می­باشد که در ان هدف یافتن کالاهایی است که معمولا به طور همزمان خریداری می­شوند. این کار کمک می­کند که         خرده فروشان بهتر بتوانند کالاهای خود را سازماندهی کرده و چیدمان بهتری از محصولات خود داشته باشند.

از مهمترین راههای تحلیل لینک کشف وابستگی و کشف ترتیب می­باشد.

منظور از کشف وابستگی یافتن قوانینی در مورد مورادی است که با هم اتفاق می­افتند مثلا اجناسی که در یک فروشگاه احتمال خرید همزمان انها زیاد است.

کشف ترتیب نیر بسیار مشابه می­باشد ولی پارامتر زمان نیز در ان دخیل می­باشد.

وابستگی­ها به صورت A->B  نمایش داده می­شوند که به A  مقدم و به Bموخر یا نتیجه گفته می­شود. مثلا اگر یک قانون به صورت زیر داشته باشیم:

" اگر افراد چکش بخرند انگاه انها میخ خواهند خرید"

در این قانون مقدم خرید چکش و نتیجه خرید میخ می­باشد.


[1]K-mean

[2]Association Analysis

Compatability by:
آخرین به روز رسانی سایت: سه شنبه, 22 اسفند 1391 - 00:26