سه شنبه 29 خرداد 1397 | Tuesday 19 th of June 2018 صفحه اصلی گروه الکترونیکی کامپیوتر
1-10 روش های کاوش

از بین تمامی روش های موجود کاوش داده ها ، سه روش در تقسیم بندی کلی وجود دارد: قوانین کلاسه بندی ، وابسته سازی و خوشه بندی .

یک قانون کلاسه بندی[1] ، یک مجموعه از قوانینی است که مجموعه داده ها ی مربوطه را کلاسه بندی می کنند و سپس یک مجموعه از قوانین وابسته با هر کلاس یا زیر کلاس را بر می گرداند.

یک قانون وابسته سازی[2] ، روابط وابستگی بین یک مجموعه از داده ها را توصیف می کند.

خوشه بندی[3] به فرا یند تقسیم مجموعه ای از داده ها (یا اشیا) به زیر کلاس هایی با مفهوم خوشه اتلاق می شود . به این ترتیب یک خوشه یک سری داده های مشابه می باشد که همانند یک گروه واحد رفتاری می کنند . لازم به ذکر است خوشه بندی همان کلاسه بندی است با این تفاوت که کلاس ها از پیش تعریف شده و معین نمی باشد و عمل گروهبندی داده ها بدون نظارت[4] انجام می گیرد.

هدف از خوشه بندی این است که داده ها ی موجود را به چند گروه تقسیم کنند و در این تقسیم بندی داده های گروه های مختلف باید حداکثر تفاوت ممکن را به هم داشته باشند و داده های موجود در یک گروه باید بسیار به هم شبیه باشند.

بر خلاف کلاسه بندی ( که درادامه خواهیم دید) در خوشه بندی، گروه ها از قبل مشخص نمی باشند و همچنین معلوم نیست که بر حسب کدام خصوصیات گرو ه بندی صورت می گیرد . در نتیجه پس از انجام خوشه بندی باید یک فرد خبره خوشه های ایجاد شده را تفسیر کند و در بعضی مواقع لازم است که پس از بررسی خوشه ها بعضی از پارامترهایی که در خوشه بندی در نظر گرفته شده اند ولی بی ربط بوده یا اهمیت چندانی ندارند حذف شده و جریان خوشه بندی از اول صورت گیرد . پس از اینکه داده ها به چند گروه منطقی و توجیه پذیر تقسیم شدند از این تقسیم بندی می توان برای کسب اطلاعات در مورد داده ها یا تقسیم داده ها جدید استفاده کنیم .

از مهمترین الگوریتم هایی که برای خوشه بندی استفاده می شوند می توان Kohnenو الگوریتم K-meansرا نام برد.



 

Compatability by:
آخرین به روز رسانی سایت: سه شنبه, 22 اسفند 1391 - 00:26