پنج شنبه 26 مهر 1397 | Thursday 18 th of October 2018 صفحه اصلی گروه الکترونیکی کامپیوتر
2-1 کلاسه بندی

هدف کلاسه بندی داده ها ، سازماندهی و تخصیص داده ها به کلاس های مجزا می باشد . در این فرایند بر اساس داده های توزیع شده ، مدل اولیه ای ایجاد می گردد. سپس این مدل برای طبقه بندی داده های جدید مورد استفاده قرار می گیرد ، به این ترتیب با بکار گیری مدل بدست امده ، تعلق داده های جدید به کلاس قابل پیشگویی می باشد . کلاسه بندی در مورد مقادیر گسسته و پیشگویی انها به کار می رود.

هدف پیشگویی[1] ، پیش بینی و دریافت مقدار یک خصیصه بر اساس خصیصه های دیگر می باشد. بر اساس داده های توزیعی ، در ابتدا یک مدل ایجاد می گردد، سپس از این مدل در پیشگویی مقادیر نا شناخته استفاده می شود . در داده کاوی ، کلاسه بندی ، به پیشگویی مقادیر گسسته ، و پیشگویی به تخمین مقادیر پیوسته اتلاق می شود .

در فرایند کلاسه بندی ، اشیا موجود به کلاس های مجزا با مشخصه های تفکیک شده ( ظروف جداگانه ) طبقه بندی و به صورت یک مدل معرفی می گردند . سپس با در نظر گرفتن ویژگی های هر طبقه ، شی جدید به انها تخصیص یافته ، برچسب و نوع ان پیشگویی می گردد.

در کلاسه بندی ، مدل ایجاد شده بر پایه ی یکسری داده های اموزشی ، (اشیا داده هایی که بر چسب کلاس انها مشخص و شناخته شده است ) حاصل می اید . مدل بدست امده در اشکال گوناگون مانند قوانین کلاسه بندی (If-Then) ، درخت های تصمیم  ، فرمول های ریاضی و شبکه های عصبی قابل نمایش می باشد . از کلاسه بندی می توان برای پیشگویی کلاس اشیا داده ها استفاده کرد.

در برخی موارد نیز افراد ترجیح می دهند مقدار یک خصیصه و نه کلاس ان را پیشگویی نمایند که به یافتن مقدار یک خصیصه ، پیشگویی اتلاق می گردد. در هر حال پیشگویی ، تخمین مقدار و بر چسب کلاس را با هم در بر می گیرد . کلاسه بندی و پیشگویی با استفاده از تحلیل ارتباط[2] ، خصیصه هایی را که فرایند مورد نظر، بی تاثیر و قابل حذف می باشند ، شناسایی می کنند.

به عنوان مثال فرض کنید مدیر فروشگاهی در نظر دارد مجمو عه ی بزرگی از داده ها را بر اساس میزان فروش به زیاد، متوسط و کم طبقه بندی کند. او باید مدلی ایجاد کند که بر اساس خصیصه های کالا مانند قیمت، مارک، محل ساخت و نوع کالا، کلاس مربوط به ان نوع کالا را تعیین نماید . طبقه بندی نهایی می بایست به طور ماکزیمال هر کلاسی را از دیگری تشخیص داده ، تصویر سازماندهی شده ای از داده ها را به نمایش در ا ورد . اگر خروجی به صورت یک درخت تصمیم باشد ، خصیصه ها به ترتیب اولویت بررسی شده ، بقیه خصیصه ها در الویت بعدی بررسی می گردند . چنین مدلی در طرح های اتی فروشگاه می تواند بسیار موثر واقع شود .

از کاربردهای کلاسه بندی می توان بازاریابی ، تشخیص بیماری ، تحلیل اثرات معالجه، تشخیص خرابی در صنعت و تعیین اعتبار را نام برد .

شکل 2-1-مثالی از فرایند دو مرحله ای کلاسه بندی

شکل 2-1-مثالی از فرایند دو مرحله ای کلاسه بندی 

کلاسه بندی داده ها یک فرایند دو مرحله است (شکل2-1):1-یادگیری 2-کلاسه بندی

1. در مرحله اول یک مدل ساخته می شود که مجموعه ای از کلاس های داده ای یا مفاهیم [1] را مشخص میکند . این مرحله را مرحله یادگیری[2] گوییم که در ان یک الگوریتم کلاسه بندی یک مدل را با تحلیل یک مجموعه ی اموزشی[3] که مجمو عه ای از تاپل های پایگاه داده است می سازد و بر چسب کلاس های مربوط به این تاپل ها را مشخص می کند . یک تاپل Xبا یک بردار صفت (x1،x2،،xn)-Xنمایش داده می شود. فرض می شود که هر تاپل به یک کلاس از پیش تعریف شده متعلق است و کلاس با یک صفت که به ان صفت بر چسب کلاس می گوییم مشخص می شود. مجموعه اموزشی به صورت تصادفی از پایگاه انتخاب می شود . از انجایی که برچسب هر تاپل اموزشی در این مرحله مشخص است ، این مرحله یادگیری نظارت شده[4] نامیده می شود.

2. در مرحله دوم ، از مدل ساخته شده برای کلاسه بندی استفاده می شود. یادگیری از طریق یک تابع (X)fy-انجام می شود که می تواند برچسب کلاس هر تاپل Xاز پایگاه را پیش بینی کند. این تابع به صورت قواعد کلاسه بندی ، درخت های تصمیم گیری یا فرمول های ریاضی است.

شکل2-2 نشان می دهد که چگونه یک تابع کلاسه بندی ساخته شده وسپس داده های جدید بوسیله ان کلاسه بندی می شوند.

شکل 2-2-عملکرد کلاسه بندی

شکل 2-2-عملکرد کلاسه بندی 

در ابتدا میزان دقت[1]  مدل یا کلاسه بند[2] تخمین زده می شود. این تاپل ها تصادفی انتخاب شده و مستقل از تاپل های مجموعه اموزشی هستند. میزان دقت در پیشگویی یک مدل روی مجموعه تست داده شده برابر است با درصد تاپل هایی از تاپل های مجموعه تست که توسط مدل ، درست کلاسه بندی شده اند.

برچسب کلاس هر تاپل مجموعه تست ، با برچسب کلاس پیش گویی شده برای ان تاپل توسط مدل یادگیری مقایسه می شود اگر میزان دقت مدل قابل قبول واقع شود، انگاه این مدل می تواند برای کلاسه بندی تاپل های جدید با بر چسب کلاس نامعلوم استفاده شود. ( در اصطلاحات یادگیری ماشین به این نوع تاپل ها یا داده ها unknown or previously unseen dataگفته می شود).



 

 



 

 



 

Compatability by:
آخرین به روز رسانی سایت: سه شنبه, 22 اسفند 1391 - 00:26