سه شنبه 23 مرداد 1397 | Tuesday 14 th of August 2018 صفحه اصلی گروه الکترونیکی کامپیوتر
3-2-2 نحوه کلاسه بندی به روش بیز ساده

- فرض می شود تعداد Mکلاس  وجود دارد. برای نمونه جدید X، کلاسه بند پیشگویی می کند که Xمتعلق به کلاسی است که بیشترین احتمال پسین شرطی روی Xرا دارد. یعنی کلاسه بند، داده ی Xرا متعلق به کلاس Ciمی داند اگر و فقط اگر:

(3-2)                                       

بنابراین باید ماکزیمم  بدست اید. کلاس Ci  که در ان  ماکزیمم است فرض [1]MAPنام دارد. با استفاده از تئوری بیز(رابطه 3-1) داریم:

(3-3)                                                   

3- از انجایی که در رابطه فوق مقدار P(X)برای همه کلاس ها یکسان است، لذا فقط لازم است که ماکزیمم  محاسبه شود. اگر احتمال پیشین کلاس ها مشخص نباشد می توانیم همه ی انها را مساوی هم در نظر بگیریم. یعنی:  و بنابراین فقط بدست اوردن ماکزیمم  کافی می باشد.

ممکن است احتمالات پیشین کلاس ها به صورت  تخمین زده شوند که diتعداد نمونه های مجموعه اموزشی متعلق به کلاس Ciو Dتعداد کل نمونه های مجموعه اموزشی می باشد.

4- در صورتی که تعداد صفت های مجموعه داده ها زیاد باشند، محاسبه  بسیار پرهزینه و زمانبر خواهد بود. روش بیز ساده برای کاهش این محاسبات، فرض می کند که تاثیر یک مقدار صفت روی یک کلاس داده شده، مستقل از مقادیر دیگر صفت های ان نمونه می باشد. به این فرض، فرض استقلال شرطی کلاس[2] گفته می شود. به عبارت دیگر هیچ رابطه وابستگی بین صفت ها وجود ندارد. بنابراین:

(3-4)                                                   

که احتمالات و  و ... و  می توانند از نمونه های اموزشی به صورت زیر تخمین زده شوند :

a) اگر  گسسته باشد انگاه:

(3-5)                                                   

که dikتعداد نمونه های اموزشی از کلاس Ciاست که در انها صفت  مقدار   دارد و diتعداد کل نمونه های اموزشی متعلق به کلاس Ciاست.

b) اگر  پیوسته باشد‌ انگاه  بر مبنای توزیع نرمال (گاوس) محاسبه می شود:

(3-6)                                       

مقدار پارامترهای  و  به ترتیب برابر است با میانگین و واریانس مقادیر صفت  در نمونه های اموزشی متعلق به کلاس Ci.

 5- برای کلاسه بندی نمونه جدید X،  برای هر کلاس Ciمحاسبه می شود. نمونه Xمتعلق به کلاس Ciاست اگر و تنها اگر:

(3-7)                                       

     پیاده سازی روش کلاسه بندی ساده بیز اسان بوده و در بیشتر موارد نتایج و خروجی های موفقی داشته است. عیب این روش اینست که برای سادگی محاسبات فرض می کند هیچ رابطه وابستگی بین صفت ها وجود ندارد و ممکن است در عمل میان متغیرها وابستگی وجود داشته باشد و این فرض استقلال موجب کاهش دقت این روش می گردد.     



[1]Maximum a Posteriori

[2]Class Condition Independence 

 

 

     کلاسه بندی ساده بیز بصورت زیر عمل می کند

1- مجموعه داده های اموزشی و برچسب کلاس متناظر انها را Dدر نظر گرفته و هر نمونه با یک بردار صفت n‌ بعدی  نمایش داده می شود که  به ترتیب مقادیر صفت های  در نمونه Xهستند. 

- فرض می شود تعداد Mکلاس  وجود دارد. برای نمونه جدید X، کلاسه بند پیشگویی می کند که Xمتعلق به کلاسی است که بیشترین احتمال پسین شرطی روی Xرا دارد. یعنی کلاسه بند، داده ی Xرا متعلق به کلاس Ciمی داند اگر و فقط اگر:

                                   

بنابراین باید ماکزیمم  بدست اید. کلاس Ci  که در ان  ماکزیمم است فرض [1]MAPنام دارد. با استفاده از تئوری بیز(رابطه 3-1) داریم:

(3-3)                                                   

3- از انجایی که در رابطه فوق مقدار P(X)برای همه کلاس ها یکسان است، لذا فقط لازم است که ماکزیمم  محاسبه شود. اگر احتمال پیشین کلاس ها مشخص نباشد می توانیم همه ی انها را مساوی هم در نظر بگیریم. یعنی:  و بنابراین فقط بدست اوردن ماکزیمم  کافی می باشد.

ممکن است احتمالات پیشین کلاس ها به صورت  تخمین زده شوند که diتعداد نمونه های مجموعه اموزشی متعلق به کلاس Ciو Dتعداد کل نمونه های مجموعه اموزشی می باشد.

4- در صورتی که تعداد صفت های مجموعه داده ها زیاد باشند، محاسبه  بسیار پرهزینه و زمانبر خواهد بود. روش بیز ساده برای کاهش این محاسبات، فرض می کند که تاثیر یک مقدار صفت روی یک کلاس داده شده، مستقل از مقادیر دیگر صفت های ان نمونه می باشد. به این فرض، فرض استقلال شرطی کلاس[2] گفته می شود. به عبارت دیگر هیچ رابطه وابستگی بین صفت ها وجود ندارد. بنابراین:

(3-4)                                                   

که احتمالات می توانند از نمونه های اموزشی به صورت زیر تخمین زده شوند :

a) اگر  گسسته باشد انگاه:

(3-5)                                                   

که dikتعداد نمونه های اموزشی از کلاس Ciاست که در انها صفت     دارد و diتعداد کل نمونه های اموزشی متعلق به کلاس Ciاست.

b) اگر بر مبنای توزیع نرمال (گاوس) محاسبه می شود:

(3-6)                                       

مقدار پارامترهای  به ترتیب برابر است با میانگین و واریانس مقادیر صفت a در نمونه های اموزشی متعلق به کلاس Ci.

 5- برای کلاسه بندی نمونه جدید X،  برای هر کلاس Ciمحاسبه می شود. نمونه Xمتعلق به کلاس Ciاست اگر و تنها اگر:

(3-7)                                       

     پیاده سازی روش کلاسه بندی ساده بیز اسان بوده و در بیشتر موارد نتایج و خروجی های موفقی داشته است. عیب این روش اینست که برای سادگی محاسبات فرض می کند هیچ رابطه وابستگی بین صفت ها وجود ندارد و ممکن است در عمل میان متغیرها وابستگی وجود داشته باشد و این فرض استقلال موجب کاهش دقت این روش می گردد.     



 

Compatability by:
آخرین به روز رسانی سایت: سه شنبه, 22 اسفند 1391 - 00:26