یکشنبه 30 شهریور 1399 | Sunday 20 th of September 2020 صفحه اصلی گروه الکترونیکی کامپیوتر
تابع ارزیابی مبتنی بر اطلاعات - تابع تولید کننده کامل

مهم­ترین روشی که در این گروه می­توانیم پیدا کنیم، روشMinimum Description Length Method (MDLM)است [She90]. نویسندگان این روش تلاش می­کنند تا همه ویژگی­های بدون استفاده[1] (بی­ربط یا اضافی) را حذف نمایند، با این دید که اگر ویژگی­های زیرمجموعه Vرا بتوانیم بصورت یک تابع ثابت مانند Fکه وابسته به کلاس نیست، بر اساس یک زیرمجموعه ویژگی دیگر مانند Uبیان کنیم. در این صورت وقتی که مقادیر ویژگی­های زیرمجموعه Uشناخته شده باشند، ویژگی­های موجود در زیرمجموعه Vبدون استفاده هستند.

از دیدگاه انتخاب ویژگی، اجتماع دو زیرمجموعه Uو V، مجموعه­ای کامل از تمام ویژگی­ها را تشکیل می­دهد و کاری که ما باید در انتخاب ویژگی انجام دهیم این است که این دو زیرمجموعه را جدا کنیم. برای انجام این کار، نویسندگان MDLM، از معیارMinimum Description Length Criterion (MDLC)که بوسیله Rissanenارایه شده است [Ris78]، استفاده کرده­اند. ان‌ها فرمولی را بدست اورده­اند که شامل تعداد بیت­های لازم برای انتقال کلاس­ها، پارامترهای بهینه سازی، ویژگی­های مفید و ویژگی­های غیرمفید است. الگوریتم تمام زیرمجموعه­های ممکن را 2Nجستجو می­کند و به عنوان خروجی زیرمجموعه­ای را بازمی­گرداند که معیار MDLCرا ارضا کند. این روش می­تواند تمام ویژگی­های مفیدی را پیدا کند که دارای توزیع نرمال باشند. برای حالت­های غیر نرمال این روش قادر نیست، ویژگی­های مفید را پیدا کند. الگوریتم زیر روش کار و فرمول­های استفاده شده را نشان می­دهد.

شکل 7- الگوریتم روش Minimum Description Length Method (MDLM

شکل 7- الگوریتم روش Minimum Description Length Method (MDLM

شکل 7- الگوریتم روش Minimum Description Length Method (MDLM


[1]- Useless

Compatability by:
آخرین به روز رسانی سایت: سه شنبه, 22 اسفند 1391 - 00:26