پنج شنبه 3 تیر 1400 | Thursday 24 th of June 2021 صفحه اصلی گروه الکترونیکی کامپیوتر
4-1 مفهوم دیتاست

      دیتاست ، مجموعه ای از داده ها ی اموزش دهنده است که برای اموزش دادن یک دسته بندی کننده استفاده می شود .این مجموعه های داده ممکن است شبیه سازی شده باشند یا داده های دنیای واقعی باشند .معمولا دیتاست ها را به دو بخش تقسیم می کنیم ، یک بخش داد های اموزش و بخش دیگر داده های تست که در این مرحله دسته بندی کننده اموزش دیده داده هایی را که برچسب انها از دید دسته بندی کننده پنهان است را دسته بندی می نماید یعنی به هر کدام برچسبی اختصاص می دهد و سپس در فاز ارزیابی برای اینکه ببینیم دسته بندی کننده تا چه اندازه خوب عمل کرده این نتایج با نتایج واقعی مقایسه می شود . معمولا دو سوم داده ها را برای اموزش و یک سوم باقیمانده را برای تست به کار می برند .مجموعه دیگری از خود مجموعه اموزش را به عنوان ارزیابی[1] در نظر می گیریم .مثلا بعد از این که 10 بار به دسته بندی کننده اموزش دادیم ، 1 بار ارزیابی را اجرا می کنیم تا خطا را بسنجیم ، این روال را چند بار تکرار می کنیم تا جایی که نرخ خطا بعد از اخرین بار که پایین رفته بود ،شروع به بالارفتن کند.اینجا نقطه ای است که باید اموزش دادن را متوقف کنیم تا سیستم استثناها را یاد نگیرد . هر دیتاست ژنی معمولا از تعداد زیادی ژن که همان ویژگی ها هستند تشکیل شده  که بیانگر تعداد مشخصی نمونه اند که در بخش بعد این موضوع را به تفکیک برای چند نمونه از دیتاست های ژنی موجود توضیح می دهیم . به دلیل تعداد زیاد این ویژگی ها و کارامد نبودن همه انها، باید به وسیله متد های انتخاب ویژگی به انتخاب ویژگی های مهم و کارامد در امر دسته بندی ، بپردازیم اما این تعداد با توجه به
 دسته بندی کننده و همجنین دیتاست مورد استفاده متفاوت است


1 Validation

Compatability by:
آخرین به روز رسانی سایت: سه شنبه, 22 اسفند 1391 - 00:26