شنبه 24 آذر 1397 | Saturday 15 th of December 2018 صفحه اصلی گروه الکترونیکی کامپیوتر
3-6- نگاشت به معماری تسلا

     همانطور که بیان شد وقتی که یک کرنل درخواست می شود، بلاک نخ های مختلفی، که گرید را می سازند به SMها با ظرفیت اجرایی دردسترس توزیع می شوند. روشی که بلاک نخ به بسته ها شکسته می شوند  از پیش تعریف شده و یکسان است. هر بسته شامل نخ هایی با Idهای پی در پی  است. اولین Wrapشامل نخ صفر است. اگر همه نخ های یک بسته مسیر اجرایی یکسانی داشته باشند ما می توانیم تعداد سیکل های کلاک که GPUبرای اجرا کل Wrapنیاز دارد را تخمین بزنیم.

Sw/Nsp

Swاندازه Wrapاست و Nspتعداد SPدر هر SMاست.

تعداد بلاک های نخی که SMمی تواند یک مرتبه پردازش کند به سازمان کرنل اغاز شده و تعداد رجیسترهای هر نخ و حافظه اشتراکی هر بلاک نخ درخواست شده بستگی دارد. علت ان این است که رجیسترها و حافظه اشتراکی در میان بلاک نخ اختصاص داده شده به SMتقسیم می شوند. یک نقطه بحرانی این است که برای اجرای یک کرنل، یک GPUبه رجیسترها و حافظه اشتراکی کافی در هر  SMنیاز دارد، حداقل یک بلاک نخ؛ تا بتواند پردازش شود درغیراینصورت درخواست کرنل شکست می خورد.

از نقطه نظر حافظه ای، حافظه اشتراکی، سراسری، بافت و حافظه ثابت کودا به طور طبیعی به ترتیب فضا حافظه تسلا مناسب خود را می گیرند. از میزبان تا کتابخانه های زمان اجرا، این امکان وجود دارد که حافظه روی دستگاه را بصورت حافظه خطی یا ارایه های کودا تخصیص دهیم. اولین متد تخصیص اجازه می دهد که مدیریت حافظه براساس اشاره گر باشد. ارایه های کودا اشیاء غیرشفافی هستند که برای واکشی بافت طراحی و بهینه شده اند.

Compatability by:
آخرین به روز رسانی سایت: سه شنبه, 22 اسفند 1391 - 00:26