جمعه 29 تیر 1397 | Friday 20 th of July 2018 صفحه اصلی گروه الکترونیکی کامپیوتر
3-9- معماری محاسبه فرمی

     شکل 3-14 معماری محاسباتی فرمی نسل سوم که دارای 16 چند پردازنده جریانی است را به تصویر می کشد هرکدام از این پردازنده های جریانی 32 هسته پردازنده کودا دارند، در مجموع 512 هسته دارد. زمانبند کار GiagaThreadبلاک های نخ را بین چند پردازندههای جریانی با ظرفیت در دسترس، توزیع و بار محاسباتی را بصورت پویا در میان GPUمتعادل می کند و وظایف هسته چندگانه را وقتی که مناسب باشد بصورت موازی اجرا می کند هر چند پردازنده جریانی تا 1536 نخ را همزمان اجرا می کند تا کمک کند که تاخیر زیاد واکشی از حافظه DRAMپوشش داده شود. زمانی که هر بلاک ترد اجرا برنامه هسته خودش را کامل می کند و منابع چند پردازنده های جریانی خودش را ازاد می کند زمانبند کار یک بلاک نخ جدید را به ان چند پردازنده جریانی نسبت می دهد.

شکل3- 14- معماری محاسبات GPUبا 512 هسته پردازنده کودا

رابط میزبان PCIe، GPUو حافظه میزبان DRAMرا به CPUو حافظه سیستم متصل می کند. کمک پردازنده های CPU+GPUو انتقال های داده از رابط دوطرفه PCIeاستفاده می کنند. نخ های چند پردازنده جریانی از طریق رابط PCIeبه حافظه سیستم دسترسی پیدا می کنند و نخ های CPUنیز از PCIeبه حافظه  DRAMپردازنده های گرافیکی دسترسی پیدا می کنند.

معماری GPU، توان محاسباتی موازی خود را با کنترل کنندههای حافظه DRAMکه با پهنای باند با حافظه بالا طراحی شده اند متوازن می کند. GPUفرمی شکل 3-14، شش رابط GDDR5 DRAMکه هر کدام دارای پهنای باند 64 بیتی با سرعت بالا هستند دارد. ادرس 40 بیتی ان تا یک ترابایت فضای ادرس حافظه سیستم CPUو DRAMGPUرا برای محاسبات با مقیاس وسیع مدیریت می کند

Compatability by:
آخرین به روز رسانی سایت: سه شنبه, 22 اسفند 1391 - 00:26