سه شنبه 31 اردیبهشت 1398 | Tuesday 21 st of May 2019 صفحه اصلی گروه الکترونیکی کامپیوتر
3-8- سیستم های محاسباتی NVIDIA Tesla S1070

سیستم محاسباتی NVIDIA Tesla S1070به چهار GPU، Tesla T10مجهز شده است. شکل 3-12 یک نمایش نموداری از این سیستم را نشان می دهد. Tesla T10، 240 هسته پردازشی دارد که در فرکانس 1.296 یا GHZ1.44 کار می کند. هسته ها در 30 SMگروه بندی می شوند. هر هسته در هر سیکل تک دقتی قادر است تا Flop30 بالا رود. یک تخمین تئوری از قدرت پردازشی سیستم به شکل زیر است:

شکل3- 12- معماری سیستم محاسباتی NVIDIA Tesla S1070

در تک دقتی:

4 GPUs _ (FLOP/cycle _ Frequency _ #Cores)-400 conf. =4 _ (3 _ 1:296 _ 240) GFLOPS = 3:732 TFLOPS

4 GPUs _ (FLOP/cycle _ Frequency _ #Cores)-500 conf. =4 _ (3 _ 1:44 _ 240) GFLOPS = 4:147 TFLOPS

در دقت مضائف: فقط یک هسته از هر SMمی تواند در هر سیکل دو عمل همزمان را منتشر کند در نتیجه به اوج تئوری زیر سوق داده می شود:

4 GPUs _ (FLOP/cycle _ Frequency _ #SMs)-400 conf. =4 _ (2 _ 1:296 _ 30) GFLOPS _ 311 GFLOPS

4 GPUs _ (FLOP/cycle _ Frequency _ #SMs)-500 conf. =4 _ (2 _ 1:44 _ 30) GFLOPS _ 345 GFLOPS

از نظر حافظه ای، هر GPUبه GB4DRAM ای با سرعت بالا و پهنای باند GB102متصل شده است. در نتیجه ظرفیت سیستم GB16 می شود. ارتباط با میزبان از طریق سویچ های NVIDIAو کارت های اتصال داخلی[1] PCIeاست. یک تک اسلات x  8یا  x2.016 PCIe  روی میزبان به دو GPUبا استفاده از سویچ های NVIDIAو یک کارت اتصال داخلی PCIeمتصل شده است. چنین ارتباطی می تواند نرخ انتقال تا GB/s12.8 را بین نود میزبان و سیستم محاسباتی فراهم کند. پیکربندی کامل این سیستم محاسباتی در شکل 3-13 نشان داده شده است. از انجایی که به توان مصرفی امروزه توجه زیادی می شود، این سیستم محاسباتی حداکثر W800توان را مصرف می کند.

شکل3- 13- پیکربندی کامل محاسباتی S1070[1]Interconnection Cards (HIC)

 

Compatability by:
آخرین به روز رسانی سایت: سه شنبه, 22 اسفند 1391 - 00:26