3-8- سیستم های محاسباتی NVIDIA Tesla S1070
سیستم محاسباتی NVIDIA Tesla S1070به چهار GPU، Tesla T10مجهز شده است. شکل 3-12 یک نمایش نموداری از این سیستم را نشان می دهد. Tesla T10، 240 هسته پردازشی دارد که در فرکانس 1.296 یا GHZ1.44 کار می کند. هسته ها در 30 SMگروه بندی می شوند. هر هسته در هر سیکل تک دقتی قادر است تا Flop30 بالا رود. یک تخمین تئوری از قدرت پردازشی سیستم به شکل زیر است:

شکل3- 12- معماری سیستم محاسباتی NVIDIA Tesla S1070
در تک دقتی:
4 GPUs _ (FLOP/cycle _ Frequency _ #Cores)-400 conf. =4 _ (3 _ 1:296 _ 240) GFLOPS = 3:732 TFLOPS
4 GPUs _ (FLOP/cycle _ Frequency _ #Cores)-500 conf. =4 _ (3 _ 1:44 _ 240) GFLOPS = 4:147 TFLOPS
در دقت مضائف: فقط یک هسته از هر SMمی تواند در هر سیکل دو عمل همزمان را منتشر کند در نتیجه به اوج تئوری زیر سوق داده می شود:
4 GPUs _ (FLOP/cycle _ Frequency _ #SMs)-400 conf. =4 _ (2 _ 1:296 _ 30) GFLOPS _ 311 GFLOPS
4 GPUs _ (FLOP/cycle _ Frequency _ #SMs)-500 conf. =4 _ (2 _ 1:44 _ 30) GFLOPS _ 345 GFLOPS
از نظر حافظه ای، هر GPUبه GB4DRAM ای با سرعت بالا و پهنای باند GB102متصل شده است. در نتیجه ظرفیت سیستم GB16 می شود. ارتباط با میزبان از طریق سویچ های NVIDIAو کارت های اتصال داخلی[1] PCIeاست. یک تک اسلات x 8یا x2.016 PCIe روی میزبان به دو GPUبا استفاده از سویچ های NVIDIAو یک کارت اتصال داخلی PCIeمتصل شده است. چنین ارتباطی می تواند نرخ انتقال تا GB/s12.8 را بین نود میزبان و سیستم محاسباتی فراهم کند. پیکربندی کامل این سیستم محاسباتی در شکل 3-13 نشان داده شده است. از انجایی که به توان مصرفی امروزه توجه زیادی می شود، این سیستم محاسباتی حداکثر W800توان را مصرف می کند.

شکل3- 13- پیکربندی کامل محاسباتی S1070
[1]Interconnection Cards (HIC)
|