سه شنبه 22 آبان 1397 | Tuesday 13 th of November 2018 صفحه اصلی گروه الکترونیکی کامپیوتر
عنوان فارسی: پیاده سازی چندنمونه از الگوریتم موازی با استفاده از کارت های گرافیکی چند هسته ای
عنوان انگلیسی: implementation of some example parallel algorithms using multi-core graphics cards
دانشجو: معاونیان خدیجه
استاد راهنما: علیرضا صالحان
استاد دفاع: نامشخص
تاریخ ارائه: تیر 1391
مقطع تحصیلی: کارشناسی
دانشگاه: دانشگاه پیام نور مشهد
موضوعات مرتبط:
رشته های مرتبط: علوم کامپیوتر | مهندسی فناوری اطلاعات |
تاریخ قرار گیری در سایت: 9 آبان 1391 ساعت: 12:23:49
تعداد بازدید: 9911 بازدید
چکیده فارسی: در سال های اخیر، افزایش روز افزون عملکرد کارت های گرافیکی، محققین را به فکر بهره گیری از توان پردازشی آنها در کاربردهای غیر گرافیکی انداخته است. درهمین راستا شاخه جدیدی در علوم کامپیوتر به نام محاسبات با اهداف همه منظوره روی واحد GPU ایجاد شده است ، هدف فعالان این عرصه بهره گیری از کارت گرافیک به عنوان یک کمک پردازنده محاسباتی در برنامه های غیرگرافیکی و برنامه های عمومی است.ازاین رو از صنعت محاسباتی گرفته تا محاسبات موازی دچار تغییرات گسترده ای شده وعملیات انتقال تقریبا تمام كامپیوترهای مصرف کننده سال 2010 همراه با پردازنده های چند هسته ای صورت گرفته است صنعت رایانه ای در سراشیبى تند انقلاب محاسباتی موازی قرار دارد ،نتیجه اینکه در پی آن، تقریبا هر برنامه نویس مشتاق در آن نیاز به آموزش برنامه نویسی موازی دارد تا بتواند در علوم کامپیوتری به طور کامل موثر واقع شود. و در نتیجه CUDA C NVIDIA تا کنون به عنوان یکی از موفق ترین زبانهای عمل كرده است كه تا به حال برای محاسبات موازی طراحی شده است. در این پایان نامه، ضمن بیان مقدمه ای از CUDA، تعدادی از دستورات زبان NVIDIA CUDA C معرفی خواهد شد
چکیده انگلیسی: In recent years, ever increasing of graphics (cards) performance has made researchers to think about taking advantage of their processing power in non-graphics applications. Therefore, a new branch of computer science called general-purpose computation has been created on GPU unit. The aim of the actors in this arena is utilization of the graphics as a computational co-processor in non-graphical and public programs. Therefore, from computing industry to parallel computing have experienced extensive changes and transfer operations have happened in almost all consumer PCs by 2010 with multi-core processors. Computer industry is moving in parallel computing revolution precipice. As a result, it is followed by this subject that almost every interested programmer need to be educated in parallel programming to be fully effective in computer science and so, the NVIDIA’S CUDA C has been one of the most successful programming language designed for parallel computing yet. In this thesis, some NVIDIA’S CUDA C language instruction will be introduced while the introduction of CUDA is also offered.
کلمات کلیدی:
عنوان بازدید
 فصل اول مقدمه 1047
|— 1ـ مقدمه 1446
|—|— 1-1- واحد پردازش گرافیکی 1580
|—|— 1-2- مقایسه توانایی های GPU با CPU 2137
|—|— 1-3- مقایسه سخت افزار GPU با CPU 1478
|—|— 1-4- فناوری های ATI و NVIDIA 1804
 فصل دوم محاسباتGPU 1269
|— 2-1 تکامل محاسبات GPU 1321
|— 2-2- توسعه فن اوری GPU 1192
|— 2-3-GPU های اولیه 1235
|— 2-4- محاسبات یکپارچه و GPU ها 1178
|— 2-5- سیتم های محاسبات GPU 1215
|— 2-6- اکوسیستم محاسبات GPU 1465
 فصل سوم محاسبات multi-GPU 1116
|— 3-1- معماری محاسباتی تسلا 1209
|— 3-2- چند پردازندههای جریانی 1188
|— 3-3- حافظه های GPU 1449
|— 3-4- نمونه SIMT 1143
|— 3-5- معماری مقیاس پذیر کودا 1269
|—|— 3-5-1- معماری دستگاه کودا 1326
|—|— 3-5-2- تردها، بلاک ها و گریدها: تطبیق الگوریتم ها با مدل کودا 2150
|—|— 3-5-3- کاربردهای کودا 1864
|—|— 3-5-4- معماری مجموعه دستور و اجرا نخ های موازی 1383
|—|— 3-5-5- معماری حافظه کودا 1195
|—|— 3-5-6- قابلیت محاسباتی 1145
|—|— 3-5-7- مدل برنامه نویسی کودا 1646
|—|— 3-5-8- یک مدل برنامه نویسی ناهمگن 1257
|—|— 3-5-9- پشته نرم افزاری کودا 1117
|—|— 3-5-10- سازمان نخ ها 1145
|—|— 3-5-11- CUDA C 1309
|—|— 3-5-12- کامپایل یک برنامه کودا 1168
|—|— 3-5-13- اشکال زدایی یک برنامه کودا 1110
|—|— 3-5-14- افزایش کارایی 988
|— 3-6- نگاشت به معماری تسلا 953
|— 3-7- پشتیبانی ممیز شناور 945
|— 3-8- سیستم های محاسباتی NVIDIA Tesla S1070 930
|— 3-9- معماری محاسبه فرمی 924
|—|— 3-9-1- سلسله مراتب حافظه کش 1040
|—|— 3-9-2- حافظه ECC 910
|—|— 3-9-3- چند پردازندههای جریانی 902
|— 3-10- برنامه نویسی multi-GPU 997
 فصل چهارم: شروع کار 880
|— شروع کار 857
|—|— 4ـ1ـ اهداف فصل 843
|—|— 4ـ2ـمحیط توسعه 900
|—|—|— 4ـ2ـ1ـ پردازنده های گرافیکی فعال شده CUDA 964
|—|—|— 4ـ2ـ2ـ دستگاه درایور NVIDIA 957
|—|—|— 4ـ2ـ3ـ کیت ابزار توسعه CUDA 1242
 فصل پنجم معرفی CUDA C 975
|— 5ـ معرفی CUDA C 923
|—|— 5ـ1ـ اهداف فصل 950
|—|— 5ـ2ـ اولین برنامه 1168
|—|— 5ـ3 دستگاه های جستجوگر 999
|—|— 5_4 خواص کاربردی دستگاه 909
 فصل ششم برنامه نویسی موازی درCUDA C 1013
|— 6ـ1ـ اهداف این فصل 949
|— 6ـ2 ـ برنامه نویسی CUDA موازی 1564
 فصل هفتم تعاون رشته ای 977
|— 7ـ1ـ اهداف فصل 930
|— 7ـ2ـ تقسیم بلوکهای موازی 978
|—|— 7ـ2ـ1 مجموع برداری: ردوکس (REDUX) 992
|—|— 7ـ2ـ2 موج دار کردن (ایجاد حلقه های موجی در)GPU با استفاده از رشته ها 1053
|— 7ـ3 حافظه اشتراکی و همزمانسازی 1022
|—|— 7ـ3ـ1 ضرب نقطه ای 1138
|—|— 7ـ3ـ2 بیت مپ حافظه مشترک 987
 نتیجه گیری 1005
 فهرست منابع 940
Compatability by:
آخرین به روز رسانی سایت: سه شنبه, 22 اسفند 1391 - 00:26