رفتن به مطلب

دوران حکومت معماری Volta با معرفی Tesla V100 آغاز شد


Recommended Posts

5914735dabe04_NVIDIAGV100SiliconDetailed(1).thumb.jpg.6b21c008a4cc01ab978a05096b8c8402.jpg

 

انویدیا در نشست مطبوعاتی GTC 2017 نسل بعدی پردازنده های گرافیکی با معماری "ولتا" را به نمایش گذاشت. همچون معماری فعلی "پاسکال"، ولتا نیز در بزرگ ترین و مجهزترین نوع پیاده سازی خود با سیلیکون GV100 بر روی برد "تسلا V100" برای استفاده در بازار محاسباتی پیشرفته معرفی شد. با توجه به کاربردهای اختصاصی که خانواده پردازنده های تسلا انویدیا دارند، بعضی از قسمت های مشخص و اختصاصی GV100 به بخش پردازنده های گرافیکی خانواده GeForce در بازار مصرف کنندگان عادی راه پیدا نخواهند کرد. به هر حال جدای از این مسائل، سیلیکون GV100 را باید نقطه اوج مهندسی انویدیا دانست. طبق بلاک دیاگرام واحد پردازشگر گرافیکی منتشر شده توسط این کمپانی، می توان شباهت هایی در سلسله مراتب چینش و ارتباط اجزای چیپ GV100 با نسل قبلی چیپ های انویدیا پیدا کرد؛ اما بیشتر تغییرات ایجاد شده در قسمت پایه واحد پردازش و تفکیک اعداد و همچنین واحد رشته های پردازشی چند منظوره (SM) صورت گرفته است.

 

59147369bad40_NVIDIAGV100SiliconDetailed(2).thumb.jpg.e4b6167e5a7e3c7f7f4a4ac249dfbc1d.jpg

 

واحد SM سیلیکون GV100 معماری ولتا دارای هسته های CUDA هم برای مقادیر FP32 و هم برای FP64 است. پیاده سازی معماری ولتا در کارت گرافیک های رده مصرف کنندگان عادی انویدیا که با نام سری GeForce عرضه می شوند، فاقد هسته های مخصوص مقادیر FP64 خواهد بود. هر واحد SM دارای 64 هسته CUDA مخصوص مقادیر FP32 و 32 هسته مخصوص مقادیر FP64 و هر هسته FP64 قادر به پردازش عملیات های 32 بیت، 16 بیت و حتی 8 بیتی بَدوی است. سیلیکون GV100 دارای 80 واحد SM است که با این حساب مجموعاً 5120 هسته FP32 و 2560 هسته CUDA محصوص مقادیر FP64 در دسترس است. یه علاه، انویدیا قسمت جدید دیگری با نام هسته های Tensor را معرفی کرده که یک قطعه طراحی شده با کاربری خاص برای سرعت بخشیدن به روند تمرین فراگیری عمیق و ساخت تعاملات شبکه ای می باشد. هر یک واحد SM دارای 8 عدد از این هسته ها است، پس سیلیکون GV100 دارای 640 هسته Tensor خواهد بود که البته همانند هسته های FP64، این هسته های Tensor نیز ممکن است در کارت گرافیک های GeForce حضور نداشته باشند. با توجه به تعداد SMها، GV100 دارای 320 واحد TMU خواهد بود و ضمناً انویدیا فرکانس این سیلیکون را در حالت بوست 1450 مگاهرتز تعیین کرده است.

در تبلیغات تسلا V100 حداکثر قدرت کارایی این سلیکون در مقادیر FP32 و FP64 بیش از %50 سریع تر از تسلا P100 با معماری پاسکال ذکر شده است. نهایت قدرت پردازشی FP32 مدل تسلا 15 ترافلاپ و در مقادیر FP64 نیز 7.5 ترافلاپ است. هسته های Tensor هم به طور موثر به میزان 120 ترافلاپ در همان وظیفه خاص سرعت بخشی به تمرین یادگیری عمیق و تعاملات شبکه ای فعالیت می کنند. این قطعات دارای واحدهای ضرب تصاعدی ماتریس – ماتریس هستند که یکی از ارکان کلیدی و مهم با توان سرعت بخشی 12 برابری نسبت به نسل پیشین در عملیات های ذکر شده؛ به شمار می آیند.

 

5914736bc2fd7_NVIDIAGV100SiliconDetailed(3).thumb.jpg.5108b3814c2049132e3f48727b24e5d4.jpg

 

GV100 یک ماژول با چیپ های چند بخشی است که با روند ساخت 12 نانومتری تو لید می شود؛ سطح Die واحد پردازش گرافیکی غول پیکر آن 815 میلی متر مربع بوده، تعداد حیرت آور 21.1 میلیارد ترانزیستور دارد و در کنار چهار پشته 32 گیگابیتی حافظه های HBM2، بیش از 16 گیگابایت حافظه اختصاصی دارد. این پشته ها از طریق یک گذرگاه حافظه 4096 بیتی با چیپ GV100 تعامل دارند که با فرکانس 1 گیگاهرتز، به راحتی 1 ترابایت بر ثانیه پهنای باند حافظه در اختیار این سیلیکون می گذارند. احتمالاً انویدیا حافظه های HMB2 را فقط در همین خانواده تسلا به کار خواهد گرفت زیرا با روند افزایشی قیمت این حافظه ها، برای این کمپانی توجیهی در استفاده آنها در کارت گرافیک های GeForce وجود ندارد. ضمناً اگر انویدیا تصمیم بگیرد مقدار FP64 و هسته های Tensor را به پیاده سازی معماری ولتا در کارت گرافیک های GeForce بیاورد، به راحتی می تواند از حافظه های ارزان و به اندازه کافی سریع GDDR6 نیز استفاده کند. کمپانی SK Hynix یکی از پیشگامان طراحی و تولید حافظه های HBM، در همین نمایشگاه GTC 2017 حافظه های GDDR6 را معرفی کرد، پس حداقل تا زمانی که انویدیا قصد مبارزه با AMD تا آخرین نفس را نداشته باشد، انتظار می رود در بخش مصارف عادی به همان حافظه های GDDR6 بسنده کند.

 

5914736e00231_NVIDIAGV100SiliconDetailed(4).thumb.jpg.0c25a272811d5ea515e1084bb613905a.jpg

 

کارت محاسباتی پیشرفته تسلا V100 در دو شکل متفاوت تولید و تسعه داده می شود؛ یکی به صورت کارتی از پیش تعبیه شده با رابط NVLink برای مزارع محاسباتی با تراکم زیاد و دیگری به صورت یک کارت اضافه شونده با رابط PCIe برای ایستگاه های کاری که از طریق کانال های خرده فروشی اختصاصی به فروش خواهد رسید.

 

منبع: TechPowerUp

مترجم: مجید بکائیان

ویرایش شده توسط Trickster
لینک به دیدگاه
Share on other sites

به گفتگو بپیوندید

هم اکنون می توانید مطلب خود را ارسال نمایید و بعداً ثبت نام کنید. اگر حساب کاربری دارید، برای ارسال با حساب کاربری خود اکنون وارد شوید .
توجه: مطلب ارسالی شما پس از تایید مدیریت برای همه قابل رویت خواهد بود.

مهمان
ارسال پست در این تاپیک...

×   شما در حال چسباندن محتوایی با قالب بندی هستید.   حذف قالب بندی

  تنها استفاده از 75 اموجی مجاز می باشد.

×   لینک شما به صورت اتوماتیک جای گذاری شد.   نمایش به صورت لینک

×   محتوای قبلی شما بازگردانی شد.   پاک کردن محتوای ویرایشگر

×   شما مستقیما نمی توانید تصویر خود را قرار دهید. یا آن را اینجا بارگذاری کنید یا از یک URL قرار دهید.

 اشتراک گذاری

×
  • اضافه کردن...