از لیون کامپیوتر قســـــــــــــــــــــــــــــــــــطی خرید کنید فروش اقساطی برای سراسر ایران
اخبار سخت افزار ، نرم افزار ، بازی و دنیای آیتی در مجله لیون کامپیوتر 🤩
جستجو در تالارهای گفتگو
در حال نمایش نتایج برای برچسب های 'tensor core'.
2 نتیجه پیدا شد
-
دوران حکومت معماری Volta با معرفی Tesla V100 آغاز شد
Trickster پاسخی ارسال کرد برای یک تاپیک در مقالات و اخبار سخت افزار و نرم افزار تهیه شده توسط لیون کامپیوتر
انویدیا در نشست مطبوعاتی GTC 2017 نسل بعدی پردازنده های گرافیکی با معماری "ولتا" را به نمایش گذاشت. همچون معماری فعلی "پاسکال"، ولتا نیز در بزرگ ترین و مجهزترین نوع پیاده سازی خود با سیلیکون GV100 بر روی برد "تسلا V100" برای استفاده در بازار محاسباتی پیشرفته معرفی شد. با توجه به کاربردهای اختصاصی که خانواده پردازنده های تسلا انویدیا دارند، بعضی از قسمت های مشخص و اختصاصی GV100 به بخش پردازنده های گرافیکی خانواده GeForce در بازار مصرف کنندگان عادی راه پیدا نخواهند کرد. به هر حال جدای از این مسائل، سیلیکون GV100 را باید نقطه اوج مهندسی انویدیا دانست. طبق بلاک دیاگرام واحد پردازشگر گرافیکی منتشر شده توسط این کمپانی، می توان شباهت هایی در سلسله مراتب چینش و ارتباط اجزای چیپ GV100 با نسل قبلی چیپ های انویدیا پیدا کرد؛ اما بیشتر تغییرات ایجاد شده در قسمت پایه واحد پردازش و تفکیک اعداد و همچنین واحد رشته های پردازشی چند منظوره (SM) صورت گرفته است. واحد SM سیلیکون GV100 معماری ولتا دارای هسته های CUDA هم برای مقادیر FP32 و هم برای FP64 است. پیاده سازی معماری ولتا در کارت گرافیک های رده مصرف کنندگان عادی انویدیا که با نام سری GeForce عرضه می شوند، فاقد هسته های مخصوص مقادیر FP64 خواهد بود. هر واحد SM دارای 64 هسته CUDA مخصوص مقادیر FP32 و 32 هسته مخصوص مقادیر FP64 و هر هسته FP64 قادر به پردازش عملیات های 32 بیت، 16 بیت و حتی 8 بیتی بَدوی است. سیلیکون GV100 دارای 80 واحد SM است که با این حساب مجموعاً 5120 هسته FP32 و 2560 هسته CUDA محصوص مقادیر FP64 در دسترس است. یه علاه، انویدیا قسمت جدید دیگری با نام هسته های Tensor را معرفی کرده که یک قطعه طراحی شده با کاربری خاص برای سرعت بخشیدن به روند تمرین فراگیری عمیق و ساخت تعاملات شبکه ای می باشد. هر یک واحد SM دارای 8 عدد از این هسته ها است، پس سیلیکون GV100 دارای 640 هسته Tensor خواهد بود که البته همانند هسته های FP64، این هسته های Tensor نیز ممکن است در کارت گرافیک های GeForce حضور نداشته باشند. با توجه به تعداد SMها، GV100 دارای 320 واحد TMU خواهد بود و ضمناً انویدیا فرکانس این سیلیکون را در حالت بوست 1450 مگاهرتز تعیین کرده است. در تبلیغات تسلا V100 حداکثر قدرت کارایی این سلیکون در مقادیر FP32 و FP64 بیش از %50 سریع تر از تسلا P100 با معماری پاسکال ذکر شده است. نهایت قدرت پردازشی FP32 مدل تسلا 15 ترافلاپ و در مقادیر FP64 نیز 7.5 ترافلاپ است. هسته های Tensor هم به طور موثر به میزان 120 ترافلاپ در همان وظیفه خاص سرعت بخشی به تمرین یادگیری عمیق و تعاملات شبکه ای فعالیت می کنند. این قطعات دارای واحدهای ضرب تصاعدی ماتریس – ماتریس هستند که یکی از ارکان کلیدی و مهم با توان سرعت بخشی 12 برابری نسبت به نسل پیشین در عملیات های ذکر شده؛ به شمار می آیند. GV100 یک ماژول با چیپ های چند بخشی است که با روند ساخت 12 نانومتری تو لید می شود؛ سطح Die واحد پردازش گرافیکی غول پیکر آن 815 میلی متر مربع بوده، تعداد حیرت آور 21.1 میلیارد ترانزیستور دارد و در کنار چهار پشته 32 گیگابیتی حافظه های HBM2، بیش از 16 گیگابایت حافظه اختصاصی دارد. این پشته ها از طریق یک گذرگاه حافظه 4096 بیتی با چیپ GV100 تعامل دارند که با فرکانس 1 گیگاهرتز، به راحتی 1 ترابایت بر ثانیه پهنای باند حافظه در اختیار این سیلیکون می گذارند. احتمالاً انویدیا حافظه های HMB2 را فقط در همین خانواده تسلا به کار خواهد گرفت زیرا با روند افزایشی قیمت این حافظه ها، برای این کمپانی توجیهی در استفاده آنها در کارت گرافیک های GeForce وجود ندارد. ضمناً اگر انویدیا تصمیم بگیرد مقدار FP64 و هسته های Tensor را به پیاده سازی معماری ولتا در کارت گرافیک های GeForce بیاورد، به راحتی می تواند از حافظه های ارزان و به اندازه کافی سریع GDDR6 نیز استفاده کند. کمپانی SK Hynix یکی از پیشگامان طراحی و تولید حافظه های HBM، در همین نمایشگاه GTC 2017 حافظه های GDDR6 را معرفی کرد، پس حداقل تا زمانی که انویدیا قصد مبارزه با AMD تا آخرین نفس را نداشته باشد، انتظار می رود در بخش مصارف عادی به همان حافظه های GDDR6 بسنده کند. کارت محاسباتی پیشرفته تسلا V100 در دو شکل متفاوت تولید و تسعه داده می شود؛ یکی به صورت کارتی از پیش تعبیه شده با رابط NVLink برای مزارع محاسباتی با تراکم زیاد و دیگری به صورت یک کارت اضافه شونده با رابط PCIe برای ایستگاه های کاری که از طریق کانال های خرده فروشی اختصاصی به فروش خواهد رسید. منبع: TechPowerUp مترجم: مجید بکائیان -
سلام خدمت تمامی دوستان و یوزر های محترم انجمن. هدف از ایجاد همچین تاپیکی اینه که کلیه اخبار و مقالات نسل جدید گیمینگ انویدیا چه در آینده دور چه نزدیک در این تاپیک برای تبادل نظرات و بحث کلی پوشش داده بشه. لذا خواهشا بحث تاپیک منحرف یا به موضوعات پیش پا افتاده که ارزش و بار علمی تاپیک رو پایین میاره کشیده نشه و در نگاه کلی مفید واقع بشه چه برای راهنمایی و یادگیری چه برای فرداهایی که خریداران ممکنه رجوع کنن به تاپیک. همونطور که از اخبار به گوش میرسه و به نوعی انویدیا اون رو با کلیپ کوتاهی به هشتگ BeForTheGame تایید کرد سری جدید سری RTX/GTX 2000 نامگذاری شدن و خبری از 11 نخواهد بود. مبنای نام RTX هم به معماری جدید انویدیا برمیگرده که در اون تکنولوژی RTX مبنای پردازش های محتوای جدید Ray racing خواهد بود. ما تا همینجا بسنده میکنیم تا اخبار دقیق تر و تایید شده به نشر برسن و مبنی بر اون تاپیک هم اپدیت بشه و یوزر ها سردرگم نشن.
- 260 ارسال
-
- 6
-
- ray tracing
- gddr6
- (و 14 مورد دیگر)