رفتن به مطلب

انویدیا با معرفی Pascal و NVLink و حافظه‌ی سه بعدی، نقشه راه کارت گرافیک‌های خود را بروز کرد


Recommended Posts

در GTC 2014، مدیر عامل کمپانی Nvidia روی صحنه آمده و از نسل‌های بعدی پردازنده‌های گرافیکی صحبت کرده است. Pascal و Volta نام دو نسل بعدی است و قرار است تکنولوژی جدیدی به نام NVLink برای ارتباط با سیستم مورد استفاده قرار بگیرد. حافظه‌های سه بعدی هم مطرح شده‌اند. در ادامه‌ی مطلب ببینیم انویدیا برای نقشه راه خود چه برنامه‌هایی در نظر گرفته و با توجه به برد کوچکی که در دست Jen-Hsun Huang، روی صحنه آمده

 

امسال در نشست سالانه‌ی تکنولوژی‌های کارت گرافیک، انویدیا مثل همیشه به معرفی نقشه راه خود و نمایشی از روند صعودی پیشرفت معماری‌های خود پرداخت. در GTC 2013 انویدیا از معماری Volta صحبت کرد. همان‌طور که می‌دانید معماری فعلی کارت گرافیک‌های سری 700 انویدیا، Kepler نام دارد. کمی پیش‌تر با معرفی دو کارت گرافیک رده متوسط و پایین GTX 750 و GTX 750 Ti شاهد رونمایی از اولین تراشه‌های مبتنی بر معماری Maxwell بودیم.

کپلر و مکسول هر دو از دانشمندان بزرگ بودند و معماری بعدی که ولتا نام دارد هم نام یکی دیگر از دانشمندان است که شاید در علم فیزیک و واحد اختلاف پتانسیل الکتریکی یعنی ولت، نامش را شنیده باشید.

فعلاً در مورد زمان‌بندی برای رونمایی از محصولات مبتنی بر ولتا خبری منتشر نشده ولیکن برای مکسول برنامه‌ریزی روشن شده است.

 

 

 

مکسول و ولتا، دو معماری بعدی انویدیا

 

طبق نمودار زیر هر یک از معماری‌ها با یک شاخص معرفی شده‌اند، کپلر که معماری فعلی است، قابلیت موازی‌سازی پویای امور محوله را دارد. مکسول هم با این ویژگی معرفی شده: حافظه‌ی مجازی یکپارچه. برنامه‌ی انویدیا هم این است که مکسول را تا اواخر سال 2014 کامل‌تر روانه‌ی بازار کند.

 

nvidia-2014-roadmap-1.jpg

 

در مورد ولتا ویژگی اساسی حافظه‌ی DRAM داخلی است، منظور از داخلی این است که حافظه با استفاده از فناوری TSV یا Through Silicon Via روی قالب تراشه‌ی پردازنده‌ی گرافیکی شکل بگیرد.

 

 

 

وقتی مکسول و ولتا در عمل با مشکل مواجه می‌شوند، پاسکال ظهور می‌کند

 

اما انویدیا در عمل ویژگی مکسول را به سرانجام نرسانده و قرار است آن را بعدها در معماری‌های بعدی کامل کند. فعلاً تنها اتفاقی که در عمل شاهد هستیم، پشتیبانی از حافظه‌ی مجازی یکپارچه به صورت نرم‌افزاری است که در CUDA 6 عملی شده است. علاوه بر این انویدیا هنوز در مورد نسل دوم مکسول‌ها صحبتی نکرده و مشخص نیست که کارت گرافیک‌های مکسولی رده اول، تا چه حد قدرتمند و سریع خواهند بود.

در نمودار زیر می‌بینیم که در نقشه راه جدید انویدیا، ویژگی اساسی مکسول پشتیبانی از DX 12 ذکر شده است.

 

nvidia-2014-roadmap-2.jpg

 

مکسول با معرفی کارت گرافیک GTX 750 شروع کرده و قرار است در سال 2014 تدریجاً سایر مدل‌ها معرفی شوند. اما آنچه باعث نا امیدی است، فقدان قابلیت‌های جدیدی است که به قابلیت‌های خانواده‌ی موفق کپلر (سری 700) و نسل اول مکسولی‌ها اضافه شود.

تغییر دیگر در نقشه راه به ولتا مربوط می‌شود، خبری از نام آن نیست! هنوز مشخص نشده که چرا ولتا در این نقشه راه دیده نمی‌شود اما آنچه قطعی به نظر می‌رسد، عرضه شدن آن دیرتر از زمان‌بندی‌هایی است که قبلاً اعلام شده بود. ویژگی اساسی ولتا هم زیر نام معماری Pascal ذکر شده که خود عجیب به نظر می‌رسد.

فعلاً برنامه‌ی انویدیا عرضه‌ی پاسکال در سال 2016 به بعد است، پاسکال دو ویژگی اساسی که قبلاً برای مکسول و ولتا ذکر شده بود را جذب کرده و یک معماری جدید و بسیار جالب به نظر می‌رسد.

 

 

 

پاسکال در نگاه اول

 

انویدیا برای بهبود عملکرد تراشه‌های گرافیکی خود، تصمیم گرفته که با استفاده از TSV، حافظه‌های DRAM را روی تراشه‌ها اضافه کند. خبر جدید در این رابطه این است که انویدیا طبق یکی از استانداردهای معرفی شده توسط JEDEC به نام HBM استفاده می‌کند. HBM مخفف High Bandwidth Memory به معنی حافظه‌هایی با پهنای باند بالاست. در نمونه‌ای که انویدیا تولید کرده هم تمام حافظه‌ی کارت گرافیک پاسکالی به صورت مجتمع بوده و هیچ حافظه‌ی دیگری روی کارت گرافیک وجود ندارد.

 

nvidia-2014-roadmap-3.jpg

 

قبلاً در معرفی ولتا از پهنای باند 1 ترابایت در ثانیه صحبت شده بود ولیکن در مورد پاسکال هیچ عدد خاصی ذکر نشده است.

یک مشکل جدی در رابطه با این حافظه‌ها، هزینه‌ی تولید است، باید صبر کرد و دید که در قبال پهنای باند بالاتر، چه هزینه‌ای متوجه مشتریان انویدیا خواهد بود.

 

nvidia-2014-roadmap-4.jpg

 

 

 

NVLink چیست؟ چه اثری روی پهنای باند و رابطه‌ی بین پردازنده‌ی اصلی و گرافیکی دارد؟

 

انویدیا در نشست اخیر در مورد حافظه‌ی مجازی یکپارچه اطلاعات جدیدی منتشر نکرده است اما یک ویژگی جالب‌تر به نام NVLink را معرفی کرده است.

برای ارتباط بین پردازنده‌ی اصلی و گرافیکی از باسی به نام PCI Express استفاده می‌شود که در مادربوردهای جدید با نسخه‌ی سوم آن روبرو هستیم. این واسط ارتباطی به ازای هر Lane پهنای باندی معادل 985 مگابایت در ثانیه دارد. توجه کنید که منظور از Lane یک مسیر دو جهته برای دریافت و ارسال سیگنال به صورت تفاضلی است. لذا در مورد مادربوردهای متداول امروزی، اگر تعداد مسیرها 16 عدد باشد و یا به اصطلاح بازاری، پهنای شکاف PCI Express، به صورت x16 نوشته شود، پهنای باند این اسلات مادربورد، 16 ضرب در 0.985 گیگابایت یا حدود 16 گیگابایت در ثانیه خواهد بود.

کارت گرافیک‌های مدرن امروزی پهنای باند حافظه‌ای به مراتب بالاتر از محدودیت‌های موجود مثل ارقام بالاتر از 250 گیگابایت در ثانیه دارند. البته این رقم پهنای باند حافظه‌ی روی کارت گرافیک است و قرار نیست واسط ارتباطی PCI-Express هم به همین اندازه سرعت داشته باشد. ولیکن 16 گیگابایت بر ثانیه و حتی 31.5 گیگابایت در ثانیه‌ای که با معرفی نسل چهارم واسط PCIe حاصل شده، به نظر کافی نیستند.

NVLink برای حل همین مشکل معرفی شده و قرار است یک جایگزین خوب برای PCIe باشد. ساختار NVLink به شدت شبیه PCIe است و حتی درست مثل آن پروگرم می‌شود. اما تفاوت اصلی آن طراحی برای ارتباط بهتر نقطه به نقطه است. NVLink هم سیگنال را به شکل تفاضلی منتقل می‌کند و کوچک‌ترین واحد ارتباطی در آن بلوک نام دارد. یک بلوک یا Block، شامل 8 مسیر یا همان‌طور که قبلاً توضیح داده شد، 8 لِین است. هر مسیر پهنای باندی معادل 20 گیگابیت در ثانیه دارد، لذا اگر پهنای واسط ارتباطی به اندازه‌ی 8 مسیر باشد، پهنای باند حاصل شده، 20 گیگابایت در ثانیه (160 گیگابیت در ثانیه) خواهد بود. توجه کنید که در PCIe 3.0 هر مسیر حدود 8 گیگابیت در ثانیه سرعت داشت. یعنی سرعت حدود 2.5 برابر بیشتر است.

 

nvidia-2014-roadmap-5.png

 

برای ارتباط بهتر می‌توان چند بلوک را با هم ترکیب کرد تا رابطه‌ی بین دو ابزار خاص سریع‌تر شود، امکان دیگر رابطه با ابزارهای اضافی دیگر است. به بیان دیگر برای ارتباط ابزارها با هم، نیازی به ارتباط با ریشه‌ی شکاف‌ها و استفاده از یک سوییچ مجزا نیست. به استفاده از ریشه‌ی مرکبی که در پردازنده‌ی اصلی گنجانده شده هم نیازی نیست، به همین علت است که می‌گوییم NVLink یک واسط با طراحی کاملاً نقطه به نقطه است و ابزارهای متصل و به عبارتی پردازنده‌های گرافیکی مستقیماً با هم در ارتباط خواهند بود.

اما به شباهت NVLink با Hypertransport کمپانی رقیب یعنی AMD و همچنین ارتباط داخلی Quick Path Interconnect اینتل توجه کنید، همگی به این ویژگی NUMA اشاره دارد که نیازی نیست تمام پردازنده‌ها با هم در ارتباط باشند. NUMA یا دسترسی غیریکنواخت به حافظه، روشی است که در آن یک پردازنده دسترسی بهتری به حافظه‌ی اختصاصی خود دارد.

 

 

 

کارت گرافیک‌های آینده، عمود بر مادربورد نخواهند بود؟

 

NVLink پهنای باند بالایی دارد و انویدیا برای ایجاد چنین سرعت فوق‌العاده‌ای نمی‌تواند از PCI و PCIe استفاده کند. طول واسط ارتباطی باید کوتاه‌تر باشد. بنابراین انویدیا تصمیم گرفته به جای استفاده از اسلات‌های شبیه PCIe روش دیگری اتخاذ کند.

انویدیا نام کانکتور جدید را درست شبیه اتصال دو برد مدار چاپی (یا PCB) در نظر گرفته که در کارت گرافیک دو هسته‌ای GTX 295 شبیه آن را دیده بودیم. mezzanine روشی برای چسباندن دو PCB است که انویدیا همین عنوان را انتخاب کرده است.

 

nvidia-2014-roadmap-6.jpg

 

nvidia-2014-roadmap-7.jpg

 

البته هنوز هیچ کانکتور خاصی معرفی نشده ولیکن چنین روش جدیدی به اعمال تغییرات جدی در مادربورد نیاز دارد و در واقع مادربوردهایی که از NVLink پشتیبانی می‌کنند، باید طراحی متفاوتی داشته باشند. اما مزیت مهم روش جدید این است که همان‌طور که گفته شد، طراحی کاملاً نقطه به نقطه خواهد بود، به علاوه پردازنده‌ی گرافیکی هم مثل CPU اتصالی شبیه سوکت خواهد داشت و مدارات مربوط به تأمین توان مصرفی و ارتباط با حافظه، روی تراشه‌ی گرافیکی ایجاد می‌شوند.

نمونه‌ای که انویدیا از پاسکال رونمایی کرده، در تصویر زیر دیده می‌شود:

 

nvidia-2014-roadmap-8.jpg

 

کانکتور در این تصویر مشخص نیست ولیکن روش اتصال قرار گرفتن روی مادربورد است و مثل کارت گرافیک‌های فعلی، به صورت عمودی قرار نمی‌گیرد.

یک مزیت دیگر روش جدید انویدیا این است که می‌توان برای خنک‌کاری، مثل پردازنده‌ی اصلی عمل کرد، البته این موضوع در مورد سرورها اهمیت دارد نه دستاپ‌های معمولی چرا که فضای در دسترس، در مورد سرورها بسیار مهم‌تر از دستاپ‌هاست. برای هر کارت گرافیک با طراحی جدید، یک کانکتور NVLink لازم است.

در تصویر زیر یک کانکتور اصطلاحاً mezzanine با پهنای باند بالا را مشاهده می‌کنید:

 

nvidia-2014-roadmap-9.jpg

 

آخرین مزیت کاکنتور مِزِنین مانند NVLink این است که در انتقال و تحویل توان مصرفی، بازدهی بالاتری دارد. در واقع بنابر ادعای انویدیا، انرژی لازم برای انتقال هر بایت داده، کمتر از PCIe است. علاوه بر این محدودیت انتقال توان در NVLink بیش از 75 واتی است که در مورد PCIe تعریف شده

است، لذا استفاده از کارت گرافیک‌های قوی‌تر بدون نیاز به کابل 6 یا 8 پین ساده‌تر خواهد شد.

 

 

 

آینده‌ی NVLink و طراحی کارت گرافیک‌ها

 

NVLinkاز نظر پهنای باند و نوع طراحی بهینه‌تر از PCIe است ولیکن جایگزینی PCIe در ابعاد بزرگ به این سادگی‌ها نیست. در واقع بلوک‌های ارتباطی که انویدیا تعریف کرده، از طریق PCIe هم قابل پیاده‌سازی هستند، درست مثل تصویر زیر:

 

nvidia-2014-roadmap-10.png

 

موضوع دیگر این است که در استفاده از NVLink هم باید برخی دستورات و ارتباطات همچنان از طریق PCIe ارسال و برقرار شوند.

بنابراین در نقشه راه انویدیا، استفاده از PCIe همچنان پابرجاست. لذا انویدیا مجبور است فعلاً از PCIe هم استفاده کند. بهترین پیش‌بینی در مورد آینده‌ی NVLink این است که در سرورها مورد استفاده قرار بگیرد و کاربران عادی از همان PCIe معروف بهره ببرند.

به هر حال تا سال 2016 هنوز 2 سال زمان باقیمانده و فعلاً خبری از پاسکال و NVLink نیست. NVLink قرار است چندین پردازنده‌ی گرافیکی را طوری به هم مربوط کند که گویی همگی یک پردازنده‌ی واحد هستند.

در حال حاضر NVLink به عنوان بخشی از کنسرسیوم OpenPOWER در اختیار طراحان POWER CPU قرار گرفته ولیکن هنوز هیچ پردازنده‌ی خاصی اعلام نشده است. حتی این احتمال هم وجود دارد که انویدیا از پردازنده‌های مبتنی بر ARM برای پیاده‌سازی NVLink استفاده کند، شاید Denver که نام هسته‌های 64 بیتی تراشه‌ی تگرا کی‌وان است هم به این منظور به کار گرفته شود. فعلاً هیچ خبری در این رابطه منتشر نشده است.

بنابر اظهارات انویدیا، نسخه‌ی دوم NVLink برای معماری پس از پاسکال که احتمالاً ولتا باشد، در نظر گرفته شده و در آن حافظه‌ی کش با واسط و پردازنده‌ای که روی آن است، یکی شده و ارتباط بهینه‌تر و سریع‌تری دارد و در ضمن در اجرای منسجم‌تر دستورات مطابق با معماری ناهمگن سیستم (HSA) گامی رو به جلو است.

 

 

 

www.anandtech.com

ویرایش شده توسط kargiravar
لینک به دیدگاه
Share on other sites

ممنون از مقالتون بهره بسزايى برديم...

بايد منتظر شد و ديد اگه اين عمر كفاف بده...

لینک به دیدگاه
Share on other sites

سلام و درود محمد جان ممنون بابت مطالب خوبت

 

خواهش میکنم

 

ممنون از مقالتون بهره بسزايى برديم...

بايد منتظر شد و ديد اگه اين عمر كفاف بده...

 

انشاالله که خدا عمر میده و این پاسکال رو هم میبینیم

 

@};- @};- @};-

@};- @};- @};-

لینک به دیدگاه
Share on other sites

دوست عزیز لطفا منبع فارسی رو هم بفر مایید

بی انصافی هست که فقط کپی کنید از زحمات دیگران بدون ذکر منبع.

http://www.zoomit.ir/articles/hardware/graphic-cards/10268-nvidia-gpu-roadmap-pascal-architecture-2016

لینک به دیدگاه
Share on other sites

لطف کنید مطالبی رو که از سایت های فارسی برمیدارید توی این انجمن :

انجمن مطالب کپی شده از سایتهای دیگر

بزارید

با تشکر

لینک به دیدگاه
Share on other sites

دوست عزیز لطفا منبع فارسی رو هم بفر مایید

بی انصافی هست که فقط کپی کنید از زحمات دیگران بدون ذکر منبع.

http://www.zoomit.ir/articles/hardware/graphic-cards/10268-nvidia-gpu-roadmap-pascal-architecture-2016

 

 

لطف کنید مطالبی رو که از سایت های فارسی برمیدارید توی این انجمن :

انجمن مطالب کپی شده از سایتهای دیگر

بزارید

با تشکر

 

بله درست میفرمایید

لینک به دیدگاه
Share on other sites

به گفتگو بپیوندید

هم اکنون می توانید مطلب خود را ارسال نمایید و بعداً ثبت نام کنید. اگر حساب کاربری دارید، برای ارسال با حساب کاربری خود اکنون وارد شوید .
توجه: مطلب ارسالی شما پس از تایید مدیریت برای همه قابل رویت خواهد بود.

مهمان
ارسال پست در این تاپیک...

×   شما در حال چسباندن محتوایی با قالب بندی هستید.   حذف قالب بندی

  تنها استفاده از 75 اموجی مجاز می باشد.

×   لینک شما به صورت اتوماتیک جای گذاری شد.   نمایش به صورت لینک

×   محتوای قبلی شما بازگردانی شد.   پاک کردن محتوای ویرایشگر

×   شما مستقیما نمی توانید تصویر خود را قرار دهید. یا آن را اینجا بارگذاری کنید یا از یک URL قرار دهید.

 اشتراک گذاری

×
  • اضافه کردن...