رفتن به مطلب

nVIDIA بمب پاسکال را برروی تسلا P100 انداخت


rezagtx
 اشتراک گذاری

Recommended Posts

  • کاربر ویژه

ما همه  اسم نسل بعدی واحد های پردازشی انویدیا را شنیده ایم،پاسکال. هر دیتایی ورای این نام را ما باید در  بخش فرضیات  و گمان ها قرار دهیم! بعضی از این  آمارها منطقی  و برخی هم  خیال پردازی ذهن پویا و تخیلی نت هستند! اما امروز  در  GTC2016 آقای Jen-Hsun در متن سخنرانی خود در کنفرانس انویدیا  اولین جزییات دقیق و واقعی  این سخت افزار را فاش کرد. البته اگر شما منتظر عرضه  این واحد های پردازشی برای مصرف کننده و بعد ارائه  مدل های  پروفشنال هستید باید بگوییم که فعلا باید منتظر ماند و دید انویدیا چه برنامه ای در سر دارد. اکنون انویدیا فقط صحبت از پیشرفته ترین مدل های خود نموده است  با کد رمز P100 و باید گفت این واحد پردازشی یک هیولای مطلق است.

 

 

چیزی که ما نیاز داریم بدانیم این است  که تراشه P100  دارای توانایی به گفته انویدیا " یادگیری عمیق " است که فقط به  مدلهای تسلا یا کوادرو محدود نیست.تکنولوژی هایی مثلNVlink   -باس پهنای بالا برای اتصال چندین GPU-  حتماً لازمه  کار  Pc gaming نخواهد بود  اما اگر  پاسکال تمام تمرکزش روی  توانایی های  یاد گیری عمیق  و  اَبَرمحاسبات است، بدان معنا نیست که یک چیپ مرگبار گیمینگ نیست. بگذارید درباره این هیولا صحبت کنیم.

 

4n4cab8025h2tvfm731r.jpg

 

نظاره گر باشید :  ماژول گرافیکی انویدیا تسلا P100 با 150 میلیارد ترانزیستور  ساخته شده برای کارایی!

 

 اگر  فکر میکنید  واحد بالا شبیه Fiji از amd است باید بگویم دلیل خوبی  برای این شباهت دارد، انویدیا به سراغ نسل دوم تراشه HBM برای حافظه رفته است. P100 به نسل دوم این حافظه مجهز است. چها رلایه  از چیپ های  روی هم ذخیره شده  با باس 4096 بیتی که البته با سرعت 1.4گیگابایت بر ثانیه  در مقایسه با سرعت 1.0 گیگابایتی نسل یک کار میکنند که در مجموع پهنای باندی 720 گیگابایت بر ثانیه!!  ارائه میدهند. این سرعت ها هیولا هستند ولی HBM فقط درباره سرعت نیست و اکنون لایه های  حافظه را افزایش داده و در مجموم 16 گیگابایت  VRM  مدل HBM2 در اختیار P100 قرار دارد. این یک عامل حیاتی برای کارتهای تسلا است. کارت قدیمی تر تسلا K40  اکنون به 12 گیگابایت حافظه مجهز است .

 

به لطف تراشه 16 نانومتری، انویدیا توانسته  تعداد ترانزیستور ها را در هسته GPU افزایش دهد. جایی که GM200 در هسته M40   تعداد 3072 هسته کودا در اختیار  دارد و شامل 8 میلیارد ترانزیستور است، P100 تعداد را به نزدیک به دوبرابر رسانده است یعنی 15.3 میلیارد. انویدیا  همچنین اعلام کرده است که این بزرگترین واحد پردازشی ساخته شده به دست آنهاست و هسته چیپ در کنار تراشه های مموری به شکلی عجیب غول پیکر هستند. اگر همه ترانزیستور های درون  GPU و اینترپوزر  و ماژول های HBM2  را در کنار هم قرار دهیم به رقم خیره کننده 150 میلیارد ترانزیستور  خواهیم رسید!!یک اَبَر تراشه !

 

 

5ibquc2bq170flfkqqf.jpg

 

Jen-Hsun با همان کت چرمی  سنتی در حال نمایش p100

 

 تعداد هسته ها چه؟ اینجا بحث جالب می شود. معماری پاسکال  یکبار دیگر تکامل یافته است و با تغییر در سایز ماژولهای SM به سطح بالایی از  کارایی دست یافته است. در معماری کپلر انویدیا در یک  SMX  تعداد 192 هسته کودا داشت. برای مثال تراشه Gk110  با 28 عدد SMX تعداد 2880 هسته کودا در اختیار داشت. مکسول  به دلیل بهینه سازی های زیاد توانست این تعداد 192 را به 128 بر هر SMX کاهش دهد اما با وجود کاهش معماری  قادر بود به دلیل بهینه سازی زیاد از این تعداد کمتر کارایی بهتری بیرو ن بکشد. در تراشه پاسکال  انویدیا تعداد  هسته کودا در هر SMX را به 64 عدد کاهش داده است ولی باز هم  کارایی و بهینه سازی  را نسبت به مکسول ادامه داده است.

 

یک تراشه 100% فعال P100  نزدیک به 3840 هسته کودا خواهد داشت! اما تسلا با خاموش کردن چهار SM تعداد 3584 هسته کودا در اختیار دارد. شاید این میزان نسبت به تراشه m40 با 3072هسته کودا خیلی اختلاف نداشته باشد ولی  پاسکال در فرکانس یک هیولاست: جایی که m40 با فرکانس  984 تا 1114  مگاهرتز فعالیت میکند  P100 قادر است در فرکانس های فوق العاده 1328 تا 1480 به صورت پیش فرض فعالیت کند. توانایی خالص پردازشی این واحد  برابراست با 21.2  بر واحد fp16  ترافلاپس در حالت  half-precision و  10.6  بر واحد fp32  ترا فلاپس برای  حالت single-precision و برای پرسیژن دوبل  5.3 ترافلاپس بر واحد fp64.

 

 این بدان معناست که این واحد پردازشی شاید هرگز در اختیار مصرف کننده mainstream قرار نگیرد. بهترین حالت این است شاید یک تایتان برپایه این واحد P100  عرضه شود شاید هم نه ،مشخص نیست. انویدیا امروز مشخصاتی هیولا وار برای این واحد پردازشی خود اعلام نموده است ولی   فعلا  تا Q12017 به عرضه و دیگر مشخصات وبازار های OEM هیچ اشاره ایی نکرده است. ما احتمالا یک GP104 خواهیم داشت که از حافظه دیگری به جز HBM2 استفاده  میکند و در یک Die کوچک تر قرار دارد. البته انویدیا  برای مصرف کننده محصولات عادی هیچ گونه   اطلاعاتی را عرضه نکرده است گویی باید  منتظر computex باشیم تا با دیگر غول های پاسکال ملاقات کنیم.

 

لینک به دیدگاه
Share on other sites

  • کاربر ویژه

داداش رضا خواب نداری برادر سر صبحی خبر میزاری @};- :laughing:

مثبتهام تموم شده +1

ولی هیولا میشه :wacko: 

ویرایش شده توسط StarKilleR
لینک به دیدگاه
Share on other sites

درود بر آقا رضا گل

تسلا P100 تو حلقم. :D‏ ‏:D‏ ‏:D

پ.ن: داش " حسن " آقا رضا مثل ماها نیستند که .... سحر خیزند. :D

یا حق

لینک به دیدگاه
Share on other sites

  • کاربر ویژه

تسلا جهنمی خواهد بود ولی من میترسم از تایتانی که از دل این در بیاد@!


داداش رضا خواب نداری برادر سر صبحی خبر میزاری @};- :laughing:

مثبتهام تموم شده +1

ولی هیولا میشه :wacko:

خوب منتظر  GTC بودم باید کنفرانس و کی نت اسپیچر انویدیا رو تماشا کرد  مگر میشه  ندید


http://www.gputechconf.com/

لینک به دیدگاه
Share on other sites

واحد های پردازشی و محل قرارگیری هسته های CUDA در Kepler با نام SMX شناخته می شدند و در Maxwell به SMM تغییر نام دادند و دوباره در Pascal به SM تغییر کردند!

تمام تمرکز Pascal فقط روی بخش Compute و سیستم های صنعتی هست، پتانسیل عملکردی Tesla P100 برای سیستم های با معماری ناهمگن هم کاملا بهینه و بروزرسانی شده است.

انویدیا به لطف بهینه سازی های لازم تعداد هسته های CUDA در واحد های SM رو کاهش داده اما با افزایش تعداد واحد های SM مجموع هسته های CUDA افزایش یافته اند.

@};-

ویرایش شده توسط RONIN021
لینک به دیدگاه
Share on other sites

باز هم NVidia نبض تکنولوژی گرافیک را بدست گرفت........کارش همین

برای ما که مصرف کننده هستیم این مهم هست که در قبال پولی که پرداخت میکنیم از جنسی که میخریم راضی باشیم حالا فرقی نداره ساخت چه کشوری باشه و کدام کمپانی

توانا بود هر که دانا بود

لینک به دیدگاه
Share on other sites

  • کاربر ویژه

بوی مرگ میاد انویدیا اینقدر ا زتوانایی محاسباتی پاسکال مطمئنه اومده تعداد هسته کودا در هر sm رو به 64 تا روسونده نصفه مکسول ! بعد خدا میدونه این 64 تا بر هر SM چقدر  بهنیه شدن که قراره از اون 198 های کپلر کارایی بیشتری نشون بدن- این واحد تسلا البته به کار محساسابت عادی نمیاد فقط powerhouse /workstation


واحد های پردازشی و محل قرارگیری هسته های CUDA در Kepler با نام SMX شناخته می شدند و در Maxwell به SMM تغییر نام دادند و دوباره در Pascal به SM تغییر کردند!

تمام تمرکز Pascal فقط روی بخش Compute و سیستم های صنعتی هست، پتانسیل عملکردی Tesla P100 برای سیستم های با معماری ناهمگن هم کاملا بهینه و بروزرسانی شده است.

انویدیا به لطف بهینه سازی های لازم تعداد هسته های CUDA در واحد های SM رو کاهش داده اما با افزایش تعداد واحد های SM مجموع هسته های CUDA افزایش یافته اند.

@};-

تایید میشه @};-

لینک به دیدگاه
Share on other sites

بوی مرگ میاد انویدیا اینقدر ا زتوانایی محاسباتی پاسکال مطمئنه اومده تعداد هسته کودا در هر sm رو به 64 تا روسونده نصفه مکسول ! بعد خدا میدونه این 64 تا بر هر SM چقدر  بهنیه شدن که قراره از اون 198 های کپلر کارایی بیشتری نشون بدن- این واحد تسلا البته به کار محساسابت عادی نمیاد فقط powerhouse /workstation

تایید میشه @};-

این کاریه که من ازش خوشم میاد !

تعداد کمتر بازدهی بیشتر .

اگر قرار باشه فقط چیپست اضافه بشه که فایده نداره !

 

فکر میکنید قیمتش توی چه حد و حدودی باشه ؟؟؟

AMD چند روز پیش یک 6000 دلاری 2 هسته ای برای نرم افزار های تخصصی بیرون داد .

خیلی دوست دارم مصرف و مکس دماش رو بدونم .

لینک به دیدگاه
Share on other sites

  • کاربر ویژه

درود

خبر خوب بود چون بالاحره معلوم شده از hbm 2 قراره استفاده بشه ... و نشون داد انویدیا کاملا اماده رقابت در رده ی سنگین وزن ها هست  :D

اما از زمان اراده خوشم نیود چرا تا سال دیگه اخه ؟؟؟ amd بنظر زودتر قراره ایندفعه کارت هاشو بریزه تو بازار ...  :-?

ویرایش شده توسط nima.mazrouie
لینک به دیدگاه
Share on other sites

به کجا چنین شتابان؟

کی گفته شتابان؟ اینا چند وقته این تکنولوژیو داشتن؛ اما الان رو کردن؛ خدا می دونه الان دارن روی تکنولوژی چند سال دیگه کار می کنن. اینا سیاستشون اینه که پول خوبی به جیب بزنن و اگه بر فرض محال رقیبشون چیز شاخی رو کنه؛ اینا هم چیزی تو چنته داشته باشن!

لینک به دیدگاه
Share on other sites

  • کاربر ویژه

گیمر از gpuساز پرسید:

 

به کجا چنین شتابان ؟؟؟

 

 سه سال پیش بود من فکر کنم سال 2014 یا 2013 مدیر انویدیا اومد دقیقا همین ماژول  کپی پاسکال رو توی دستش بود  . اینها الان دارن پردازنده  3 4سال بعد رو روش کار میکنن مگر میشه یکشبه و دوماهه GPU ساخت در این ابعاد؟؟

ویرایش شده توسط rezagtx
لینک به دیدگاه
Share on other sites

نامردا خودشون با hbm 2 بازی میکنن به ما ddr5 میدن و hbm 1 . :D =))


شرمنده اینجا میگم ولی تاپیک دسته یا موس و کیبرد برای من نصفه باز میشه :(

انجمن جن گرفته ! :wacko:

http://forum.lioncomputer.ir/index.php?showtopic=57083

لینک به دیدگاه
Share on other sites

ef95gp100-SM-diagram.png

 

در Pascal تعداد Thread ها، Warps ها و سایز Registers ها همراه با بیشتر شدن تعداد واحد های SM نیز افزایش یافته است، تعداد registers ها مشابه نسل قبلی Maxwell و Kepler هستند اما همانطور که گفتم افزایش تعداد واحدهای SM در نهایت منجر به گسترش این بخش شده است، میزان Shared Memory هم به خاطر افزایش تعداد SMها در GP100 بهبود یافته است و نقریبا مجموع پهنای باند حافظه اشتراکی بیش از دو برابر شده است، هر چقدر میزان این مؤلفه های ذکر شده بیشتر باشد عملکرد واحدهای SM نیز در اجرای دستورات پردازشی بهتر خواهد شد و Pascal به خوبی پیشرفت معماری را نسبت به Maxwell نشان می دهد، بدون شک توسعه Warp Scheduler ها قطعا به Pascal در مورد مؤلفه Async Compute کمک خواهد کرد، هدف اصلی انویدیا با Pascal تسخیر بازار HPC ها می باشد و برای مطمئن شدن از این امر نسبت هسته های CUDA با قابلیت پردازشی Double-Precision را در واحد های SM به خوبی افزایش داده است، در هر واحد SM تراشه GP100 تعداد 32 هسته CUDA با نقش پردازشی FP64 حضور دارد که نسبت بخش پردازشی Double-Precision به Single-Precision یا FP32 به مقدار 2:1 رسیده است، این در حالی هست که در تراشه پرچمدار معماری Kepler یعنی GK110 این نسبت برابر 3:1 بوده است، مشابه با پرچمدار های نسل قبلی GP100 با الگوریتم های محاسباتی IEEE 754‐2008 جهت انجام عملیات FMA و همچنین الگوریتم پردازشی تبدیل سریع فوریه (FFT) نیز کاملا هماهنگ خواهد بود، در بخش Deep Learning نیز ممیزهای شناور 16 بیتی یا FP16 حضور دارند تا بهترین سازگاری و پتانسیل عملکردی را برای ابزارهای وابسته به هوش مصنوعی فراهم کنند!

ویرایش شده توسط RONIN021
لینک به دیدگاه
Share on other sites

گیمر از gpuساز پرسید:

 

به کجا چنین شتابان ؟؟؟

 

 سه سال پیش بود من فکر کنم سال 2014 یا 2013 مدیر انویدیا اومد دقیقا همین ماژول  کپی پاسکال رو توی دستش بود  . اینها الان دارن پردازنده  3 4سال بعد رو روش کار میکنن مگر میشه یکشبه و دوماهه GPU ساخت در این ابعاد؟؟

آره، سطح پردازنده‌ها مثل زمین کشاورزیه، شخم میزنن بعد روش بذر می‌پاشن. :)  @};-  @};-  @};-  @};-

 البته یکی از مهم‌ترین ویژگی این معماری اشتراک گذاری مموری‌های گرافیک در سیستم‌های چند گرافیکه‌ است.

 

مقایسه بین سه نسل اخیر:

واقعا پاسکال دو برابر ماکسول قدرت داره.

 

ws01_gpu.png

ویرایش شده توسط EDK-TheONE
لینک به دیدگاه
Share on other sites

درود

این خبر رو هم تازه خوندم که انودیا ابر کامپیوتر با نام DGX-1ساخته که داخلش فقط 8 عدد از این تسلا p100استفاده میکنه @-)  :eek: 

لینک به دیدگاه
Share on other sites

یک سوال

150 میلیارد ترانزیستور یا 15 میلیارد ترانزیستور ؟

لینک به دیدگاه
Share on other sites

به کجا چنین شتابان؟

به کجا چنین شتابان ؟

گون از نسیم پرسید

دل من گرفته زینجا

هوس سفر نداری

ز غبار این بیابان ؟

 همه آرزویم اما

 چه کنم که بسته پایم

به کجا چنین شتابان ؟

به هر آن کجا که باشد به جز این سرا سرایم

سفرت به خیر !‌ اما تو و دوستی خدا را

چو از این کویر وحشت به سلامتی گذشتی

به شکوفه ها به باران

 برسان سلام ما را

 

 

 

 

 

 

البته امیدوارم قیمت سری دکستاپ که میاد مناسب باشه یه کارت مید رنج با قیمت های اند نفوروشن 

ما امید واریم  این نسل که بیاد چه amd چه انودیا قیمتشون مناسب باشه برای من اصلا مهم نیست کدوم قویتر از کدوم فقط برام مهمه با پولی که میدم کارایی معقولی بگیرم امید وارم amd دوباره نیاد کارتای سری 400 ریبرند بزنه این نسل قیمتای انودیا خیلی خوب بود ولی واسته ها و وارد کننده های سودجو حسابی از خجالتمون دراومدن 

نامردا خودشون با hbm 2 بازی میکنن به ما ddr5 میدن و hbm 1 . :D =))

شرمنده اینجا میگم ولی تاپیک دسته یا موس و کیبرد برای من نصفه باز میشه :(

انجمن جن گرفته ! :wacko:

http://forum.lioncomputer.ir/index.php?showtopic=57083

برای من هم بعضی صفحات نصفه باز میشد خودش درست شد

لینک به دیدگاه
Share on other sites

  • کاربر ویژه

15 میلیارد فقط در GPU است کل ماژول نزدیک به 150 میلیارد ترانزیستور داره!

لینک به دیدگاه
Share on other sites

  • کاربر ویژه

شدیدا منتظر سری جدید کارتهای amd  و انویدیا هستم

 

میخواستم 970 بخرم ولی چیزهایی که از سری جدید شنیدم کاملا پشیمونم کرد

لینک به دیدگاه
Share on other sites

  • کاربر ویژه

نه اقا پشیمون نشو خبری نیست الان ربطی نداره 970 کار خودش رو میکنه مگر وقتی کارت جدیدد اومد اون از کار می افته؟ بگیر استفاده کن الان قیمت ها خوبه بهترین رنج رو داره 1080 میخوره. هیچ چیزی نیست که الان بشنویم و ما رو مثلا از معماری مکسول دور کنه. بگیرید استفاده کنید

لینک به دیدگاه
Share on other sites

  • کاربر ویژه

نه اقا پشیمون نشو خبری نیست الان ربطی نداره 970 کار خودش رو میکنه مگر وقتی کارت جدیدد اومد اون از کار می افته؟ بگیر استفاده کن الان قیمت ها خوبه بهترین رنج رو داره 1080 میخوره. هیچ چیزی نیست که الان بشنویم و ما رو مثلا از معماری مکسول دور کنه. بگیرید استفاده کنید

 

اره از کار میوفته

الان وضعیت کارتهای سری 700 رو ببینید

کارت 770 به چه فلاکتی افتاده از کارت 960 هم ضعیفتر شده

در صورتی که تستهای بازیها دو سال پیش رو نگاه کنید کارت 760 و 960 تقریبا برابر بودن اختلاف در حد 1 یا 2 فریم بود

ولی تو بازیهای جدید ببینید به چه وضعی افتاده

post-7187-0-58654100-1459968413_thumb.png

لینک به دیدگاه
Share on other sites

  • کاربر ویژه

عزیزم با گسترش بازی ها توسعه درایور ها دیگه هر نسل باید جهتش رو بره اینجور که شما میگید 760 باید تا ابد از،760استفاده کرد. معلومه درایور که توسعه داده میشه باید با کارت 960 سازگار باشه با ید تمام توان این رو به کار بگیره الان این کارت داره براش بازی ساخته میشه. کارت 760 ضمنا کارتی نیست که ادم بهش خیلی اینده نگرانه نگاه کنه کارتی است که کاربر میگیره برای استفاده عادی نه اینکه دو سال بعدش هنوز بگه غلان بازی اجرا نشدد یا فلان فریم کم شد یا فلان جا کند شد. کارت رو اول عمر عرضه میگیرن و استفاده میکنن. همه چیز به مخاطب بسته است اگر مخاطب دید استفاده ایی که داره از کارت میکنه جوابگوهه خوب ادامه میده ولی اگر دید نیاز گیمنیگ رو بر طرف نمیکنه باید بره ارتقا.شاید یک فرد سه سال با یک کارت سر کنه ولی برای یک کاربر پراستفاده دیگه یک سال هم جواب نده.

هر کسی میخواد کارت گرافیک بخره باید بخودش و استفاده خودش نگاه کنه و از خود بپرسه از کارت گرافیک چی میخواد.

ضمنا اگر اینجوره خوب ادم هر کارت بخره سال بعد از کارت جدیدتر کند تر میشه بنابراین نخریدن به امید اینکه جلو بی افته اشتباهه. اگر گیمر میخواد بازی کنه باید قویترین کارتی که بودجه اش اجازه میده رو بگیره و بعد استفاده کنه و هروقت جوابگو نبود براش این رو خودش میفهمه نه من نه شما ارتقا بده حالا چه چند روز بعدش باشه یا دو سال بعد.

من خودم دوستم اینجا بایکی از کارتهای 770 قدیمی خودم هم فالوت 4 هم دراگون ایج اینکویزیشن و بدون مشکل تمام کرد. این که هی به نمودار و حرف دیگران گوش کنیم و ببنیم شخصی که اصلا تا الان کارت انویدیا ندیده به چشم بحث ایجاد کنه نمیشه باید دید شخص چی میخواد اینکه انتظار داریم کارت دو سال پیش بیشتر بازی روز رو مثل همون روز یک عرضه با همون فریم و کیفیت اجرا کنه خوب غیرمنطقی است.

لینک به دیدگاه
Share on other sites

به گفتگو بپیوندید

هم اکنون می توانید مطلب خود را ارسال نمایید و بعداً ثبت نام کنید. اگر حساب کاربری دارید، برای ارسال با حساب کاربری خود اکنون وارد شوید .
توجه: مطلب ارسالی شما پس از تایید مدیریت برای همه قابل رویت خواهد بود.

مهمان
ارسال پست در این تاپیک...

×   شما در حال چسباندن محتوایی با قالب بندی هستید.   حذف قالب بندی

  تنها استفاده از 75 اموجی مجاز می باشد.

×   لینک شما به صورت اتوماتیک جای گذاری شد.   نمایش به صورت لینک

×   محتوای قبلی شما بازگردانی شد.   پاک کردن محتوای ویرایشگر

×   شما مستقیما نمی توانید تصویر خود را قرار دهید. یا آن را اینجا بارگذاری کنید یا از یک URL قرار دهید.

 اشتراک گذاری

×
  • اضافه کردن...