از لیون کامپیوتر قســـــــــــــــــــــــــــــــــــطی خرید کنید فروش اقساطی برای سراسر ایران
اخبار سخت افزار ، نرم افزار ، بازی و دنیای آیتی در مجله لیون کامپیوتر 🤩
جستجو در تالارهای گفتگو
در حال نمایش نتایج برای برچسب های 'hpc'.
2 نتیجه پیدا شد
-
مشاهدهی عکس بالا در کیفیت اصلی معماری مورد انتظار شرکت Nvidia، یعنی معماری پاسکال، در عرصهی پردازشهای سنگین پیکسلی، برای خود هیولایی خواهد بود. این معماری برای اولین بار در مراسم GTC 2016 و در قالب کارتگرافیک Tesla P100 دیده شد و هماکنون نیز، طرح بلاک این معماری در دستان ما افتاده است. برای شروع، سیلیکون GP100 یک ماژول چند چیپی (مولتی چیپ)، مانند چیپ Fiji شرکت AMD است که از یک قالب جیپییو بزرگ، چهار دسته حافظه و یک رابط مسیریاب الکتریکی برای سیلیکون که بعنوان یک زیرلایه برای جیپییو و حافظهها عمل میکند و باعث اتصال رشتههای میکروسکوپی به این دو قطعه مهم میشود، تشکیل شده است. سیلیکون GP100 به حافظههای پرسرعت HBM2 با پهنای 4096 بیت و پهنای باند 1 ترابایت بر ثانیه مجهز گشته است. کارتگرافیک Tesla P100 از همین حافظهها، منتهی با پهنای باند کاهش یافتهی 720 گیگابایت بر ثانیه استفاده میکند. سیلیکون GP100 از سلسله مراتب پیچیده و سطح بالایی بهرهمند شده و ساختمان و اسکلتی به مراتب شبیه سایر جیپییوهای شرکت Nvidia دارد، ولی در دو مورد کلیدی با سایرین تفاوت دارد: باس و حافظه. یک رابط نسل سوم PCI-Express x16، این جیپییو را به سیستم شما مرتبط میکند. موتور GigaThread پردازش را بین شش اتاقک پردازش گرافیکی (GPC) توزیع میکند. هشت کنترلر حافظه، رابط پرسرعت 4096 بیتی HBM2 را میسازند و قطعهی "High-speed Hub" نیز چهار درگاه پرسرعت NVLink را به بیرون میفرستد. متأسفانه هنوز مشخص نشده است که درگاههای NVLink هرکدام دارای سرعت 80 گیگابایت بر ثانیه هستند، یا هرچهار درگاه با هم این سرعت را دارند. همانطور که قبلاََ اشاره شد، سیلیکون GP100 از شش اتاقک پردازش گرافیکی برخوردار شده است. این شش اتاقک پردازشی کاملاََ مستقل هستند و زیرمجموعهی این جیپییو میباشند. آنها همچنین دارای ابتدا و انتهای رندر اختصاصی خود هستند. با معماری پاسکال، حداقل در سیلیکون GP100، هر اتاقک GPC دارای واحدهای چندین پردازشگر سایهزن (SM) هستند و هرکدام از این SMها خود دارای 64 هستهی پردارشی CUDA میباشند. بنابراین در مجموع، سیلیکون GP100 خانهی 3,840 هستهی CUDA است. از دیگر مشخصات اساسی کارتگرافیک Tesla P100، میتوان به 240 واحد TMU یا نقشهبردار بافت، 56 اتاقک فعال GPC (بجای 60 اتاقک) و در مجموع 3584 هستهی CUDA اشاره کرد. مشاهدهی عکس بالا در کیفیت اصلی بهنظر میرسد که معماری پاسکال در ارائهی سرعت کلاک بالا، کمک شایانی کند. کارتگرافیک Tesla P100، برخلاف اینکه یک محصول شرکتی است و استفادهی معمولی ندارد، از سرعت کلاک 1328 مگاهرتز بهره میبرد که این سرعت با فعال شدن GPU Boost به 1480 مگاهرتز نیز میرسد! این شرایط در حالی است که توان خروجی کارتگرافیک به 300 وات میرسد. این موارد ممکن است شما را بترساند، اما باید این را هم بهیاد داشته باشید که دستههای حافظه به بستهی جیپییو انتقال یافتهاند و هیتسینک نیز با آنها در تماس بوده و در نتیحه باید با تمام گرمای ایجاد شده توسط قالب جیپییو و دستههای حافظه دست و پنجه نرم کند که در نهایت امر، بر ماژول مولتی چیپ مورد بحث، گرمای شدیدی حکمفرما خواهد شد. در نهایت، نوبت به درگاه NVLink میرسد. این متصلکنندهی داخلی که دستاورد بومی شرکت Nvidia است، موجب میشود تا کارتگرافیکهای چندگانه (مولتی جیپییو ستاپ)، همانند یک سیستم چند سوکته مدرن (چندین پردازنده بصورت همزمان در یک سیستم) کار کنند. در این شیوه، لینکهای QPI (شرکت اینتل) یا HyperTransport (شرکت AMD) بزرگراههای ارتباطی را بین سوکتهای همسایه ارائه میدهند. هر درگاه NVLink سرعتی حدود 80 گیگابایت بر ثانیه را در اختیار دارد و امر مجازی سازی واقعی حافظه را بین چندین جیپییو ممکن میکند. این قابلیت میتواند در سیستمهای شتاب دهنده HPC GPU توانایی خود را به رخ بکشد که در آن، یک جیپییو میتواند به حافظههای کنترل شده توسط جیپییو همسایه دسترسی داشته باشد که در نهایت، نرمافزار نیز مجموع حافظههای موجود در هردو جیپییو را بعنوان یک بلاک مشترک و پیوسته تشخیص و نمایش خواهد داد. سیستم متحد حافظه Nvidia به مدلهای برنامه نویسی شده مثل CUDA 8 حافظهی بیشتر از حد انتظار و بیشتر از حد توان یک GPU که بتواند آنرا کنترل کند را در دسترس قرار میدهد و در نهایت، حافظهی سیستم را افزایش میدهد. منبع: techpowerup مترجم: مجتبی حیدرزاده
-
AMD به تازگی از یک نمونه قدرتمندتر پردازنده کلاس سرور به نام Epyc 7H12 رونمایی کرد که در اصل مدل ارتقاء یافته 7742با فرکانس پایه بالاترو تعداد 64 هسته پردازشی به شمار میرود.با توجه به افزایش فرکانس پایه از 2.25 به 2.6 گیگاهرتز ، توان حرارتی SKU جدید از 225 وات TDP به 280 وات رسیده است.این پردازنده چهارمین عضو خانواه Epyc ها در کلاس سرور به شمار میرود که با 64 هسته پردازشی همراه میشود. تعداد 64 هسته با 128 رشته پردازشی در فرکانس پایه 2.6 و بوست فرکانس 3.3 گیگاهرتزی با توان حرارتی 280 واتی ، به طور ویژه مناسب کاربران HPC و بارهای کاری فوق سنگین طراحی شده است.این پردازنده تحت خنک سازی مایع ، میتواند عملکرد قابل توجهی را در عملیات های سنگین محاسباتی به ارمغان آورد.مدل جدید حدود 100 مگاهرتزاز فرکانس افزایشی آن کاسته شده ، با این حال با توجه به حجم کاری بالای سرورها و به دلیل برخورداری از فرکانس پایه بالاتر ، میزان عملکرد به میزان قابل توجهی بهبود یافته است.پردازشگر AMD EPYC 7H12 در تست های ATOS بر روی BullSequana XH2000 ، توانسته با میانگین قدرت پردازشی 4.2 ترافلاپس ، حدود 11 درصد بهتر از مدل AMD EPYC 7742 ظاهر شود. منبع : Guru3d مترجم : محمد فتحی