معماري Ampere انويديا براي پردازنده‌هاي گرافيكي معرفي شد

جمعه ۲۶ ارديبهشت ۱۳۹۹ - ۱۹:۳۰
مطالعه 11 دقيقه
مرجع متخصصين ايران
انويديا پس از مدت‌ها انتظار سرانجام روز گذشته از معماري امپر (Ampere) براي نسل بعدي پردازنده‌ي گرافيكي خود پرده‌برداري كرد.
تبليغات

انويديا از مدت‌ها پيش اعلام كرده بود كه قصد دارد در جريان برگزاري مراسم GTC 2020 خبري مهم در رابطه‌با پردازنده‌هاي گرافيكي نسل بعد خود اعلام كند. كنفرانس GTC 2020 درنهايت توسط جن‌سون هوانگ، مديرعامل انويديا برگزار شد و در اين همايش شاهد معرفي رسمي معماري امپر براي كارت‌هاي گرافيكي بوديم. انويديا در جريان برگزاري مراسم روز گذشته، قدرتمندترين پردازنده‌ي گرافيكي خود تا به‌امروز را معرفي كرد؛ پردازنده‌اي گرافيكي كه مبتني‌بر ليتوگرافي ۷ نانومتري است و در دسته‌ي امپر جاي مي‌گيرد.

انويديا مي‌گويد GA100 نخستين پردازنده‌ي گرافيكي است كه از معماري امپر استفاده مي‌كند؛ GA100 را مي‌توان بزرگ‌ترين پردازنده‌ي گرافيكي به‌حساب آورد كه با استفاده از ليتوگرافي ۷ نانومتري انقلابي TSMC ساخته مي‌شود. در ادامه تلاش مي‌كنيم نگاهي عميق به معماري امپر انويديا و به‌خصوص كارت گرافيك ۷ نانومتري GA100 بياندازيم و مشخصات متخصص آن را موردمطالعه قرار دهيم. 

طبق اعلام رسمي، Ampere GA100 با فاصله‌ي زياد نسبت‌به رقبا بزرگ‌ترين پردازنده‌ي گرافيكي ۷ نانومتري ساخته‌شده در تاريخ به‌شمار مي‌آيد. اين كارت گرافيك به‌صورت ويژه براي بازار محصولات رايانشي قدرتمند (HPC) نظير سرورها، حافظه‌هاي ذخيره‌سازي عمده و موارد مشابه ساخته شده است. از GA100 براي اهدافي نظير تحقيقات علمي، هوش مصنوعي، شبكه‌‌هاي عصبي عميق و AI Inferencing استفاده خواهد شد. 

مرجع متخصصين ايران انويديا امپر / Nvidia Ampere

پردازنده‌ي گرافيكي NVIDIA Ampere GA100 قرار است در چندين فرم فاكتور در دسترس قرار گيرد؛ از كارت‌هاي يگانه‌ي Mezzanine Modular گرفته تا كارت‌هاي PCIe 4.0. همچنين پردازنده‌ي گرافيكي موردمباحثه در چندين پيكربندي توليد خواهد شد، بااين‌حال آنچه انويديا مانوري ويژه روي آن داده پيكربندي Tesla A100 است كه در سيستم‌هاي DGX A100 و HGX A100 مورداستفاده قرار مي‌گيرد. 

Ampere GA100 بزرگ‌‌جثه‌ترين پردازنده‌ي گرافيكي ۷ نانومتري دنيا است

وقتي موضوعِ مباحثه به مشخصات هسته‌هاي پردازشي Ampere GA100 مي‌رسد، اين كارت گرافيك جديد در نقش هيولايي بي‌شاخ‌و‌دم ظاهر مي‌شود. با درانديشه متخصصينگرفتن اينكه Ampere GA100 مساحت Die معادل ۸۲۶ ميلي‌مترمربع (mm۲) دارد، بايد انتظار قدرت پردازشي بسيار بالايي را از آن داشته باشيم، به‌خصوص با دانستن اين حقيقت كه پردازنده‌ي موردمباحثه مساحت Die بيشتري نسبت‌به Volta GV100 دارد. طبق مشخصات رسمي، مساحت پردازنده‌ي گرافيكي Volta GV100 به ۸۱۵mm۲ مي‌رسد.

پردازنده‌ي گرافيكي جديد انويديا نسبت‌به مدل پيشين خود بيش از دو برابر ترانزيستور بيشتري دارد و شمار كل ترانزيستورهاي آن به ۵۴ ميليارد عدد رسيده است؛ درحالي كه نسل پيش اين پردازنده از ۲۱/۱ ميليارد ترانزيستور استفاده مي‌كرد. اين ميزان پيشرفت در نگاه اول تحسين‌برانگيز است و نشان مي‌دهد كه Ampere GA100 قرار است قدرت پردازشي بسيار زيادي را ارائه دهد. با درانديشه متخصصينگرفتن اندازه‌ي Die و شمار ترانزيستورها مي‌توان با اطمينان از GA100 به‌عنوان چگال‌ترين پردازنده‌ي گرافيكي تاريخ ياد كرد. 

براساس اعلام رسمي، مشخصات كليدي پردازنده‌ي گرافيكي NVIDIA Ampere GA100 شامل موارد زير هستند:

  • هشت واحد GPC (كلاستر پردازشي گرافيكي)، هشت واحد TPS/GPC، دو واحد SM/TPC، شانزده واحد SM/GPC و ۱۲۸ واحد SM به‌ازاي كل قدرت پردازشي پردازنده
  • ۶۴ هسته‌ي كوداي FP32 به‌ازاي هر واحد SM، درمجموع ۸٬۱۹۲ هسته‌ي كوداي FP32 به‌ازاي كل قدرت پردازشي پردازنده
  • ۴ هسته‌ي تنسور نسل سوم به‌ازاي هر واحد SM، درمجموع ۵۱۲ هسته‌ي تنسور نسل سوم به‌ازاي كل قدرت پردازشي پردازنده
  • ۶ بسته‌ي HBM2 معادل ۱۲ عدد كنترلر حافظه‌ي ۵۱۲ بيت
مرجع متخصصين ايران انويديا امپر / Nvidia Ampere

از طرفي نسخه‌ي ويژه‌ي پردازنده‌ي گرافيكي موردمباحثه را با نام A100 داريم كه ظاهرا از هسته‌هاي تنسور استفاده مي‌كند و مشخصات آن به‌شرح زير است:

  • هفت واحد GPC، هفت يا هشت واحد TPC/GPC، دو واحد SM/TPC، حداكثر ۱۶ واحد SM/GPC و ۱۰۸ واحد SM
  • ۶۴ هسته‌ي كوداي FP32 به‌ازاي هر واحد SM، درمجموع ۶٬۹۱۲ هسته‌ي كوداي FP32 به‌ازاي كل قدرت پردازشي پردازنده
  • ۴ هسته‌ي تنسور نسل سوم به‌ازاي هر واحد SM، درمجموع ۴۳۲ هسته‌ي تنسور نسل سوم به‌ازاي كل قدرت پردازشي پردازنده
  • ۵ بسته‌ي HBM2 معادل ۱۰ عدد كنترلر حافظه‌ي ۵۱۲ بيت

پردازنده‌ي گرافيكي Tesla A100 نسبت‌به مدل GA100 قدرت پردازشي به‌نسبت كمتري دارد، زيرا از نسخه‌ي اوليه‌ي ليتوگرافي ۷ نانومتري بهره مي‌گيرد؛ بااين‌حال اين موضوع به‌معني ضعف آن نيست. تسلا A100 همچنان قدرت پردازشي بسيار بالايي دارد، به‌خصوص با درانديشه متخصصينگرفتن اندازه‌ي اين پردازنده‌ي گرافيكي (انويديا به‌طور معمول از چنينن پردازنده‌هايي با نام اَبَر GPU يا SUPER GPU ياد مي‌كند). 

پردازنده‌ي گرافيكي Ampere GA100 ميزبان بيش از ۵۴ ميليارد ترانزيستور است

طبق اطلاعات رسمي منتشرشده از سوي انويديا، نسخه‌ي كامل پردازنده‌ي گرافيكي NVIDIA Ampere GA100 مجهز به ۱۲۸ واحد SM (چندپردازنده‌‌هاي جرياني) است و ۸٬۱۹۲ هسته‌ي كودا (CUDA) دارد. اين اعداد نشان مي‌دهند Ampere GA100 نخستين پردازنده‌ي گرافيكي دنيا است كه اين حجم از هسته‌هاي كودا را روي يك Die جاي مي‌دهد.

آن‌طور كه انويديا مي‌گويد پردازنده‌ي موردمباحثه ۸٬۱۹۲ هسته‌ي سري FP32 دارد، از ۴٬۰۹۶ هسته‌ي FP64 بهره مي‌برد و به ۵۱۲ هسته‌ي تنسور مجهز شده است. اين پردازنده‌ي گرافيكي مجهزبه ۸ كلاستر پردازشي گرافيكي است كه هر يك از آن‌ها شامل ۱۶ واحد SM و ۸ واحد TPC مي‌شوند. مدل Tesla A100 پردازنده‌ي گرافيكي قدرتمند انويديا داراي توان طراحي حرارتي (TDP) معادل ۴۰۰ وات است. 

انويديا مي‌گويد پردازنده‌ي گرافيكي A100 از لحاظ طراحي متخصص، محصولي انقلابي به‌حساب مي‌آيد و پنج ويژگي كليدي دارد. ويژگي اول، همان معماري امپر است. امپر در قلب تپنده‌ي پردازنده‌ي A100 جاي دارد و باعث شده اين پردازنده بتواند ميزبان بيش از ۵۴ ميليارد ترانزيستور باشد. بهره‌مندي از چنين تعدادي از ترانزيستور، پردازنده‌ي گرافيكي A100 را به بزرگ‌ترين پردازنده‌ي ۷ نانومتري دنيا تبديل مي‌كند. ويژگي كليدي دوم پردازنده به بهره‌مندي آن از هسته‌هاي تنسور نسل سوم TF32 بازمي‌گردد.

مقايسه‌ي پردازنده‌ي گرافيكي Tesla A100 امپر با نسل‌هاي گذشته

پارامتر / نام پردازنده‌ي گرافيكي

Tesla K40

(PCI-Express)

Tesla M40

(PCI-Express)

Tesla P100

(PCI-Express)

(Tesla P100 (SXM2

(Tesla V100 (SXM2

(Tesla V100S (PCIe

(Tesla A100 (SXM4

واحد پردازش گرافيكي (GPU)

GK110 (معماري كپلر)

GM200 (معماري مكس‌ول)

GP100 (معماري پاسكال)

GP100 (معماري پاسكال)

GV100 (معماري وُلتا)

GV100 (معماري وُلتا)

GA100 (معماري امپر)

ليتوگرافي (نود پردازشي)

۲۸ نانومتري

۲۸ نانومتري

۱۶ نانومتري

۱۶ نانومتري

۱۲ نانومتري

۱۲ نانومتري

۷ نانومتري

شمار ترانزيستورها

۷/۱ ميليارد

۸ ميليارد

۱۵/۳ ميليارد

۱۵/۳ ميليارد

۲۱/۱ ميليارد

۲۱/۱ ميليارد

۵۴/۲ ميليارد

اندازه‌ي Die واحد پردازش گرافيكي

۵۵۱ ميلي‌متر مربع

۶۰۱ ميلي‌متر مربع

۶۱۰ ميلي‌متر مربع

۶۱۰ ميلي‌متر مربع

۸۱۵ ميلي‌متر مربع

۸۱۵ ميلي‌متر مربع

۸۲۶ ميلي‌متر مربع

شمار واحدهاي SM

۱۵

۲۴

۵۶

۵۶

۸۰

۸۰

۱۰۸

شمار واحدهاي TPC

۱۵

۲۴

۲۸

۲۸

۴۰

۴۰

۵۴

شمار هسته‌هاي كوداي FP32 به‌ازاي هر واحد SM

۱۹۲

۱۲۸

۶۴

۶۴

۶۴

۶۴

۶۴

شمار هسته‌هاي كوداي FP64 به‌ازاي هر واحد SM

۶۴

۴

۳۲

۳۲

۳۲

۳۲

۳۲

شمار كل هسته‌هاي كوداي FP32 

۲٬۸۸۰

۳٬۰۷۲

۳٬۵۸۴

۳٬۵۸۴

۵٬۱۲۰

۵٬۱۲۰

۶٬۹۱۲

شمار كل هسته‌‌هاي كوداي FP64

۹۶۰

۹۶

۱٬۷۹۲

۱٬۷۹۲

۲٬۵۶۰

۲٬۵۶۰

۳٬۴۵۶

شمار هسته‌هاي تنسور

-

-

-

-

۶۴۰

۶۴۰

۴۳۲

شمار واحدهاي بافتي

۲۴۰

۱۹۲

۲۲۴

۲۲۴

۳۲۰

۳۲۰

۴۳۲

سرعت كلاك پايه

۷۴۵ مگاهرتز

۹۴۸ مگاهرتز

۱٬۱۹۰ مگاهرتز

۱٬۳۲۸ مگاهرتز

۱٬۲۹۷ مگاهرتز

نامشخص

نامشخص

سرعت كلاك تقويت‌شده (بوست)

۸۷۵ مگاهرتز

۱٬۱۱۴ مگاهرتز

۱٬۳۲۹ مگاهرتز

۱٬۴۸۰ مگاهرتز

۱٬۵۳۰ مگاهرتز

۱٬۶۰۱ مگاهرتز

۱٬۴۱۰ مگاهرتز

شمار واحدهاي تاپس (DNN/AI)

-

-

-

-

۱۲۵ تاپس

۱۳۰ تاپس

۱٬۲۴۸ تاپس (يا ۲٬۴۹۶ تاپس با Sparsity)

قدرت پردازشي FP16 

-

-

۱۸/۷ فلاپس

۲۱/۲ فلاپس

۳۰/۴ فلاپس

۳۲/۸ فلاپس

۳۱۲ فلاپس (يا ۶۲۴ فلاپس با Sparsity)

قدرت پردازشي FP32 

۵/۰۴ ترافلاپس

۶/۸ ترافلاپس

۱۰ ترافلاپس

۱۰/۶ ترافلاپس

۱۵/۷ ترافلاپس

۱۶/۴ ترافلاپس

۱۹/۵ ترافلاپس در حالت استاندارد و ۱۵۶ ترافلاپس تحت شرايط خاص

قدرت پردازشي FP64 

۱/۶۸ ترافلاپس

۰/۲ ترافلاپس

۴/۷ ترافلاپس

۵/۳ ترافلاپس

۷/۸ ترافلاپس

۸/۲ ترافلاپس

۹/۷ ترافلاپس در حالت استاندارد و ۱۹/۵ ترافلاپس تحت شرايط خاص

رابط حافظه

۳۸۴ بيت GDDR5

۳۸۴ بيت GDDR5

۴٬۰۹۶ بيت HBM2

۴٬۰۹۶ بيت HBM2

۴٬۰۹۶ بيت HBM2

۴٬۰۹۶ بيت HBM2

۶٬۱۴۴ بيت HBM2e

ظرفيت حافظه

۱۲ گيگابايت GDDR5 با پهناي باند ۲۸۸ گيگابيت‌بر‌ثانيه

۲۴ گيگابايت GDDR5 با پهناي باند ۲۸۸ گيگابيت‌بر‌ثانيه

۱۶ گيگابايت HBM2 با پهناي باند ۷۳۲ گيگابيت‌بر‌ثانيه يا ۱۲ گيگابايت HB2 با پهناي باند ۵۴۹ گيگابيت‌بر‌ثانيه

۱۶ گيگابايت HBM2 با پهناي باند ۷۳۲ گيگابيت‌بر‌ثانيه

۱۶ گيگابايت HBM2 با پهناي باند ۹۰۰ گيگابيت‌بر‌ثانيه

۱۶ گيگابايت HBM2 با پهناي باند ۱٬۱۳۴ گيگابيت‌بر‌ثانيه

۴۰ گيگابايت HBM2 با پهناي باند ۱/۶ ترابيت‌بر‌ثانيه

اندازه‌ي حافظه‌ي كش L2

۱٬۵۳۶ كيلوبايت

۳٬۰۷۲ كيلوبايت

۴٬۰۹۶ كيلوبايت

۴٬۰۹۶ كيلوبايت

۶٬۱۴۴ كيلوبايت

۶٬۱۴۴ كيلوبايت

۴۰٬۹۶۰ كيلوبايت

توان طراحي حرارتي (TDP)

۲۳۵ وات

۲۵۰ وات

۲۵۰ وات

۳۰۰ وات

۳۰۰ وات

۲۵۰ وات

۴۰۰ وات

هسته‌هاي سري تنسور كه به‌شكلي گسترده مورداستفاده قرار گرفته‌اند اكنون سرعت پردازشي بيشتري دارند و استفاده از آن‌ها راحت‌تر است. امروزه هسته‌هاي تنسور نسل سوم TF32 مي‌توانند در حوزه‌ي هوش مصنوعي ۲۰ درصد عملكردي بهتر نسبت‌به نسل‌هاي گذشته از خود نشان دهند. ناگفته نماند كه هسته‌هاي تنسور اكنون از FP64 نيز همراهي مي‌كنند. بهره‌مندي از FP64 باعث مي‌شود اين هسته‌ها بتوانند هنگام انجام پردازش‌هاي مربوط‌به بازار HPC به‌ميزان ۲/۵ برابر قدرت رايانشي بيشتري ارائه دهند.

ويژگي كليدي سوم پردازنده‌ي انويديا بهره‌مندي از قابليت متخصص MIG است. به‌لطف MIG، پردازنده‌ي A100 به هفت قسمت تقسيم مي‌شود تا بتواند براي اهداف مختلف، قدرت پردازشي متنوعي را ارائه دهد. بدين ترتيب A100 مي‌تواند تشخيص دهد كه براي انجام وظيفه‌اي خاص بايد چه‌ميزان قدرت رايانشي ارائه شود. MIG باعث مي‌شود ميزان بهينه‌سازي پردازنده به حداكثر برسد و بازده آن بالا رود. انويديا از NVLink به‌عنوان ويژگي كليدي چهارم پردازنده‌ي گرافيكي A100 ياد مي‌كند. همچينن طبق گفته‌ي انويديا ساخته‌شدن پردازنده‌ي جديد با اتكا بر تكنيك Structural Sparsity پنجمين ويژگي كليدي آن است.

انويديا پردازنده‌ي گرافيكي Ampere GA100 را در چندين مدل با مشخصات مختلف توليد مي‌كند

ديگر مشخصات مهم پردازنده‌ي NVIDIA Ampere GA100 شامل بهره‌مندي آن از رابط حافظه‌ي ۶٬۱۴۴ بيت است كه شامل حداكثر ۴۸ گيگابايت حافظه‌ي HBM2e در ۶ بسته‌ي HBM2 مي‌شود؛ اين بسته‌ها به‌صورت پراكنده در اطراف Die پردازنده‌ي گرافيكي جاي گرفته‌اند. هر يك از بسته‌هاي موردمباحثه به‌ازاي هر داي داراي ۲ گيگابايت حافظه‌ي گرافيكي (VRAM) هستند؛ بنابراين براي دستيابي به ۴۸ گيگابايت حافظه به بسته‌هاي 4Hi نياز پيدا خواهيد كرد. هر بسته‌ي 4Hi توانايي جاي دادن ۸ گيگابايت حافظه را در خود دارد؛‌ بنابراين ۶ بسته‌ي 4Hi در كنار هم مي‌توانند ۴۸ گيگابايت حافظه‌ي گرافيكي را ارائه دهند كه عددي بسيار درخورتوجه است. ظاهرا حافظه‌ي پردازنده مي‌تواند پهناي باند حدودا ۱/۶ ترابيت‌بر‌ثانيه را ارائه دهد.

پردازنده‌ي گرافيكي امپر انويديا قرار است داراي چندين پيكربندي براي حافظه‌ي HBM باشد، بااين‌حال به‌طور كلي حافظه‌ي ارائه‌شده نهايتا ۴۸ گيگابايت خواهد بود؛ مگر اينكه انويديا بخواهد در آينده پيكربندي‌هاي ديگري را با بسته‌هاي 6Hi يا حتي 8Hi ارائه دهد كه به‌ترتيب مي‌توانند سقف حافظه را به ۷۲ و ۹۶ گيگابايت ارتقاء دهند. پردازنده‌ي گرافيكي Tesla V100S انويديا دوبرابر ظرفيت حافظه‌ي HBM بيشتر نسبت‌به Tesla V100 دارد و ظرفيت آن به ۳۲ گيگابايت مي‌رسد. با درانديشه متخصصينگرفتن همين موضوع احتمال مي‌دهيم انويديا بخواهد چنين رويكردي را براي يكي ديگر از مدل‌هاي آينده‌ي Tesla A100 تكرار كند. 

تصوير زير، طرح بلوك‌هاي پردازنده‌ي گرافيكي NVIDIA Ampere GA100 را نشان مي‌دهد:

براي مشاهده‌ي تصوير بالا در ابعاد اصلي روي آن كليك كنيد

به‌علاوه در تصوير زير مي‌توانيد نظاره‌گر طرح بلوك‌هاي SM پردازنده‌ي NVIDIA Ampere GA100 باشيد:

براي مشاهده‌ي تصوير بالا در ابعاد اصلي روي آن كليك كنيد

پس از مطالعه دقيق مشخصات متخصص نسخه‌ي كامل پردازنده‌ي گرافيكي جديد انويديا، بهتر است به بيان برخي نكات درمورد شتاب‌دهنده‌ي گرافيكي Tesla A100 نيز بپردازيم. Tesla A100 نسخه‌ي ضعيف‌تر Ampere GA100 به‌حساب مي‌آيد و به ۱۰۸ واحد SM مجهز شده است. اين پردازنده‌ي گرافيكي ۶٬۹۱۲ هسته‌ي FP32 به‌همراه ۳٬۴۵۶ هسته‌ي FP64 و ۴۳۲ هسته‌ي تنسور دارد. طبق اطلاعات رسمي، Tesla A100 داراي رابط باس ۵٬۱۲۰ بيت است و حداكثر ظرفيت حافظه‌ي گرافيكي HBM2 آن به ۴۰ گيگابايت مي‌رسد. اين پردازنده‌ي گرافيكي از برخي جوانب جلب ‌توجه مي‌كند. خصوصا به‌ اين دليل كه استفاده از ۴۰ گيگابايت حافظه‌ي HBM2 به‌معني استفاده از بسته‌هاي 5Hi خواهد بود كه البته چنين اتفاقي دور از انتظار به‌انديشه متخصصين مي‌رسد. به‌جاي آن، احتمال مي‌دهيم پردازنده‌ي موردمباحثه به بسته‌هاي 6Hi با تراشه‌ي DRAM ناقص روي هر بسته، مجهز شده باشد. 

NVIDIA Ampere Tesla A100 داراي توان طراحي حرارتي ۴۰۰ وات است

آن‌طور كه انويديا مي‌گويد پردازنده‌ي NVIDIA Ampere Tesla A100 داراي توان طراحي حرارتي ۴۰۰ وات است؛ يعني ۱۰۰ وات بيشتر از مدل Tesla V100 Mezzanine. مدل PCIe پردازنده از توان طراحي حرارتي ۳۰۰ وات استفاده مي‌كند، بااين‌حال نسبت‌به مدل مزانين (Mezzanine) سرعت كلاك پايين‌تري دارد. مدل Mezzanine ازطريق سوئيچ‌هاي جديد NVLINK، داراي رابط GPU به GPU است. ازطرفي مدل PCIe را داريم كه از سوئيچ ملناكس (Mellanox) به‌همراه دو رابط NVLINK نسل جديد و دو درگاه EDR استفاده مي‌كند. 

در زمينه‌ي عملكرد پردازشي، NVIDIA Ampere GA100 قدرت يك Peta-OP را ارائه مي‌دهد كه به‌ميزان ۲۰ برابر بيشتر از قدرت ارائه‌شده توسط Volta GV100 است. همچنين طبق گفته‌ي انويديا پردازنده‌ي Ampere GA100 نسبت‌به Volta GV100 تا ۲٫۵ برابر عملكردي بهتر در زمينه‌ي پردازش فرمت نقطه شناور دقت دوگانه (Double-Precision Floating-Point Format) از خود برجاي مي‌گذارد كه احتمالا به قدرت پردازشي حدودا ۱۹٫۵ ترافلاپس FP64 منتهي مي‌شود؛ به‌خصوص با درانديشه متخصصينگرفتن اين حقيقت كه قدرت پردازشي پردازنده‌ي Volta به حدود ۸ ترافلاپس FP64 مي‌رسد. اين موضوع نشان مي‌دهد كه عملكرد پردازنده‌ي جديد در زمينه‌ي پردازش فرمت نقطه شناور دقت يگانه به حداكثر ۱۵۶ ترافلاپس FP32 مي‌رسد كه براي بازار محصولات HPC عددي ديوانه‌وار است.

پردازند‌ه‌ي Tesla V100 انويديا كه بر پايه‌ي پردازنده‌ي Ampere GA100 ساخته شده است قرار است در سيستم‌هاي DGX A100 و HGX A100 اين شركت مورداستفاده قرار گيرد. سيستم‌هاي DGX به‌صورت مطلق روي تحقيقات مبتني‌بر هوش مصنوعي و همچنين پردازش‌هاي متنوع بازار HPC متكي هستند. از طرفي سيستم‌هاي HGX را داريم كه طبق گفته‌ي انويديا قدرت پردازشي خودشان را روي حوزه‌ي رايانش ابري (Cloud Computing) يا ديتاسنترها متمركز مي‌كنند. سيستم‌هاي موردمباحثه انويديا با نام دقيق DGX-A100 و HGX-A100 شناخته مي‌شوند و نسل سوم سيستم‌هاي DGX و HGX به‌حساب مي‌آيند.

مرجع متخصصين ايران انويديا امپر

شماري از شركاي تجاري انويديا پيش‌تر به‌صورت رسمي اعلام كرده‌اند كه قصد دارند در برخي سرورهاي جديد خود از پردازنده‌هاي جديد انويديا استفاده كنند؛ اين سرورها در دسته‌ي سرورهاي 1U و 2U و 4U و حتي حداكثر 10U جاي مي‌گيرند (توضيحات بيشتر درمورد واحدهاي يادشده را در اين‌جا بخوانيد). براساس اطلاعات رسمي هر يك از اين سرورها مجهزبه حداكثر ۸ تراشه‌ي Tesla A100 مبتني‌بر Ampere GA100 هستند و از لاين‌هاي PCIe Gen 4.0 استفاده مي‌كنند. 

جن‌سون هوانگ چند روز پيش در ويدئويي كوتاه به‌صورت مختصر‌به نسل بعدي سيستم DGX-A100 اشاره كرد كه انويديا به‌زودي به‌صورت كامل از آن پرده‌برداري مي‌كند. ظاهرا نسل بعدي DGX-A100 خواهد توانست به‌لطف بهره‌مندي از ۸ پردازنده‌ي Tesla A100 حداكثر ۵ پتافلاپس قدرت پردازشي ارائه دهد. گفته مي‌شود اين سيستم به‌ميزان ۲۰ برابر سريع‌تر از نسل پيش است كه از پردازنده‌هاي مبتني‌بر معماري Volta استفاده مي‌كرد. سيستم مبتني‌بر امپر DGX-A100 انويديا از روز گذشته با ارزش پايه‌ي ۱۹۹٬۰۰۰ دلار روانه‌ي بازار شده است. 

شما متخصصان اخبار تخصصي، علمي، تكنولوژيكي، فناوري مرجع متخصصين ايران چه انديشه متخصصيناتي درمورد معماري امپر انويديا داريد؟

مشخصات متخصص كامل، بهترين ارزش كارت گرافيك انويديا در فروشگاه‌هاي اينترنتي و مقايسه‌ي محصولات اين شركت با يكديگر و كارت گرافيك هاي AMD را در بخش محصولات اخبار تخصصي، علمي، تكنولوژيكي، فناوري مرجع متخصصين ايران مشاهده كنيد. محصولات متنوعي از سري‌‌ Geforce و محصولات حرفه‌اي Quadro در اين بخش براي خريد و مقايسه در اختيار متخصصان قرار گرفته است. 

تبليغات
جديد‌ترين مطالب روز

هم انديشي ها

تبليغات

با چشم باز خريد كنيد
اخبار تخصصي، علمي، تكنولوژيكي، فناوري مرجع متخصصين ايران شما را براي انتخاب بهتر و خريد ارزان‌تر راهنمايي مي‌كند
ورود به بخش محصولات