معماري Ampere انويديا براي پردازندههاي گرافيكي معرفي شد
انويديا از مدتها پيش اعلام كرده بود كه قصد دارد در جريان برگزاري مراسم GTC 2020 خبري مهم در رابطهبا پردازندههاي گرافيكي نسل بعد خود اعلام كند. كنفرانس GTC 2020 درنهايت توسط جنسون هوانگ، مديرعامل انويديا برگزار شد و در اين همايش شاهد معرفي رسمي معماري امپر براي كارتهاي گرافيكي بوديم. انويديا در جريان برگزاري مراسم روز گذشته، قدرتمندترين پردازندهي گرافيكي خود تا بهامروز را معرفي كرد؛ پردازندهاي گرافيكي كه مبتنيبر ليتوگرافي ۷ نانومتري است و در دستهي امپر جاي ميگيرد.
انويديا ميگويد GA100 نخستين پردازندهي گرافيكي است كه از معماري امپر استفاده ميكند؛ GA100 را ميتوان بزرگترين پردازندهي گرافيكي بهحساب آورد كه با استفاده از ليتوگرافي ۷ نانومتري انقلابي TSMC ساخته ميشود. در ادامه تلاش ميكنيم نگاهي عميق به معماري امپر انويديا و بهخصوص كارت گرافيك ۷ نانومتري GA100 بياندازيم و مشخصات متخصص آن را موردمطالعه قرار دهيم.
طبق اعلام رسمي، Ampere GA100 با فاصلهي زياد نسبتبه رقبا بزرگترين پردازندهي گرافيكي ۷ نانومتري ساختهشده در تاريخ بهشمار ميآيد. اين كارت گرافيك بهصورت ويژه براي بازار محصولات رايانشي قدرتمند (HPC) نظير سرورها، حافظههاي ذخيرهسازي عمده و موارد مشابه ساخته شده است. از GA100 براي اهدافي نظير تحقيقات علمي، هوش مصنوعي، شبكههاي عصبي عميق و AI Inferencing استفاده خواهد شد.
پردازندهي گرافيكي NVIDIA Ampere GA100 قرار است در چندين فرم فاكتور در دسترس قرار گيرد؛ از كارتهاي يگانهي Mezzanine Modular گرفته تا كارتهاي PCIe 4.0. همچنين پردازندهي گرافيكي موردمباحثه در چندين پيكربندي توليد خواهد شد، بااينحال آنچه انويديا مانوري ويژه روي آن داده پيكربندي Tesla A100 است كه در سيستمهاي DGX A100 و HGX A100 مورداستفاده قرار ميگيرد.
Ampere GA100 بزرگجثهترين پردازندهي گرافيكي ۷ نانومتري دنيا است
وقتي موضوعِ مباحثه به مشخصات هستههاي پردازشي Ampere GA100 ميرسد، اين كارت گرافيك جديد در نقش هيولايي بيشاخودم ظاهر ميشود. با درانديشه متخصصينگرفتن اينكه Ampere GA100 مساحت Die معادل ۸۲۶ ميليمترمربع (mm۲) دارد، بايد انتظار قدرت پردازشي بسيار بالايي را از آن داشته باشيم، بهخصوص با دانستن اين حقيقت كه پردازندهي موردمباحثه مساحت Die بيشتري نسبتبه Volta GV100 دارد. طبق مشخصات رسمي، مساحت پردازندهي گرافيكي Volta GV100 به ۸۱۵mm۲ ميرسد.
پردازندهي گرافيكي جديد انويديا نسبتبه مدل پيشين خود بيش از دو برابر ترانزيستور بيشتري دارد و شمار كل ترانزيستورهاي آن به ۵۴ ميليارد عدد رسيده است؛ درحالي كه نسل پيش اين پردازنده از ۲۱/۱ ميليارد ترانزيستور استفاده ميكرد. اين ميزان پيشرفت در نگاه اول تحسينبرانگيز است و نشان ميدهد كه Ampere GA100 قرار است قدرت پردازشي بسيار زيادي را ارائه دهد. با درانديشه متخصصينگرفتن اندازهي Die و شمار ترانزيستورها ميتوان با اطمينان از GA100 بهعنوان چگالترين پردازندهي گرافيكي تاريخ ياد كرد.
براساس اعلام رسمي، مشخصات كليدي پردازندهي گرافيكي NVIDIA Ampere GA100 شامل موارد زير هستند:
- هشت واحد GPC (كلاستر پردازشي گرافيكي)، هشت واحد TPS/GPC، دو واحد SM/TPC، شانزده واحد SM/GPC و ۱۲۸ واحد SM بهازاي كل قدرت پردازشي پردازنده
- ۶۴ هستهي كوداي FP32 بهازاي هر واحد SM، درمجموع ۸٬۱۹۲ هستهي كوداي FP32 بهازاي كل قدرت پردازشي پردازنده
- ۴ هستهي تنسور نسل سوم بهازاي هر واحد SM، درمجموع ۵۱۲ هستهي تنسور نسل سوم بهازاي كل قدرت پردازشي پردازنده
- ۶ بستهي HBM2 معادل ۱۲ عدد كنترلر حافظهي ۵۱۲ بيت
از طرفي نسخهي ويژهي پردازندهي گرافيكي موردمباحثه را با نام A100 داريم كه ظاهرا از هستههاي تنسور استفاده ميكند و مشخصات آن بهشرح زير است:
- هفت واحد GPC، هفت يا هشت واحد TPC/GPC، دو واحد SM/TPC، حداكثر ۱۶ واحد SM/GPC و ۱۰۸ واحد SM
- ۶۴ هستهي كوداي FP32 بهازاي هر واحد SM، درمجموع ۶٬۹۱۲ هستهي كوداي FP32 بهازاي كل قدرت پردازشي پردازنده
- ۴ هستهي تنسور نسل سوم بهازاي هر واحد SM، درمجموع ۴۳۲ هستهي تنسور نسل سوم بهازاي كل قدرت پردازشي پردازنده
- ۵ بستهي HBM2 معادل ۱۰ عدد كنترلر حافظهي ۵۱۲ بيت
پردازندهي گرافيكي Tesla A100 نسبتبه مدل GA100 قدرت پردازشي بهنسبت كمتري دارد، زيرا از نسخهي اوليهي ليتوگرافي ۷ نانومتري بهره ميگيرد؛ بااينحال اين موضوع بهمعني ضعف آن نيست. تسلا A100 همچنان قدرت پردازشي بسيار بالايي دارد، بهخصوص با درانديشه متخصصينگرفتن اندازهي اين پردازندهي گرافيكي (انويديا بهطور معمول از چنينن پردازندههايي با نام اَبَر GPU يا SUPER GPU ياد ميكند).
پردازندهي گرافيكي Ampere GA100 ميزبان بيش از ۵۴ ميليارد ترانزيستور است
طبق اطلاعات رسمي منتشرشده از سوي انويديا، نسخهي كامل پردازندهي گرافيكي NVIDIA Ampere GA100 مجهز به ۱۲۸ واحد SM (چندپردازندههاي جرياني) است و ۸٬۱۹۲ هستهي كودا (CUDA) دارد. اين اعداد نشان ميدهند Ampere GA100 نخستين پردازندهي گرافيكي دنيا است كه اين حجم از هستههاي كودا را روي يك Die جاي ميدهد.
آنطور كه انويديا ميگويد پردازندهي موردمباحثه ۸٬۱۹۲ هستهي سري FP32 دارد، از ۴٬۰۹۶ هستهي FP64 بهره ميبرد و به ۵۱۲ هستهي تنسور مجهز شده است. اين پردازندهي گرافيكي مجهزبه ۸ كلاستر پردازشي گرافيكي است كه هر يك از آنها شامل ۱۶ واحد SM و ۸ واحد TPC ميشوند. مدل Tesla A100 پردازندهي گرافيكي قدرتمند انويديا داراي توان طراحي حرارتي (TDP) معادل ۴۰۰ وات است.
انويديا ميگويد پردازندهي گرافيكي A100 از لحاظ طراحي متخصص، محصولي انقلابي بهحساب ميآيد و پنج ويژگي كليدي دارد. ويژگي اول، همان معماري امپر است. امپر در قلب تپندهي پردازندهي A100 جاي دارد و باعث شده اين پردازنده بتواند ميزبان بيش از ۵۴ ميليارد ترانزيستور باشد. بهرهمندي از چنين تعدادي از ترانزيستور، پردازندهي گرافيكي A100 را به بزرگترين پردازندهي ۷ نانومتري دنيا تبديل ميكند. ويژگي كليدي دوم پردازنده به بهرهمندي آن از هستههاي تنسور نسل سوم TF32 بازميگردد.
مقايسهي پردازندهي گرافيكي Tesla A100 امپر با نسلهاي گذشته | |||||||
---|---|---|---|---|---|---|---|
پارامتر / نام پردازندهي گرافيكي | Tesla K40 (PCI-Express) | Tesla M40 (PCI-Express) | Tesla P100 (PCI-Express) | (Tesla P100 (SXM2 | (Tesla V100 (SXM2 | (Tesla V100S (PCIe | (Tesla A100 (SXM4 |
واحد پردازش گرافيكي (GPU) | GK110 (معماري كپلر) | GM200 (معماري مكسول) | GP100 (معماري پاسكال) | GP100 (معماري پاسكال) | GV100 (معماري وُلتا) | GV100 (معماري وُلتا) | GA100 (معماري امپر) |
ليتوگرافي (نود پردازشي) | ۲۸ نانومتري | ۲۸ نانومتري | ۱۶ نانومتري | ۱۶ نانومتري | ۱۲ نانومتري | ۱۲ نانومتري | ۷ نانومتري |
شمار ترانزيستورها | ۷/۱ ميليارد | ۸ ميليارد | ۱۵/۳ ميليارد | ۱۵/۳ ميليارد | ۲۱/۱ ميليارد | ۲۱/۱ ميليارد | ۵۴/۲ ميليارد |
اندازهي Die واحد پردازش گرافيكي | ۵۵۱ ميليمتر مربع | ۶۰۱ ميليمتر مربع | ۶۱۰ ميليمتر مربع | ۶۱۰ ميليمتر مربع | ۸۱۵ ميليمتر مربع | ۸۱۵ ميليمتر مربع | ۸۲۶ ميليمتر مربع |
شمار واحدهاي SM | ۱۵ | ۲۴ | ۵۶ | ۵۶ | ۸۰ | ۸۰ | ۱۰۸ |
شمار واحدهاي TPC | ۱۵ | ۲۴ | ۲۸ | ۲۸ | ۴۰ | ۴۰ | ۵۴ |
شمار هستههاي كوداي FP32 بهازاي هر واحد SM | ۱۹۲ | ۱۲۸ | ۶۴ | ۶۴ | ۶۴ | ۶۴ | ۶۴ |
شمار هستههاي كوداي FP64 بهازاي هر واحد SM | ۶۴ | ۴ | ۳۲ | ۳۲ | ۳۲ | ۳۲ | ۳۲ |
شمار كل هستههاي كوداي FP32 | ۲٬۸۸۰ | ۳٬۰۷۲ | ۳٬۵۸۴ | ۳٬۵۸۴ | ۵٬۱۲۰ | ۵٬۱۲۰ | ۶٬۹۱۲ |
شمار كل هستههاي كوداي FP64 | ۹۶۰ | ۹۶ | ۱٬۷۹۲ | ۱٬۷۹۲ | ۲٬۵۶۰ | ۲٬۵۶۰ | ۳٬۴۵۶ |
شمار هستههاي تنسور | - | - | - | - | ۶۴۰ | ۶۴۰ | ۴۳۲ |
شمار واحدهاي بافتي | ۲۴۰ | ۱۹۲ | ۲۲۴ | ۲۲۴ | ۳۲۰ | ۳۲۰ | ۴۳۲ |
سرعت كلاك پايه | ۷۴۵ مگاهرتز | ۹۴۸ مگاهرتز | ۱٬۱۹۰ مگاهرتز | ۱٬۳۲۸ مگاهرتز | ۱٬۲۹۷ مگاهرتز | نامشخص | نامشخص |
سرعت كلاك تقويتشده (بوست) | ۸۷۵ مگاهرتز | ۱٬۱۱۴ مگاهرتز | ۱٬۳۲۹ مگاهرتز | ۱٬۴۸۰ مگاهرتز | ۱٬۵۳۰ مگاهرتز | ۱٬۶۰۱ مگاهرتز | ۱٬۴۱۰ مگاهرتز |
شمار واحدهاي تاپس (DNN/AI) | - | - | - | - | ۱۲۵ تاپس | ۱۳۰ تاپس | ۱٬۲۴۸ تاپس (يا ۲٬۴۹۶ تاپس با Sparsity) |
قدرت پردازشي FP16 | - | - | ۱۸/۷ فلاپس | ۲۱/۲ فلاپس | ۳۰/۴ فلاپس | ۳۲/۸ فلاپس | ۳۱۲ فلاپس (يا ۶۲۴ فلاپس با Sparsity) |
قدرت پردازشي FP32 | ۵/۰۴ ترافلاپس | ۶/۸ ترافلاپس | ۱۰ ترافلاپس | ۱۰/۶ ترافلاپس | ۱۵/۷ ترافلاپس | ۱۶/۴ ترافلاپس | ۱۹/۵ ترافلاپس در حالت استاندارد و ۱۵۶ ترافلاپس تحت شرايط خاص |
قدرت پردازشي FP64 | ۱/۶۸ ترافلاپس | ۰/۲ ترافلاپس | ۴/۷ ترافلاپس | ۵/۳ ترافلاپس | ۷/۸ ترافلاپس | ۸/۲ ترافلاپس | ۹/۷ ترافلاپس در حالت استاندارد و ۱۹/۵ ترافلاپس تحت شرايط خاص |
رابط حافظه | ۳۸۴ بيت GDDR5 | ۳۸۴ بيت GDDR5 | ۴٬۰۹۶ بيت HBM2 | ۴٬۰۹۶ بيت HBM2 | ۴٬۰۹۶ بيت HBM2 | ۴٬۰۹۶ بيت HBM2 | ۶٬۱۴۴ بيت HBM2e |
ظرفيت حافظه | ۱۲ گيگابايت GDDR5 با پهناي باند ۲۸۸ گيگابيتبرثانيه | ۲۴ گيگابايت GDDR5 با پهناي باند ۲۸۸ گيگابيتبرثانيه | ۱۶ گيگابايت HBM2 با پهناي باند ۷۳۲ گيگابيتبرثانيه يا ۱۲ گيگابايت HB2 با پهناي باند ۵۴۹ گيگابيتبرثانيه | ۱۶ گيگابايت HBM2 با پهناي باند ۷۳۲ گيگابيتبرثانيه | ۱۶ گيگابايت HBM2 با پهناي باند ۹۰۰ گيگابيتبرثانيه | ۱۶ گيگابايت HBM2 با پهناي باند ۱٬۱۳۴ گيگابيتبرثانيه | ۴۰ گيگابايت HBM2 با پهناي باند ۱/۶ ترابيتبرثانيه |
اندازهي حافظهي كش L2 | ۱٬۵۳۶ كيلوبايت | ۳٬۰۷۲ كيلوبايت | ۴٬۰۹۶ كيلوبايت | ۴٬۰۹۶ كيلوبايت | ۶٬۱۴۴ كيلوبايت | ۶٬۱۴۴ كيلوبايت | ۴۰٬۹۶۰ كيلوبايت |
توان طراحي حرارتي (TDP) | ۲۳۵ وات | ۲۵۰ وات | ۲۵۰ وات | ۳۰۰ وات | ۳۰۰ وات | ۲۵۰ وات | ۴۰۰ وات |
هستههاي سري تنسور كه بهشكلي گسترده مورداستفاده قرار گرفتهاند اكنون سرعت پردازشي بيشتري دارند و استفاده از آنها راحتتر است. امروزه هستههاي تنسور نسل سوم TF32 ميتوانند در حوزهي هوش مصنوعي ۲۰ درصد عملكردي بهتر نسبتبه نسلهاي گذشته از خود نشان دهند. ناگفته نماند كه هستههاي تنسور اكنون از FP64 نيز همراهي ميكنند. بهرهمندي از FP64 باعث ميشود اين هستهها بتوانند هنگام انجام پردازشهاي مربوطبه بازار HPC بهميزان ۲/۵ برابر قدرت رايانشي بيشتري ارائه دهند.
ويژگي كليدي سوم پردازندهي انويديا بهرهمندي از قابليت متخصص MIG است. بهلطف MIG، پردازندهي A100 به هفت قسمت تقسيم ميشود تا بتواند براي اهداف مختلف، قدرت پردازشي متنوعي را ارائه دهد. بدين ترتيب A100 ميتواند تشخيص دهد كه براي انجام وظيفهاي خاص بايد چهميزان قدرت رايانشي ارائه شود. MIG باعث ميشود ميزان بهينهسازي پردازنده به حداكثر برسد و بازده آن بالا رود. انويديا از NVLink بهعنوان ويژگي كليدي چهارم پردازندهي گرافيكي A100 ياد ميكند. همچينن طبق گفتهي انويديا ساختهشدن پردازندهي جديد با اتكا بر تكنيك Structural Sparsity پنجمين ويژگي كليدي آن است.
انويديا پردازندهي گرافيكي Ampere GA100 را در چندين مدل با مشخصات مختلف توليد ميكند
ديگر مشخصات مهم پردازندهي NVIDIA Ampere GA100 شامل بهرهمندي آن از رابط حافظهي ۶٬۱۴۴ بيت است كه شامل حداكثر ۴۸ گيگابايت حافظهي HBM2e در ۶ بستهي HBM2 ميشود؛ اين بستهها بهصورت پراكنده در اطراف Die پردازندهي گرافيكي جاي گرفتهاند. هر يك از بستههاي موردمباحثه بهازاي هر داي داراي ۲ گيگابايت حافظهي گرافيكي (VRAM) هستند؛ بنابراين براي دستيابي به ۴۸ گيگابايت حافظه به بستههاي 4Hi نياز پيدا خواهيد كرد. هر بستهي 4Hi توانايي جاي دادن ۸ گيگابايت حافظه را در خود دارد؛ بنابراين ۶ بستهي 4Hi در كنار هم ميتوانند ۴۸ گيگابايت حافظهي گرافيكي را ارائه دهند كه عددي بسيار درخورتوجه است. ظاهرا حافظهي پردازنده ميتواند پهناي باند حدودا ۱/۶ ترابيتبرثانيه را ارائه دهد.
پردازندهي گرافيكي امپر انويديا قرار است داراي چندين پيكربندي براي حافظهي HBM باشد، بااينحال بهطور كلي حافظهي ارائهشده نهايتا ۴۸ گيگابايت خواهد بود؛ مگر اينكه انويديا بخواهد در آينده پيكربنديهاي ديگري را با بستههاي 6Hi يا حتي 8Hi ارائه دهد كه بهترتيب ميتوانند سقف حافظه را به ۷۲ و ۹۶ گيگابايت ارتقاء دهند. پردازندهي گرافيكي Tesla V100S انويديا دوبرابر ظرفيت حافظهي HBM بيشتر نسبتبه Tesla V100 دارد و ظرفيت آن به ۳۲ گيگابايت ميرسد. با درانديشه متخصصينگرفتن همين موضوع احتمال ميدهيم انويديا بخواهد چنين رويكردي را براي يكي ديگر از مدلهاي آيندهي Tesla A100 تكرار كند.
تصوير زير، طرح بلوكهاي پردازندهي گرافيكي NVIDIA Ampere GA100 را نشان ميدهد:
براي مشاهدهي تصوير بالا در ابعاد اصلي روي آن كليك كنيد
بهعلاوه در تصوير زير ميتوانيد نظارهگر طرح بلوكهاي SM پردازندهي NVIDIA Ampere GA100 باشيد:
براي مشاهدهي تصوير بالا در ابعاد اصلي روي آن كليك كنيد
پس از مطالعه دقيق مشخصات متخصص نسخهي كامل پردازندهي گرافيكي جديد انويديا، بهتر است به بيان برخي نكات درمورد شتابدهندهي گرافيكي Tesla A100 نيز بپردازيم. Tesla A100 نسخهي ضعيفتر Ampere GA100 بهحساب ميآيد و به ۱۰۸ واحد SM مجهز شده است. اين پردازندهي گرافيكي ۶٬۹۱۲ هستهي FP32 بههمراه ۳٬۴۵۶ هستهي FP64 و ۴۳۲ هستهي تنسور دارد. طبق اطلاعات رسمي، Tesla A100 داراي رابط باس ۵٬۱۲۰ بيت است و حداكثر ظرفيت حافظهي گرافيكي HBM2 آن به ۴۰ گيگابايت ميرسد. اين پردازندهي گرافيكي از برخي جوانب جلب توجه ميكند. خصوصا به اين دليل كه استفاده از ۴۰ گيگابايت حافظهي HBM2 بهمعني استفاده از بستههاي 5Hi خواهد بود كه البته چنين اتفاقي دور از انتظار بهانديشه متخصصين ميرسد. بهجاي آن، احتمال ميدهيم پردازندهي موردمباحثه به بستههاي 6Hi با تراشهي DRAM ناقص روي هر بسته، مجهز شده باشد.
NVIDIA Ampere Tesla A100 داراي توان طراحي حرارتي ۴۰۰ وات است
آنطور كه انويديا ميگويد پردازندهي NVIDIA Ampere Tesla A100 داراي توان طراحي حرارتي ۴۰۰ وات است؛ يعني ۱۰۰ وات بيشتر از مدل Tesla V100 Mezzanine. مدل PCIe پردازنده از توان طراحي حرارتي ۳۰۰ وات استفاده ميكند، بااينحال نسبتبه مدل مزانين (Mezzanine) سرعت كلاك پايينتري دارد. مدل Mezzanine ازطريق سوئيچهاي جديد NVLINK، داراي رابط GPU به GPU است. ازطرفي مدل PCIe را داريم كه از سوئيچ ملناكس (Mellanox) بههمراه دو رابط NVLINK نسل جديد و دو درگاه EDR استفاده ميكند.
در زمينهي عملكرد پردازشي، NVIDIA Ampere GA100 قدرت يك Peta-OP را ارائه ميدهد كه بهميزان ۲۰ برابر بيشتر از قدرت ارائهشده توسط Volta GV100 است. همچنين طبق گفتهي انويديا پردازندهي Ampere GA100 نسبتبه Volta GV100 تا ۲٫۵ برابر عملكردي بهتر در زمينهي پردازش فرمت نقطه شناور دقت دوگانه (Double-Precision Floating-Point Format) از خود برجاي ميگذارد كه احتمالا به قدرت پردازشي حدودا ۱۹٫۵ ترافلاپس FP64 منتهي ميشود؛ بهخصوص با درانديشه متخصصينگرفتن اين حقيقت كه قدرت پردازشي پردازندهي Volta به حدود ۸ ترافلاپس FP64 ميرسد. اين موضوع نشان ميدهد كه عملكرد پردازندهي جديد در زمينهي پردازش فرمت نقطه شناور دقت يگانه به حداكثر ۱۵۶ ترافلاپس FP32 ميرسد كه براي بازار محصولات HPC عددي ديوانهوار است.
پردازندهي Tesla V100 انويديا كه بر پايهي پردازندهي Ampere GA100 ساخته شده است قرار است در سيستمهاي DGX A100 و HGX A100 اين شركت مورداستفاده قرار گيرد. سيستمهاي DGX بهصورت مطلق روي تحقيقات مبتنيبر هوش مصنوعي و همچنين پردازشهاي متنوع بازار HPC متكي هستند. از طرفي سيستمهاي HGX را داريم كه طبق گفتهي انويديا قدرت پردازشي خودشان را روي حوزهي رايانش ابري (Cloud Computing) يا ديتاسنترها متمركز ميكنند. سيستمهاي موردمباحثه انويديا با نام دقيق DGX-A100 و HGX-A100 شناخته ميشوند و نسل سوم سيستمهاي DGX و HGX بهحساب ميآيند.
شماري از شركاي تجاري انويديا پيشتر بهصورت رسمي اعلام كردهاند كه قصد دارند در برخي سرورهاي جديد خود از پردازندههاي جديد انويديا استفاده كنند؛ اين سرورها در دستهي سرورهاي 1U و 2U و 4U و حتي حداكثر 10U جاي ميگيرند (توضيحات بيشتر درمورد واحدهاي يادشده را در اينجا بخوانيد). براساس اطلاعات رسمي هر يك از اين سرورها مجهزبه حداكثر ۸ تراشهي Tesla A100 مبتنيبر Ampere GA100 هستند و از لاينهاي PCIe Gen 4.0 استفاده ميكنند.
جنسون هوانگ چند روز پيش در ويدئويي كوتاه بهصورت مختصربه نسل بعدي سيستم DGX-A100 اشاره كرد كه انويديا بهزودي بهصورت كامل از آن پردهبرداري ميكند. ظاهرا نسل بعدي DGX-A100 خواهد توانست بهلطف بهرهمندي از ۸ پردازندهي Tesla A100 حداكثر ۵ پتافلاپس قدرت پردازشي ارائه دهد. گفته ميشود اين سيستم بهميزان ۲۰ برابر سريعتر از نسل پيش است كه از پردازندههاي مبتنيبر معماري Volta استفاده ميكرد. سيستم مبتنيبر امپر DGX-A100 انويديا از روز گذشته با ارزش پايهي ۱۹۹٬۰۰۰ دلار روانهي بازار شده است.
شما متخصصان اخبار تخصصي، علمي، تكنولوژيكي، فناوري مرجع متخصصين ايران چه انديشه متخصصيناتي درمورد معماري امپر انويديا داريد؟
مشخصات متخصص كامل، بهترين ارزش كارت گرافيك انويديا در فروشگاههاي اينترنتي و مقايسهي محصولات اين شركت با يكديگر و كارت گرافيك هاي AMD را در بخش محصولات اخبار تخصصي، علمي، تكنولوژيكي، فناوري مرجع متخصصين ايران مشاهده كنيد. محصولات متنوعي از سري Geforce و محصولات حرفهاي Quadro در اين بخش براي خريد و مقايسه در اختيار متخصصان قرار گرفته است.
هم انديشي ها