پردازنده مركزي Nvidia Grace بر پايه ARM معرفي شد؛ ۱۰ برابر قويتر از x86
انويديا شب گذشته در جريان برگزاري GTC 2021 معماري متكي بر آرم گريس (Nvidia Grace) را براي پردازندههاي مركزي كلاس ديتاسنتر معرفي و ادعا كرد اين معماري ۱۰ برابر سرعت بيشتر نسبت به پرسرعتترين سرورهاي امروزي در حوزهي هوش مصنوعي و رايانش با قدرت بالا دارد.
پردازندههاي مركزي اختصاصي انويديا بهزودي در نقش قلب تپندهي دو ابركامپيوتر هوش مصنوعي ظاهر ميشوند و از هستههاي نسل بعد Neoverse آرم كه جزئيات دقيقشان را فعلا نميدانيم استفاده ميكنند. اين تراشهها در ابركامپيوترهاي يادشده در كنار حافظهي رم LPDDR5x قرار ميگيرند كه ۵۰۰ گيگابايت بر ثانيه توان عملياتي ارائه ميدهد. ابركامپيوترها از اتصال ۹۰۰ گيگابايت بر ثانيهايِ NVLink به كارت گرافيكي نامشخص بهره ميبرند تا قدرت پردازشي زيادي ارائه بدهند.
آنطور كه تامز هاردور مينويسد، انويديا از نقشهي راه جديد خود نيز كه پردازندهي مركزي بعد از معماري گريس (Grace Next) را براي سال ۲۰۲۵ نشان ميدهد پردهبرداري كرده است. تيم سبز ميگويد معماري گرافيكي «Ampere Next Next» در اواسط سال ۲۰۲۴ از راه خواهد رسيد.
معماري گريس انويديا فعلا مختص پردازندههاي مركزي كلاس ديتاسنتر است
تصاحب آرم توسط انويديا كه هنوز بهطور كامل انجام نشده و منتظر دريافت چراغ سبز از نهادهاي بزرگ تنظيم مقررات در سراسر دنيا است، باعث شد بسياري از تحليلگران تخمين بزنند كه انويديا سراغ توليد پردازندهي مركزي متكي بر معماري آرم ميرود. جن سون هوانگ، مديرعامل انويديا، پيشتر تأييد كرده بود كه احتمال توليد پردازندهي مركزي انويديا وجود دارد.
اولين نسل معماري پردازشي گريس در قالب پردازندههاي مركزي كلاس دسكتاپ و لپتاپ ارائه نميشود؛ اما بهوضوح مشخص است تيم سبز اهداف بزرگي براي پردازندههاي كلاس ديتاسنتر گريس در سر ميپروراند.
انويديا فعلا تعداد هسته و سرعت كلاك پردازندههاي گريس را اعلام نكرده است كه البته اتفاق تعجببرانگيزي محسوب نميشود؛ چون بنا بر اطلاعات رسمي، پردازندههاي ديتاسنتر گريس تا اوايل سال ۲۰۲۳ به بازار عرضه نخواهند شد. البته انويديا مشخصا گفته است پردازندههاي يادشده از هستههاي نسل بعد Neoverse آرم استفاده ميكنند.
با درانديشه متخصصينگرفتن آنچه دربارهي نقشهي راه عمومي فعلي آرم ميدانيم، احتمال ميدهيم هستهاي كه انويديا به آن اشاره ميكند، پلتفرم V1 موسوم به Zeus باشد. هستههاي Zeus براي دستيابي به بيشترين قدرت پردازشي بهينه شدهاند و به همين دليل تمام ناحيهي داي (Die) را در بر ميگيرند و مصرف انرژي بالايي دارند.
پردازندههاي مبتني بر هستههاي Zeus ممكن است در مدلهاي هفت و پنج نانومتري توليد شوند و در مقايسه با هستههاي فعلي N1 آرم، تا ۵۰ درصد دستورالعمل بر سيكل كلاك (IPC) بيشتر ارائه بدهند. پلتفرم V1 آرم از تمام فناوريهاي جديد مثل PCIe 5.0 و DDR5 و حتي HBM2e يا HBM3 به همراه اينتركانكت CCIX 1.1 همراهي ميكند. به انديشه متخصصين ميرسد انويديا حداقل فعلا براي متصل كردن پردازندهي مركزي و پردازندهي گرافيكي خود، به جاي CCIX سراغ NVLink اختصاصي ميرود.
انويديا ميگويد پردازندهي مركزي گريس خواهد توانست امتياز بالاي ۳۰۰ در بنچمارك SPECrate_2017_int_base كسب كند و اين يعني قدرت پردازشي زيادي دارد. تيم سبز ادعا ميكند با هشت پردازندهي گرافيكي در يك سيستم DGX، سيستم ميتواند به امتياز فوقالعادهي ۲۴۰۰ در بنچمارك SPECrate_2017_int_base دست پيدا كند. نسل فعلي DGX در بهترين حالت امتياز ۴۵۰ كسب ميكند و اين يعني قرار است شاهد تفاوتهاي محسوسي باشيم.
AMD EPYC Milan كه جديدترين پردازندههاي تيم قرمز براي ديتاسنتر محسوب ميشوند و قدرت پردازشي بسيار زيادي دارند، داراي امتياز SPEC بين ۳۸۲ تا ۴۲۴ هستند و همين موضوع باعث ميشود پردازندهي مركزي گريس بيشتر در نقش رقيبي براي پردازندههاي ديتاسنتر نسل قبل ۶۴ هستهاي AMD يعني سري Rome ظاهر شود. به انديشه متخصصين ميرسد ادعاي انويديا مبني بر ۱۰ برابر شدن قدرت پردازشي پلتفرم جديدش نسبت به سرورهاي نسل فعلي، به پردازش گرافيكي مرتبط باشد.
انويديا ميگويد نخستين مدلهاي پردازندهي مركزي گريس در قالب پكيج BGA در دسترس قرار ميگيرند و اين يعني برخلاف پردازندههاي مرسوم x86، تراشههاي سوكتدار نخواهند بود. به انديشه متخصصين ميرسد اولين پردازندههاي گريس به همراه هشت بسته حافظهي LPDDR5x در دسترس قرار ميگيرند. انويديا ميگويد حافظهي LPDDR5x ECC در مقايسه با سابسيستم استاندارد حافظهي DDR4 دو برابر پهناي باند بيشتر و ۱۰ برابر مصرف انرژي كمتر دارد.
نسل بعد NVLink انويديا كه فعلا جزئيات زيادي دربارهي آن نميدانيم، تراشه را به پردازندهي مركزي مجاور با نرخ انتقال ۹۰۰ گيگابايت بر ثانيه (۱۴ برابر سريعتر) متصل ميكند. مطالعهها نشان ميدهد سرعت نسل بعد NVLink انويديا ۳۰ برابر سريعتر از سيستمهاي ارتباطي بين پردازندهي مركزي و پردازندهي گرافيكي سرور در دنياي امروز است. انويديا همچنين ميگويد نسل جديد NVLink ميتواند اطلاعات را در بين پردازندههاي مركزي با سرعت دو برابر بيشتر از سيستمهاي مرسوم انتقال بدهد.
استفاده از NVLink باعث انسجام حافظهي كش ميشود و اين يعني حافظهي سيستم و پردازندهي گرافيكي (LPDDR5x و HBM) در فضاي مشتركي قرار ميگيرند تا برنامهنويسي سادهتر شود. انسجام كش همچنين باعث كاهش حركت دادهها در بين پردازندهي مركزي و پردازندهي گرافيكي ميشود و قدرت پردازشي را بالا و مصرف انرژي را پايين ميآورد.
اين تركيب باعث ميشود انويديا از لحاظ تئوري بتواند قابليتي مثل سيستمهايي كه داراي پردازندهي مركزي EPYC و پردازندهي گرافيكي Radeon Instinct هستند ارائه بدهد. اينتل نيز تركيب مشابهي با پردازندهي مركزي Sapphire Rapids و پردازندهي گرافيكي Ponte Vecchio در ابركامپيوتر Aurora دارد. انويديا ميگويد استفاده از پردازندهي مركزي و پردازندهي گرافيكي اختصاصي در ابركامپيوتر ۲٫۸ اگزافلاپسي Selene، زمان مورد نياز براي تعليم GPT-3 (بزرگترين مدل هوش مصنوعي زبان طبيعي در دنيا) را از ۱۴ روز به دو روز كاهش ميدهد.
انويديا همچنين از نقشهي راهي رونمايي كرد تا روند منظم ارتقاء قطعات خود را در سالهاي پيش رو به نمايش بگذارد. انويديا ميگويد در سالهاي آينده با نرخي بهنسبت ثابت، مدل جديد پردازندههاي گرافيكي، پردازندههاي مركزي (آرم و x86) و واحد پردازش داده (DPU) خود را معرفي ميكند.
پردازندههاي ديتاسنتر Nvidia Grace تا اوايل سال ۲۰۲۳ به بازار عرضه نميشوند
طبق گفتهي جن سون هوانگ، انويديا هر دو سال يك بار هر يك از معماريهاي پردازشي خود را پيشرفتهتر ميكند؛ با اين توضيح كه معماري x86 در يك سال پيشرفتهتر ميشود و سال بعد نوبت بهبود آرم ميرسد؛ انويديا ميگويد احتمالا در بين آنها بهبودهاي ديگري هم اعمال ميكند و شايد اين بهبودها به جاي معماري به فناوري پردازشي مربوط باشند.
نكتهي جالب اين است كه انويديا براي انتخاب نام پردازندهي مركزي گريس از نام گريس هاپر (دانشمند معروف حوزهي كامپيوتر) استفاده كرده است. طبق شايعهها، انويديا از مدتها پيش كار روي پردازندههاي گرافيكي هاپر را كه متكي بر طراحي چيپلت هستند آغاز كرده. هماهنگي جالبي در نام پردازندههاي مركزي و گرافيكي جديد تيم سبز به چشم ميخورد.
انويديا ميگويد آزمايشگاه ملي لس آلاموس كه متعلق به وزارت انرژي ايالات متحده است، بهزودي ابركامپيوتري با پردازندهي گريس توليد ميكند. اين سيستم توسط HPE ساخته ميشود و در سال ۲۰۲۳ به مرحلهي عملياتي ميرسد. وزارت انرژي آمريكا فعلا جزئيات زيادي دربارهي ابركامپيوتر جديدش منتشر نكرده است.
انويديا ميگويد پردازندهي مركزي گريس در قويترين ابركامپيوتر هوش مصنوعي دنيا با نام Alps قرار ميگيرد؛ سيستم Alps در مركز ملي رايانش سوئيس واقع ميشود و به دانشمندان و محققان اروپايي كمك ميكند. ابركامپيوتر Alps كه در ۲۰۲۳ الكترونيك ميشود، در حوزههايي مثل آبوهوا، ديناميك مولكولي، ديناميك سيالات محاسباتي و موارد اينچنيني به كار خواهد آمد.
هم انديشي ها