نگاهي عميق به پردازندههاي جديد 7 نانومتري AMD Epyc Rome
رونمايي AMD از پردازندههاي ۷ نانومتري دسكتاپ رايزن سري ۳۰۰۰ گامي بزرگ براي اين شركت بود. براي نخستين بار در طي چند دهه، AMD توانست به شركت رقيبش، اينتل برسد و حتي آن را شكست دهد. اين برتري در تمامي ويژگيهاي اصلي پردازندهها صدق ميكند؛ ويژگيهايي نظير كارايي تكهسته، كارايي چندهسته، بهينگي توان/گرما و ارزش. اشخاص ثالث عملكرد كمنظير پردازندههاي AMD را تأييد و آن را يك موفقيت واقعي قلمداد كردهاند. اما سوالي بزرگ همچنان باقي است: آيا اين شركت ميتواند موفقيت پردازندههاي ۷ نانومتري خود را در حوزههاي موبايل و سرور نيز تكرار كند؟
AMD بهتازگي بهطور رسمي از پردازندههاي جديد سري اپيك ۷۰۰۲ (Epyc 7002) موسوم به Rome پرده برداشت. به انديشه متخصصين ميآيد نيمي از سؤال بزرگ ما بهطور كاملي پاسخ داده شده است. پس از ورود هجمه به بنچماركهاي رايزن ۳۰۰۰ كه توسط خود AMD گرفته شده بود، اين شركت تهيهي بنچمارك از پردازندههاي جديدش را به رسانهها سپرده تا عملكرد سختافزار آنها را مورد مطالعه قرار دهند.
خلاصهي نتايج به اين قرار است: اپيك «روم» براي سرور برابر با رايزن ۳۰۰۰ براي دسكتاپ است. IPC (تعداد عمليات در هر سيكل) بهبود يافته، هستههاي بيشتر و كارايي گرمايي بالاتر اين پردازنده نسبت به رقيب اينتلي و نسلهاي گذشته همين سري كاملا بارز است.
عملكرد
Epyc Rome عملكرد تكترد ضعيفتري نسبت به Xeon دارد اما اين اختلاف كاهش قابل توجهي داشته است
روم تعداد تردهاي (thread) بسيار بيشتري در هر سوكت نسبت به پردازندههاي Xeon Scalable دارد. همچنين اين پردازنده نرخ زماني DDR4 بالاتري دارد و از ۱۲۸ مسير PCIe 4.0 همراهي ميكند (هركدام از مسيرهاي PCIe 4.0 دو برابر PCIe 3.0 پهناي باند دارد). اين ويژگيها در ديتاسنترهاي بزرگ بسيار حائز اهميت است زيرا در اين مراكز علاوه بر قدرت خام پردازندهها، سرعت انتقال دادهها و عدم بروز گلوگاههاي داده نيز بسيار مهم است. روم بهطور معناداري نسبت به نسلهاي سابق Epyc بهبود يافته است. كارايي بالاتر و حذف گلوگاهها در تنظيمات چند سوكته از جمله اين بهبودها به شمار ميروند.
روم همچنان قادر به شكست قويترين پردازندههاي زئون در نرخ زماني سختافزار يا كارايي تك هسته نيست اما از هميشه به زئون نزديكتر است. اين بهبود تا حد بسياري مديون بهبودهاي بسيار زياد AMD در معماري اين پردازندهها است كه در اسلايدهاي شركت مذكور در روز معرفي نام برده شدند.
در مطالعه زير بهطور تخصصي نسخههاي دو سوكته پردازندههاي AMD و اينتل مورد مطالعه قرار ميگيرند؛ يعني پردازندههاي Epyc 7742 (با ۶۴ هسته و ۱۲۸ ترد)، Epyc 7502 (با ۳۲ هسته و ۶۴ ترد) در مقابل Xeon Platinum 8280 (با ۲۸ هسته و ۵۶ ترد) و Xeon Gold 6138 (با ۲۰ هسته و ۴۰ ترد).
PyBench يك ابزار بنچمارك تك ترداي است. نرخ زماني بالاتر پردازندههاي Xeon در اينجا كاملا به چشم ميآيد
MKL-DNN يك بسته نرمافزاري اينتل است كه بهشدت براي پردازندههاي Xeon بهينه شده، اما پردازندههاي رم پاياپاي اينتل را تعقيب ميكنند
بهينهسازيهاي اينتل در نرمافزار اين شركت در اين تست كاملا ملموس است
Epyc Rome در عملكرد چندترداي نسبت به Xeon كاملا برتر است
در تستهاي تك ترداي مانند PHPBench و PyBench راحت ميتوان ۱۵ درصد بهبود عملكردي را كه AMD از آن صحبت به ميان آورده بود، مشاهده كرد. تفاوت عملكرد تك ترداي پردازندههاي AMD و اينتل نيز به كمترين ميزان خود رسيده است. Epyc Rome همچنان قاعده را به Xeon Scalable ميبازد اما تفاوت عملكردي آنها از ۵۰ درصد به ۲۰ درصد تقليل يافته است. Xeon Scalable در تستهاي انكدينگ ويدئو MKL-DNN نيز برتر ظاهر ميشود (البته با تعلق اين بسته نرمافزاري به خود اينتل و بهينهسازيهاي آن براي سري Xeon دور از انتظار نيست).
درست است كه اينتل برتري ناعادلانهاي در بنچماركهاي MKL-DNN دارد اما به هرحال پردازندههاي اينتل در اين تستها برتر بوده و انتخاب مناسبتري براي متخصصاني هستند كه متخصصي با محوريت MKL-DNN دارند.
در تستهاي vendor-neutral و چندتردايپسند مانند انكد ويديوهاي x265 يا بنچمارك OpenSSL پردازندههاي Epyc ميدرخشند
در تستهايي با تمركز بر متخصصي vendor-neutral و چندتردايپسند (multithreading-friendly) مانند انكد ويديوهاي x265 و OpenSSL، پردازندههاي روم نسبتبه زئونها كاملا برتر ظاهر شدند.
AMD در عملكرد چندترداي برتر از اينتل بوده و در عملكرد تكترداي نيز فاصلهي خود را با اينتل به ميزان قابل توجهي كاهش داده است.
هزينه
پردازندههاي Platinum 8280 و Gold 6138 به ترتيب دههزار (۱۰۰۰۰) و دوهزاروهفتصد (۲۷۰۰) دلار ارزشگذاري شدهاند. اما در آن سو پردازندههاي Epyc 7742 و Epyc 7502 شركت AMD به ترتيب هفتهزار (۷۰۰۰) و دوهزاروششصد (۲۶۰۰) دلار ارزش دارند. در پايهايترين حالت پردازندهها بهتر است بهصورت هزينه بر ترد مقايسه شوند.
پردازندههاي Epyc بهطور واضحي از Xeon ارزانترند اما نكته جالبتر نزديكبودن ارزش بر ترد دو پردازنده Epyc است
نكته جالبي كه از اين جدول حاصل ميشود، ارزانتر بودن Epyc نيست، بلكه نزديك بودن هزينه بر ترد دو پردازنده Epyc نسبت به Xeon است. هزينهي قطعات اينتل در مدلهاي بالا بهطور ناگهاني افزايش زيادي مييابد.
Epyc Rome از Xeon ارزانتر بوده و بهينگي انرژي و گرمايي آن تا ۵۰ درصد بهتر است
مصرف انرژي در روم ظاهرا مناسب است. Epyc 7742 توان طراحي حرارتي (TDP) بالاتري نسبت به Xeon 8280 دارد اما مصرف انرژي آن تنها اندكي بيشتر است (225W TDP در مقابل 205W TDP). اين موضوع به همراه تعداد تردهاي بسيار بالاتر آن، پردازندههاي روم را از انديشه متخصصين مصرف انرژي بسيار بهينه ميكند. طبق تستهاي انجامشده Phoronix، پردازنده Epyc 7742 در تست سنگين OpenSSL حدودا ۵۰ درصد نسبت به Xeon 8280 از انديشه متخصصين گرمايي بهينهتر است.
پردازنده امن AMD
پردازندههاي Epyc داراي يك پردازنده ARM A5 به نام پردازنده امن (AMD Secure Processor) است كه خارج از پيكربندي x86 عمل ميكند و از سوي لايهي سختافزاري x86 در دسترس نيست. اين پردازنده براي AMD حكم موتور مديريت اينتل (IME) را دارد. اين پردازنده مانند IME، بوتهاي UEFI امن را تسهيل ميكند. البته اين پردازندهها ممكن است موجب بروز اشكالات امنيتي «لايه صفر» شوند كه خارج از دسترس و عملكرد عادي x86 بهروز دارند و تشخيص يا رفعشان نسبتا دشوار است. سابقهي امنيتي پردازندهي امن AMD بينقص نيست اما تا بدينجا از IME بهتر بوده است.
قابليتهايي نظير رمزنگاري امن حافظه (SME) و رمزنگاري حافظه امن (SEV) تنها با وجود يك پردازنده ناظر خارج از x86 امكانپذير است. در پردازندههاي AMD اين پردازنده يك ARM A5 است.
AMD با استفاده از پردازنده امن، چند قابليت كليدي فراهم آورده كه به اندازه كافي مورد توجه قرار نگرفتهاند: رمزنگاري امن حافظه (Secure Memory Encryption) و مجازيسازي رمزنگاريشده امن (Secure Encrypted Virtualization). درون كنترلر حافظه Epyc يك موتور AES-128 همراهبا كليدهايي كه از سوي SEP كنترل ميشوند، قرار دارد. اگر رمزنگاري امن حافظه در بايوس سيستم فعال باشد، تمام رم سيستم با استفاده از كليدي كه SEP در اختيار سيستم قرار ميدهد، رمزنگاري شده و هنگام درخواست از سوي CPU رمزگشايي ميشود. استفاده از رمزنگاري امن حافظه و مجازيسازي رمزنگاريشده امن بهطور همزمان به رم اجازه ميدهد تا با چند كليد مجزا رمزنگاري شود و كليد يكساني با سيستمعامل ميزبان نداشته باشند.
رمزنگاري امن حافظه (SME)
بهطور خلاصه: رم با AES-128 و كليدهايي كه در سطح x86 در دسترس نيستند، رمزنگاري ميشود.
رمرنگاري امن حافظه به همراهي سطح خاصي از سيستمعامل نياز نداشته و كاملا شفاف نسبت به سطح اپليكيشن عمل ميكند.
رمزنگاري امن حافظه (SME) ابتدا بهعنوان يك لايهي مقاومتي جدي در برابر حملات مبتني بر فيزيك مانند Rowhammer و RAMbleed عمل ميكند. حملات مبتني بر فيزيك بر پايه دستكاري مستقيم رم سيستم در خارج از ديد و دسترس معمول پردازنده، عمل ميكنند. يك روش تلطيف و مقابله با اين حملات تصادفيسازي لايه (Layout Randomization) نام دارد. اين تكنيك برنامهنويسي حدس مكانهايي از رم را كه در اشتغال داده قرار دارد، سخت ميكند و از اين رو دسترسي مهاجم به داده مورد انديشه متخصصين دشوارتر ميشود.
SME نميتواند و نخواهد توانست تا با حملاتي كه در داخل چارچوب سختافزار x86 رخ ميدهد، مقابله كند اما در حملات مبتني بر فيزيك يك سد محكم به شمار ميرود و حتي در صورت رخدادن سرقت، دادهها همچنان با AES-128 با كليدي كه مهاجم به آن دسترسي ندارد، رمزنگاري شدهاند. و بهطور مشابهي، اگرچه SME نميتواند مانع از تخريب اطلاعات حافظه با Rowhammer شود اما اين آسيبپذيري را بهطور قابل توجهي كاهش ميدهد.
نزديكترين چيز به SME كه هماكنون در پلتفرم اينتل وجود دارد، افزونههاي حفاظتي سيگنال (SGX) است. SGX يك قسمت نسبتا كوچكي از حافظه رمزنگاري شده را به اپليكيشنهايي كه مستقيما براي استفاده از آن طراحيشدهاند، اختصاص ميدهد. SGX برخلاف SME، نميتواند توسط نرمافزارهاي موروثي (Legacy Applications) مورد سوءاستفاده قرار گيرد و همچنين تأثير معناداري بر كارايي دارد. اين نتايج در آناليزي كه از سوي دانشگاه ايالتي وين و دانشگاه هيوستون صورت گرفت، به دست آمد.
مجازيسازي رمزنگاريشده امن (SEV)
مجازيسازي رمزنگاريشده امن (SEV) ايدهي رمزنگاري امن حافظه (SME) را يك گام فراتر برده و به كليدهاي مجزاي AES-128 اجازه ميدهد كه به ماشينهايي مجازي كه در لايهي زيرين پردازنده Epyc در حال اجرا هستند، اختصاص يابند. نسل اول پردازندههاي Epyc تنها تا ۱۵ كليد جدا را پيشتيباني ميكردند اما در روم اين تعداد به ۵۰۹ كليد افزايش يافته است. در روم ويژگي جديدي تحت عنوان مجازيسازي رمزنگاريشده امن - وضعيت رمزنگاريشده (SEV-ES) نيز اضافه شده كه وضعيت كامل پردازندهي يك ماشين مجازي را با يك كليد رمزنگاري ميكند. اين كليد نه براي ميهمانها و نه براي خود ميزبان ماشين مجازي قابل دسترسي نيست.
SEV در مقياس بزرگ، قابليت بسيار خوبي براي هاستهاي مجازي در مقياس ديتاسنتر است. پرواضح است كه اين قابليت سدي امنيتي اضافه ميكند تا از ميزبان (هاست) و ماشينهاي مجازي ديگر محافظت كند. البته SEV دسترسي و كنترل متخصص را نيز محدود ميكند به طوري كه متخصص root هم نميتواند مستقيما وضعيت رم و پردازنده را مشاهده كند.
اين لايهي اضافي امنيتي ميتواند بسياري از شركتهايي را كه محتواي بسيار حساس اما نياز كمي به قدرت سختافزار دارند، متقاعد به استفاده از ماشينهاي مجازي ارزانارزش بهجاي سختافزار فيزيكي گرانارزشي كه به آن نيازي هم ندارند، كند.
جمعبندي
عرضهي سري جديد پردازنده Epyc Rome زنگ خطري براي اينتل در حوزهي سرورها به شمار ميرود. AMD نشان داده است كه با جديت تمام به رقابت خود با اينتل ادامه داده و روزبهروز عرصه را بر اينتل تنگتر ميكند. بر همگان روشن است كه اينتل اقتدار و برتري سابق خود را از دست داده و براي از دستندادن سلطه خود بر بازار نياز به تلاشي مضاعف دارد.
انديشه متخصصينات شما دربارهي پردازنده جديد Epyc Rome چيست؟ آيا ميتواند رقيبي جدي براي سري Xeon باشد؟ آيا AMD قادر است تا به سلطهي اينتل بر بازار پردازندههاي سرور پايان دهد؟ اينتل چه راهكارهايي براي حفظ عرصه دارد؟ انديشه متخصصيناتهاي خود را با ما و ساير متخصصان اخبار تخصصي، علمي، تكنولوژيكي، فناوري مرجع متخصصين ايران به اشتراك بگذاريد.
هم انديشي ها