مقايسه عملكرد پردازندههاي سرور اينتل و AMD در رايانش ابري
شركت آمريكايي AMD با ساخت تراشهي EPYC، نبرد بر سر پردازندههاي سرور ميان دو تراشهساز بزرگ آمريكايي، يعني اينتل و AMD را شديدتر كرد. درحاليكه بيشترين تمركز رسانههاي خبري بر تراشههاي ساختهشده براي مصارف عام و گيمينگ است، اين پردازندههاي سرور هستند كه درآمدهاي هنگفتي براي شركتهاي مادر بهبار ميآورند. بهجاي اظهارانديشه متخصصين دربارهي سطح عملكرد پردازندههاي سرور، با بيان نتايج عملي بنچماركهايي كه روي آنها در مركز داده آمازون انجام شده، بهتر ميتوان واقعيتها را بيان كرد.
مقايسهي سطح عملكرد سرورهاي رايانش ابري آمازون (Iaas) با پردازندههاي اينتل و AMD
سرويس رايانش ابري آمازون AWS EC2 در نوامبر۲۰۱۸، Instanceهاي مبتنيبر پردازندههاي EPYC از AMD را معرفي كرد. Instance قسمتي از منابع سرور اعم از پردازنده و حافظه مجازي است كه دراختيار هر كلاينت قرار ميگيرد. اين Instanceها از همان تعداد پردازندهي مجازي و ظرفيت حافظهي مجازي نمونههاي اينتل استفاده ميكنند. Instanceهاي EPYC ميتوانند در تمام مدت پردازش از ۲ تا ۹۶ پردازندهي مجازي را بهرهبرداري كنند. بهطور كلي، آمازون خدمات Instanceهاي AMD خود را ۱۰ درصد ارزانتر از Instanceهاي اينتل دراختيار رايانش ابري قرار ميدهد.
در اين مطلب، قصد داريم نگاهي به گسترهي وسيع موارد متخصصد زيرساختهاي ابري بيندازيم و Instanceهاي اشارهشده را جزءبهجزء مقايسه كنيم. بهخاطر داشته باشيد هرچند از نوع معماري پردازندههاي AMD بهكاررفته در سرورهاي آمازون اطمينان داريم، از معماري Instanceهاي اينتل اطلاع چنداني نداريم. آمازون در زمينهي معماري تراشههاي اين Instanceها اطلاعاتي منتشر نكرده؛ اما ازآنجاكه انجام برخي از اين آزمايشها مستلزم اجراي كدهاي AVX512 است، ميتوان تصور كرد اين Instanceها از آخرين معماري اينتل برخوردار باشند.
در زير، فهرست كامل انواع آزمونهاي باركاري (workload) را ارائه ميكنيم كه در اين مطالعه، روي Instanceهاي اينتل و AMD اعمال شده است:
باركاري int/FP
باركاري پهناي باند حافظه
باركاري web/java
باركاري database
باركاري (High-Performance Compute (HPC
بيهيچ توضيح اضافهتري، بياييد نگاهي به نتايج بنچماركهاي انجامشده روي اين Instanceها بيندازيم. اولين آزمايش بين Instanceهايي با ۱۶ پردازندهي مجازي بود. اين آزمايش در محيط سيستمعامل Linux 7.5 و با بهكارگيري كامپايلر ICC اجرا شده است. Instanceهاي اينتل برتري اندكي در باركاري web/java و برتري كاملي در اجراي وظايف HPC (محاسبات سطح بالا) دارند. با درانديشه متخصصينگرفتن اينكه از پردازندهي EPYC دو واحد 128bit-FMA و پردازندههاي Skylake و بالاتر دو واحد 512bit-FMA برخوردار هستند، اين برتري اينتل چندان تعجببرانگيز نيست؛ چراكه دست بالا را در انجام وظايف HPC خواهد داشت.
در اينجا، ذكر دو نكته ضروري است: ۱. برخي از اين Instanceها، بهويژه در سمت سرور، NUMA-binded به دسترسي غيريكنواخت به حافظه مقيد نشدهاند؛ چراكه انجام چنين كاري نيازمند تنظيمات زيادي است؛ ۲. استفاده از كامپايلرهاي متفاوت، همچون GCC، ممكن است باعث بهبود نتايج عملكرد پردازنده شود.
اين قابليتها روشهاي بهينهسازي گرانارزشي محسوب ميشوند و اگرچه شكاف ميان دادههاي سمت سرور را كاهش ميدهد، همچنان براي غلبه بر پردازندههاي اينتل كافي نخواهد بود.
در تصوير زير، ارقام بهدستآمدهي Instanceهايي با ۹۶ پردازندهي مجازي نشان داده شده كه بازهم نسخههاي سرور اينتل بر نسخههاي سرور AMD برتري دارند. در اين آزمايش هم اختلاف در اجراي وظايف HPC همچنان زياد است؛ اما در بخش آزمايشهاي پهناي باند از ميزان اين اختلاف كاسته ميشود.
در آخرين بخش، عملكرد را برحسب بهاي پرداختي خدمات سرور با مدل ارزشگذاري رايانش ابري آمازون (در تاريخ ۱۲ژانويه۲۰۱۹) آزمودهايم. نتايج اين آزمايش در شكل زير آورده شده است. بهطور متوسط نسخههاي اينتل در اجراي وظايف HPC از ارزش پرداخت بيشتري از ۱.۲۵ تا ۴.۱ برابر بيشتر از نسخههاي AMD برخوردار هستند.
آنچه از برآيند اين آزمايشها ميخواهيم بگوييم، اين است كه Instanceهاي اينتل چه ازانديشه متخصصين ارزش پرداخت و چه ازانديشه متخصصين سطح عملكرد در بين تمام موارد رايانش ابري، در جايگاه بالاتري ايستادهاند.
مجددا يادآوري ميكنيم كه ممكن است با بهكارگيري كامپايلرهاي مختلف و انجام بهينهسازيهايي روي باركاري تخصيصيافته در محل سرور (مثل Numa-binding) نسخههاي AMD به سطح عملكرد بهتري دست پيدا كنند؛ اما اين ميزان بهبود براي غلبه بر تفاوتهاي سختافزاري نهفته در تراشههاي اينتل كافي نخواهد بود. برخي از اين تفاوتها استفاده از تراشههاي يكپارچه در نسخهي اينتل بهجاي ماژولهاي چندتراشهاي در نسخههاي AMD و نيز اختلاف در FMAها است كه در پردازش HPC بسيار مهم خواهد بود. برمبناي ارقام بهدستآمده، بهانديشه متخصصين ميرسد اينتل همچنان بازار مراكز داده را در تصاحب خود داشته باشد. بااينحال در سمت ديگر ماجرا، بازارهاي حرفهاي و غيرحرفهاي ويرايش ويدئو وجود دارد كه پردازندههاي EPYC با درانديشه متخصصينگرفتن هزينههاي ارزانتر خدماتِ سرورهاي مجهز به آن، ميتواند درخشش بيشتري داشته باشد.
هم انديشي ها