اينتل پردازنده گرافيكي Xe HP با قدرتي در مقياس پتافلاپس را به‌نمايش گذاشت

سه‌شنبه ۲۸ مرداد ۱۳۹۹ - ۱۵:۴۵
مطالعه 5 دقيقه
مرجع متخصصين ايران
راجا كودوري در جريان برگزاري رويداد Hot Chips، پردازنده‌ي گرافيكي خانواده‌ي Xe HP را كه متشكل‌از چهار كاشي است و به مقايس پتافلاپس ازلحاظ قدرت پردازشي دست پيدا مي‌كند، به‌نمايش گذاشت.
تبليغات

راجا كودوري، معمار ارشد اينتل و رئيس واحد تجاري كارت گرافيك مجزا در اين شركت كه سال ۲۰۱۷ از AMD جدا شد، طي چند ماه اخير در مراسم‌هاي مختلف حضور پيدا كرده و جزئياتي جديد درباره‌ي معماري جديد پردازنده‌هاي گرافيكي اينتل يعني معماري Xe و محصولاتي كه برپايه‌ي آن ساخته مي‌شوند با رسانه‌ها در ميان گذاشته است. پردازنده‌هاي گرافيكي خانواده‌ي Xe تنوع بالايي از محصولات را شامل مي‌شوند؛ از پردازنده‌هاي گرافيكي كم‌مصرف مجتمع‌ و پايين‌رده تحت نام Xe LP Graphics گرفته تا پردازنده‌هاي گرافيكي مخصوص ديتاسنترها كه عموما متشكل‌از چندين تراشه هستند. كودوري به‌تازگي جزئياتي جديد درباره‌ي پردازنده‌هاي گرافيكي دسته‌ي دوم دردسترس رسانه‌ها قرار داده است.

همان‌طور كه هفته‌ي گذشته اعلام شد، پردازنده‌هاي گرافيكي سري Xe HP اينتل قرار است در سه نوع روانه‌ي بازار شوند. مدل پايه كه تاكنون چند بار در اخبار رسمي ظاهر شده است از يك كاشي (Tile) بهره مي‌گيرد كه شامل ۵۱۲ واحد اجرايي (EU) و به‌احتمال زياد دو بسته‌ي HMB2e خواهد بود. اينتل هنوز مشخصات متخصص رسمي اين پردازنده‌ي گرافيكي را تأييد نكرده، اما به‌تازگي نحوه‌ي عملكرد پردازنده‌هاي گرافيكي خانواده‌ي Xe كه شامل يك، دو يا چهار كاشي هستند را به‌نمايش گذاشته است كه جزئيات را مي‌توانيد در تصوير زير مشاهده كنيد:

براي مشاهده‌ي تصوير بالا در ابعاد اصلي روي آن كليك كنيد

قدرت پردازشي بيشتري كه حضور كاشي‌هاي اضافه به‌همراه مي‌آورد در نگاه اول فوق‌العاده است؛ بااين‌حال نبايد فراموش كنيد نتايج حاضر در تصوير بالا مربوط به انجام وظايف گرافيكي آني (Real-Time) نيستند. تقسيم كار بين پردازنده‌هاي گرافيكي به‌منظور دستيابي به فناوري‌هايي نظير SLI و CrossFire كار بسيار سخت‌تري است و استفاده از پردازنده‌ گرافيكي اضافي در بهترين حالت ممكن، عملكرد اجراي بازي‌هاي ويدئويي را بين ۵۰ تا ۸۰ درصد بهبود مي‌بخشد. براي اهداف غيرگرافيكي كه بيشتر روي توان پردازشي متمركز هستند، كارها به‌طور معمول به‌طور مجزا انجام مي‌شوند. 

راجا كودوري در رويداد Hot Chips پردازنده‌ي گرافيكي چهار كاشي Xe HP را جلوي دوربين به‌نمايش گذاشت

در ابتدا تصور مي‌شد كه پردازنده‌ي گرافيكي متشكل‌از چهار كاشي وجود خارجي ندارد و بيشتر بازي تبليغاتي اينتل است‌؛ اما راجا كودوري در جريان برگزاري رويداد Hot Chips اينتل، پردازنده‌ي موردمباحثه را كه ابعاد بسيار بزرگي داشت رو به دوربين نشان داد تا ثابت كند اينتل واقعا در حال ساخت پردازنده‌‌ي گرافيكي بسيار رده‌بالا و قدرتمندي است.

پردازنده‌ي متشكل‌از چهار كاشي اينتل واقعا ابعاد بزرگي دارد؛ بزرگ‌تر از تمامي تراشه‌هايي كه تاكنون ديده بوديم. اينكه پردازنده‌ي گرافيكي موردمباحثه سري Xe HP وارد مرحله‌ي توليد نهايي مي‌شود يا نه، سؤالي است كه فعلا پاسخش را با اطمينان نمي‌دانيم. فراموش نكنيد اينتل پردازنده‌ي گرافيكي Xe HPC ملقب‌به پونته وكيو (Ponte Vecchio) را هم دارد و طي چند وقت اخير به‌شكلي ويژه روي آن مانور داده است.

براي مشاهده‌ي تصوير بالا در ابعاد اصلي روي آن كليك كنيد

پردازنده‌ي گرافيكي Xe HP براي تبديل‌شدن به پردازنده‌اي با چند كاشي از EMIB استفاده مي‌كند. آن‌طور كه اينتل در اطلاعيه‌اي رسمي اعلام كرده، پردازنده‌ي گرافيكي Xe HPC قرار است شامل يك كاشي با نام رمبو كش (Rambo Cache) باشد، از فناوري پكيجينگ Foveros استفاده كند و با بهره‌گيري از Co-EMIB بهبودهاي بيشتري در زمينه‌ي پردازشي ارائه دهد.

اينتل روي سه مدل از پردازنده‌هاي گرافيكي Xe HP با يك، دو و چهار كاشي كار مي‌كند

اينتل مي‌گويد كاشي پايه‌ي پردازنده‌ي پونته وكيو با استفاده از ليتوگرافي جديد ۱۰ نانومتري سوپرفين (SuperFin) ساخته مي‌شود كه نسخه‌ي بهبوديافته‌ي فين‌فت (FinFET) به‌حساب مي‌آيد. كاشي رمبو كش از ليتوگرافي «بهبوديافته‌ي» سوپرفين كه جزئيات كاملش را دردسترس نداريم استفاده مي‌كند. هنوز ليتوگرافي كاشي Xe Link I/O مشخص نشده، اما اينتل گفته كه اين كاشي توسط شركتي خارجي توليد مي‌شود. درنهايت آن‌طور كه تيم آبي مي‌گويد، براي توليد كاشي اصلي يعني كاشي پردازشي، از دو نوع ليتوگرافي بهره گرفته خواهد شد كه در نوع خود اتفاق عجيبي است. 

اينتل به‌صورت رسمي اعلام مي‌كند كه در آزمايشگاه‌هايش درحال كار روي پردازنده‌هايي از خانواده‌ي Xe HP با يك، دو و چهار كاشي است. استفاده از EMIB بدين معني است كه دو پردازنده‌ي گرافيكي آخر به‌ترتيب دو و چهار برابر پردازنده‌ي پايه ابعاد دارند؛ بنابراين لازم است در آن‌ها از سه سوكت مجزا استفاده شود. 

براي مشاهده‌ي تصوير بالا در ابعاد اصلي روي آن كليك كنيد

پردازنده‌ي گرافيكي چهار كاشي Xe HP كه راجا كودروي در جلوي دوربين نشانش داد ظاهرا مي‌تواند به ۴۲ ترافلاپس قدرت پردازشي FP32 دست پيدا كند؛ البته اين عدد، حداكثر توانايي پردازنده‌ي گرافيكي اينتل نيست. كودوري در بخشي از سخنان خود مدعي شد اين پردازنده‌ي گرافيكي قدرتمند مي‌تواند به قدرت پردازشي در مقايس پتافلاپس دسترسي پيدا كند (به‌عبارتي ديگر، بيش از ۱٬۰۰۰ ترافلاپس). دستيابي به اين هدف به‌لطف حضور هسته‌هاي تنسور (Tensor) ممكن مي‌شود؛ البته فعلا پيكربندي دقيق هسته‌ها را در پردازنده‌ي گرافيكي اينتل نمي‌دانيم.

همچون معماري A100 انويديا و معماري TPUv4 گوگل، Xe HP از هسته‌هاي تنسور همراهي مي‌كند. هنوز اطلاعاتي دقيق اعلام نشده اما حدس مي‌زنيم اين هسته‌ها مي‌توانند به‌ازاي هر سيكل، ۱۲۸ عمليات انجام دهند؛ به‌عبارتي، پردازنده‌ي گرافيكي اينتل به‌ازاي واحد اجرايي شامل يك هسته‌ي تنسور خواهد بود. اين يعني اگر ۲٬۰۴۸ واحد اجرايي داشته باشيم، با حل كردن اين معادله «۲۰۴۸x۱۲۸x۲» به جواب «۵۲۴٬۲۸۸» مي‌رسيم. البته در اين‌جا سرعت كلاك را لحاظ نكرده‌ايم. انتظار داريم براي يك پتافلاپس شاهد دستيابي به سرعت كلاك دو گيگاهرتز باشيم. شايد اينتل نوع ديگري از هسته‌هاي تنسور را استفاده كند كه بتوانند به‌ازاي هر سيكل، بيش از ۱۲۸ عمليات انجام دهند. در هر صورت به‌لطف چنين پردازنده‌ي توانمندي، ابررايانه‌ها ساده‌تر مي‌‌توانند به قدرت پردازشي بسيار بالا دسترسي پيدا كنند.

جديد‌ترين مطالب روز

هم انديشي ها

تبليغات

با چشم باز خريد كنيد
اخبار تخصصي، علمي، تكنولوژيكي، فناوري مرجع متخصصين ايران شما را براي انتخاب بهتر و خريد ارزان‌تر راهنمايي مي‌كند
ورود به بخش محصولات