اينتل پردازنده گرافيكي Xe HP با قدرتي در مقياس پتافلاپس را بهنمايش گذاشت
راجا كودوري، معمار ارشد اينتل و رئيس واحد تجاري كارت گرافيك مجزا در اين شركت كه سال ۲۰۱۷ از AMD جدا شد، طي چند ماه اخير در مراسمهاي مختلف حضور پيدا كرده و جزئياتي جديد دربارهي معماري جديد پردازندههاي گرافيكي اينتل يعني معماري Xe و محصولاتي كه برپايهي آن ساخته ميشوند با رسانهها در ميان گذاشته است. پردازندههاي گرافيكي خانوادهي Xe تنوع بالايي از محصولات را شامل ميشوند؛ از پردازندههاي گرافيكي كممصرف مجتمع و پايينرده تحت نام Xe LP Graphics گرفته تا پردازندههاي گرافيكي مخصوص ديتاسنترها كه عموما متشكلاز چندين تراشه هستند. كودوري بهتازگي جزئياتي جديد دربارهي پردازندههاي گرافيكي دستهي دوم دردسترس رسانهها قرار داده است.
همانطور كه هفتهي گذشته اعلام شد، پردازندههاي گرافيكي سري Xe HP اينتل قرار است در سه نوع روانهي بازار شوند. مدل پايه كه تاكنون چند بار در اخبار رسمي ظاهر شده است از يك كاشي (Tile) بهره ميگيرد كه شامل ۵۱۲ واحد اجرايي (EU) و بهاحتمال زياد دو بستهي HMB2e خواهد بود. اينتل هنوز مشخصات متخصص رسمي اين پردازندهي گرافيكي را تأييد نكرده، اما بهتازگي نحوهي عملكرد پردازندههاي گرافيكي خانوادهي Xe كه شامل يك، دو يا چهار كاشي هستند را بهنمايش گذاشته است كه جزئيات را ميتوانيد در تصوير زير مشاهده كنيد:
براي مشاهدهي تصوير بالا در ابعاد اصلي روي آن كليك كنيد
قدرت پردازشي بيشتري كه حضور كاشيهاي اضافه بههمراه ميآورد در نگاه اول فوقالعاده است؛ بااينحال نبايد فراموش كنيد نتايج حاضر در تصوير بالا مربوط به انجام وظايف گرافيكي آني (Real-Time) نيستند. تقسيم كار بين پردازندههاي گرافيكي بهمنظور دستيابي به فناوريهايي نظير SLI و CrossFire كار بسيار سختتري است و استفاده از پردازنده گرافيكي اضافي در بهترين حالت ممكن، عملكرد اجراي بازيهاي ويدئويي را بين ۵۰ تا ۸۰ درصد بهبود ميبخشد. براي اهداف غيرگرافيكي كه بيشتر روي توان پردازشي متمركز هستند، كارها بهطور معمول بهطور مجزا انجام ميشوند.
راجا كودوري در رويداد Hot Chips پردازندهي گرافيكي چهار كاشي Xe HP را جلوي دوربين بهنمايش گذاشت
در ابتدا تصور ميشد كه پردازندهي گرافيكي متشكلاز چهار كاشي وجود خارجي ندارد و بيشتر بازي تبليغاتي اينتل است؛ اما راجا كودوري در جريان برگزاري رويداد Hot Chips اينتل، پردازندهي موردمباحثه را كه ابعاد بسيار بزرگي داشت رو به دوربين نشان داد تا ثابت كند اينتل واقعا در حال ساخت پردازندهي گرافيكي بسيار ردهبالا و قدرتمندي است.
پردازندهي متشكلاز چهار كاشي اينتل واقعا ابعاد بزرگي دارد؛ بزرگتر از تمامي تراشههايي كه تاكنون ديده بوديم. اينكه پردازندهي گرافيكي موردمباحثه سري Xe HP وارد مرحلهي توليد نهايي ميشود يا نه، سؤالي است كه فعلا پاسخش را با اطمينان نميدانيم. فراموش نكنيد اينتل پردازندهي گرافيكي Xe HPC ملقببه پونته وكيو (Ponte Vecchio) را هم دارد و طي چند وقت اخير بهشكلي ويژه روي آن مانور داده است.
براي مشاهدهي تصوير بالا در ابعاد اصلي روي آن كليك كنيد
پردازندهي گرافيكي Xe HP براي تبديلشدن به پردازندهاي با چند كاشي از EMIB استفاده ميكند. آنطور كه اينتل در اطلاعيهاي رسمي اعلام كرده، پردازندهي گرافيكي Xe HPC قرار است شامل يك كاشي با نام رمبو كش (Rambo Cache) باشد، از فناوري پكيجينگ Foveros استفاده كند و با بهرهگيري از Co-EMIB بهبودهاي بيشتري در زمينهي پردازشي ارائه دهد.
اينتل روي سه مدل از پردازندههاي گرافيكي Xe HP با يك، دو و چهار كاشي كار ميكند
اينتل ميگويد كاشي پايهي پردازندهي پونته وكيو با استفاده از ليتوگرافي جديد ۱۰ نانومتري سوپرفين (SuperFin) ساخته ميشود كه نسخهي بهبوديافتهي فينفت (FinFET) بهحساب ميآيد. كاشي رمبو كش از ليتوگرافي «بهبوديافتهي» سوپرفين كه جزئيات كاملش را دردسترس نداريم استفاده ميكند. هنوز ليتوگرافي كاشي Xe Link I/O مشخص نشده، اما اينتل گفته كه اين كاشي توسط شركتي خارجي توليد ميشود. درنهايت آنطور كه تيم آبي ميگويد، براي توليد كاشي اصلي يعني كاشي پردازشي، از دو نوع ليتوگرافي بهره گرفته خواهد شد كه در نوع خود اتفاق عجيبي است.
اينتل بهصورت رسمي اعلام ميكند كه در آزمايشگاههايش درحال كار روي پردازندههايي از خانوادهي Xe HP با يك، دو و چهار كاشي است. استفاده از EMIB بدين معني است كه دو پردازندهي گرافيكي آخر بهترتيب دو و چهار برابر پردازندهي پايه ابعاد دارند؛ بنابراين لازم است در آنها از سه سوكت مجزا استفاده شود.
براي مشاهدهي تصوير بالا در ابعاد اصلي روي آن كليك كنيد
پردازندهي گرافيكي چهار كاشي Xe HP كه راجا كودروي در جلوي دوربين نشانش داد ظاهرا ميتواند به ۴۲ ترافلاپس قدرت پردازشي FP32 دست پيدا كند؛ البته اين عدد، حداكثر توانايي پردازندهي گرافيكي اينتل نيست. كودوري در بخشي از سخنان خود مدعي شد اين پردازندهي گرافيكي قدرتمند ميتواند به قدرت پردازشي در مقايس پتافلاپس دسترسي پيدا كند (بهعبارتي ديگر، بيش از ۱٬۰۰۰ ترافلاپس). دستيابي به اين هدف بهلطف حضور هستههاي تنسور (Tensor) ممكن ميشود؛ البته فعلا پيكربندي دقيق هستهها را در پردازندهي گرافيكي اينتل نميدانيم.
همچون معماري A100 انويديا و معماري TPUv4 گوگل، Xe HP از هستههاي تنسور همراهي ميكند. هنوز اطلاعاتي دقيق اعلام نشده اما حدس ميزنيم اين هستهها ميتوانند بهازاي هر سيكل، ۱۲۸ عمليات انجام دهند؛ بهعبارتي، پردازندهي گرافيكي اينتل بهازاي واحد اجرايي شامل يك هستهي تنسور خواهد بود. اين يعني اگر ۲٬۰۴۸ واحد اجرايي داشته باشيم، با حل كردن اين معادله «۲۰۴۸x۱۲۸x۲» به جواب «۵۲۴٬۲۸۸» ميرسيم. البته در اينجا سرعت كلاك را لحاظ نكردهايم. انتظار داريم براي يك پتافلاپس شاهد دستيابي به سرعت كلاك دو گيگاهرتز باشيم. شايد اينتل نوع ديگري از هستههاي تنسور را استفاده كند كه بتوانند بهازاي هر سيكل، بيش از ۱۲۸ عمليات انجام دهند. در هر صورت بهلطف چنين پردازندهي توانمندي، ابررايانهها سادهتر ميتوانند به قدرت پردازشي بسيار بالا دسترسي پيدا كنند.
هم انديشي ها