داستان اوجگيري و سقوط كارتهاي گرافيكي مجهز به چند پردازنده
در دنياي كارتهاي گرافيكي، بيشتربودن آمار و ارقام اغلب بهمعناي بهتربودن قدرت و بهرهوري است. هستههاي سايهزني بيشتر، رم بيشتر، پهناي باند بيشتر و... همگي بهمعناي بهرهوري بهتر و تنظيمات باجزئياتتر براي بازيها بودهاند؛ البته براي رسيدن به چنين وضعيتي، هميشه به تراشههاي بزرگتر نياز بوده است. طراحان و توليدكنندگان هميشه از خود ميپرسيدهاند: «چگونه ميتوان به سرعت و بهرهوري بيشتر در كارتهاي گرافيكي دست پيدا كرد؟» درواقع، همواره اين سؤال مطرح بود: «اگر پردازندهها در حداكثر ابعاد و تعداد ترانزيستور باشند، چگونه ميتوان سرعت را بازهم افزايش داد؟»
پاسخ به پرسش مذكور ساده است: بايد تعداد تراشهها را افزايش دهيم. البته قطعا اجراي چنين راهكاري آسان نيست. افزايش تعداد پردازندهها در كارتهاي گرافيكي در دورهاي از تاريخ سختافزار رخ داد؛ اما دورهاي طولاني نبود. درادامهي اين مطلب اخبار تخصصي، علمي، تكنولوژيكي، فناوري مرجع متخصصين ايران، داستان كارتهاي گرافيكي را مطالعه ميكنيم كه با بهرهمندي از چند GPU، به غولهاي واقعي بهرهوري و قدرت و البته ارزش تبديل شدند.
ظهور كارتهايي با پردازندهي چندگانه
پيشازآنكه تاريخچهي كارتهاي گرافيكي با چند GPU را شروع كنيم، ابتدا نگاهي به كارتهاي امروزي و نحوهي طراحي و پيكربندي قطعات الكترونيكي روي آنها خواهيم انداخت. روي برد مداري كه پس از برداشتن سيستم خنككننده ديده ميشود، قطعهي سيليكوني بزرگي مشاهده ميكنيم كه همان پردازندهي گرافيكي يا GPU است.
تمامي فرايندهاي محاسبهاي و مديريت دادهها كه براي شتابدهي به پردازش ويدئو و دادههاي دوبعدي و سهبعدي نياز است، در داخل يك تراشه تراشههاي ديگري كه روي برد مداري كارت گرافيك حضور دارند، ماژولهاي DRAM مخصوص GPU و تعدادي كنترلرهاي ولتاژ هستند.
ساختار كارتهاي گرافيكي هميشه اينچنين نبوده است؛ زيرا برخي از كارتهاي گرافيك سهبُعدي اوليه چند تراشه داشتند كه همهي آنها GPU محسوب نميشدند. بهعنوان مثال، كارت Voodoo1 از شركت 3dfx كه در سال ۱۹۹۶ به بازار عرضه شد، دو پردازنده روي برد مداري داشت؛ اما تنها يكي از آنها وظيفهي مديريت و پردازش بافتها را برعهده ميگرفت و ديگري پيكسلها را باهم تركيب ميكرد.
در كارت گرافيكي Voodoo 1 و بسياري از كارتهاي گرافيكي ابتدايي در بازار سختافزار، به تراشهاي مجزا براي انجام وظايف پردازشي دوبُعدي نياز بود. شركتهايي همچون ATI و انويديا و S3 پس از مدتي روند جديدي در طراحي در پيش گرفتند و تلاش كردند تمامي پردازندههاي مستقل را در ساختاري واحد تجميع كنند.
هرچه تعداد قطعات سيليكوني روي يك كارت گرافيكي بيشتر ميشد، هزينههاي توليد افزايش پيدا ميكرد؛ بههميندليل، پردازندههاي بازار مصرفكننده بسيار سريع بهسمت ساختار تراشههاي واحد پيش رفتند. بااينحال در همان دوران، كارتهاي گرافيكي حرفهاي بازار مصرفكننده مانند Voodoo 1 اغلب از ساختار چندتراشهاي استفاده ميكردند.
شركت 3DLabs زماني بهعنوان غول دنياي پردازش گرافيكي، خصوصا در صنعت رندر حرفهاي شناخته ميشد و اين شركت زماني با ساختن محصولات غولپيكر پردازش گرافيكي بهشهرت رسيد. يكي از محصولات كه در تصوير زير مشاهده ميكنيد، Dynmic Pictures Oxygen 402 نام دارد و با چند تراشه در دورهاي از تاريخ صنعت سختافزار بهعنوان غول حرفهاي پردازش گرافيكي شناخته ميشد.
كارت گرافيك غولپيكر 3DLabs دو تراشهي بزرگ داشت كه در سمت چپ و پايين تصوير مشاهده ميكنيد. اين تراشهها وظيفهي پردازش دوبُعدي و مديريت خروجي ويدئو را برعهده داشتند. چهار شتابدهنده نيز در زير هيتسينكهاي كارت قرار دارند كه كل پردازشهاي سهبُعدي را انجام ميدهند. در آن زمان، پردازش رئوس هندسي در سمت CPU انجام ميشد كه بعدا ساير بخشهاي رندر را در سمت كارت گرافيك تركيب ميكرد.
تراشههاي Oxygen رئوس هندسي را به مثلث تبديل ميكردند و سپس هر فريم با تركيب رندر رنگ و بافت، به پيكسل منتقل ميشد. صرفانديشه متخصصين از فرايند رندر كه خود جزئيات و مشخصات خاصي دارد، اين سؤال مطرح ميشود: «چرا به چهار شتابدهندهي رندر سهبُعدي نياز بوده است و چرا شركت سازنده تراشهي بزرگ يكپارچهاي توليد نميكرد؟»
تركيب قدرت چند پردازندهي گرافيكي
براي درك دليل استفاده از چند پردازنده در كارتهايي همچون محصول 3dLabs، ابتدا بايد نگاهي كلي به فرايند توليد و نمايش تصاوير سهبعدي بيندازيم. ازلحاظ تئوري، ميتوان تمامي محاسبات لازم را با استفاده از CPU انجام داد؛ اما پردازندههاي مركزي اغلب براي وظايف انشعابي و تصادفي در ساختار خطي طراحي ميشوند.
گرافيك سهبعدي برخلاف وظايف مرسوم پردازندههاي مركزي بسيار سادهتر است؛ اما به حجم عظيمي از فعاليتهاي موازي در مراحل متعدد نياز دارد. فعاليتها و پردازشهاي موازي و چندمرحلهاي نيز از توان و قدرت CPU خارج خواهد بود. اگر پردازندهي مركزي مشغول وظيفهي رندركردن يك فريم باشد، ديگر نميتواند كار متفرقهاي انجام دهد.
پردازندههاي گرافيكي بهدليل همان محدوديتهايي متولد شدند كه پردازندههاي مركزي در حوزهي وظايف موازي داشتند. اگرچه هنوزهم فعاليتهاي مقدماتي براي يك فريم سهبُعدي پردازندهي مركزي انجام ميشود، محاسبههاي رياضي مخصوص گرافيك به تراشهاي مخصوص نياز دارند. تصوير زير روند زماني پردازش چهار فريم را نشان ميدهد كه در آن، پردازندهي مركزي وظايف موردنياز در هر دوره را ايجاد ميكند.
دستورالعملها و اطلاعاتي كه نشان ميدهند چه دادهاي براي چه مرحلهاي نياز خواهد بود، از پردازندهي مركزي به پردازندهي گرافيكي ارسال ميشوند. اگر ارسال دستورالعملها بيش از زمان موردنياز براي تنظيمكردن فريم بعدي طول بكشد، در نمايش فريمها با تأخير مواجه ميشويم و بهنوعي بايد منتظر پايانيافتن فرايند پردازش و رندر روي فريم اول بمانيم.
از نگاهي ديگر، ميدانيم كه نرخ فريم GPU كمتر از CPU است. تراشهي گرافيكي قدرتمندتر قطعا زمان موردنياز براي رندركردن فريم را كاهش ميدهد؛ اما اگر ازلحاظ كيفيت و شرايط ساخت چنين پردازندههايي در سطح مهندسي و هزينهي توليد محدوديتهايي داشته باشيم، چه راهكارهاي ديگري پيشنهاد ميشوند؟
دو راهكار براي رفع اشكال طراحي و توليد تراشههاي گرافيكي بزرگتر وجود دارد: ۱. استفاده از GPU ديگر براي شروع رندر فريم بعدي در زماني است كه GPU اول رندر فريم اول را انجام ميدهد؛ ۲. ميتوان فشار كاري رندر هر فريم را بين چند تراشه تقسيم كرد. راهكار اول بهنام alternate frame rendering يا AFR شناخته ميشود.
دياگرام بالا چگونگي اجراي ساختار AFR را نشان ميدهد. همانطوركه ميبينيد، فاصلهي زماني بين نمايش فريمها روي نمايشگر درمقايسهبا حالت استفاده از پردازندهي گرافيكي واحد كمتر شده است. نرخ فريم كلي نيز بهتر ميشود؛ هرچند هنوزهم در سطحي پايينتر از CPU قرار دارد.
با روش AFR همچنان تأخير درخورتوجهي بين زمان كار روي فريم اول و نمايش آن روي نمايشگر وجود دارد. دليل چنين تأخيري آن است كه هنوز براي پردازش كل يك فريم، به يك GPU وابسته هستيم. راهكار ديگر كه وظيفهي كاري رندر فريم را بين دو يا چند پردازندهي گرافيكي تقسيم ميكند، روشي متمركز بر اشتراكگذاري بخشهاي گوناگون فريم در بلوكهاي متنوع دارد كه بهنام split frame rendering شناخته ميشود. بهبيانِبهتر، در اين روش خطوط پيكسلها با ايجاد تغيير در وظيفهي رندر ايجاد ميشوند. اين راهكار در كارت گرافيك Dynami Oxygen اجرا ميشد.
با استفاده از روش بالا، هر فريم با سرعت بسيار بيشتري پردازش ميشود و تأخير بين انجام كار در CPU و نمايش فريم به ميزان چشمگيري كاهش مييابد. نرخ فريم كلي نيز شايد بهتر از AFR نباشد؛ ولي پايداري و ثبات بيشتري دارد.
هر دو روشي كه در بالا توضيح داديم، ميتوان با استفاده از چند كارت گرافيكي بهجاي چند پردازنده روي يك كارت گرافيكي اجرا كرد. فناوريهايي همچون CrossFire از شركت AMD و SLI از شركت انويديا هنوزهم در صنعت حضور دارند؛ البته امروزه در بازار مصرفكننده، ديگر اثر زيادي از ساختارهايي با چند كارت گرافيكي نيست.
در اين مقاله فقط كارتهاي گرافيكي مجهز به چند GPU را مطالعه ميكنيم؛ پس درادامه، بازهم همان ساختار را دنبال خواهيم كرد.
اژدها وارد ميشود
كارتهاي گرافيكي شركت 3DLabs به چند پردازندهي گرافيكي واقعا قدرتمند مجهز بودند؛ ولي ارزش بسيار گراني هم داشتند. بهعنوان مثال، كارت Oxygen 402 به ارزش ۳،۶۹۵ دلار فروخته ميشد كه با نرخ امروزي تقريبا ارزشش ۶ هزار دلار ميشود! دراينميان، شركت ديگري هم محصولاتي با چند پردازندهي گرافيكي توليد و عرضه ميكرد كه ارزشي مقرونبهصرفه داشتند.
دو سال پس از معرفي Oxygen 402 به بازار و در سال ۱۹۹۹، شركت ATI Technologies كارت گرافيكي Rage Fury MAXX را معرفي كرد. در آن زمان، اين شركت كانادايي سابقهي بيش از ۱۰ سال فعاليت در دنياي گرافيك را در كارنامهاش داشت و محصولات خانوادهي Rage نيز بسيار محبوب بودند.
كارت گرافيك MAXX شركت ATI از دو تراشهي Rage 128 بهره ميبرد كه هركدام ۳۲ مگابايت حافظهي SDRAM اختصاصي داشتند. اين محصول از روش AFR براي رندرگرفتن و خروجيدادن فريمها استفاده ميكرد. كمي بعد، محصول ATI از كارت گرافيك Nvidia GeForce 256 DDR شكست خورد كه با ارزش ۲،۹۹۹ دلاري و تنها ۲۰ دلار گرانتر، عملكردي بسيار بهتر داشت.
شركت 3dfx از پيشگامان توليد كارتهاي مجهز به چند GPU بود
در تاريخ كارتهاي گرافيكي، GeForce 256 بهعنوان اولين كارت گرافيكي شناخته ميشود كه با توضيح مجهزبودن به يك GPU به بازار معرفي و عرضه شد. پيش از معرفي محصول انويديا هم، عبارت GPU در بازار استفاده ميشد؛ اما اگر GPU را تراشهاي بدانيم كه تمامي محاسبات فرايند رندر را انجام ميدهد (از تبديل رئوس هندسي به شكلها و تركيب نور تا توليد بافت و تركيب پيكسلها)، انويديا اولين شركتي بود كه چنين تراشهاي توليد كرد.
شركت ديگري كه علاقهي زيادي به كشف محصولات مجهز به چند GPU داشت، 3dfx بود. آنها از پيشگامان تركيب و اتصال چند كارت گرافيكي بودند كه بهنام scan line interleaving يا SLI شناخته ميشود. كارتهاي گرافيكي Voodoo 2 اولين محصولاتي بودند كه از اين فناوري همراهي ميكردند. شركت 3dfx تقريبا يك سال پس از معرفي و عرضهي ATI MAXX، محصولي بهنام Voodoo 5 5500 به بازار عرضه كرد كه ارزش خُردهفروشيِ كمتر از ۳۰۰ دلار داشت.
تراشههاي VSA-100 روي كارت گرافيك Voodoo 5 مانند تركيب Rage 128 Pro، ساختاري دوقلو داشتند؛ اما باس حافظهي بيشتري ارائه ميكردند. متأسفانه اين كارت گرافيكي ديرتر از انتظارها به بازار عرضه شد و اشكالات عملكردي متعددي هم داشت. از همه بدتر اينكه Voodoo 5 تنها كمي بهتر از GeForce 256 DDR بود و در رقابت با نسل بعدي، يعني GeForce 2 GTS، با ارزش ارزانتر هم كاملا شكست خورد.
بخشي از كمبودهاي عملكردي كارت Voodoo 5 را ميتوان بهدليل پردازندههاي گرافيكي دانست؛ اما رابطي كه در كارت استفاده شده بود، تأثير مستقيمي بر كاهش قدرت ميگذاشت. بخش موسوم به Accelerated Graphics Port يا AGP نسخهي مخصوص PCI bus قديمي بود كه بهصورت اختصاصي براي پردازندههاي گرافيكي ساخته شد. اگرچه اين ساختار چگونگي انتقال داده به كارت را بهبود داده بود، با داشتن اتصال مستقيم به حافظهي سيستمي، نميتوانست چند دستگاه متصل را مديريت كند.
درمجموع، كارتهاي مجهز به چند GPU به تراشهاي اضافه نياز داشتند تا يا نقش مديريت و مسئوليتي مانند دستگاه حاضر روي AGP را براي هدايت جريان داده به GPU بازي كند يا مانند Voodoo 5 يكي از پردازندههاي گرافيكي بايد آن وظايف را برعهده ميگرفت. همين عوامل باعث شد تا پايداري باس در كارتهاي مذكور با اشكال روبهرو شود و تنها راه براي حل آن نيز اجراي رابط كارت در نرخ پايينتر بود.
شركت ATI طراحي و تجربهي محصولات با چند GPU را ادامه داد؛ هرچند تعداد محدودي از آنها به بازار عمومي عرضه شدند. درنهايت نيز، شركت 3dfx به انويديا فروخته شد و حتي فرصت بهبود تراشههاي VSA-100 را پيدا نكرد. فناوري SLI آنها در كارتهاي گرافيكي بعدي انويديا استفاده شد كه البته تنها نام آن فناوري را يدك ميكشيد و ساختاري كاملا متفاوت داشت.
دراينبين، شركت XGI Technology كه اسپينآفي از شركت توليد تراشهي SiS بود، تلاش كرد با كارتهاي Volari Duo V8 Ultra وارد رقابت بازار كارتهاي گرافيكي مجهز به چند GPU شود. اگرچه در معرفي و بازاريابيهاي اوليه قدرت و توانايي زيادي براي كارت مذكور ادعا شده بود، درنهايت شركت موفق نشد محصولي قدرتمند به بازار عرضه كرد.
كارتهاي گرافيكي Volari Duo نتوانستند از سقوط شركت XGI جلوگيري كنند و در همان بازار، شركت ATI با كارتهاي گرافيكي مجهز به يك GPU مانند Radeon 9800XT و 9600Pro موفقيتهاي بيشتري كسب كرد. شايد تصور كنيد كه شركتها بهدليل اين رخدادها، از توليد كارتهاي گرافيكي با چند پردازنده منصرف شوند؛ اما آنها محصولاتي بسيار گرانارزش بودند. بااينهمه، هنوز يك شركت به آينده اميدوار بود: انويديا.
رقابت براي پيشرفت بيشتر
انويديا كه در سالهاي ۲۰۰۴ و ۲۰۰۵ بهصورت محدود كارتهاي گرافيكي مجهز به چند پردازندهي گرافيكي را معرفي كرده بود، تلاشهاي خود را در سال ۲۰۰۶ بيشتر كرد و كارتهاي GeForce 7900 و 7950GX2 را به بازار فرستاد. رويكرد اين شركت آمريكايي در كارتهاي جديد سال ۲۰۰۶ كمي با گذشته تفاوت داشت؛ بهگونهاي كه آنها بهجاي استفاده از دو GPU در يك مدار بردار، بهنوعي دو كارت گرافيك GeForce 7900 GT را بههم متصل كردند.
در آن سالها، AGP با استاندارد جديد PCI Express جايگزين شده بود. با اينكه رابط جديد آنچنان هم بالغ نبود، استفاده از PCIe اين امكان را فراهم ميكرد كه چند دستگاه را در يك درگاه بهكار انداخت. نكتهي مثبت اين بود كه كارتهاي گرافيكي با چند پردازنده، با پايداري بيشتري درمقايسهبا حالت AGP كار ميكردند.
كارتهاي گرافيكي مدل 7950GX2 با وجود ارزش ۵۹۹ دلاري هنگام رونمايي، با ارزشهاي ارزانتر هم در بازار پيدا ميشدند. ناگفته نماند، ارزش نهايي كمتر از هزينهي خريد دو كارت مجزاي 7900GT بود. در آن سالها، محصول انويديا بهعنوان سريعترين كارت گرافيك بازار در دستهي مصرفكننده شناخته ميشد.
رقابت بين انويديا و ATI تا ۶ سال بعد ادامه داشت؛ رقابتي كه با معرفي انواع كارتهاي گرافيكي مجهز به چند GPU همراه شد و هركدام دستهي خاصي از بازار را هدف قرار ميدادند. برخي از اين كارتهاي گرافيكي ارزش بسيار گراني داشتند. بهعنوان مثال، كارت Radeon HD 5790 با برچسب ارزشي ۶۹۹ دلاري بهدست مشتريان ميرسيد؛ البته شركتهاي سازنده هميشه سرعت بيشتر را بهعنوان بهانهاي براي ارزش گرانتر محصولات خود مطرح ميكردند.
برخي از كارتهاي گرافيك مجهز به چند GPU ارزش معقولي داشتند كه از ميان آنها ميتوان به GeForce GTX 295 اشاره كرد كه به ارزش ۵۰۰ دلار فروخته ميشد. ۵۰۰ دلار براي سال ۲۰۰۹ بازهم ارزش زيادي بود؛ اما باتوجهبه اينكه كارت GTX 260 متعلق به سال ۲۰۰۸ ارزش ۴۵۰ دلاري داشت و GTX 295 قدرتي دوبرابر آن را ارائه ميكرد، ۵۰ دلار هزينهي بيشتر بسيار منطقي بود.
رقابت در دنياي فناوري هميشه به پيشرفت و فتح قلههاي جديد ميانجامد. افزونبراين با اينكه كارتهاي گرافيكي پرچمدار در بازار هميشه به ارزش بسيار گران مشهور بودند، انويديا در سال ۲۰۱۲ حركت جديدي در بازار شروع كرد كه بازهم فاصلهي بين سطوح گوناگون را افزايش داد.
كارتهاي گرافيكي مجهز به چند GPU تا سال ۲۰۱۲ اغلب از پردازندههاي گرافيكي دستهي پايينتر در گروه محصولات حرفهاي استفاده ميكردند تا مصرف توان و گرما را در سطح رضايتبخشي نگه دارند. ارزشگذاري آن محصولات نيز بهگونهاي بود كه با وجود متمايزكردن كارتها از دستههاي ديگر محصول، بهازاي ارزششان عملكرد مناسبي ارائه ميكردند.
محصول انقلابي انويديا، GeForce GTX 690 با ارزش ۹۹۹ دلاري، رخدادي كاملا جديد در بازار كارتهاي گرافيكي مجهز به چند GPU بود. ارزش اين كارت گرافيك نهتنها دوبرابر محصول بعدي خود، يعني GTX 680 بود؛ بلكه دقيقا كارايي برابر با دو كارت GTX 680 را به متخصص ارائه ميكرد. همچنين، كارايي و قدرت كارت جديد انويديا از تركيب دو كارت AMD Radeon HD 7970 هم كمتر بود. تنها مزيت محصول جديد تيم سبز مصرف بهينهي توان بود. اين كارت مصرف توان ۳۰۰ واتي داشت؛ درحاليكه هر كارت گرافيك HD 7970 بهتنهايي ۲۵۰ وات برق مصرف ميكرد. بااينهمه، مزيت مصرف توان نسبت به ارزش بسيار گران كارت جديد آنچنان بهچشم نيامد.
اژدها خارج ميشود
انويديا پس از عرضهي GTX 690 به بازار، توجه و تمركز خود را روي كارتهاي گرافيك مجهز به يك پردازنده معطوف كرد. در ميانهي سال ۲۰۱۴، اين شركت كارتي به بازار عرضه كرد كه تا امروز بهعنوان آخرين كارت گرافيك مجهز به چند GPU از برند انويديا شناخته ميشود. كارت گرافيك GeForce GTX Titan Z با وجود قدرت خارقالعادهاي كه در شكل يك كارت گرافيك تكي ارائه ميكرد، بهنوعي آزمونوخطا انويديا محسوب ميشد. اين كارت گرافيك كه با ارزشي نزديك به سههزار دلار قطعا مخصوص گروه خاصي از مصرفكنندگان توليد شده بود، بههيچوجه محصولي منطقي بهانديشه متخصصين نميرسيد.
درمقابل، كارت جديد تيم سبز از پردازندههاي گرافيكي شبيه به GeForce GTX 780 Ti بهره ميبرد؛ اما براي كاهش مصرف توان، كلاك آنها تا حدودي كاهش پيدا كرده بود. درنهايت، GeForce GTX Titan Z عملكرد چندان بهتري از تركيب دوگانهي GTX 780 Ti نداشت. نكتهي مهم اين است كه كارت مذكور با ارزش ۶۹۹ دلار عرضه ميشد و خريد دو عدد از آن منطقيتر از خريد يك كارت GeForce GTX Titan Z بود.
با مطالعه ارزش كارتهاي همرده، متوجه ميشويم كه انويديا هزينهاي تقريبا دوبرابر ارزش مرسوم را در Titan Z از خريداران دريافت ميكرد. البته بازهم تنها ويژگي مثبت مصرف اندك توان بود كه وقتي دركنار معايب قرار ميگرفت، آنچنان بهچشم نميآمد. مصرف توان در كارتهاي گرافيكي AMD با چند پردازنده هميشه اشكالي بزرگ بود؛ البته تيم قرمز هم در سال ۲۰۱۵ توانست در Radeon R9 390 X2 اين اشكال را حل كند.
كارت گرافيكي Radeon R9 390 X2 با ارزش ۱،۳۹۹ دلار و مصرف توان ۵۸۰ وات به بازار عرضه ميشد. در مقام مقايسه، بايد بدانيد كه سيستمي معمولي در سال ۲۰۱۵ با برخورداري از كارت گرافيك ميانرده، توان مصرفي ۳۵۰ وات داشت. در ماههاي پاياني سال ۲۰۱۵، رقابت در بازار كارتهاي گرافيكي مجهز به چند پردازنده تقريبا بهپايان رسيده بود. انويديا ديگر محصول خاصي به بازار عرضه نميكرد و AMD نيز تنها چند كارت محدود متمركز بر بازار متخصصان حرفهاي معرفي كرد.
اكنون و پس از گذشت چند سال از سردشدن نبرد بر سر كارتهاي گرافيك با چند پردازنده، اين سؤال ايجاد ميشود: «آيا هنوزهم بازاري براي آنها وجود دارد؟» فراموش نكنيد كه كارتهاي گرافيك امروزي هم با ارزشهايي نزديك به هزار دلار فروش مطلوبي تجربه ميكنند؛ پس اشكال كارتهاي چندپردازندهاي لاخبار تخصصيا ارزش نبوده است. در مباحثه مصرف توان نيز، همين وضعيت وجود دارد. كارت گرافيك Radeon Pro Duo با دو پردازندهي گرافيكي توان طراحي گرمايي ۳۵۰ وات داشت كه ۴۰ درصد كمتر از R9 380 X2 بود.
كارتهاي گرافيكي با چند پردازنده هنوزهم در بازار وجود دارند. يكي از آنها در اپل مك پرو استفاده ميشود و AMD Radeon Pro Vega II Duo نام دارد كه با برچسب ارزشي ۲،۴۰۰ دلار، قطعا براي هر متخصصي مناسب نخواهد بود. متخصص كارشناسان دليل اصلي مرگ ظاهري كارتهاي مجهز به چند GPU را نه در خود محصولات، بلكه در نوع استفاده از قابليت آنها ميدانند.
كاربري اشتباه از فناوري
در سال ۱۹۹۹ كه كارت Rage Fury MAXX به بازار عرضه شد، بازيهاي سهبُعدي واقعي (با ساختار چندضلعي و بافت) هنوز جديد بودند. بهعنوان مثال، بازي Quake از id Software تنها سه سال قبل معرفي شده بود. كنسولهاي بازي همچون Sega Dreamcast عناويني با گرافيكهاي خيرهكننده داشتند؛ اما دنياي بازيهاي كامپيوتري آنچنان پررونق نبود. همهي آنها براي ارائهي جلوههاي بصري روشهاي مشابهي داشتند. ساختار بازي بهگونهاي بود كه تنها چندضلعيها را روشن ميكرد و كمي بافت نيز به صحنه اضافه ميشد. در آن زمان، پردازندههاي گرافيكي ظرفيتهاي محدودي داشتند و درنتيجه، گرافيك بازيها نيز بايد از محدوديتها پيروي ميكردند.
با پيشرفت سختافزارهاي كامپيوتري، توسعهدهندگان روشهاي پيچيدهتري براي رندر و ارائهي جلوههاي بصري بهكار گرفتند. هر فريم سهبُعدي شايد به چند مرحله رندر نياز داشته باشد تا تصوير نهايي را ارائه كند يا محتواي فريمي به فريم بعدي وارد شود. درنتيجهي پيشرفتهاي فناورانه در سيستم رند، فشار كاري روي پردازندههاي گرافيكي متنوعتر شد.
كاربراني كه از كارتهاي گرافيكي مجهز به چند پردازنده استفاده ميكنند يا پيكربندي چند كارت گرافيك دارند، در اكثر مواقع نرخ فريم بيشتري درمقايسهبا پيكربندي يك GPU تجربه ميكنند. ناگفته نماند افزايش تفاوت بين فريمها خود را در پديدهاي بهنام Micro Stuttering آشكار ميكند. در چنين پديدهاي، نرخ فريم بهيكباره سقوط ميكند و مجددا به وضعيت قبل بازميگردد؛ البته سقوط و بازگشت نرخ فريم بسيار سريع رخ ميدهد، درحدي كه حتي در بنچماركها نميتوان بهراحتي لحظهي سقوط و بازگشت را متوجه شد. درنهايت همين پايين و بالا شدن بهخوبي در بازي احساس ميشود. پديدهي Micro Stuttering در سيستمهايي با چند پردازندهي گرافيكي مرسوم است و با وجود راهكارهايي براي كاهش اثر آن، هنوز نميتوان پديده را كاملا حذف كرد.
در سال ۲۰۱۵، مايكروسافت رابط برنامهنويسي Direct3D 12 را عرضه كرد كه با هدف آسانسازي فرايند برنامهنويسي موتورهاي بازي ساخته شده بود. يكي از قابليتهاي مهم و جديد رابط ردمونديها، همراهي بهتر از پيكربندي چند پردازندهي گرافيكي بود. اگرچه رابط جديد بسياري از اشكالات را برطرف ميكرد، توسعهدهندگان بايد آن را بهطور كامل و با دقت در محصولات خود اجرا ميكردند. باتوجهبه پيچيدگي فرايند توسعهي يك عنوان بازي مدرن، وظيفهي اضافه براي هماهنگكردن موتور بازي با هدف بهبود بهرهبرداري از كارت گرافيك مجهز به چند GPU، فشار كاري توسعهدهندگان را افزايش ميداد. نكتهي مهمتر اينكه ابعاد بازار براي چنين بهينهسازي هم آنچنان بزرگ نبود.
استفادهي بهينه از پيكربندي مجهز به چند GPU، تنها به توسعهي بخشهاي اضافه در بازيها محدود نيست. حدود هشت سال پيش، انويديا و AMD در درايورهاي خود پروفايلهاي CrossFire/SLI توسعه دادند. اين پروفايلها، تنها پيكربنديهاي داخل سختافزاري بودند كه بهمحض شناسايي عنواني خاص فعال ميشدند؛ اما در گذر زمان، بهبود يافتند. بهعنوان مثال، برخي از ساختارهاي سايهزني پيش از كامپايلشدن در درايور، با هدف كاهش اشكالات پردازشي جايگزين ميشدند. بههرحال هنوزهم در درايورهاي جديد تلاشهايي براي كاهش اشكالات چند پردازندهي گرافيكي ميشود؛ ولي هنوز باگهاي متعددي در درايورها وجود دارد.
دليل اصلي مرگ كارتهاي گرافيكي با چند پردازنده در پيشنيازهاي نرمافزاري يا پديدهي micro stuttering نيست و درواقع، دليل اصلي اين بود كه توسعهي سريع كارتهايي با تراشههاي تكي بازار را بهسمت جديدي سوق داد.
كارت گرافيك Titan Z محصول سال ۲۰۱۴ نرخ محاسبهي FP32 برابر با پنج ترافلاپس داشت و پهناي باند حافظهي ۳۳۶ گيگابيتبرثانيه را به متخصص ارائه ميكرد. تنها چهار سال بعد، انويديا كارت GeForce RTX 2080 Ti را به بازار عرضه كرد كه توان پردازشي ۱۳/۴۵ ترافلاپس و پهناي باند ۶۱۶ گيگابيتبرثانيه داشت و تنها از يك تراشهي GPU بهره ميبرد. نكتهي مهمتر اينكه ارزش كارت جديد نصف Titan Z بود.
در محصولات AMD نيز رخدادي مشابه پيش آمد. كارت گرافيك Radeon RX 5700XT كه در سال ۲۰۱۹ و پنج سال پس از R9 380 X2 معرفي شد، با ارزش ۴۰۰ دلارياش، ۹۰ درصد قدرت پردازشي بيشتري ارائه ميكرد و پهناي باند آن نيز ۳۰ درصد بهتر از نسل قديمي بود.
اكنون بازهم اين سؤال مطرح ميشود: «آيا عمر كارتهاي گرافيكي با چند GPU بهپايان رسيده است؟» احتمالا بله. حتي در بازارهاي بسيار حرفهاي و وركاستيشن نيز نياز چنداني به اين كارتها وجود ندارد و جايگزيني يك GPU در يك مجموعه، از ازدستدادن چند تراشهي همزمان آسانتر بهانديشه متخصصين ميرسد. اين كارتها در دورهاي از تاريخ بازار خاصي را هدف گرفتند؛ اما بهمرورِزمان با افزايش مصرف توان و ارزشهاي سرسامآور، محبوبيت خود را از دست دادند.
هم انديشي ها