جزئيات جديدي از كارت هاي گرافيكي RTX و پردازنده ‌هاي امپر انويديا منتشر شد

يك‌شنبه ۱۶ شهريور ۱۳۹۹ - ۱۵:۴۵
مطالعه 19 دقيقه
مرجع متخصصين ايران
اخبار و اطلاعات جديدي از پردازنده‌هاي گرافيكي انويديا امپر به‌همراه قدرت و كارايي كارت‌هاي گرافيكي RTX 3070 و RTX 3080 و RTX 3090 منتشر شده است.
تبليغات

انويديا اطلاعات تكميلي جديدي را درباره‌ي كارت‌هاي گرافيكي RTX 30 خود دراختيار رسانه‌ها گذاشت. اطلاعات جديد، جزئياتي از عملكرد و بهره‌وري پردازنده‌هاي امپر (Ampere) موجود در كارت‌هاي مذكور را هم دراختيار مخاطبان قرار مي‌دهد. اطلاعات تكميلي، بخشي از برنامه‌ي مطالعه عميق محصولات انويديا هستند كه پردازنده‌هاي گرافيكي گيمينگ امپر مدل‌هاي GA 102 و GA 104 را مورد مطالعه قرار مي‌دهند. پردازنده‌هاي مذكور، به‌زودي و در قالب كارت‌هاي گرافيكي جديد دراختيار مصرف‌كننده‌ها قرار مي‌گيرند.

همان‌طور كه گفته شد، اطلاعات جديد انويديا پيرامون محصولات جديد، علاوه بر اشاره‌ي مجدد به برخي از جزئيات RTX 30، بيشتر روي توانايي‌ها و جزئيات پردازنده‌ي گرافيكي امپر متمركز مي‌شود. انويديا جلسه‌ي پرسش و پاسخي هم در رديت برگزار كرد كه اطلاعاتي جزئي در آن دراختيار مخاطبان قرار گرفت. اطلاعات جلسه‌ي مذكور بيشتر حول طراحي SM براي پردازنده‌هاي گرافيكي امپر تمركز داشت. ابتدا، نگاهي به پردازنده‌هاي گرافيكي داريم كه در دل كارت‌هاي RTX 30 قرار گرفته‌اند.

پردازنده‌ي گرافيكي پرچم‌دار GA102 (مخصوص RTX 3080 و RTX 3090)

پردازنده‌ گرافيمي GA102 به‌عنوان محصول پرچم‌دار انويديا در خانواده‌ي گيمينگ جديد شناخته مي‌شود كه در قالبي با ابعاد ۶۲۸ ميلي‌متر مربع ساخته مي‌شود. در مجموع، ۲۸ ميليارد ترانزيستور در اين تراشه استفاده شده است. انويديا مي‌گويد تراشه‌ي GA102 شامل ۶ واحد GPC (مخفف Graphics Processing Clusters) مي‌شود و همچنين ۶ واحد TPC‌ (مخفف Texture Processing Clusters) در آن وجود دارد. تراشه‌ي GA102 در RTX 3090 از ۴۱ واحد TPC يا ۸۲ واحد SM استفاده مي‌كند، درحالي‌كه در RTX 3080 اين اعداد به ۳۴ واحد TPC يا ۶۸ واحد SM مي‌رسند. هر واحد SM در پردازنده‌هاي گرافيكي اتمپر شامل ۱۲۸ هسته‌ي CUDA مي‌شود كه داراي ساختار بازطراحي‌شده هستند و در ادامه، جزئيات آن‌ها را شرح مي‌دهيم. پردازنده‌ي GA102 در RTX 3080 داراي ۱۰،۴۹۶ هسته است، درحالي‌كه در RTX 3080 شاهد ۸،۷۰۴ هسته هستيم.

پردازنده‌ي گرافيكي GA102 ازلحاظ چگالي، دوبرابر پردازنده‌ي تورينگ TU102 است و در هر ميلي‌متر مربع، ۴۴/۵۶ ميليون ترانزيستور دارد. در مدل قبلي، در هر ميلي‌متري مربع، ۲۴/۶۷ ميليون ترانزيستور وجود داشت. دليل اصلي افزايش چگالي را مي‌توان بهره‌برداري از روش توليد هشت نانومتري سامسونگ در پردازنده‌هاي جديد دانست.

مرجع متخصصين ايران مشخصات جزئي RTX 3080

هر واحد SM در پردازنده‌ي گرافيكي جديد شامل چهار هسته‌‌ي تنسور و يك هسته‌ي RT مي‌شود. پردازنده‌ي گرافيكي GA102 از يك حافظه‌ي كش L2 مشترك بهره مي‌برد. RTX 3090 داراي ۶ و RTX 3080 داراي پنج مگابايت حافظه‌ي كش است. دياگرام بلوكي اختصاي پردازنده‌ي گرافيكي كه ازسوي انويديا دراختيار رسانه‌ها قرار گرفت، مجموع ۱۰ كنترلر ۳۲ بيتي حافظه را در RTX 3080 نشان مي‌دهد كه باس ۳۲۰ بيتي را به‌هرماه دارد. كارت گرافيك RTX 3090 داراي ۱۲ كنترلر ۳۲ بيتي حافظه خواهد بود كه رابط باس ۳۸۴ بيتي را به‌همراه مي‌آورد.

پردازنده‌ي گرافيكي GA104 (مخصوص RTX 3070)

در دل كارت گرافيك انويديا RTX 3070، پردازنده‌ي گرافيكي GA104 قرار دارد. اين تراشه، يكي از چندين پردازنده‌ي گرافيكي امپر محسوب مي‌شود كه در دسته‌ي گيمينگ به بازار خواهد آمد. GA104 دومين تراشه‌ي سريع امپر در خانواده‌ي جديد محسوب مي‌شود كه آن هم با روش توليد هشت نانومتري سامسونگ ساخته شده است. پردازنده‌ي گرافيكي مذكور، ابعاد ۳۵۹/۲ ميلي‌متر مربعي داشته و ۱۷/۴ ميليارد ترانزيستور در آن قرار دارد. تعداد ترانزيستورهاي GA104 حدود ۹۳ درصد تعداد ترانزيستور GA102 مي‌شود. فراموش نكنيد كه GA104 ابعادي نصف GA102 دارد و درنتيجه چگالي بسيار بالايي را در آن شاهد هستيم.

مرجع متخصصين ايران معماري انويديا امپر
مرجع متخصصين ايران معماري انويديا امپر نسل دوم RTX
مرجع متخصصين ايران معماري انويديا تورينگ
مرجع متخصصين ايران كارت گرافيك Nvidia GeForce RTX 3090 و 3080 و 3070 كنار هم

انويديا در RTX 3070 از ۴۶ واحد SM استفاده مي‌كند كه در مجموع، ۵،۸۸۸ هسته‌ي CUDA را دراختيار متخصص مي‌گذارد. كارت گرافيكي RTX 3070 علاوه بر هسته‌هاي CUDA مجهز به نسل دوم هسته‌هاي رهگيري پرتو يا همان RT نيز مي‌شود. همچنين نسل جديد هسته‌هاي تنسور و SM كاملا جديد براي استريم چندگانه‌ي داده در واحدها در كارت جديد استفاده مي‌شوند. پردازنده‌ي گرافيكي GA104 شامل ۱۸۴ هسته‌ي تنسور و ۴۶ هسته‌ي RT مي‌شود. البته احتمال زيادي وجود دارد كه GA104 با پيكربندي ۶،۱۴۴ هسته‌اي عرضه شود كه شايد در يك محصول آتي شاهد آن باشيم. پردازنده‌ي GA104 از چهار مگابايت حافظه‌ي كش L2 اشتراكي بهره مي‌برد و در مجموع، هشت كنترلر حافظه‌ي ۳۲ بيتي در آن ديده مي‌شود. درنتيجه رابط باس اين كارت گرافيك، ۲۵۶ بيتي است.

مشخصات متخصص كارت‌هاي گرافيك RTX 30 مجهز به پردازنده‌هاي انويديا امپر

نام كارت گرافيك

انويديا GeForce RTX 3070

انويديا GeForce RTX 3080

انويديا GeForce RTX 3090

نام پردازنده گرافيكي

Ampere GA104-300

Ampere GA102-200

Ampere GA102-300

روش توليد

هشت نانومتري سامسونگ

هشت نانومتري سامسونگ

هشت نانومتري سامسونگ

ابعاد قالب

۳۹۵/۲ ميلي‌متر مربع

۶۲۸/۴ ميلي‌متر مربع

۶۲۸/۴ ميلي‌متر مربع

تعداد ترانزيستور

۱۷/۴ ميليارد

۲۸ ميليارد

۲۸ ميليارد

تعداد هسته‌هاي CUDA

۵،۸۸۸

۸،۷۰۴

۱۰،۴۹۶

TMU/ROP

نامشخص

نامشخص

نامشخص

هسته‌هاي Tensor/RT

184/46

272/68

328/82

كلاك پايه

۱۵۰۰ مگاهرتز

۱۴۴۰ مگاهرتز

۱۴۰۰ مگاهرتز

كلاك تقويت‌شده

۱۷۳۰ مگاهرتز

۱۷۱۰ مگاهرتز

۱۷۰۰ مگاهرتز

قدرت پردازشي FP32

۲۰ ترافلاپس

۳۰ ترافلاپس

۳۶ ترافلاپس

ترافلاپس RT

۴۰ ترافلاپس

۵۸ ترافلاپس

۶۹ ترافلاپس

TOPs هسته‌هاي تنسور

۱۶۳

۲۳۸

۲۸۵

ظرفيت حافظه

۸ يا ۱۶ گيگابايت GDDR6

۱۰ يا ۲۰ گيگابايت GDDR6X

۲۴ گيگابايت GDDR6X

باس حافظه

۲۵۶ بيت

۳۲۰ بيت

۳۸۴ بيت

سرعت حافظه

۱۴ گيگابيت‌برثانيه

۱۹ گيگابيت‌برثانيه

۱۹/۵ گيگابيت‌برثانيه

پهناي باند

۴۴۸ گيگابيت‌برثانيه

۷۶۰ گيگابيت‌برثانيه

۹۳۶ گيگابيت‌برثانيه

توان طراحي گرمايي

۲۲۰ وات

۳۲۰ وات

۳۵۰ وات

ارزش

۴۹۹ دلار

۶۹۹ دلار

۱۴۹۹ دلار

تاريخ عرضه

اكتبر ۲۰۲۰

۱۷ سپتامبر ۲۰۲۰

۲۴ سپتامبر ۲۰۲۰

طراحي پردازنده‌ي جريان يا SM در انويديا امپر

كارت‌هاي گرافيكي RTX 30 انويديا مجهز به پردازنده‌هاي امپر، با طراحي كاملا جديدي در بخش SM همراه هستند. در ادامه، جزئيات كاملي از طراحي جديد SM در معماري امپر مي‌خوانيد.

مرجع متخصصين ايران طراحي پردازنده‌ي جريان يا SM در انويديا امپر

توني تاماسي از تيم انويديا مي‌گويد يكي از اهداف مهم طراحي در SM در كارت‌هاي گرافيكي RTX 30 با پردازنده‌ي امپر، رسيدن به دوبرابر جريان عمليايتي FP32 نسبت به معماري تورينگ بوده است. واحد SM در پردازنده‌هاي امپر براي رسيدن به اين هدف از طراحي مسير داده‌اي جديد براي فرايندهاي عملياتي FP32 و INT32 بهره مي‌برند. هر مسير داده در هر جهت، شامل ۱۶ هسته‌ي FP32 CUDA مي‌شود كه توانايي اجراي ۱۶ عمليات FP32 را در هر چرخه‌ي كلاك دارند. مسير داده‌اي ديگر شامل ۱۶ هسته‌ي FP32 و ۱۶ هسته‌ي INT32 مي‌شود. درنتيجه‌ي اين طراحي جديد، هريك از بخش‌هاي Ampere SM در هر كلاك توانايي اجراي ۳۲ عمليات FP32 يا ۱۶ عمليات FP32 به‌همراه ۱۶ عمليات INT32 را دارد. همه‌ي چهار بخش SM در تركيب با يكديگر مي‌توانند ۱۲۸ عمليات FP32 را در يك كلاك انجام دهند كه دوبرابر نرخ FP32 در واحد‌هاي SM معماري تورينگ مي‌شود. همچنين آن‌ها مي‌توانند در هر كلاك، ۶۴ عمليات FP32 و ۶۴ عمليات INT32 انجام دهند.

طراحي جديد واحد SM در كارت‌هاي جديد RTX 30 كي از عوامنل اصلي افزايش سرعت آن‌ها است

دوبرابر كردن سرعت پردازش براي FP32، قدرت و عملكرد را براي تعدادي از فرايندها و الگوريتم‌هاي مرسوم گرافيكي بهبود مي‌بخشد. فرايندهاي سايه‌زني مدرن عموما تركيبي از دستورالعمل‌هاي FP32 حسابي مانند FFMA و FADD و FMUL دارند كه با دستورالعمل‌هاي ساده‌تر همچون جمع اعداد صحيح براي پيدا و دريافت كردن داده، مقايسه‌هاي مميز شناور، پردازش‌هاي حداقل/حداكثر و موارد ديگر مي‌شود. بهبود عملكرد بسته به سطح سايه‌زني يا اپليكيشن در پردازش‌ها متفاوت خواهد بود كه به مجموعه‌اي از دستورالعمل‌ها وابسته مي‌شود. سايه‌زن‌هاي حذف نويز در رهگيري پرتو مثال‌هاي خوبي هستند كه احتمالا از دوبرابر شدن جريان‌هاي داده‌اي در FP32 سود مي‌برند.

دوبرابر كردن جريان خروجي محاسبه در پردازنده، نيازمند دوبرابر كردن مسيرهاي داده‌اي بود كه از آن‌ها همراهي مي‌كردند. به‌همين دليل در Ampere SM شاهد دوبرابر شدن حافظه‌ي اشتراكي و عملكرد كش L1 در SM هستيم. در SM امپر شاهد ۱۲۸ بايت در هر كلاك هستيم كه در تورينگ، ۶۴ بايت در هر كلاك بود. انويديا، پهناي باند L1 براي GeForce RTX 3080 را ۲۱۹ گيگابايت‌برثانيه اعلام مي‌كند كه در مقايسه با ۱۱۶ گيگابايت‌برثانيه در GeForce RTX 2080 Super يك بهبود قابل‌توجه محسوب مي‌شود.

تاماسي در ادامه‌ي صحبت‌هايش مي‌گويد امپر هم مانند نسل‌هاي قبلي پردازنده‌هاي انويديا، مجهز به GPC، TPC، SM و ROP است كه دركنار كنترلرهاي حافظه عمل مي‌كنند. واحد GPC را مي‌توان يك بلوك سخت‌افزاري سطح بالا با سلطه‌ي بيشتر دانست. تمامي واحدهاي پردازشي گرافيكي كليدي در داخل GPC قرار مي‌گيرند. هر GPC شامل يك موتور اختصاصي Raster مي‌شود كه در طراحي جديد، دو پارتيشن ROP هم در آن قرار گرفته‌اند. هر پارتيشن، شامل هشت واحد ROP (مخفف Raster Operators) مي‌شود. اضافه شدن ROP را مي‌توان قابليت جديد پردازنده‌هاي گرافيكي مبتني بر معماري امپر در دسته‌ي GA10x دانست. تاماسي در پايان صحبت‌هايش مي‌گويد كه به‌زودي جزئيات بيشتر را در سند متخصص انويديا امپر منتشر خواهند كرد.

با نگاهي دقيق‌تر به واحد SM در امپر، متوجه وجود ۱۲۸ واحد FP32 در هر بلوك مي‌شويم. يكي از دو مسير داده‌اي FP32 مي‌تواند به‌صورت هم‌زمان فرايندهاي عملياتي INT32 را هم انجام دهد. هزينه‌هاي تنسور شامل چهار واحد مي‌شوند. چهار واحد بافت و يك هسته‌ي RT هم در هر SM ديده مي‌شود.

مرجع متخصصين ايران يادگيري عميق انويديا امپر / Nvidia Ampere
مرجع متخصصين ايران هسته تنسور نسل سوم انويديا امپر / Nvidia Ampere
مرجع متخصصين ايران رهگيري پرتو انويديا امپر / Nvidia Ampere
مرجع متخصصين ايران بهبود رهگيري پرتو انويديا امپر / Nvidia Ampere
مرجع متخصصين ايران بهبود موشن بلور در انويديا امپر / Nvidia Ampere
مرجع متخصصين ايران موشن بلور
مرجع متخصصين ايران معرفي موشن بلور در انويديا امپر / Nvidia Ampere
مرجع متخصصين ايران رندر صحنه موشن بلور انويديا امپر / Nvidia Ampere
مرجع متخصصين ايران شتاب‌دهي سخت افزاري انويديا امپر / Nvidia Ampere
مرجع متخصصين ايران معماري پاسكال انويديا
مرجع متخصصين ايران هسته هاي اختصاصي RT در انويديا امپر / Nvidia Ampere
مرجع متخصصين ايران هسته هاي اختصاصي RT انويديا امپر
مرجع متخصصين ايران بهبود قدرت با هسته هاي اختصاصي RT
مرجع متخصصين ايران معماري انويديا تورينگ
مرجع متخصصين ايران معماري سنتي انويديا پاسكال
مرجع متخصصين ايران معماري انويديا پاسكال در برابر تورينگ
مرجع متخصصين ايران انويديا تورينگ در مقابل انويديا امپر
مرجع متخصصين ايران معماري انويديا امپر / Nvidia Ampere
مرجع متخصصين ايران معماري انويديا امپر / Nvidia Ampere
مرجع متخصصين ايران RT حرفه اي در انويديا امپر / Nvidia Ampere
مرجع متخصصين ايران چالش IO در نسل جديد بازي‌ها
مرجع متخصصين ايران بهبود عميق عملكرد در انويديا امپر / Nvidia Ampere
مرجع متخصصين ايران مشخصات ذخيره سازي انويديا امپر / Nvidia Ampere
مرجع متخصصين ايران خواندن داده فشرده نشده در انويديا امپر / Nvidia Ampere
مرجع متخصصين ايران IO قديمي براي بازي ها اشكال ايجاد مي كرد
مرجع متخصصين ايران خواندن داده هاي فشرده در معماري قديمي گرافيكي
مرجع متخصصين ايران اشكال پردازنده در خواندن داده فشرده نشده
مرجع متخصصين ايران RTX IO
مرجع متخصصين ايران معرفي RTX IO
مرجع متخصصين ايران فشرده سازي به كمك NVMe
مرجع متخصصين ايران دمو انويديا امپر / Nvidia Ampere
مرجع متخصصين ايران دموي سرعت بارگذاري انويديا امپر / Nvidia Ampere

انويديا براي هسته‌هاي نسل سومي تنسور، از همان معماري Smarsity استفاده مي‌كند كه در خانواده‌ي محصولات Ampere HPC هم استفاده شده بود. امپر از چهار هسته‌ي تنسور در هر SM بهره مي‌برد كه كمتر از هشت هسته‌ي موجود در هر SM در تورينگ است. ازطرفي آن‌ها نه‌تنها از طراحي نسل سوم بهره مي‌برند، بلكه جريان‌هاي SM بزرگ‌تري هم دارند كه موجب افزايش تعداد مي‌شود. پردازنده‌هاي گرافيكي امپر توانايي اجراي ۱۲۸ فرايند عملياتي FP16 FMA را در هر هسته‌ي تنسور دارند كه از كل هسته‌هاي INT16 بهره مي‌برد و با به‌كار گرفتن معماري Sparsity تا ۲۵۶ افزايش پيدا مي‌كند. مجموع فرايندهاي عملياتي FP16 FMA به ۵۱۲ مي‌رسد و با به‌كارگيري معماري مذكور، مي‌توان آن را به ۱۰۲۴ رساند. اعداد مذكور، نشان‌دهنده‌ي بهبود دوبرابري نسبت به پردازنده‌هاي گرافيكي تورينگ هستند كه به‌لطف طراحي به‌روز تنسور ممكن مي‌شود.

فرايندهاي بهبود بالا براي هسته‌هاي رهگيري پرتو هم رخ مي‌دهد كه در نسل دوم، دوبرابر تداخل پرتو را نسبت به معماري تورينگ در پي دارند. بيشتر بودن تعداد واحدهاي SM همچنين باعث افزايش تعداد هسته‌هاي RT هم مي‌شود كه عملكرد كلي و شتاب‌دهي رهگيري پرتو را به‌ميزان قابل‌توجهي در امپر افزايش مي‌دهد. 

حافظه‌ي GDDR6X، تكامل بعدي در دنياي گرافيك

حافظه‌هاي Micron GDDR6X دستاوردهاي مهمي در كارت‌هاي گرافيكي جديد دارند. اين حافظه‌ها سريع‌تر هستند و دركنار دوبرابر كردن نرخ داده‌ي I/O، براي اولين‌بار از سيگنال‌دهي PAM4 چندسطحي در قالب‌هاي حافظه بهره مي‌برند. حافظه‌هاي مذكور در كلاس محصولات انويديا RTX 3090 به پهناي باند تا يك ترابايت مي‌رسند كه براي اجراي بازي‌هاي حرفه‌اي نسل بعد در رزولوشن 8K عالي خواهند بود.

مرجع متخصصين ايران  حافظه گرافيكي GDDR6X

مشخصات و قابليت‌هاي GDDR6X SGRAM جديد

  • نرخ داده‌ي SGRAM در حافظه‌هاي جديد نسبت به نسل قبلي دوبرابر مي‌شود كه در هر تراكنش، توان كمتري هم مصرف مي‌كنند و از مرز يك ترابايت‌برثانيه در پهناي باند حافظه‌ي سيستمي فراتر مي‌روند.
  • اين حافظه‌ها، اولين دستگاه‌هاي حافظه‌اي اختصاصي گرافيك محسوب مي‌شوند كع از سيگنال‌دهي رمزنگاري شده‌ي PAM4 بين پردازنده و DRAM بهره مي‌برند. در سيستم جديد، از چهار سطح ولتاژ براي رمزنگاري و جابه‌جايي دو بيت از داده در هر كلاك رابط استفاده مي‌شود.
  • حافظه‌هاي جديد را مي‌توان در سرعت‌هاي بسيار بالا با پايداري مناسب طراحي كرد و به كار انداخت. امكان توليد انبوه آن‌ها نيز اكنون فراهم شده است.

همان‌طور كه گفته شد، GDDR6X از سيگنال‌دهي چندسطحي PAM4 جديد استفاده كرده كه سرعت انتقال داده را بسيار سريع‌تر مي‌كند. همچنين نرخ I/O نيز بهبود پيدا مي‌كند و ظرفيت هر قالب حافظه در آن از ۶۴ به ۸۴ گيگابيت‌برثانيه مي‌رسد. قالب‌‌هاي حافظه‌ي Micron GDDR6x همچنين تنها DRAMهاي مخصوص گرافيك هستند كه مي‌توان با وجود بهره‌گيري از PAM4 آن‌ها را به‌صورت انبوه توليد كرد.

مرجع متخصصين ايران قالب حافظه micron gddr6x

نكته‌ي جذاب درباره‌ي حافظه‌هاي GDDR6X اينكه مي‌توان سرعت آن‌ها را تا ۲۱ گيگابيت‌برثانيه افزايش داد. البته در RTX 3090 شاهد حداكثر سرعت ۱۹/۵ گيگابيت‌برثانيه در آن‌ها هستيم. ظاهرا توليدكننده‌ها مي‌توانند قالب‌هايي با ظرفيت بيشتر را هم از مايكرون خريداري كنند. مايكرون همچنين تأييد مي‌كند كه برنامه‌هايي براي افزايش سرعت حافظه‌ها تا بيش از ۲۱ گيگابيت‌برثانيه در سال ۲۰۲۱ داد، اما هنوز مشخص نيست كه چه كارت‌هايي از اين حافظه‌ها بهره خواهند برد.

حافظه‌هاي مايكرون GDDR6X نه‌تنها سرعت بيشتر، بلكه پهناي باند بيشتري را هم با ۱۵ درصد توان مصرفي كمتر نسبت به نسل قبل ارائه مي‌كنند.

مشخصات حافظه‌هاي GDDR6X در مقايسه با نسل‌هاي قبل

نام حافظه

GDDR5

GDDR5X

GDDR6

GDDR6X

 چگالي

از ۵۱۲ مگابايت تا هشت گيگابايت

هشت گيگابايت

هشت گيگابايت و ۱۶ گيگابايت

هشت گيگابايت و ۱۶ گيگابايت

VDD و VDDQ

۱/۵ يا ۱/۳۵ ولت

۱/۳۵ ولت

۱/۳۵ يا ۱/۲۵ ولت

۱/۳۵ يا ۱/۲۵ ولت

VPP

نامشخص

۱/۸ ولت

۱/۸ ولت

۱/۸ ولت

نرخ داده

تا هشت‌ گيگابيت‌برثانيه

تا ۱۲ گيگابيت‌برثانيه

تا ۱۶ گيگابيت‌برثانيه

۱۹ و ۲۱ و بيشتر از ۲۱ گيگابيت‌برثانيه

تعداد كانال

۱

۱

۲

۲

Access granularity

۳۲ بايت

۶۴ بايت - ۲ عدد ۳۲ بايتي در حالت pseuso 32B

دو كانال ۳۲ بايتي

دو كانال ۳۲ بايتي

Burst length

۸

۱۶ يا ۸

۱۶

۸ در حالت PAM4 و ۱۶ در حالت RDQS

سيگنال‌دهي

POD15/POD135

POD135

POD135/POD125

PAM4 POD135/POD125

پكيج

BGA-170

14x12x0.8mm ball pitch

BGA-190

14x12x0.65mm ball pitch

BGA-180

14x12x0.75mm ball pitch

BGA-180

14x12x0.75mm ball pitch

عرض I/O

x32/x16

x32/x16

دو كانال x16/x8

دو كانال x16/x8

تعداد سيگنال

61

- 40 DQ, DBI, EDC

- 15 CA

- 6 CK, WCK

61

- 40 DQ, DBI, EDC

- 15 CA

- 6 CK, WCK

70 يا 74

- 40 DQ, DBI, EDC

- 24 CA

- 6 or 10 CK, WCK

70 يا 74

- 40 DQ, DBI, EDC

- 24 CA

- 6 or 10 CK, WCK

PLL, DCC

PLL

PLL

PLL,DCC

DCC

CRC

CRC-8

CRC-8

دو عدد CRC-8

دو عدد CRC-8

VREFD

در هر دو بايت، داخلي يا خارجي

داخلي در هر بايت

داخلي در هر پين

داخلي در هر پين، سه گيرنده‌ي زيرمجموعه در هر پين

Equalization

نامشخص

RX/TX

RX/TX

RX/TX

VREFC

خارجي

خارجي يا داخلي

خارجي يا داخلي

خارجي يا داخلي

خود نوسازي يا SRF

بله، SRF موقتي كنترل‌شده

بله، SRF موقتي كنترل‌شده و SRF هايبرنيت

بله، SRF موقتي كنترل‌شده و SRF هايبرنيت

VDDQ-off

بله، SRF موقتي كنترل‌شده و SRF هايبرنيت

VDDQ-off

اسكن

SEN

IEEE 1149.1 JTAG

IEEE 1149.1 JTAG

IEEE 1149.1 JTAG

طراحي سيستم خنك‌كننده در GeForce RTX 30

انويديا يكي از بهترين طراحي‌هاي سيستم گرمايي Founders Edition را در كارت‌هاي گرافيكي RTX 30 پياده‌سازي كرده است. تيم سبز مي‌گويد عملكرد بهتر و سريع‌تر كارت‌هاي گرافيكي جديد، نيازمند راهكارهاي خنك‌كننده‌ي بهتر بود و به همين دليل، آن‌ها راهكاري مخصوص را براي نسل بعدي كارت‌هاي گرافيكي خود به‌كار گرفته‌اند. اين راهكارهاي جديد، پردازنده‌ي گرافيكي را در دماي پايين نگه مي‌دارند و با پياده‌سازي فناوري‌هاي متعدد موجود و تعدادي فناوري جديد، جلوي افزايش بيش‌ازحد صداي عملياتي را هم مي‌گيرند.

سيستم خنك‌كننده‌ي جديد فاندرز اديشن از يك هيت‌سينك مخصوص با آلياژ آلومينيم استفاده مي‌‌كند كه با بهره‌مندي از محفظه‌ي بخار و فن‌هاي مبتني بر فناوري محوري دوسويه، عملكردي عالي دارد. هيت‌سينك خنك‌كننده از يك پوشش نانوكربن بهره مي‌برد كه قطعا در كنترل كردن دما موفق خواهد بود.

مرجع متخصصين ايران سيستم خنك كننده در RTX 30

طراحي سيستم خنك‌كننده‌ي جديد در RTX 30 بسيار منحصربه‌فرد به‌انديشه متخصصين مي‌رسد. اين اولين طراحي در نوع خود محسوب مي‌شود كه آخرين بار نمونه‌اي مشابه با آن را در GTX 780 با هيت‌سينكي بزرگ ديده بوديم.

در طراحي سيستم خنك‌كننده‌ي جديد، موقعيت‌هاي خاصي براي قرارگيري فن ديده مي‌شود كه يكي در جلو و ديگري در پشت كارت قرار مي‌گيرد. اين پيكربندي كشش و مكش كه با تركيب فن دوگانه ايجاد مي‌شود، گرما را با عملكردي ساده‌تر و بهينه‌تر از خروجي بخار كارت گرافيك استخراج مي‌كند. البته كمي هوا به داخل كيس انتقال داده مي‌شود كه باتوجه‌به قدرت و كيفيت بالاي سيستم‌هاي خنك‌كننده‌ي كنوني و بهره‌مندي از خنك‌كننده‌هاي مايع، اشكال زيادي ايجاد نخواهد كرد.

مرجع متخصصين ايران جريان هوا در سيستم خنك كننده RTX 30
مرجع متخصصين ايران سيستم خنك كننده RTX 30
مرجع متخصصين ايران جريان هوا كيس
مرجع متخصصين ايران نمودار سيستم خنك كننده RTX 3080
مرجع متخصصين ايران سيستم خنك كننده RTX 30 در مقايسه با RTX 2080
مرجع متخصصين ايران نمايي از RTX 30 در كيس
مرجع متخصصين ايران جريان سيستم خنك كننده RTX 30
مرجع متخصصين ايران جريان هوا در RTX 30

انويديا تأكيد مي‌كند كه طراحي جديد فاندرز اديشن صداي كمتري نسبت به خنك‌كننده‌هاي سنتي دومحوره دارد و همچنين عملكردي دوبرابر بهتر از آن‌ها را ارائه مي‌كند. تغيير در طراحي مصرف توان و خصوصا NVLink نقش مهمي در بهبود عملكرد سيستم خنك‌كننده داشته است. تغييرات جديد، جريان بهتر هوا را در از ميان بزرگ‌ترين مجموعه‌ي فين طراحي‌شده تا به امروز، آسان‌تر مي‌كند. منافذ براكتي بزرگ‌تر در ساختار خنك‌كننده در تركيب با فين‌هاي خاص، جريان بزرگ‌تري از هوا را ممكن مي‌كنند. از هر جهت كه نگاه كنيد، طراحي فاندرز اديشن با تمركز بر افزايش جريان هوا انجام شده است. به حداقل رساندن دما و رسيدن به بالاترين سطح عملكرد با كمترين صدا، همگي در طراحي جديد لحاظ شده‌اند.

مرجع متخصصين ايران بهبود عملكرد در توان مصرفي خنك كننده RTX 30

كارت گرافيك RTX 3080 در ممباحثه صداي خنك‌كننده و عملكرد، در حداكثر دماي ۷۸ درجه‌ي سانتي‌گراد عمل مي‌كند. كارت گرافيك مذكور براي رسيدن به حداكثر بايد به توان ۳۲۰ وات برسد كه در آن حالت، خروجي صداي ۳۰ دسي‌بل خواهد داشت. در مقام مقايسه، كارت گرافيك تورينگ فاندر اديشن حداكثر دماي ۸۱ درجه‌ي سانتي‌گراد داشت و حداكثر صداي آن نيز با توان ۲۴۰ وات، ۳۲ دسي‌بل گزارش مي‌شد (كارت گرافيك RTX 2080 Super).

مرجع متخصصين ايران بهبود ۱/۹ برابري عملكرد در توان مصرفي خنك كننده RTX 30

در آزمايش‌هاي اختصاصي تيم سبز،  RTX 3080 فركانس ميانگين ۱۹۲۰ مگاهرتز را با توان مصرفي ۳۱۰ وات ثبت مي‌كند كه حداكثر دماي آن را به ۷۶ درجه مي‌رساند. انويديا در همين مقايسه، فاكتور ۱/۹ برابر را مطرح كرده و ادعا مي‌كند كه RTX 3080 با صدا و دماي كمتر امكان ارائه‌ي خروجي ۱۰۰ فريم‌برثانيه را دارد كه در مقايسه با ۶۰ فريم‌برثانيه‌ي نسل قبلي، يك پيشرفت محسوب مي‌شود.

طراحي برد PCB و توان RTX 3080 و RTX 3090

يكي از تغييرهاي عمده‌اي كه در كارت گرافيك RTX 3090 Founders Edition ديده مي‌شود، در طراحي PCB نهفته است. كارت‌هاي گرافيكي RTX 3080 و RTX 3090 با پكيجينگ منحصربه‌فرد و كامپكت PCB طراحي و ساخته مي‌شوند كه قبلا در فضاي مصرف‌كننده در هيچ‌جا ديده نشده بود. ازطرفي كامپكت بودن طراحي بدين معني نيست كه كارت‌ها توان مصرفي زياي ندارند. انويديا در همين كارت‌هاي كامپكت مجموعه‌اي با توان طراحي بسيار بالا قرار داده است.

مرجع متخصصين ايران طراحي PCB در RTX 30

برد PCB در كارت‌هاي جديد انويديا شامل ۲۰ بخش مصرف‌كننده‌ي توان مي‌شود كه طراحي خاص و حرفه‌اي آن را در مقايسه با كارت‌هاي RTX 20 پرچم‌دار نشان مي‌دهد. پردازنده‌ي گرافيكي توان مورد نياز خود را از ۱۸ فاز دريافت مي‌كند و توان حافظه نيز از دو فاز ديگر تأمين مي‌شود. انويديا مي‌گويد اين نوع از PCB يك محصول عالي براي اوركلاك محسوب مي‌شود كه متخصصان با استفاده از آن، به توان‌هاي بسيار بالاتري خواهند رسيد. البته PCB در نسخه‌ي فاندرز اديشن با نسخه‌‌ي عادي تفاوت دارد و در نسخه‌هاي مرسوم، از همان طراحي چهارگوش استفاده مي‌شود.

مرجع متخصصين ايران طراحي جديد PCB در RTX 30

كارت‌هاي گرافيكي RTX 30 مدل فاندرز اديشن علاوه بر طراحي جديد، از كانكتورهاي برق ۱۲ پيني Micro-Fit 3.0 بهره مي‌برند. اين كانكتورها نيازي به ارتقا منبع تغذيه ايجاد نمي‌كنند چون با رابط‌هاي 2x8pin به 1x12pin عرضه مي‌شوند و مي‌توان بدون اشكال تأمين توان، از آن‌ها بهره برد.

جانمايي كانكتورهاي ۱۲ پيني روي PCB در كارت‌هاي جديد انويديا يك نوآوري ديگر را از تيم سبز نشان مي‌دهد. پين‌ها به‌صورت عمودي جانمايي شده‌اند و باتوجه‌به طراحي PCB، مي‌توان دليل استفاده از طراحي ۱۲ پيني را به‌جاي طراحي استاندارد هشت پيني استاندارد متوجه شد. در PCB فضاي محدودي براي انجام فرايندهاي اين‌چنيني وجود دارد و بايد از ورودي توان كوچك‌تر استفاده مي‌شد.

عملكرد، زمان عرضه و ارزش RTX 30

انويديا در اطلاعات تكميلي خود جزئياتي از اعداد و ارقام توان در كارت‌هاي گرافيكي جديد منتشر كرد. در نمودارهاي زير، توان و عملكرد كارت‌هاي RTX 3070 و RTX 3080 و RTX 3090 v را مشاهده مي‌كنيد.

مرجع متخصصين ايران قدرت و عملكرد RTX 30

انويديا هنوز هيچ آمار و ارقام دقيقي درباره‌ي كارت‌هاي جديد سري RTX 30 منتشر نكرده است، اما باتوجه‌به همين رونمايي كلي هم مي‌توان پيش‌بيني كرد كه RTX 3070 عملكردي بالاتر از RTX 2080 Ti دارد و RTX 3080 بسيار بهتر از RTX 2080 Ti خواهد بود. كارت گرافيك پرچم‌دار RTX 3090 هم كه سرعتي تقريبا ۵۰ درصد بهتر از RTX 2080 Ti دارد و بهبودي عالي را در مجموعه‌ي خانواده‌ي جديد نشان مي‌دهد.

مرجع متخصصين ايران BFGPU در RTX 30
مرجع متخصصين ايران عملكرد RTX 3070
مرجع متخصصين ايران عملكرد RTX 3080
مرجع متخصصين ايران كارت گرافيك Nvidia GeForce RTX 3090 از نماي بالا

درواقع انويديا پيش‌نمايشي كلي را از عملكرد و قدرت كارت‌هاي جديد به نمايش گذاشت. آن‌ها پيش‌نمايشي از Doom Eternal را با RTX 3080 نمايش دادند كه بسيار بهتر از RTX 2080 Ti ظاهر شد و همچنين توانايي عالي كارت در اجراي بازي‌هاي 4K هم به نمايش گذاشته شد. در اكثر بازي‌‌هاي AAA، كارت‌هاي جديد انويديا توانايي رسيدن به حداكثر نرخ فريم ۶۰ فريم‌برثانيه را دارند.

مرجع متخصصين ايران بازي هاي جديد همراهي RTX
مرجع متخصصين ايران بازي هاي RTX جديد
مرجع متخصصين ايران فورت نايت با RTX
مرجع متخصصين ايران DLSS جديد در فورت نايت
مرجع متخصصين ايران بازي هاي RTX جديد در چين
مرجع متخصصين ايران DLSS 2.0 در فورت نايت
مرجع متخصصين ايران DLSS 2.0 در مقايسه به DLSS 1.0
مرجع متخصصين ايران 3Dmark با همراهي از RTX جديد
مرجع متخصصين ايران DLSS 2.0 مقايسه با DLSS 1.0
مرجع متخصصين ايران RTX 3090 كيفيت 8K
مرجع متخصصين ايران اشكالات بازي 8K
مرجع متخصصين ايران 8K DLSS در RTX 30
مرجع متخصصين ايران HDMI 2.1 در RTX30
مرجع متخصصين ايران Nvidia DLSS 8K
مرجع متخصصين ايران RTX 30 مخصوص بازي 8K
مرجع متخصصين ايران AV1 Decoder در RTX 30

درنهايت نوبت به اطلاعات ارزش و زمان عرضه‌ي كارت‌هاي جديد انويديا مي‌رسد. تيم سبز مي‌گويد RTX 3080 اول از همه و در تاريخ ۱۷ سپتامبر به بازار عرضه مي‌شود. پس از آن نوبت RTX 3090 خواهد بود كه ۲۴ سپتامبر به بازار مي‌آيد و درنهايت RTX 3070 در ماه اكتبر به مصرف‌كننده‌ها عرضه مي‌شود. ازلحاظ ارزش نيز كارت‌ها به‌ترتيب ۱،۴۹۹ و ۶۹۹ و ۴۹۹ دلار ارزش خواهند داشت. به‌زودي نسخه‌هاي سفارشي و پرميوم نيز با ارزش‌هاي متنوع معرفي مي‌شوند.

تبليغات
جديد‌ترين مطالب روز

هم انديشي ها

تبليغات

با چشم باز خريد كنيد
اخبار تخصصي، علمي، تكنولوژيكي، فناوري مرجع متخصصين ايران شما را براي انتخاب بهتر و خريد ارزان‌تر راهنمايي مي‌كند
ورود به بخش محصولات