پردازنده‌هاي موبايل، لپ‌تاپ، دسكتاپ و سرور چه تفاوتي با يكديگر دارند؟

جمعه ۸ آذر ۱۳۹۸ - ۲۲:۰۰

مطالعه 16 دقيقه

در اين مقاله سعي شده تا با تكيه بر فاكتورهاي مؤثر بر قدرت پردازشي، معماري پردازنده‌هاي به‌كار رفته در كامپيوترهاي دسكتاپ، موبايل‌هاي هوشمند، لپ‌تاپ‌ها و سرورها مطالعه شود.

تبليغات

در مباحثه مربوط به پردازنده‌ها، بسياري عقيده دارند كه تراشه‌هاي به‌كار رفته در موبايل‌هاي جديد هوشمند توانسته‌اند تا حدودي فاصله‌ي بين قدرت پردازشي دستگاه‌هاي يادشده و كامپيوترهاي خانگي و لپ‌تاپ‌ها را كم كنند. با اينكه مقايسه‌ي پردازنده‌هاي مورد استفاده در دستگاه‌هاي مختلف، اساسا مقايسه‌ي صحيحي نيست. اما در اين مطلب سعي شده با تمركز بر معماري به‌كار رفته در پردازنده‌هاي مختلف، درك درستي از ساز‌وكار اين تراشه‌ها در تمامي زمينه‌ها فراهم شود. البته باتوجه به گستردگي وسعت موارد مؤثر، تنها بخشي از اِلمان‌هاي يادشده مطالعه خواهد شد. وقتي صحبت از موارد متخصصيِ پردازنده به ميان مي‌آيد، آن‌چه كه بيشتر جلب توجه مي‌كند مواردي چون سرورها، دستگاه‌هاي موبايل و كامپيوترهاي خانگي است. گستره‌ي متخصصد عبارت «موبايل» در حوزه‌ي فناوري نه‌تنها موبايل‌هاي هوشمند را شامل مي‌شود، بلكه لپ‌تاپ‌ها و نوت‌بوك‌ها را نير در بر مي‌گيرد. از اين‌رو در اين مقاله موارد مذكور به‌طور كامل مورد ارزيابي قرار خواهند گرفت. البته در ابتدا لازم است تا براي درك تفاوت موجود در پردازنده‌هاي مختلف، ماهيت پردازنده به‌صورت مختصر مورد واكاوي قرار گيرد.

پردازنده چيست و نحوه‌ي عملكرد آن چگونه است؟

پردازنده، ريزپردازنده يا واحد پردازش مركزيِ (CPU) مداري الكتريكي در بيشتر محصولات الكترونيكيِ هوشمند از قبيل كامپيوتر، موبايل‌هاي هوشمند، لپ‌تاپ‌ها و سرورها است. اين تراشه به واسطه‌ي انجام الگوريتم‌هاي پايه‌اي، كنترل و انجام عمليات ورودي/خروجيِ (I/O) مشخص‌شده، دستورالعمل‌هاي موجود در برنامه‌ها را انجام مي‌دهد. به بيان ساده عملكرد اساسي همه‌ي پردازنده‌ها، صرف‌انديشه متخصصين از ساختار فيزيكي‌شان، اجراي يك رشته از دستورالعمل‌هاي ذخيره شده است كه به آن برنامه گفته مي‌شود. تقريبا تمامي پردازنده‌ها هنگام اجراي عمليات روي دستورالعمل‌ها از مراحل واكشي (fetch)، رمزگشايي (decode) و اجرا (execute) پيروي مي‌كنند كه در مجموع به‌عنوان سيكل كلاك شناخته مي‌شود.

مقاله‌هاي مرتبط:

پردازنده‌ها چگونه طراحي و ساخته مي‌شوند؟ (قسمت اول)

راهنماي خريد CPU و پردازنده كامپيوتر - ۲۰۱۹

پس از اتمام مرحله‌ي اجرا براي يك دستورالعمل، كل فرايند‌ مذكور تكرار مي‌شود. در پردازنده‌ها حافظه‌هايي با نام ثبات (register) وجود دارد كه سريع‌ترين تجهيزات ذخيره‌سازي در يك سيستم كامپيوتري محسوب مي‌شوند. ثباتي با نام شمارنده‌ي برنامه (program counter) در پردازنده‌ها، آدرس دستورالعمل بعدي در رشته‌ي دستورالعمل‌ها را به‌جهت استفاده‌ي پردازنده در خود ذخيره مي‌كند. درواقع شمارنده‌ي پردازنده دستورالعمل‌ها را از حافظه‌ي اصلي واكشي مي‌كند. در برنامه‌هاي كامپيوتري يا موبايلي، دستورالعملهايي از نوع انشعاب وجود دارد. دستورالعمل‌هاي انشعاب شبيه به گزاره‌ي «اگر» براي يك پردازنده است. اگر شرايطي برقرار باشد (If True)، يك مجموعه از دستورالعمل‌ها اجرا مي‌شود و اگر آن شرايط برقرار نباشد (If False)، مجموعه دستورالعمل ديگري به اجرا گذارده مي‌شود. اگر دستورالعمل‌هاي يادشده اجرا شوند، شمارنده‌ي برنامه به‌گونه‌اي اصلاح مي‌شود كه دستورالعمل‌هاي صحيح را واكشي كند.

دستورالعمل واكشي‌شده از حافظه، مشخص مي‌كند كه پردازنده چه كاري را بايد انجام دهد. در مرحله‌ي رمزگشايي كه به وسيله‌ي مدار معروف به رمزگشاي دستورالعمل (instruction decoder) انجام مي‌شود، دستورالعمل‌ها به سيگنال‌هايي تبديل مي‌شوند كه ساير قسمت‌هاي پردازنده را كنترل مي‌كننند. نحوه‌ي تفسير دستورالعمل‌ها توسط معماري مجموعه دستورالعمل‌هاي پردازنده يا به‌اختصار ISA صورت مي‌پذيرد. پس از مراحل واكشي و رمزگشايي، مرحله‌ي اجرا انجام مي‌گيرد. بسته به معماري پردازنده، اين روند ممكن است يك يا چندين سيكل طول بكشد.

بيشتر پردازنده‌هاي مدرن مراحل معدود يادشده را براي افزايش بازدهي به دست‌كم ۲۰ مرحله‌ي خردتر تقسيم مي‌كنند. به عبارت ديگر، هر چند يك پردازنده در هر چرخه‌ي كاري يا سيكل كلاك اجراي چندين دستورالعمل را شروع مي‌كند، ادامه مي‌دهد و به سرانجام مي‌رساند؛ اما براي اجراي هر دستورالعمل از آغاز تا اتمام، ممكن است ۲۰ سيكل كلاك يا حتي بيشتر لازم باشد. به چنين مدلي در اصطلاح يك پايپ‌لاين اطلاق مي‌شود. پر شدن يك خط لوله با سيال در جريان مدتي به طول مي انجامد، اما پس از آن يك خروجي پايدار و ثابت از آن سيال به دست مي‌آيد. در پايپ‌لاين پردازنده، به‌جاي سيال دستورالعمل‌ها به جريان مي‌افتند.

حقيقت اين است كه فركانس پردازشي و تعداد هسته‌ها، ديگر معياري مناسب و شاخصي قابل‌اعتماد جهت ارزيابي قدرت پردازنده‌ها نيست. حتي اعداد و ارقام به‌عمل آمده از شاخص‌هاي يادشده در گذشته نيز درك درستي از كارايي پردازنده‌ها ارائه نمي‌كردند. حال كه پاي اين تراشه‌ها در دنياي موبايل‌هاي هوشمند بازشده، مقايسه‌ي پردازنده‌ها تنها با تكيه بر تعداد هسته‌ها و فركانس پردازشي اشتباهي محض است.

توان طراحي حرارتي و ليتوگرافي ساخت

آن‌چه كه در حال حاضر به‌‌عنوان معياري صحيح براي مقايسه‌ي پردازنده‌ها محسوب مي‌شود، تركيبي از توان طراحي حرارتي (TDP)، ليتوگرافي ساخت پردازنده، معماري به‌كار رفته در آن و مواردي از اين دست است. توان طراحي حرارتي در پردازنده، ميزان گرماي توليدشده توسط پردازنده، كارت گرافيك و SoC (سيستم روي تراشه يا SoC، مداري يكپارچه از اجزاي مختلف كامپيوتر از جمله پردازنده، كارت گرافيك و رم است) و مقدار توان لازم در سيستم خنك‌كننده جهت دفعِ آن است. در نگاه اول شايد اين سؤال پيش آيد كه چرا لاخبار تخصصي استفاده از خنك‌كننده‌اي قدرت‌مندتر كه در ظاهر نكته‌اي منفي در عملكرد پردازنده است، عاملي مهم در ميزان كارايي پردازنده محسوب مي‌شود؟ درواقع بالا رفتن TDP نشان‌دهنده‌ي افزايش ابعاد پردازنده در تمامي فاكتورها است.

از سال ۲۰۰۹ ليتوگرافي به نامي تجاري براي اهداف بازاريابي تبديل شده و نشان‌دهنده‌ي فناوري‌هاي به‌كار رفته در فرايند توليد تراشه است و درواقع ارتباطي با طول گيت در ترانزيستورهاي پردازنده ندارد.

براي درك موضوع كافي است ابعاد وسايل نقليه‌اي چون دوچرخه، قطار و هواپيما را در انديشه متخصصين بگيريد. هر كدام از دستگاه‌هاي يادشده، در نهايت مسافر را به مقصد خواهند رساند، اما حجم كاري و سرعت و متخصصي هر كدام از آن‌ها براي مصارف و اهداف خاصي مهم است و درواقع اين مصرف سوختشان است كه نشان‌دهنده‌ي كثرت قطعات به‌كار رفته در وسيله و پيچيدگي آن است. فاكتورهايي كه در پردازنده رابطه‌ي مستقيمي با بزرگي TDP دارند شامل پيچيدگي ريزمعماري، تعداد هسته‌ها، عملكرد پيش‌بيني‌كننده‌ي پرش، ميزان حافظه‌ي كش، تعداد پايپ‌لاين‌هاي اجرايي و مواردي اين‌چنيني است. لاخبار تخصصيا توان طراحي حرارتي بين محصولات توليديِ شركت‌هاي مختلف يكي نيست، اما محدوده‌اي كه اين معيار در آن قرار مي‌گيرد تقريبا در تمامي محصولات مشابه از يك متخصصي، يكسان است.

در مورد ليتوگرافي ساخت پردازنده مي‌توان اين‌گونه گفت كه در استاندارد تعريف‌شده توسط صنايع توليد تراشه، هر نسل از فرايند توليد تراشه‌هاي نيمه‌هادي يا به‌عبارتي ليتوگرافي ساخت پردازنده، با طول گيتِ ترانزيستورهاي به‌كار رفته در تراشه بر حسب نانومتر (سابقا ميكرومتر) مشخص مي‌شود. اگرچه از سال ۲۰۰۹ ليتوگرافي پردازنده به نامي تجاري براي اهداف بازاريابي تبديل شده و نشان‌دهنده‌ي نسل جديدي از فناوري‌هاي به‌كار رفته در فرايند توليد تراشه است و درواقع هيچ ارتباطي با طول گيت در ترانزيستورهاي به‌كار رفته در پردازنده ندارد. براي مثال فرايند ۷ نانومتري شركت تراشه‌سازي GlobalFoundries همانند ليتوگرافي ۱۰ نانومتري شركت اينتل است. بنابراين مفهوم حقيقي ليتوگرافي ساخت دچار ابهام شده است. علاوه بر اين تراشه‌هاي سامسونگ و شركت صنايع نيمه‌هادي تايوان (TSMC) با ليتوگرافي ۱۰ نانومتري تنها اندكي بيشتر از تراشه‌هاي ۱۴ نانومتري اينتل ترانزيستور دارند. حتي تراكم ترانزيستور در تراشه‌هاي ۱۰ نانومتري اينتل بيشتر از تراشه‌هاي ۷ نانومتري سامسونگ و برخي از انواع پردازنده‌هاي توليدي TSMC است. شايان ذكر است تراكم ترانزيستورها در تراشه‌هاي ۱۰ نانومتري اينتل ۱۰۰٫۷۶ ميليون ترانزيستور در ميلي‌متر مربع است. تعداد ترانزيستورهاي به كار رفته در تراشه‌هاي نوع N7P و N7FF صنايع نيمه‌هادي تايوان و تمامي تراشه‌هاي سامسونگ كمتر از مقدار يادشده براي تراشه‌ي ۱۰ نانومتري اينتل است. تعداد كل ترانزيستورها در پردازنده‌ي A13 بايونيك اپل ۸٫۵ ميليارد عدد است كه با تقسيم بر مساحت تراشه (۹۸٫۴۸ ميلي‌متر مربع) تراكمي تقريبا برابر با ۸۶ ميليون ترانزيستور در ميلي‌متر مربع را نشان مي‌دهد.

با تمامي اين‌ها، ليتوگرافي ساخت در معناي واقعي فاكتوري مهم در مقايسه‌ي پردازنده‌ها محسوب مي‌شود. با كاهش ليتوگرافي، بازده پردازنده افزايش مي‌يابد. بنابراين اگر دو پردازنده را با طراحي مشابه و ليتوگرافي متفاوت در انديشه متخصصين گرفت، پردازنده‌ي با ليتوگرافي پايين‌تر خصوصيات زير را دارا خواهد بود:

فركانس پردازشي بيشتري نسبت به پردازنده‌ي با ليتوگرافي بالاتر خواهد داشت

توان مصرفي پايين‌تري خواهد داشت.

گرماي كمتري توليد خواهد كرد.

به دليل تراكم بيشتر در تعداد ترانزيستورها، مساحت كمتري خواهد داشت.

به‌طور كلي هنگامي كه اينتل، AMD و سازنده‌هاي تراشه‌هاي مبتني‌بر معماري ARM مانند سامسونگ و كوالكام ليتوگرافي تراشه‌هايشان را كاهش مي‌دهند، بازدهي پردازنده نيز بهبود مي‌يابد. باتوجه به اينكه در اكثر اوقات متخصصان سرعت بالاي پردازشي را به كاهش توان مصرفي ترجيح مي‌دهند، شركت‌ها نيز در اين راستا اقدام مي‌كنند كه خود مانعي در برابر افزايش بهره‌وري در مصرف انرژي است. برخي نيز پردازنده‌هاي خود را به‌‌گونه‌اي طراحي مي‌كنند كه توازن ميان افزايش كارايي و ميزان كاهش مصرف انرژي را حفظ كنند. گروه سومي نيز هستند كه افزايش بهره‌وري در ميزان مصرف انرژي نسبت به افزايش سرعت پردازشي را در ارجحيت قرار مي‌دهند.

نكته‌ي اصلي كه بايد در انديشه متخصصين گرفته شود اين است كه توان طراحي حرارتي در موبايل‌هاي هوشمند در بيشترين حالت تنها ۵ وات است. اين در حالي است كه پردازنده‌هاي پايين‌رده‌ي دسكتاپ در حدود ۴۵ وات توان طراحي حرارتي دارند. توان طراحي حرارتي در پردازنده‌هاي سرور نيز اندكي بيشتر از پردازنده‌هاي دسكتاپ است. دليل تفاوت موجود در TDP دستگاه‌هاي يادشده، پيش‌تر نيز گفته شد. براي درك بهتر موضوع ذكر اين نكته لازم است كه پردازنده‌هاي به‌كار رفته در دستگاه‌هاي مختلف روي صفحاتي با نام داي ساخته مي‌شوند. در ممباحثه مدارات مجتمع، هر داي (die) يك بلوك كوچك از مواد نيمه‌رسانا است كه مداري با كاركرد خاص، طي فرآيندي مانند فوتوليتوگرافي روي آن ساخته شده‌ است. پردازنده‌ها در دستگاه‌هاي قابل حمل، SoC هستند. به اين معني كه بخش‌هاي مختلفي اعم از پردازنده، پردازنده‌ي گرافيكي، حافظه، كنترلر USB، مدارهاي مديريت مصرف انرژي و مودم‌هاي بي‌سيم واي‌فاي و شبكه‌هاي تلفن همراه در SoC در كنار هم تجميع شده‌اند. با اين حال اندازه‌ي كل داي در SoCها كوچكتر از پردازنده‌هاي كامپيوتر و سرور است. با درانديشه متخصصين گرفتن اين نكته، حتي اگر ليتوگرافي به كار رفته در پردازنده‌ها برابر بوده و تراكم ترانزيستورها برابر باشد، در اكثر موارد پردازنده‌هاي كامپيوتر تعداد بيشتري ترانزيستور دارند. در صورت برابر بودن اندازه‌ي داي‌ها نيز، باتوجه به كثرت قطعات در SoCها، تعداد ترانزيستورهايي كه تنها براي پردازنده استفاده شده‌اند، بسيار كمتر از پردازنده‌هاي كامپيوتر و سرور است.

از انديشه متخصصينات توان مصرفي نيز در طراحي پردازنده‌هاي دسكتاپ، محافظه‌كاري كمتري صورت مي‌پذيرد. اين در حالي است كه در دستگاه‌هاي موبايل، عملكرد تركيبي سخت‌افزار، نرم‌افزار و فريم‌ور به‌گونه‌اي است كه با ايجاد محدوديت‌هايي در سرعت پردازشي، عمر باتري را طولاني‌تر كنند. در پردازنده‌هاي دسكتاپ تنها زماني توان مصرفي كنترل مي‌شود كه تأثيري منفي در ايجاد بهترين عملكرد داشته باشد. علاوه بر اين در دستگاه‌هاي قابل حمل، ترفندهايي نرم‌افزاري اعم از كاهش نرخ فريم در قسمت‌هايي از بازي‌ها صورت مي‌پذيرد كه با پايين‌آوردن سطح عملكرد پردازنده توان مصرفي را نيز كاهش مي‌دهند. فركانس پردازشي نيز در SoCهاي دنياي موبايل براي مصرف بهينه‌ي انرژي محدود شده است. در پردازنده‌ي بالارده‌اي چون A13 بايونيك اپل ميزان فركانس پردازشي ۲٫۶۵ گيگاهرتز بوده و حتي كمتر از پردازنده‌هاي ميان‌رده‌ي نسل ششم اينتل است. اين نكته نيز بايد در انديشه متخصصين گرفته شود كه ميزان فركانس پردازشي تبليغ شده براي پردازنده‌هاي موبايل نشان‌دهنده‌ي كارايي پردازنده در بالاترين سطوح عملكردي است. اما فركانس پردازنده‌هاي كامپيوتري در حالت بوست و اوركلاك پردازنده به‌ميزان چشم‌گيري افزايش پيدا مي‌كند.

معماري

در مباحثه مربوط به معماري، تمامي پردازنده‌هاي دسكتاپ، لپ‌تاپ و سرور با بهره‌گيري از معماري X86 در مقابل پردازنده‌هاي موبايل با معماري ARM قرار گرفته‌اند. هر كدام كاركرد و وظيفه‌ي خاصي داشته و متخصصي متناسبي را عهده‌دار هستند. در مورد معماري و طراحي پردازنده‌هاي ARM، اين عبارت مخفف Acorn RICS Machines است، حال آنكه اگر منظور كمپاني توسعه‌دهنده‌ي اين معماري باشد، اختصار ARM كوتاه شده‌ي عبارت Advances RISC Machines است. ساليان مديدي است كه معماري ARM در مركز ريزپردازنده‌هاي مدرن و طراحي‌هاي فشرده قرار دارد.

ARM خانواده‌اي از معماري RISC يا reduced instruction set computing به مفهوم محاسبات بر پايه‌ي مجموعه‌ دستورالعمل‌هاي ساده‌شده براي پردازنده‌هاي مختلف است. در پردازنده‌هاي مبتني‌بر معماري RISC تمركز اصلي اين است كه تعداد دستورالعمل‌ها تا جاي ممكن كم بوده و دستورالعمل‌هاي مذكور تا جاي ممكن ساده باشند. دستورالعمل‌هاي ساده مزيت‌هايي را هم براي مهندسين سخت‌افزار و هم نرم‌افزار ايجاد مي‌كند. از آن‌جايي كه دستورالعمل‌ها ساده هستند، مدار به تعداد كمتري ترانزيستور احتياج دارد. درنتيجه تراشه كوچك‌تر بوده و فضاي بيشتري برا جاسازي قطعات ديگر در داخل دستگاه وجود دارد. به همين دليل نيز پردازنده‌هاي مبتني بر معماري ARM بيشتر SoC بوده و بسياري از قطعات را به‌صورت مجتمع در خود جاي داده‌اند.

اما دستورالعمل‌هاي ساده نيز با هزينه‌اي همراه هستند. انجام وظايف سنگين در اين نوع معماري، نيازمند تعداد بيشتري از دستورالعمل‌ها است. همين نيز منجر به افزايش مصرف حافظه و زمان اجراي طولاني‌ترِ دستورالعمل‌ها مي‌شود. با اين حال معماري ARM با پايپ‌لاين‌هاي سريع‌تر و افزايش فركانس پردازشي، تأخير يادشده در اجراي دستورالعمل‌ها را تا حدودي جبران مي‌كند. در سمت ديگر، پردازنده‌هاي اينتل و AMD تحت معماري x86 در خانواده‌اي با نام CISC قرار دارند كه مخففي از عبارت Complex Instruction Set Computing و به‌معني محاسبات براساس مجموعه دستورالعمل‌هاي پيچيده است.

فقدان قابليت SMT در معماري ARM دليل موجهي براي افزايش روز‌افزون تعداد هسته‌ها در اين معماري است.

برخلاف پردازنده‌هاي RISC، تمركز دستورالعمل‌ها در معماري CISC، بر انجام وظايف سنگين‌تر با ميزان بيشتري از انعلاف‌پذيري است. براي درك بهتر موضوع لازم است تا چند نكته را يادآور شويم. در تمامي پردازنده‌هاي حال حاضر، بخشي به‌نام ALU قرار دارد كه مختصر شده‌ي عبارت arithmetic logic unit به مفهوم واحد منطق و حساب است. داده‌هايي كه متخصص يا نرم‌افزارها وارد سيستم مي‌كنند عملوند نام دارد. كدهايي كه تايين مي‌كنند چه نوع عملياتي بايد صورت گيرد و نيز عملوندها، ورودي‌هاي ALU هستند. خروجي ALU نتيجه‌ي عمليات انجام‌شده است. درواقع كاري كه ALU انجام مي‌دهد انجام عمليات حسابي و بيتي روي اعداد باينري است.

در پردازنده‌هاي RISC، معماري به‌كار رفته از نوع load-store به مفهوم بارگذاري و ذخيره‌سازي است. در مهندسي كامپيوتر load-store، معماري از مجموعه دستورالعمل‌ها است كه دستورالعمل‌ها را به دو بخش تقسيم مي‌كند: دسترسي به حافظه و عمليات ALU. در بخش دسترسي به حافظه عملوندها از حافظه به ثبات‌ها بارگذاري مي‌شوند. سپس عمليات روي‌شان صورت مي‌پذيرد. در بخش عمليات ALU نيز عملوندها از قبل روي ثبات‌ها هستند. در كل روند كار در معماري load-store به اين صورت است كه داده‌ها در ابتدا روي ثبات‌ها كپي مي‌شوند. هنگام بارگذاري يا load، فرايند كپي از حافظه‌ي اصلي در ثبات سپس داده‌هايي كه عمليات روي‌شان صورت گرفته در حافظه‌ي اصلي ذخيره يا store مي‌شوند. در نهايت مي‌توان اين‌گونه گفته پردازنده‌هاي نوع RISC عمليات را تنها بين ثبات‌ها انجام مي‌دهند. در معماري نوع load-store دستورها به شكل زير است:

LOAD r1, Y

LOAD r2, Z

PROD r1, r2, r3

STORE r3, X

دستور اول و دوم متغيرهاي r1 و r2 را از آدرس y و z واقع در حافظه‌ي اصلي به ثبات درون پردازنده بارگذاري يا load مي‌كند. دستور سوم اين دو عدد را با هم ضرب كرده و مقدار r3 را توليد مي‌كند و دستور چهارم مقدار r3 را در آدرس x از حافظه‌ي اصلي ذخيره مي‌كند. ساده بودن دستورهاي load-store در معماري RISC سبب شده تا معماري يادشده و به تبع آن پردازنده‌هاي ARM كه در دستگاه‌هاي قابل حمل مورد استفاده هستند، تنها در يك سيكل كلاك هر دستورالعملي را اجرا كنند. اما به دليل تعدّد دستورالعمل‌ها در اين معماري، ثبات‌هاي بيشتري نيز مورد استفاده قرار مي‌گيرد.

اما در پردازنده‌هاي CISC، معماري به‌كار رفته از نوع register–memory به مفهوم ثبات-حافظه است. در مهندسي كامپيوتر معماري يادشده مجموعه دستورالعمل‌هايي است كه اجازه مي‌دهد عمليات نه‌تنها بين ثبات‌ها، بلكه بين بخشي از ثبات و بخشي از حافظه يا فقط در حافظه صورت گيرد. در رويكرد register–memory ممكن است يكي از عملوندها در ثبات و ديگري در حافظه باشد.در معماري نوع register–memory دستورهاي ضرب براي دو عدد به شكل زير است:

mul r1,r1

چنين دستوالعملي با اينكه عمليات پيچيده‌اي را انجام ميدهد و به هيچ وجه ساده‌سازي نشده، اما در عوض حافظه‌ي كمتري را اشغال مي‌كند. شايد به همين دليل است كه پردازنده‌هاي مبتني بر معماري ARM برخلاف نوع x86 روز به‌روز حافظه‌ي رم بيشتري را مي‌طلبند.

مقاله‌هاي مرتبط:

پردازنده‌ها چگونه طراحي و ساخته مي‌شوند؟ (قسمت دوم)

حركت به‌سمت اتم‌ها؛ رقابت تراشه‌سازان براي كاهش هرچه‌بيشتر ابعاد

پردازنده‌هاي پيچيده مي‌توانند چندين دستورالعمل را به‌صورت هم‌زمان واكشي، رمزگشايي و اجرا كنند. چنين قابليتي پردازش چندرشته‌اي هم‌زمان (Simultaneous Multithreading ) يا SMT ناميده مي‌شوند. پردازنده‌هايي كه قابليت SMT دارند، دستورالعمل‌ها را در هر هسته با دو يا چند رشته‌ي مجزا اجرا مي‌كنند. در پردازنده‌هاي دنياي موبايلي، يعني ARM، ايجاد چنين قابليتي باعث پيچيدگي ريزمعماري شده و ميزان توان مصرفي را بسيار بالا مي‌برد. از اين رو SMT تنها در پردازنده‌هاي مبتني بر معماري X86 مورد استفاده قرار مي‌گيرد. فقدان قابليت SMT در معماري ARM دليل موجهي براي افزايش روز‌افزون تعداد هسته‌ها در اين معماري است.

با اينكه مقايسه‌ي بين پردازنده‌هاي مختلف با متخصصي‌هاي متفاوت امكان‌پذير نبوده و نخواهد بود، نتايج حاصل از در كنار هم قرار دادن مشخصات اعلام‌شده براي اين پردازنده‌ها درك درستي از ريزمعماري استفاده‌شده در پردازنده‌هاي يادشده را براي متخصصان فراهم خواهد كرد. در ادامه برخي اطلاعات مربوط به تعدادي از پردازنده‌هاي مختلف از متخصصي سرور، دسكتاپ، لپ‌تاپ، تبلت و موبايل‌هاي هوشمند آورده شده‌ است. البته باتوجه به اينكه شركت اپل مشخصات مربوط به پردازنده‌هاي خود را به‌صورت عمومي منتشر نمي‌كند و اطلاعات به‌دست آمده تنها با واكاوي و تجزيه و تحليل پردازنده‌ها مشخص مي‌شود و اطلاعات زيادي از پردازنده‌ي جديد اين شركت، يعني A13 بايونيك در دسترس نيست، پردازنده‌ي نسل پيشين اپل با نام A12 بايونيك مطالعه خواهد شد.

پردازنده	AMD EPYC 7552	اينتل Core i9-9900K	اينتل Core i9-8950HK	اپل A12 بايونيك	كوالكام اسنپ‌دراگون 855
ليتوگرافي	۷ نانومتري	۱۴ نانومتري	۱۴ نانومتري	۷ نانومتري	۷ نانومتري
معماري	x86	x86	x86	ARMv8.3	ARMv8
تعداد هسته‌ها	۴۸	۸	۶	۶	۸
تعداد رشته‌ها	۹۶	۱۶	۱۲	۶	۸
ريزمعماري	Zen 2	Coffee Lake	Coffee Lake	Vortex, Tempest	Cortex-A76 Cortex-A55
فركانس پردازشي	۲٫۲ گيگاهرتز	۳٫۶ گيگاهرتز	۲٫۹ گيگاهرتز	۲٫۴۹ گيگاهرتز	۲.۸۴ گيگاهرتز ۲.۴۲ گيگاهرتز ۱.۸ گيگاهرتز
فركانس بوست	۳٫۳۵ گيگاهرتز	۵ گيگاهرتز	۴٫۶ گيگاهرتز	ندارد	ندارد
اندازه‌ي داي	۱۹۲ ميلي‌متر مربع	۳۵۵٫۵۲ ميلي‌متر مربع	۱۴۹ ميلي‌متر مربع	۸۳٫۲۳ ميلي‌متر مربع	۷۳٫۲۷ ميلي‌متر مربع
تعداد ترانزيستورها	۱۹٫۲ ميليارد	نامشخص	۷٫۲ ميليارد	۶٫۹ ميليارد	نامشخص
حافظه‌ي كش L1	۳ مگابايت	۶۴ كيلوبايت در هر هسته	۶۴ كيلوبايت در هر هسته	۱۲۸ كيلوبايت داده ۱۲۸ كيلوبايت دستورالعمل‌ها	نامشخص
حافظه‌ي كش L2	۲۴ مگابايت	۲۵۶ كيلوبايت در هر هسته	۲۵۶ كيلوبايت در هر هسته	۸ مگابايت	هسته‌ي Gold Prime كش ۵۱۲ كيلوبايتي هسته‌هاي Gold هركدام ۲۵۶ كيلوبايت هسته‌هاي Silver هركدام ۱۲۸ كيلوبايت
حافظه‌ي كش L3	۱۹۲ مگابايت	۱۶ مگابايت اشتراكي	۱۲ مگابايت اشتراكي	ندارد	۲ مگابايت L3 مشترك در قالب DSU ۳ مگابايت كش سطح سيستم
توان طراحي حرارتي	۲۰۰ وات	۹۵ وات	۴۵ وات	زير ۵ وات	زير ۵ وات
حافظه‌ي رم	۸ كانال ۶۴ بيتي DDR4 با فركانس ۳۲۰۰ مگاهرتز پهناي باند ۱۹۰٫۷ گيگابايت‌برثانيه	۲ كانال ۶۴ بيتي DDR4 با فركانس ۲۶۶۶ مگاهرتز پهناي باند ۳۹٫۷۴ گيگابايت‌برثانيه	۲ كانال ۶۴ بيتي DDR4 و LPDDR3 با فركانس ۲۶۶۶ و ۲۱۳۳ مگاهرتز پهناي باند ۳۹٫۷۴ گيگابايت‌برثانيه	مشخص نيست	۴ كانال ۱۶ بيتي LPDDR4X با فركانس ۲۱۳۳ مگاهرتز پهناي باند ۳۴٫۱ گيگابايت‌برثانيه

در ابتدا ذكر اين نكته لازم است كه هسته‌هاي پردازنده‌ي كوالكام اسنپ‌دراگون 855 به تعداد ۸ هسته از نوع Cortex-A76 و Cortex-A55 معماري ARM است. كوالكام با شخصي‌سازي هسته‌هاي مذكور نام‌هاي Kryo 485 Gold و Kryo 485 Silver و Kryo 485 Gold را برايشان درانديشه متخصصين گرفته است.

از انديشه متخصصين ليتوگرافي ساخت، پرواضح است كه پردازنده‌هاي جديد موبايل تراكم ترانزيستوري بيشتري دارند، اما كوچك بودن اندازه‌ي داي و SoC بودنشان باعث شده تا تعداد كمتري از ترانزيستورها تنها در هسته‌هاي پردازشي به‌كار برده شوند. براي مثال در پردازنده‌ي A12 بايونيك اپل با سطح مقطعي برابر با ۸۳٫۲۳ ميلي‌متر مربع، تنها ۱۱٫۹ ميلي‌متر معادل با ۱۴٫۲۹ درصد از سطح داي به هسته‌هاي پردازشي و قطعات مركب در آن اختصاص داده شده‌ است. با يك حساب سرانگشتي تعداد ترانزيستورها براي بخش مذكور برابر خواهد بود با اندكي كمتر از يك ميليارد ترانزيستور. با اينكه آمار و ارقام دقيقي از تعداد ترانزيستورها در پردازنده‌هاي جديد اينتل منتشر نمي‌شود و ساختار داي در پردازنده‌هاي مذكور مبهم است، اما سطحي از تراشه كه تنها براي پردازنده وقف شده به‌مراتب بيشتر است.

قطعات مجتمع در پردازنده‌ي A12 بايونيك اپل

ايجاد قدرت پردازش كامپيوتري در دنياي موبايل شايد سخت باشد، اما دست نيافتني نيست.

همان‌گونه كه در جدول مشاهده مي‌شود پردازنده‌هاي مبتني‌بر معماري X86 با دارا بودن پردازش چندرشته‌اي هم‌زمان، تعداد بيشتري از رشته دستورالعمل‌ها را به‌صورت هم‌زمان اجرا مي‌كنند. اما بنا بر معماري به‌كار رفته، سيكل كلاك بيشتري صرف پردازش دستورالعمل‌ها مي‌شود. نوع پايپ‌لاين عموما در هسته‌هاي ARM در نسل‌هاي مختلف دچار تغيير مي‌شود، اما باتوجه به ماهيت اين‌پردازنده‌ها مراحل خردترِ اجراي دستورالعمل‌ها كمتر از پردازنده‌هاي x86 است. براي مثال تعداد مراحل پايپ‌لاين‌ها در هسته‌ي Cortex-A55 معماري مذكور ۸ مرحله بوده و براي Cortex-A76 سيزده مرحله است. مراحل پايپ‌لاين براي پردازنده‌ي 9900k بين ۱۴ و ۱۹ مرحله است. پايپ‌لاين بيشتر به‌معني انجام دستورهاي پيچيده‌تر، اما با تعداد سيكل كلاك بيشتر است. فركانس پردازشي نيز در پردازنده‌هاي موبايل در جدول فوق، عموما كمتر از تراشه‌هاي كامپيوتري است. دليل فركانس پايين‌تر همان‌گونه كه در ابتدا گفته شد، پايين‌آوردن توان مصرفي است.

نتيجه‌گيري

همان‌گونه كه در ابتدا گفته شد، به دليل متخصصي‌هاي متفاوت در پردازنده‌هاي به‌كار رفته در دستگاه‌هاي مختلف، مقايسه‌ي انواع مختلف از پردازنده‌ها غيرممكن است. اما آيا اينكه هر پردازنده‌اي در طيف عملكردي خود، وظيفه‌اش را به خوبي انجام دهد مباحثه ديگري است. بزرگ‌ترين نقطه‌ي منفي در پردازنده‌هاي مبتني‌بر معماري ARM محدود‌سازي فركانس پردازشي و عدم استفاده از پردازش چندرشته‌اي در ساختار پردازنده‌ است. با گذر زمان و نياز به اجراي دستورهاي پيچيده‌تر در دستگاه‌هاي تلفن همراه، تعداد پايپ‌لاين‌ها افزايش پيدا كرده و فركانس پردازشي اندكي افزايش پيدا كرده است. اما توان مصرفي نيز به تبعِ آن بالا رفته است. چالش پيش‌رو براي ARM، تغيير ساختار به‌نحوي است كه با ثابت نگه‌داشتن مصرف انرژي، پردازش چندرشته‌اي به ساختار اين پردازنده‌ها اضافه شود.

در مورد پردازنده‌هاي x86 نيز پايين آوردن تعداد سيكل كلاك باعث تقويت قدرت پردازشي خواهد شد. واقعيت اين است كه به مرور زمان اين دو معماري به هم نزديك شده و سختار مشابه‌تري را نسبت به آن‌چه كه در گذشته شاهد بوديم، پيدا مي‌كنند. ايجاد قدرت پردازش كامپيوتري در دنياي موبايل شايد سخت باشد، اما دست نيافتني نيست.

مقاله رو دوست داشتي؟

انديشه متخصصينت چيه؟

بهروز ادراكى

جديد‌ترين مطالب روز

مقاله رو دوست داشتي؟

انديشه متخصصينت چيه؟

بهروز ادراكى

هم انديشي ها