پردازندههاي موبايل، لپتاپ، دسكتاپ و سرور چه تفاوتي با يكديگر دارند؟
در مباحثه مربوط به پردازندهها، بسياري عقيده دارند كه تراشههاي بهكار رفته در موبايلهاي جديد هوشمند توانستهاند تا حدودي فاصلهي بين قدرت پردازشي دستگاههاي يادشده و كامپيوترهاي خانگي و لپتاپها را كم كنند. با اينكه مقايسهي پردازندههاي مورد استفاده در دستگاههاي مختلف، اساسا مقايسهي صحيحي نيست. اما در اين مطلب سعي شده با تمركز بر معماري بهكار رفته در پردازندههاي مختلف، درك درستي از سازوكار اين تراشهها در تمامي زمينهها فراهم شود. البته باتوجه به گستردگي وسعت موارد مؤثر، تنها بخشي از اِلمانهاي يادشده مطالعه خواهد شد. وقتي صحبت از موارد متخصصيِ پردازنده به ميان ميآيد، آنچه كه بيشتر جلب توجه ميكند مواردي چون سرورها، دستگاههاي موبايل و كامپيوترهاي خانگي است. گسترهي متخصصد عبارت «موبايل» در حوزهي فناوري نهتنها موبايلهاي هوشمند را شامل ميشود، بلكه لپتاپها و نوتبوكها را نير در بر ميگيرد. از اينرو در اين مقاله موارد مذكور بهطور كامل مورد ارزيابي قرار خواهند گرفت. البته در ابتدا لازم است تا براي درك تفاوت موجود در پردازندههاي مختلف، ماهيت پردازنده بهصورت مختصر مورد واكاوي قرار گيرد.
پردازنده چيست و نحوهي عملكرد آن چگونه است؟
پردازنده، ريزپردازنده يا واحد پردازش مركزيِ (CPU) مداري الكتريكي در بيشتر محصولات الكترونيكيِ هوشمند از قبيل كامپيوتر، موبايلهاي هوشمند، لپتاپها و سرورها است. اين تراشه به واسطهي انجام الگوريتمهاي پايهاي، كنترل و انجام عمليات ورودي/خروجيِ (I/O) مشخصشده، دستورالعملهاي موجود در برنامهها را انجام ميدهد. به بيان ساده عملكرد اساسي همهي پردازندهها، صرفانديشه متخصصين از ساختار فيزيكيشان، اجراي يك رشته از دستورالعملهاي ذخيره شده است كه به آن برنامه گفته ميشود. تقريبا تمامي پردازندهها هنگام اجراي عمليات روي دستورالعملها از مراحل واكشي (fetch)، رمزگشايي (decode) و اجرا (execute) پيروي ميكنند كه در مجموع بهعنوان سيكل كلاك شناخته ميشود.
پس از اتمام مرحلهي اجرا براي يك دستورالعمل، كل فرايند مذكور تكرار ميشود. در پردازندهها حافظههايي با نام ثبات (register) وجود دارد كه سريعترين تجهيزات ذخيرهسازي در يك سيستم كامپيوتري محسوب ميشوند. ثباتي با نام شمارندهي برنامه (program counter) در پردازندهها، آدرس دستورالعمل بعدي در رشتهي دستورالعملها را بهجهت استفادهي پردازنده در خود ذخيره ميكند. درواقع شمارندهي پردازنده دستورالعملها را از حافظهي اصلي واكشي ميكند. در برنامههاي كامپيوتري يا موبايلي، دستورالعملهايي از نوع انشعاب وجود دارد. دستورالعملهاي انشعاب شبيه به گزارهي «اگر» براي يك پردازنده است. اگر شرايطي برقرار باشد (If True)، يك مجموعه از دستورالعملها اجرا ميشود و اگر آن شرايط برقرار نباشد (If False)، مجموعه دستورالعمل ديگري به اجرا گذارده ميشود. اگر دستورالعملهاي يادشده اجرا شوند، شمارندهي برنامه بهگونهاي اصلاح ميشود كه دستورالعملهاي صحيح را واكشي كند.
دستورالعمل واكشيشده از حافظه، مشخص ميكند كه پردازنده چه كاري را بايد انجام دهد. در مرحلهي رمزگشايي كه به وسيلهي مدار معروف به رمزگشاي دستورالعمل (instruction decoder) انجام ميشود، دستورالعملها به سيگنالهايي تبديل ميشوند كه ساير قسمتهاي پردازنده را كنترل ميكننند. نحوهي تفسير دستورالعملها توسط معماري مجموعه دستورالعملهاي پردازنده يا بهاختصار ISA صورت ميپذيرد. پس از مراحل واكشي و رمزگشايي، مرحلهي اجرا انجام ميگيرد. بسته به معماري پردازنده، اين روند ممكن است يك يا چندين سيكل طول بكشد.
بيشتر پردازندههاي مدرن مراحل معدود يادشده را براي افزايش بازدهي به دستكم ۲۰ مرحلهي خردتر تقسيم ميكنند. به عبارت ديگر، هر چند يك پردازنده در هر چرخهي كاري يا سيكل كلاك اجراي چندين دستورالعمل را شروع ميكند، ادامه ميدهد و به سرانجام ميرساند؛ اما براي اجراي هر دستورالعمل از آغاز تا اتمام، ممكن است ۲۰ سيكل كلاك يا حتي بيشتر لازم باشد. به چنين مدلي در اصطلاح يك پايپلاين اطلاق ميشود. پر شدن يك خط لوله با سيال در جريان مدتي به طول مي انجامد، اما پس از آن يك خروجي پايدار و ثابت از آن سيال به دست ميآيد. در پايپلاين پردازنده، بهجاي سيال دستورالعملها به جريان ميافتند.
حقيقت اين است كه فركانس پردازشي و تعداد هستهها، ديگر معياري مناسب و شاخصي قابلاعتماد جهت ارزيابي قدرت پردازندهها نيست. حتي اعداد و ارقام بهعمل آمده از شاخصهاي يادشده در گذشته نيز درك درستي از كارايي پردازندهها ارائه نميكردند. حال كه پاي اين تراشهها در دنياي موبايلهاي هوشمند بازشده، مقايسهي پردازندهها تنها با تكيه بر تعداد هستهها و فركانس پردازشي اشتباهي محض است.
توان طراحي حرارتي و ليتوگرافي ساخت
آنچه كه در حال حاضر بهعنوان معياري صحيح براي مقايسهي پردازندهها محسوب ميشود، تركيبي از توان طراحي حرارتي (TDP)، ليتوگرافي ساخت پردازنده، معماري بهكار رفته در آن و مواردي از اين دست است. توان طراحي حرارتي در پردازنده، ميزان گرماي توليدشده توسط پردازنده، كارت گرافيك و SoC (سيستم روي تراشه يا SoC، مداري يكپارچه از اجزاي مختلف كامپيوتر از جمله پردازنده، كارت گرافيك و رم است) و مقدار توان لازم در سيستم خنككننده جهت دفعِ آن است. در نگاه اول شايد اين سؤال پيش آيد كه چرا لاخبار تخصصي استفاده از خنككنندهاي قدرتمندتر كه در ظاهر نكتهاي منفي در عملكرد پردازنده است، عاملي مهم در ميزان كارايي پردازنده محسوب ميشود؟ درواقع بالا رفتن TDP نشاندهندهي افزايش ابعاد پردازنده در تمامي فاكتورها است.
از سال ۲۰۰۹ ليتوگرافي به نامي تجاري براي اهداف بازاريابي تبديل شده و نشاندهندهي فناوريهاي بهكار رفته در فرايند توليد تراشه است و درواقع ارتباطي با طول گيت در ترانزيستورهاي پردازنده ندارد.
براي درك موضوع كافي است ابعاد وسايل نقليهاي چون دوچرخه، قطار و هواپيما را در انديشه متخصصين بگيريد. هر كدام از دستگاههاي يادشده، در نهايت مسافر را به مقصد خواهند رساند، اما حجم كاري و سرعت و متخصصي هر كدام از آنها براي مصارف و اهداف خاصي مهم است و درواقع اين مصرف سوختشان است كه نشاندهندهي كثرت قطعات بهكار رفته در وسيله و پيچيدگي آن است. فاكتورهايي كه در پردازنده رابطهي مستقيمي با بزرگي TDP دارند شامل پيچيدگي ريزمعماري، تعداد هستهها، عملكرد پيشبينيكنندهي پرش، ميزان حافظهي كش، تعداد پايپلاينهاي اجرايي و مواردي اينچنيني است. لاخبار تخصصيا توان طراحي حرارتي بين محصولات توليديِ شركتهاي مختلف يكي نيست، اما محدودهاي كه اين معيار در آن قرار ميگيرد تقريبا در تمامي محصولات مشابه از يك متخصصي، يكسان است.
در مورد ليتوگرافي ساخت پردازنده ميتوان اينگونه گفت كه در استاندارد تعريفشده توسط صنايع توليد تراشه، هر نسل از فرايند توليد تراشههاي نيمههادي يا بهعبارتي ليتوگرافي ساخت پردازنده، با طول گيتِ ترانزيستورهاي بهكار رفته در تراشه بر حسب نانومتر (سابقا ميكرومتر) مشخص ميشود. اگرچه از سال ۲۰۰۹ ليتوگرافي پردازنده به نامي تجاري براي اهداف بازاريابي تبديل شده و نشاندهندهي نسل جديدي از فناوريهاي بهكار رفته در فرايند توليد تراشه است و درواقع هيچ ارتباطي با طول گيت در ترانزيستورهاي بهكار رفته در پردازنده ندارد. براي مثال فرايند ۷ نانومتري شركت تراشهسازي GlobalFoundries همانند ليتوگرافي ۱۰ نانومتري شركت اينتل است. بنابراين مفهوم حقيقي ليتوگرافي ساخت دچار ابهام شده است. علاوه بر اين تراشههاي سامسونگ و شركت صنايع نيمههادي تايوان (TSMC) با ليتوگرافي ۱۰ نانومتري تنها اندكي بيشتر از تراشههاي ۱۴ نانومتري اينتل ترانزيستور دارند. حتي تراكم ترانزيستور در تراشههاي ۱۰ نانومتري اينتل بيشتر از تراشههاي ۷ نانومتري سامسونگ و برخي از انواع پردازندههاي توليدي TSMC است. شايان ذكر است تراكم ترانزيستورها در تراشههاي ۱۰ نانومتري اينتل ۱۰۰٫۷۶ ميليون ترانزيستور در ميليمتر مربع است. تعداد ترانزيستورهاي به كار رفته در تراشههاي نوع N7P و N7FF صنايع نيمههادي تايوان و تمامي تراشههاي سامسونگ كمتر از مقدار يادشده براي تراشهي ۱۰ نانومتري اينتل است. تعداد كل ترانزيستورها در پردازندهي A13 بايونيك اپل ۸٫۵ ميليارد عدد است كه با تقسيم بر مساحت تراشه (۹۸٫۴۸ ميليمتر مربع) تراكمي تقريبا برابر با ۸۶ ميليون ترانزيستور در ميليمتر مربع را نشان ميدهد.
با تمامي اينها، ليتوگرافي ساخت در معناي واقعي فاكتوري مهم در مقايسهي پردازندهها محسوب ميشود. با كاهش ليتوگرافي، بازده پردازنده افزايش مييابد. بنابراين اگر دو پردازنده را با طراحي مشابه و ليتوگرافي متفاوت در انديشه متخصصين گرفت، پردازندهي با ليتوگرافي پايينتر خصوصيات زير را دارا خواهد بود:
بهطور كلي هنگامي كه اينتل، AMD و سازندههاي تراشههاي مبتنيبر معماري ARM مانند سامسونگ و كوالكام ليتوگرافي تراشههايشان را كاهش ميدهند، بازدهي پردازنده نيز بهبود مييابد. باتوجه به اينكه در اكثر اوقات متخصصان سرعت بالاي پردازشي را به كاهش توان مصرفي ترجيح ميدهند، شركتها نيز در اين راستا اقدام ميكنند كه خود مانعي در برابر افزايش بهرهوري در مصرف انرژي است. برخي نيز پردازندههاي خود را بهگونهاي طراحي ميكنند كه توازن ميان افزايش كارايي و ميزان كاهش مصرف انرژي را حفظ كنند. گروه سومي نيز هستند كه افزايش بهرهوري در ميزان مصرف انرژي نسبت به افزايش سرعت پردازشي را در ارجحيت قرار ميدهند.
نكتهي اصلي كه بايد در انديشه متخصصين گرفته شود اين است كه توان طراحي حرارتي در موبايلهاي هوشمند در بيشترين حالت تنها ۵ وات است. اين در حالي است كه پردازندههاي پايينردهي دسكتاپ در حدود ۴۵ وات توان طراحي حرارتي دارند. توان طراحي حرارتي در پردازندههاي سرور نيز اندكي بيشتر از پردازندههاي دسكتاپ است. دليل تفاوت موجود در TDP دستگاههاي يادشده، پيشتر نيز گفته شد. براي درك بهتر موضوع ذكر اين نكته لازم است كه پردازندههاي بهكار رفته در دستگاههاي مختلف روي صفحاتي با نام داي ساخته ميشوند. در ممباحثه مدارات مجتمع، هر داي (die) يك بلوك كوچك از مواد نيمهرسانا است كه مداري با كاركرد خاص، طي فرآيندي مانند فوتوليتوگرافي روي آن ساخته شده است. پردازندهها در دستگاههاي قابل حمل، SoC هستند. به اين معني كه بخشهاي مختلفي اعم از پردازنده، پردازندهي گرافيكي، حافظه، كنترلر USB، مدارهاي مديريت مصرف انرژي و مودمهاي بيسيم وايفاي و شبكههاي تلفن همراه در SoC در كنار هم تجميع شدهاند. با اين حال اندازهي كل داي در SoCها كوچكتر از پردازندههاي كامپيوتر و سرور است. با درانديشه متخصصين گرفتن اين نكته، حتي اگر ليتوگرافي به كار رفته در پردازندهها برابر بوده و تراكم ترانزيستورها برابر باشد، در اكثر موارد پردازندههاي كامپيوتر تعداد بيشتري ترانزيستور دارند. در صورت برابر بودن اندازهي دايها نيز، باتوجه به كثرت قطعات در SoCها، تعداد ترانزيستورهايي كه تنها براي پردازنده استفاده شدهاند، بسيار كمتر از پردازندههاي كامپيوتر و سرور است.
از انديشه متخصصينات توان مصرفي نيز در طراحي پردازندههاي دسكتاپ، محافظهكاري كمتري صورت ميپذيرد. اين در حالي است كه در دستگاههاي موبايل، عملكرد تركيبي سختافزار، نرمافزار و فريمور بهگونهاي است كه با ايجاد محدوديتهايي در سرعت پردازشي، عمر باتري را طولانيتر كنند. در پردازندههاي دسكتاپ تنها زماني توان مصرفي كنترل ميشود كه تأثيري منفي در ايجاد بهترين عملكرد داشته باشد. علاوه بر اين در دستگاههاي قابل حمل، ترفندهايي نرمافزاري اعم از كاهش نرخ فريم در قسمتهايي از بازيها صورت ميپذيرد كه با پايينآوردن سطح عملكرد پردازنده توان مصرفي را نيز كاهش ميدهند. فركانس پردازشي نيز در SoCهاي دنياي موبايل براي مصرف بهينهي انرژي محدود شده است. در پردازندهي بالاردهاي چون A13 بايونيك اپل ميزان فركانس پردازشي ۲٫۶۵ گيگاهرتز بوده و حتي كمتر از پردازندههاي ميانردهي نسل ششم اينتل است. اين نكته نيز بايد در انديشه متخصصين گرفته شود كه ميزان فركانس پردازشي تبليغ شده براي پردازندههاي موبايل نشاندهندهي كارايي پردازنده در بالاترين سطوح عملكردي است. اما فركانس پردازندههاي كامپيوتري در حالت بوست و اوركلاك پردازنده بهميزان چشمگيري افزايش پيدا ميكند.
معماري
در مباحثه مربوط به معماري، تمامي پردازندههاي دسكتاپ، لپتاپ و سرور با بهرهگيري از معماري X86 در مقابل پردازندههاي موبايل با معماري ARM قرار گرفتهاند. هر كدام كاركرد و وظيفهي خاصي داشته و متخصصي متناسبي را عهدهدار هستند. در مورد معماري و طراحي پردازندههاي ARM، اين عبارت مخفف Acorn RICS Machines است، حال آنكه اگر منظور كمپاني توسعهدهندهي اين معماري باشد، اختصار ARM كوتاه شدهي عبارت Advances RISC Machines است. ساليان مديدي است كه معماري ARM در مركز ريزپردازندههاي مدرن و طراحيهاي فشرده قرار دارد.
ARM خانوادهاي از معماري RISC يا reduced instruction set computing به مفهوم محاسبات بر پايهي مجموعه دستورالعملهاي سادهشده براي پردازندههاي مختلف است. در پردازندههاي مبتنيبر معماري RISC تمركز اصلي اين است كه تعداد دستورالعملها تا جاي ممكن كم بوده و دستورالعملهاي مذكور تا جاي ممكن ساده باشند. دستورالعملهاي ساده مزيتهايي را هم براي مهندسين سختافزار و هم نرمافزار ايجاد ميكند. از آنجايي كه دستورالعملها ساده هستند، مدار به تعداد كمتري ترانزيستور احتياج دارد. درنتيجه تراشه كوچكتر بوده و فضاي بيشتري برا جاسازي قطعات ديگر در داخل دستگاه وجود دارد. به همين دليل نيز پردازندههاي مبتني بر معماري ARM بيشتر SoC بوده و بسياري از قطعات را بهصورت مجتمع در خود جاي دادهاند.
اما دستورالعملهاي ساده نيز با هزينهاي همراه هستند. انجام وظايف سنگين در اين نوع معماري، نيازمند تعداد بيشتري از دستورالعملها است. همين نيز منجر به افزايش مصرف حافظه و زمان اجراي طولانيترِ دستورالعملها ميشود. با اين حال معماري ARM با پايپلاينهاي سريعتر و افزايش فركانس پردازشي، تأخير يادشده در اجراي دستورالعملها را تا حدودي جبران ميكند. در سمت ديگر، پردازندههاي اينتل و AMD تحت معماري x86 در خانوادهاي با نام CISC قرار دارند كه مخففي از عبارت Complex Instruction Set Computing و بهمعني محاسبات براساس مجموعه دستورالعملهاي پيچيده است.
فقدان قابليت SMT در معماري ARM دليل موجهي براي افزايش روزافزون تعداد هستهها در اين معماري است.
برخلاف پردازندههاي RISC، تمركز دستورالعملها در معماري CISC، بر انجام وظايف سنگينتر با ميزان بيشتري از انعلافپذيري است. براي درك بهتر موضوع لازم است تا چند نكته را يادآور شويم. در تمامي پردازندههاي حال حاضر، بخشي بهنام ALU قرار دارد كه مختصر شدهي عبارت arithmetic logic unit به مفهوم واحد منطق و حساب است. دادههايي كه متخصص يا نرمافزارها وارد سيستم ميكنند عملوند نام دارد. كدهايي كه تايين ميكنند چه نوع عملياتي بايد صورت گيرد و نيز عملوندها، وروديهاي ALU هستند. خروجي ALU نتيجهي عمليات انجامشده است. درواقع كاري كه ALU انجام ميدهد انجام عمليات حسابي و بيتي روي اعداد باينري است.
در پردازندههاي RISC، معماري بهكار رفته از نوع load-store به مفهوم بارگذاري و ذخيرهسازي است. در مهندسي كامپيوتر load-store، معماري از مجموعه دستورالعملها است كه دستورالعملها را به دو بخش تقسيم ميكند: دسترسي به حافظه و عمليات ALU. در بخش دسترسي به حافظه عملوندها از حافظه به ثباتها بارگذاري ميشوند. سپس عمليات رويشان صورت ميپذيرد. در بخش عمليات ALU نيز عملوندها از قبل روي ثباتها هستند. در كل روند كار در معماري load-store به اين صورت است كه دادهها در ابتدا روي ثباتها كپي ميشوند. هنگام بارگذاري يا load، فرايند كپي از حافظهي اصلي در ثبات سپس دادههايي كه عمليات رويشان صورت گرفته در حافظهي اصلي ذخيره يا store ميشوند. در نهايت ميتوان اينگونه گفته پردازندههاي نوع RISC عمليات را تنها بين ثباتها انجام ميدهند. در معماري نوع load-store دستورها به شكل زير است:
LOAD r1, Y
LOAD r2, Z
PROD r1, r2, r3
STORE r3, X
دستور اول و دوم متغيرهاي r1 و r2 را از آدرس y و z واقع در حافظهي اصلي به ثبات درون پردازنده بارگذاري يا load ميكند. دستور سوم اين دو عدد را با هم ضرب كرده و مقدار r3 را توليد ميكند و دستور چهارم مقدار r3 را در آدرس x از حافظهي اصلي ذخيره ميكند. ساده بودن دستورهاي load-store در معماري RISC سبب شده تا معماري يادشده و به تبع آن پردازندههاي ARM كه در دستگاههاي قابل حمل مورد استفاده هستند، تنها در يك سيكل كلاك هر دستورالعملي را اجرا كنند. اما به دليل تعدّد دستورالعملها در اين معماري، ثباتهاي بيشتري نيز مورد استفاده قرار ميگيرد.
اما در پردازندههاي CISC، معماري بهكار رفته از نوع register–memory به مفهوم ثبات-حافظه است. در مهندسي كامپيوتر معماري يادشده مجموعه دستورالعملهايي است كه اجازه ميدهد عمليات نهتنها بين ثباتها، بلكه بين بخشي از ثبات و بخشي از حافظه يا فقط در حافظه صورت گيرد. در رويكرد register–memory ممكن است يكي از عملوندها در ثبات و ديگري در حافظه باشد.در معماري نوع register–memory دستورهاي ضرب براي دو عدد به شكل زير است:
mul r1,r1
چنين دستوالعملي با اينكه عمليات پيچيدهاي را انجام ميدهد و به هيچ وجه سادهسازي نشده، اما در عوض حافظهي كمتري را اشغال ميكند. شايد به همين دليل است كه پردازندههاي مبتني بر معماري ARM برخلاف نوع x86 روز بهروز حافظهي رم بيشتري را ميطلبند.
پردازندههاي پيچيده ميتوانند چندين دستورالعمل را بهصورت همزمان واكشي، رمزگشايي و اجرا كنند. چنين قابليتي پردازش چندرشتهاي همزمان (Simultaneous Multithreading ) يا SMT ناميده ميشوند. پردازندههايي كه قابليت SMT دارند، دستورالعملها را در هر هسته با دو يا چند رشتهي مجزا اجرا ميكنند. در پردازندههاي دنياي موبايلي، يعني ARM، ايجاد چنين قابليتي باعث پيچيدگي ريزمعماري شده و ميزان توان مصرفي را بسيار بالا ميبرد. از اين رو SMT تنها در پردازندههاي مبتني بر معماري X86 مورد استفاده قرار ميگيرد. فقدان قابليت SMT در معماري ARM دليل موجهي براي افزايش روزافزون تعداد هستهها در اين معماري است.
با اينكه مقايسهي بين پردازندههاي مختلف با متخصصيهاي متفاوت امكانپذير نبوده و نخواهد بود، نتايج حاصل از در كنار هم قرار دادن مشخصات اعلامشده براي اين پردازندهها درك درستي از ريزمعماري استفادهشده در پردازندههاي يادشده را براي متخصصان فراهم خواهد كرد. در ادامه برخي اطلاعات مربوط به تعدادي از پردازندههاي مختلف از متخصصي سرور، دسكتاپ، لپتاپ، تبلت و موبايلهاي هوشمند آورده شده است. البته باتوجه به اينكه شركت اپل مشخصات مربوط به پردازندههاي خود را بهصورت عمومي منتشر نميكند و اطلاعات بهدست آمده تنها با واكاوي و تجزيه و تحليل پردازندهها مشخص ميشود و اطلاعات زيادي از پردازندهي جديد اين شركت، يعني A13 بايونيك در دسترس نيست، پردازندهي نسل پيشين اپل با نام A12 بايونيك مطالعه خواهد شد.
پردازنده | AMD EPYC 7552 | اينتل Core i9-9900K | اينتل Core i9-8950HK | اپل A12 بايونيك | كوالكام اسنپدراگون 855 |
---|---|---|---|---|---|
ليتوگرافي | ۷ نانومتري | ۱۴ نانومتري | ۱۴ نانومتري | ۷ نانومتري | ۷ نانومتري |
معماري | x86 | x86 | x86 | ARMv8.3 | ARMv8 |
تعداد هستهها | ۴۸ | ۸ | ۶ | ۶ | ۸ |
تعداد رشتهها | ۹۶ | ۱۶ | ۱۲ | ۶ | ۸ |
ريزمعماري | Zen 2 | Coffee Lake | Coffee Lake | Vortex, Tempest | Cortex-A76 Cortex-A55 |
فركانس پردازشي | ۲٫۲ گيگاهرتز | ۳٫۶ گيگاهرتز | ۲٫۹ گيگاهرتز | ۲٫۴۹ گيگاهرتز | ۲.۸۴ گيگاهرتز ۲.۴۲ گيگاهرتز ۱.۸ گيگاهرتز |
فركانس بوست | ۳٫۳۵ گيگاهرتز | ۵ گيگاهرتز | ۴٫۶ گيگاهرتز | ندارد | ندارد |
اندازهي داي | ۱۹۲ ميليمتر مربع | ۳۵۵٫۵۲ ميليمتر مربع | ۱۴۹ ميليمتر مربع | ۸۳٫۲۳ ميليمتر مربع | ۷۳٫۲۷ ميليمتر مربع |
تعداد ترانزيستورها | ۱۹٫۲ ميليارد | نامشخص | ۷٫۲ ميليارد | ۶٫۹ ميليارد | نامشخص |
حافظهي كش L1 | ۳ مگابايت | ۶۴ كيلوبايت در هر هسته | ۶۴ كيلوبايت در هر هسته | ۱۲۸ كيلوبايت داده ۱۲۸ كيلوبايت دستورالعملها | نامشخص |
حافظهي كش L2 | ۲۴ مگابايت | ۲۵۶ كيلوبايت در هر هسته | ۲۵۶ كيلوبايت در هر هسته | ۸ مگابايت | هستهي Gold Prime كش ۵۱۲ كيلوبايتي هستههاي Gold هركدام ۲۵۶ كيلوبايت هستههاي Silver هركدام ۱۲۸ كيلوبايت |
حافظهي كش L3 | ۱۹۲ مگابايت | ۱۶ مگابايت اشتراكي | ۱۲ مگابايت اشتراكي | ندارد | ۲ مگابايت L3 مشترك در قالب DSU ۳ مگابايت كش سطح سيستم |
توان طراحي حرارتي | ۲۰۰ وات | ۹۵ وات | ۴۵ وات | زير ۵ وات | زير ۵ وات |
حافظهي رم | ۸ كانال ۶۴ بيتي DDR4 با فركانس ۳۲۰۰ مگاهرتز پهناي باند ۱۹۰٫۷ گيگابايتبرثانيه | ۲ كانال ۶۴ بيتي DDR4 با فركانس ۲۶۶۶ مگاهرتز پهناي باند ۳۹٫۷۴ گيگابايتبرثانيه | ۲ كانال ۶۴ بيتي DDR4 و LPDDR3 با فركانس ۲۶۶۶ و ۲۱۳۳ مگاهرتز پهناي باند ۳۹٫۷۴ گيگابايتبرثانيه | مشخص نيست | ۴ كانال ۱۶ بيتي LPDDR4X با فركانس ۲۱۳۳ مگاهرتز پهناي باند ۳۴٫۱ گيگابايتبرثانيه |
در ابتدا ذكر اين نكته لازم است كه هستههاي پردازندهي كوالكام اسنپدراگون 855 به تعداد ۸ هسته از نوع Cortex-A76 و Cortex-A55 معماري ARM است. كوالكام با شخصيسازي هستههاي مذكور نامهاي Kryo 485 Gold و Kryo 485 Silver و Kryo 485 Gold را برايشان درانديشه متخصصين گرفته است.
از انديشه متخصصين ليتوگرافي ساخت، پرواضح است كه پردازندههاي جديد موبايل تراكم ترانزيستوري بيشتري دارند، اما كوچك بودن اندازهي داي و SoC بودنشان باعث شده تا تعداد كمتري از ترانزيستورها تنها در هستههاي پردازشي بهكار برده شوند. براي مثال در پردازندهي A12 بايونيك اپل با سطح مقطعي برابر با ۸۳٫۲۳ ميليمتر مربع، تنها ۱۱٫۹ ميليمتر معادل با ۱۴٫۲۹ درصد از سطح داي به هستههاي پردازشي و قطعات مركب در آن اختصاص داده شده است. با يك حساب سرانگشتي تعداد ترانزيستورها براي بخش مذكور برابر خواهد بود با اندكي كمتر از يك ميليارد ترانزيستور. با اينكه آمار و ارقام دقيقي از تعداد ترانزيستورها در پردازندههاي جديد اينتل منتشر نميشود و ساختار داي در پردازندههاي مذكور مبهم است، اما سطحي از تراشه كه تنها براي پردازنده وقف شده بهمراتب بيشتر است.
قطعات مجتمع در پردازندهي A12 بايونيك اپل
ايجاد قدرت پردازش كامپيوتري در دنياي موبايل شايد سخت باشد، اما دست نيافتني نيست.
همانگونه كه در جدول مشاهده ميشود پردازندههاي مبتنيبر معماري X86 با دارا بودن پردازش چندرشتهاي همزمان، تعداد بيشتري از رشته دستورالعملها را بهصورت همزمان اجرا ميكنند. اما بنا بر معماري بهكار رفته، سيكل كلاك بيشتري صرف پردازش دستورالعملها ميشود. نوع پايپلاين عموما در هستههاي ARM در نسلهاي مختلف دچار تغيير ميشود، اما باتوجه به ماهيت اينپردازندهها مراحل خردترِ اجراي دستورالعملها كمتر از پردازندههاي x86 است. براي مثال تعداد مراحل پايپلاينها در هستهي Cortex-A55 معماري مذكور ۸ مرحله بوده و براي Cortex-A76 سيزده مرحله است. مراحل پايپلاين براي پردازندهي 9900k بين ۱۴ و ۱۹ مرحله است. پايپلاين بيشتر بهمعني انجام دستورهاي پيچيدهتر، اما با تعداد سيكل كلاك بيشتر است. فركانس پردازشي نيز در پردازندههاي موبايل در جدول فوق، عموما كمتر از تراشههاي كامپيوتري است. دليل فركانس پايينتر همانگونه كه در ابتدا گفته شد، پايينآوردن توان مصرفي است.
نتيجهگيري
همانگونه كه در ابتدا گفته شد، به دليل متخصصيهاي متفاوت در پردازندههاي بهكار رفته در دستگاههاي مختلف، مقايسهي انواع مختلف از پردازندهها غيرممكن است. اما آيا اينكه هر پردازندهاي در طيف عملكردي خود، وظيفهاش را به خوبي انجام دهد مباحثه ديگري است. بزرگترين نقطهي منفي در پردازندههاي مبتنيبر معماري ARM محدودسازي فركانس پردازشي و عدم استفاده از پردازش چندرشتهاي در ساختار پردازنده است. با گذر زمان و نياز به اجراي دستورهاي پيچيدهتر در دستگاههاي تلفن همراه، تعداد پايپلاينها افزايش پيدا كرده و فركانس پردازشي اندكي افزايش پيدا كرده است. اما توان مصرفي نيز به تبعِ آن بالا رفته است. چالش پيشرو براي ARM، تغيير ساختار بهنحوي است كه با ثابت نگهداشتن مصرف انرژي، پردازش چندرشتهاي به ساختار اين پردازندهها اضافه شود.
در مورد پردازندههاي x86 نيز پايين آوردن تعداد سيكل كلاك باعث تقويت قدرت پردازشي خواهد شد. واقعيت اين است كه به مرور زمان اين دو معماري به هم نزديك شده و سختار مشابهتري را نسبت به آنچه كه در گذشته شاهد بوديم، پيدا ميكنند. ايجاد قدرت پردازش كامپيوتري در دنياي موبايل شايد سخت باشد، اما دست نيافتني نيست.
هم انديشي ها