در چند ماه اخیر، ما آخرین نسخه از گرافیک مجتمع (یکپارچه) 32 بیتی مربوط به AMD را بر روی پلتفرم دسکتاپ، تست و بررسی کردهایم که در این آزمایش، برخی از نتایج شگفانگیز درخصوص اینکه چگونه یک پلتفرم با گرافیک یکپارچه میتواند وجود داشته باشد، درنظر گرفته شده است. ما در این بررسی کوتاه، آزمایشی مشابه با چند ماه گذشته انجام میدهیم ولی با این تفاوت که این بار از آخرین پردازندههای نسل 11 از سری Rocket Lake استفاده خواهیم کرد! این پردازندهها از گرافیک Xe-LP اینتل بهره میبرند که بههنگام راهاندازی پلتفرم مبتنی بر موبایل Tiger Lake، بهعنوان “نسل بعدی” معرفی شدهاند. با وجود اینکه نسخه پیادهسازی شده بر روی Rocket Lake دارای واحدهای گرافیکی و حافظه کمتر است، بودجه خوبی برای حداکثرسازی آن وجود دارد؛ که این نشان دهندهی آن است که اینتل بهسوی یک مبارزه پیش میرود!…
رویارویی CPU با GPU:
اینتل یکپارچهسازی گرافیک بر روی سیستمهای خود را توسط چیپستهایی با نوعی خروجی ویدئویی و از سال 1999 آغاز کرده است. در سال 2010، این شرکت چیپست گرافیکی را به پردازنده گرافیکی روی بورد، انتقال داده که به سختافزار گرافیک این امکان را میدهد تا برای دسترسی به حافظه، از پهنای باند با سرعت بالاتر و تاخیر کمتری استفاده کند. در حال حاضر، پردازندههای مصرفی اینتل از گرافیک یکپارچه به عنوان پیکربندی بهصورت پیشفرض بهره میگیرند که در آن بیشتر پردازندههای طراحی شدهی خود را به گرافیک اختصاص میدهد.
اینتل از زمان تولید نخستین گرافیک مجتمع خود تا زمان خط تولید موجود در سال 2020، به طراحی “Gen” متکی بوده بهگونهای که در طول این سالها با بهروزرسانی در عملکرد و نرخ پردازش، چندین نسخه از آن ارائه شده است؛ بهطوریکه در اولین پردازنده 10 نانومتری اینتل، یعنی Ice Lake نیز سری Gen 11 بهطور گسترده حضور دارد.
با این حال، آخرین طراحی از گرافیک اینتل متفاوت است؛ این طراحی که دیگر “Gen” نامگذاری نمیشود، با صرف محاسبات بیشتر، ویژگیهای بیشتر و تلاش گستردهتر، منجر به ارائهی طراحی با مقیاسپذیری بیشتر شده که از محاسبات موبایلی تا محاسبات مربوط به سوپرکامپیوترها را دربر میگیرد. اکنون این خانواده گرافیکی جدید، معروف به Xe ، پایه و اساس طراحیهای گرافیک اینتل است که در چهار مدل زیر وجود دارد:
- Xe-HPC : برای افزایش کارایی در محاسبات انجام گرفته در سوپرکامپیوترها
- Xe-HP: برای عملکرد بالا و بهینهسازی FP64
- Xe-HPG: برای افزایش سرعت و عملکرد در کاربردهای گیمینگ
- Xe-LP: برای کاربردهایی با توان مصرفی کم
در ابتدا، اینتل طراحیهای LP خود را با پردازندههای موبایل Tiger Lake به بازار ارائه نمود، سپس با استفاده از کارت گرافیک نوت بوک Xe MAX، و حالا با گرافیکهای Rocket Lake به بازار عرضه نموده است.
LP ، یک بهروزرسان سریع:
مدل LP اینتل، با سازماندهی مجدد در ساختار طراحی اولیه، گرافیک قبلی Gen 11 را بهبود میبخشد. در این نسخه بهبودیافته، به جای حضور 7 واحد منطقی در هر واحد اجرا، حالا 8 واحد وجود دارد که در آن، LP میتواند به جای ارسال یک پالس مثلثی در هر کلاک، دو پالس در هر کلاک ارسال کند. طراحی پیش فرض LP شامل 96 واحد اجرایی است که به یک اسلایس شامل تمام ویژگیهای ظاهری و سختافزاری، و حداکثر شش اسلایس با اندازه کوچکتر (نیم-اسلایس) تقسیم میشود که در هر کدام 16 واحد منطقی و 64 KiB حافظه نهان سطح یک (L1 cache) وجود دارد. هرگونه از LP میتواند حداکثر 96 واحد اجرایی در یک پیکربندی 6×16 داشته باشد.
هم اکنون، واحدهای اجرایی به صورت جفتی و با حضور یک رشته زمانبندی مشترک بین هر جفت، کار میکنند. حتی با وجود این تغییر، هر واحد اجرایی مجزا، به یک طراحی گسترده 8+2 منتقل شده است؛ به طوریکه، 8تای اول برای بخشهای صحیح و یا ممیز شناور (FP/INT) و 2 واحد آخر برای محاسبات ریاضی پیچیده درنظر گرفته شده است. قبلاً، طراحی انجام گرفته به صورت یک طراحی 4+4 دیده میشد، از این رو، اینتل این ماشین ریاضی را متعادل کرده و آن را در واحدهای بزرگتر ایجاد کرده است. این طراحی جدید 8+2 با کاهش برخی عملیات محاسباتی که مستقیماً باعث بلاک شدن خط لوله FP میشوند، بهره وری را در کارهای محاسباتی و گرافیکی بهبود میدهد.
نسخه نهایی Tiger Lake LP دارای تمامی 96 واحد عملیاتی به همراه شش زیربخش است که هرکدام 16 واحد اجرایی (6×16) دارند. در مقایسه با این سری، Rocket Lake دارای چهار نیم –اسلایس است که هرکدام یک واحد اجرایی 64تایی دارند که در حقیقت نیمی از این واحدهای اجرایی در هر زیربخش (نیم –اسلایس)، غیرفعال هستند؛ از این رو، پیادهسازی نهایی این مدل به صورت یک واحد عملیاتی 32 تایی (4×8) است. دوتا از پایینترین مدلهای پردازنده از سری Rocket Lake، تنها دارای یک طراحی 3×8 هستند. به منظور داشتن تنها نیمی از هر نیم-اسلایس به صورت فعال، نیاز است تا به لحاظ تئوری، حافظه نهان بیشتری در هر رشته و در طول عملیات فراهم شود که این کار باعث کاهش فشار وارد شده به حافظه نهان در طول عملیات میشود. احتمالاً اینتل این انعطافپذیری را با هدف افزایش حجم کار گرافیکی در بخشهایی که دارای نیم-اسلایس عملیاتی هستند، فراهم کرده است.
Xe-LP مبتنی بر ماشین رسانهای (media) اصلاح شده نیز ارائه میشود. این مدل، دارای یک خط لوله ویدئویی 12 بیتی از نوع end-to-end برای HDR، پشتیبانی از کدگذاری HEVC و رمزگشایی AV1 وجود دارد، که کدک (کدکها جریانی از دادهها را بهمنظور ذخیرهسازی، کدگذاری کرده و در مواقع نیاز، به منظور نمایش یا ویرایش داده، کدگشایی میکنند. ) دوم، یک کدک رایگان برای فراهم آوردن گزارشی مشابه یا با کیفیتتر از HEVC ارائه میدهد. اینتل اولین ارائه دهنده IGP دسکتاپ برای پشتیبانی از رمزگشای AV1 است.
مقایسه سریهای Rocket Lake:
در این بررسی، ما تراشههای Core i7-11700K، Core i9-11900K و Core i5-11600K را درنظر گرفتهایم. این سه، از بهترین پردازندههای سری Rocket Lake اینتل هستند که قدرت پردازشی بالایی داشته که باعث شده از بالاترین پیکربندی گرافیک LP که اینتل در Rocket Lake ارائه میدهد، پشتیبانی کند. هر سه پردازنده دارای یک پیکربندی 4×8 و فرکانس توربو تا 1300 مگاهرتز هستند.
موارد مقایسه ما شامل: گرافیک نسل قبلی Gen 11 اینتل یعنی Core i9-10900K با یک واحد اجرایی 24تایی، آخرین پردازندههای مبتنی بر پلتفرم دسکتاپ AMD، تعدادی از پردازندههای موبایل اینتل، و یک گرافیک مجزا با GT1030 است.
در این بررسیها، ما از حافظه JEDEC به منظور تست و آزمایش استفاده میکنیم. گرافیک، نیازمند پهنای باند حافظه است در صورتیکه کنترل کنندههای حافظه CPU در مقایسه با پردازندههای موبایل یا کارتهای گرافیک، کند هستند. در حالیکه یک پردازنده گرافیکی ممکن است نیازمند 300 گیگابایت در ثانیه از برخی حافظه های GDDR باشد ، یک پردازنده با دو کانال DDR4-3200 تنها پهنای باندی با سرعت 51.2 گیگابایت در ثانیه دارد. همچنین ، اشتراکگذاری حافظه بین CPU و GPU کار را پیچیدهتر میکند. موارد استفاده اکثر این پردازنده ها روی گرافیک یکپارچه، اغلب در سیستم های از پیش ساخته شده با قیمت مناسب است. گفته شده ، اگر قیمت Ethereum به طور مداوم افزایش یابد ، گرافیک یکپارچه تنها چیزی است که باقی مانده است.
آزمایش ما دو هدف را دنبال میکند: بهترین نمونه و بهترین تجربه. این بدان معنی است که برای اغلب بنچمارکهایی که میخواهیم در 720p Low و 1080p Max استفاده کنیم، بهعنوان نواحی درنظر گرفته شده در گرافیک یکپارچه استفاده میشود. اگر طرحی نتواند در 720p Low کار کند، در آینده نزدیک به جایی نخواهد رسید، اما اگر بتوانیم در گیمهای خاص با کیفیت 1080p Max به نتایج خوبی برسیم، آنگاه گرافیک یکپارچه به عنوان یک گزینه رقابتی در مقابل راهکارهای گرافیکی گسسته و مجزا در نظر گرفته میشود.