حدث Intel Architecture Day 2021و تغطية لما يخص سوق المستخدمين

فى كل عام تقوم شركة Intel بالأعلان عن احدث تقنياتها في حدث Architecture day فهو حدث سنوى ثابت للشركة وهو حدث مهم للمستخدمين لانه يعلن عن المعماريات الجديدة للأسواق و التحسينات و الأداء المتوقع منها ، واليوم سنغطي بعض النقاط الخاصة بهذا الحدث بداية من معالجات Alder Lake وصولاً إلى البطاقات الرسومية الجديدة التى تنوى Intel المنافسة بها امام الجميع بل المنافسة وليس على استحياء و تسديد بعض الضربات للشركات الأخرى المنافسة في هذا السوق لنبدأ معاً .اهداف معمارية المعالجات المركزية الجديدة التى اعلنت عنها Intel فى هذا الحدث بشكل عام هو الأستخدام الواسع و امكانيات التوسعة وزيادة الكثافه ، اطقم تعليمات الذكاء الأصطناعى و اطقم تعليمات Vector  و اخيراً أفضل معمارية من حيث الكفائة في المعالجة لدى شركة Intel و عصر جديد للمعالجات المركزية الهجينة .

أنوية جديدة لحقبة جديدة فى تاريخ المعالجات

انوية جديدة أكثر كفائة في المعالجة مقابل استهلاك الطاقة و هى مصممة لتعدد المهام و قامت Intel بتقديم  تحسينات كثيرة على مستوى التصميم الخاص بهذه الأنوية يشمل تحسينات على وحدات التعليمات و وحدات المنطق مع امكانية معالجة 6 تعليمات في الدورة الواحدة مع الحفاظ علي ازمنة وصول ضمن النطاق الطبيعي بدون تأخير يذكر ، أيضا تم إضافة وحدات Vector المتقدمة للذكاء الأصطناعى و اداء وحدات الفصلة العائمة التى تم تحسينها لتقدم ضعف الأداء و المعروفة بأسم FMA

كل هذه التحسينات أدت إلى زيداة الأداء بنسبة 80% حيث تقارن Intel الأداء هنا بين 4 انوية من الأنوية الأكثر كفائة و نواتين من معالجات Skylake او الجيل العاشر مع تفعيل خيوط المعالجة الفائقة و بصورة اخرى 4C Efficient Core ضد 2C4T Skylake كل هذا عند تردد 3.3GHz لكل الأنوية محل المقارنة وهى نتائج جيدة جداً ولكن كان يجب عرض نتائج الأنوية مقابل الأنوية بنفس العدد  مع غلق وحدات المعالجة الفائقة لنحصل علي نسبة واضحة من الأداء من هذه الأنوية .

هنا تعلن الشركة عن الأداء الخاص بالنواة الواحدة من حيث ازمنة الوصول وهو افضل من معمارية الجيل العاشر بقرابة ال40% وهو امر ممتاز بكل تأكيد .

معمارية الأنوية الأسرع و الأفضل Golden Cove للجيل القادم هى المعمارية الأكبر و الأسرع لدى شركة Intel حيث تم دمج مصفوفة Matrix جديدة للمعالجة الحسابية للذكاء الأصطناعى ، و تم زيادة عدد العمليات التى يمكن ان ينفذها المعالج في المرة الواحدة مع زيادة حجم الكود الذي يمكن تنفيذة إلى 256K بدل من 128K فى المعمارية السابقة مع زيادة معدلات فك الترميز من 4 إلى 6 في المعمارية الجديدة و تغيير في وحدات المنطق و حدات الفصلة العائمة و وجود متحكم جديد للطاقة داخل المعالج للحصول علي اداء افضل مقابل سحب الطاقة و زيادة حجم الذاكرة المخبأية لكل نواة إلى 1.25MB و الكثير من التحسينات الأخرى التى قدمتها الشركة في المعمارية الجديدة والتى يمكنك ان تراها في الصور القادمة

 

كل هذه التحسينات قدمت اداء أفضل للنواة الواحدة يمكن ان يصل إلى 19% بصورة أفضل من معالجات الجيل الحادى عشر من Intel وهو باستخدام الكثير من البرامج ولكن لم توضح Intel ما هي باقي البرامج التى استخدمتها الشركة لتقديم هذه النسبة فنحن نري في احيان يوجد تفوق يفوق 50% و احيانا يوجد انخفاضي في الأداء يصل إلى 10-15% فهل ستنجح تلك الأنوية الجديدة فى ان تمنح Intel التفوق التى تسعى إلية هذا ما سنعرفة معاً وقت إطلاق معالجات Alder Lake .

معالجات Alder Lake الجديدة

تحتاج Intel كما شرحنا إلى معمارية يمكنها ان تتوسع ويتم استخدامها في الكثير من الأجهزة دون مشكلة او معاناه مع تقديم مميزات جديدة للصناعة مثل DDR 5 وPCI-E5.0 وهو ما تقدمة شركة Intel مع معمارية Alder Lake الجديدة و التى ستتراوح بين 9 وات حتى 128 وات و مبنية علي دقة تصنيع Intel 7 الجديدة الأكثر كفائة من الدقة السابقة و التى ستكون منافسة بصوةر كبيرة لدقات تصنيع 7nm الأخرى

مرونة معمارية Alder Lake تمكنها من دخول سوق الأجهزة اللوحة النحيفة و الأجهزة اللوحة مع اجهزة الحواسيب المكتبية عالية الأداء بل و دخول سوق الخوادم مع معالجات Sapphire rapids الجديدة والمبنية علي معماريات Alder Lake مع تدعيمات الخوادم الأخرى مثل دعم اطقم تعليمات AVX 512 و زيادة حجم الذواكر مع محرك المصوصات الجديد ، تستمر معالجات Alder Lake الخاصه بالحواسيب المكتبية فى ان تحمل نفس البطاقة الرسومية الخاصة بمعالجات الجيل الحادي عشر ، اما علي الصعيد الأخر فستجد بطاقة اقوى في الحواسيب النقالة دون شك لان هذا السوق يحتاج إلى بطاقة اقوي في حالة عدم احتواء الجهاز علي بطاقة رسومية .

أعلى معالجات الحواسيب المكتبى من معمارية Alder Lake سيملك 16 نواة يتم تقسيمهم إلى 8 انوية من انوية المعالجة السريعة و 8 انوية من انوية المعالجة الأكثر كفاءة حيث يظهر الفرق بين حجم الأنوية في الصورة مع 30MB من الذاكرة المخبأية التى يتم مشاركتها بين كافة الأنوية ، لا تنسي ان عدد المسارات المعالجة الفائقة مخصصة للأنوية عالية الأداء فقط بمعدل مسارين لكل نواة اي 16 مسار معالجة فائقة و 8 مسارات اخرى للمعالجة الفائقة ليصبح العدد الخاص بنا هو 24 مسار معالجة فائقة

معالجات Alder Lake تملك متحكم ذواكر مميز حيث يمكنة ان يدعم ذواكر DDR5 بسرعات تبداً من 4800MT/s وهو ما يعني اننا سنري سرعات تصل إلى 6800MT/s فنحن امام عصر جديد لسرعات نقل البيانات بين المعالجات و الذواكر و الأكثر تميزا هو ان الشركة تدعم ايضاً ذواكر DDR4 بسرعة 3200Mt/s مثل المنصة الحالية لتقدم بذلك للمصنعين حرية استخدام اي ذواكر مع تلك المعالجات وهو ما سنرى تأثيره بكل تأكيد ، كل هذا بالإضافة إلى كسر السرعة و التحكم في الفولتية .

سرعة النقل داخل المعالج المركزى الجديد بمعمارية Alder Lake حيث تتصل الأنوية بينها وبين بعض عن طريق جسر الربط باسم Compute Fabric و بسرعة 1TB/s وهى كمية هائلة من البيانات التى يمكن ان يقوم بها هذا الجسر بين كافة الأنوية و علي الصعيد الأخر يستطيع متحكم الذواكر ان يقدم إتصال يصل إلى 204GB/s بينه وبين الأنوية و يمكن لجسر الربط الخاص بوحدات الأدخال والأخراج مثل USB و خلافة من امور ان ينقل 64GB/s وهو كافي لتقنيات Thunderbolt الجديدة فالمعالج يتفوق علي كل ما رأيناه حتي الأن من حيث قدرات التوصيل .

الحل السهل و الصعب وهو Intel Thread Director ! فالتصميم الهجين فى المعالجات المركزية كما نعلم يتكون من انوية قوية و انوية ضعيفة لتوفير الطاقة و إما تشغيل هذا او تشغيل هذا فهذا هو الحل البدائى اما المشكلة هى البرامج و الألعاب وحتى نظام التشغيل تحت سؤال كيف ؟ و من ؟ و متى ؟

كيف تجعل البرنامج او اللعبة التى تحتاج إلى اداء أعلى ان تعمل علي الأنوية الأقوى و الأسرع من نوع Performance Cores ؟

كيف يعرف نظام التشغيل من من الأنوية يجب ان يعمل ومن لا او من من الأنوية يملك مساحة إضافية ليقوم بتنفيذ التعليمات ؟

متي يمكن لنظام التشغيل ان يقوم بنقل برنامج يعمل في الخلفية إلى الأنوية الضعيفة التى يا تحتاج إلى اداء كبير وهذا كمجرد مثال ؟

كل هذه الأسئلة لا يوجد لها حل سوى وجود شريحة أخرى داخل المعالج لتتواصل مع نظام التشغيل وهذا هو كان الحل الصحيح ليحصل المستخدم علي كل قطرة من الأداء فلماذا يتم ترك انوية لا تعمل و المستخدم يحتاجها او تقع ضمن النطاق المسموح للطاقة ؟  ، تقوم وحدة Thread Director فى معالجات Alder Lake الجديدة بصورة بسيطة علي التواصل مع نظام التشغيل و تعطي له البيانات الخاصة بالأنوية بل وتحدد اي الأنوية يمكنه ان يقوم بتشغيل هذا البرنامج الأن و لنعطي امثلة :

– إذا قمت بفتح لعبة او برنامج رندر ستقوم وحدة Thread Director بتشغيل اللعبة على الأنوية عالية الأداء وهم فى مثالنا 8 انوية و تقوم بتشغيل البرامج البسيطة في الخلفية مثل برامج ديسكورد او سكيبى على الأنوية الموفرة للطاقة ليحصل المستخدم علي افضل اداء للبرنامج الرئيسى

– إذا قمت بتشغيل تطبيقات Office على سبيل المثال وهى لا تحتاج إلى معالجة قوية فالمعالج سيجعلها تعمل علي الأنوية الأكثر كفائة (الموفرة للطاقة و الأقل تردد ) داخل المعالج ولكن هناك ميزة هنا لوحدة Thread Director انه يقوم علي تصنيف نوع العمليات التى يحتاجها كل برنامج ولعبة و من المعروف ان العمليات من نوع Vector تحتاج إلى قوة معالجة فإذا قمت بعمل اي امر يحتاج إلى تعليمات Vector سيقوم Thread director بتنفيذ هذه التعليمات علي الأنوية الأكثر سرعة و نقل البرنامج بصورة لحظية دون ان تشعر وهذا هو التحكم الذكى

– الوضع الأخير لنفترض انك تستخدم بالفعل الأنوية الأكثر قوة و اداء كاملة و قم بتشغيل برنامج اخر يعتمد علي الذكاء الصطناعى سيخبر نظام التشغيل Thread Director و سيقوم Thread Director بالبحث عن أقل نواه تقوم بتنفيذ تعليمات معقدة و يقوم بنقلها إلى الأنوية الأصغر الأكثر كفائة كهربياً و بذلك يحصل المستخدم دائما علي أفضل اداء من البرامج و الألعاب و يعمل المعالج كلة بشكل ذكي و مميز .

ما هي العقبات التى تواجه هذا الأمر من وجهة نظرى الشخصية ؟
لكي يقوم Thread Director بهذا العمل الضخم فانه سيتواصل مع نظام التشغيل Windows 11 كثيرا و إذا كان هذا الأتصال سيتم بصورة كبيرة فهذا سيضع عبء علي نظام التشغيل فيجب ان تكون المعلومات متناسبة مع استهلاك الموارد ليكون هذا الحل ناجح وهو ما سنراه مع الوقت ……

البطاقات الرسومية Intel ARC

معمارية البطاقات الرسومية الجديدة لدى شركة Intel التى سيتم تقديمها في بداية عام 2022 مع استخدام دقات تصنيع 6Nm من شركة TSMC وهو ما يعكس رغبة Intel في المنافسة و تسديد الضربات للشركات الأخرى .

اول ما تفكر به شركة Intel هو الحلول البرمجية حيث انها تعلم جداً ان الجزء الأكثر تعقيدا في البطاقات الرسومية هو الجزء البرمجي فوجود تعريفات لقيادة البطاقات الرسومية بكفاءة يمكن ان يصنع من البطاقات الرسومية البسيطة امر جليل حيث تؤثر التعريفات في العتاد بصورة مميزة لأستخراج أخر قطرة من الأداء مع تجربة مستخدمة مميزة بكل تأكيد فالتعريفات المليئة بالمشاكل لا يحبها المستخدمين خاصة مع معمارية جديدة فلا مفر من وجود مشاكل و عندا تقول الشركة هذا الأمر فانها تنتبه كثيراً لما تقدمه وهو شيء يدل علي جدية المنافسة في هذا السوق الجديد .

لكي تحصل علي اداء عالى مع الحفاظ علي الجودة فيجب عليك استخدام خوارزميات التعظيم للصورة و الذكاء الصطناعى وهو ما اعلنتة شركة Intel مع تقنيات Xe SS و هي اختصار Xe Super Sampling و هى التقنية المنافسة لتقنيات AMD و Nvidia و التى بأسم DLSS و FSR  .

منذ فترة قريبه  قامت شركة Intel بتعيين Anton Kaplanyan لديها فى قسم البطاقات الرسومية للبحث و التطوير و هو احد مهندسي Nvidia سابقا و العقل الخفي وراء تقنيات DLSS و تطويرها هذه ببساطة ما تريد ان تقدمة Intel فى بطاقتها الرسومية الجديدة مع تقنيات XeSS وهى خط الدفاع الطموح لتلك البطاقات الجديدة .
حيث قالت Intel انها استطاعت ان تقوم بتحسين اداء دقة عرض 4K إلى الضعف علي بطاقتها الجديدة دون التضحية بالجودة كل هذا عن طريق استخدام دقة 1080P و تكبيرها عن طريق الصور المرجعية مع الذكاء الصطناعى عبر مكتبة كبيرة لتقديم جودة فائقة واداء ممتاز،  ليس هذا فقط بل اعلنت انها ستقوم بمعالجة هذا الأمر عن طريق وحدات XMX و لتبسيط الأمر عليك وحدات XMX هي الشبيه بوحدات Tensor Cores فى Nvidia ، لم تقم Intel بالتوقف هنا حيث انها اعلنت انها ستستعمل تقنيات XeSS للبطاقات المدمجة في معالجتها دون الأحتياج إلى العتاد او التسريع العتادى عن طريق خوارزميات DP4a لكل البطاقات الرسومية الداعمة لهذه التعليمات و بكلمات اخرى سيكون جزء من التقنية يعمل عبر الألعاب علي بطاقات كثيره سواء من Intel او حتى من Nvidia فهذه الخوارزمية مفتوحة المصدر .
بتلك الطريقة تضمن Intel انها تقوم بتنفيذ الأمر عتادياً على بطاقاتها و الألعاب التى تدعم التقنية ستقوم بتشغيلها عن طريق خوارزمية DP4a علي البطاقات التى لا تملك التسريع العتادى لتحصل علي اداء أفضل مثل تقنيات FSR الخاصة ب AMD ، المشكلة هنا انا نحتاج إلى ان ننتظر و نرى ما ستقدمة فكل تقنية يتم طرحها تحتاج إلى الوقت حتى تنضج تماماً .
السؤال الأخر الأن والتحدي الكبير امام Intel كم عدد مطورين الألعاب الذي يمكن ان تقنعهم الشركة بضم تقنيات XeSS ؟ و باي سرعة ؟ كل هذا سننتظر الكثير من الوقت لنراه ولكن علي كل حال Intel ستطرح ملف التطوير مفتوح المصدر للمطورين في الشهر القادم وهو ما يعني ان الشركة تعطي المطورين كل ما تملك لدمج التقنيات الخاصة بها في الألعاب
هذه هي بنية النواة الواحدة داخل البطاقات الرسومية الخاصة بشركة Intel وهى تحتوى على 16 وحدة من نوع Vector و 16 وحدة من نوع Matrix Engine بعرض نطاق 1024Bit و عرض نطاقة 256bit لوحدات Vector حيث تمثل وحدات XMX هنا وحدات لمعالجة الذكاء الصطناعة و ستقوم Intel بتشكيل الصورة المناسبة لتناسب هذه المعمارية اسواق الاعبين او اسواق الخوادم و الحوسبة لننتقل إلى الصورة الأكبر وهى
اربعة انوية من انوية Xe-Core ثم وحدات Ray Tracing لمعالجة تتبع الأشعة بصورة المختلفة و وحدات التظليل و الإكساء بكل تأكيد
وحدات تتبع الأشعة هنا ستتمكن من معالجة مختلف تأثيرات تتبع الأشعه وهو بناء متطور وليس بدائى ولكن لا نعرف الأداء لهذه الأنوية وهو ما ستكشف Intel عنه في المستقبل القريب نهاية هذا العام فلا تزال المعمارية تحت  التطوير

يمكن للشركة مضاعفة عدد شرائح المعالجة إلى ثمانية شرائح وهذا في بداية اول معمارية فقط وهو ما يعني 512 وحدة معالجة من نوع Vector  و 4096 وحدة من نوع XMX للمعالجة وهى اعداد جيدة جداً لتضع Intel اقدامها في منتصف بطاقات الفئة المتوسطة و تنافس بطاقات RTX 3060Ti بكل اريحية او بطاقة RX 6700XT إذا احسنت من تحسينات المعمارية الخاصة بها مع الحلول البرمجية فهو ما يعطي المستخدم نظرة واعدة في هذا الأمر .

الشركة تعلن عن اكثر من معمارية للبطاقات الرسومية كما نرى ، ليس هذا فقط فتسمية المعماريات مستوحاه من الألعاب وهى تسمية ذكية من الشركة للدخول في صفوف اللاعبين بكل بساطة وسهلة