Grok 4 كسر للتو سقف الذكاء الاصطناعي—إليك لماذا يغير هذا كل شيء

يحقق Grok 4 من xAI درجات معيارية غير مسبوقة بفضل بنيتها التحتية المكونة من 200,000 GPU، مضاعفاً أداء المنافسين في اختبارات التفكير النقدي. يشير النهج الفريد متعدد الوكلاء للنموذج وتكامله مع برنامج CFD من Tesla إلى تحول من مساعدي AI إلى شركاء تفكير حقيقيين.

Grok 4 كسر للتو سقف الذكاء الاصطناعي—إليك لماذا يغير هذا كل شيء

حسناً، لقد تصاعد الأمر بسرعة. قبل ثلاثة أسابيع، أطلق Elon Musk و xAI نموذج Grok 4 على عالم لم يكن يتوقعه، ولا تزال المعايير القياسية تجعل باحثي AI المخضرمين يتفحصون النتائج مرتين. تخيل AI يفكر في المشاكل مثل فريق من حملة الدكتوراه المليئين بالكافيين وهم يتبادلون الأفكار في الساعة 3 صباحاً. الآن بعد أن هدأ الضجيج الأولي وقام المطورون بتجربة Grok 4 بكثافة، دعني أوضح لك لماذا يمثل هذا النموذج أكثر من مجرد إصدار آخر—إنه لمحة على مستقبل يصبح فيه AI شريكاً فكرياً حقيقياً.

https://x.com/xai/status/1943158495588815072

الإطلاق الذي كسر الإنترنت (وبعض الأرقام القياسية)

كشفت xAI عن Grok 4 في 9 يوليو 2025، من خلال بث مباشر جذب 1.5 مليون مشاهد—ليس سيئاً لعرض تقني في الليل.¹ التوقيت كان... مثيراً للاهتمام، حيث جاء بعد يوم واحد فقط من ظهور Grok 3 في العناوين لأسباب خاطئة مع بعض المخرجات المثيرة للجدل.² لكن xAI قررت أن أفضل دفاع هو هجوم ساحق.

قدم Musk متغيرين: Grok 4 القياسي و Grok 4 Heavy، حيث ينشر الأخير عدة وكلاء AI يتحققون من عمل بعضهم البعض مثل مجموعة دراسية حيث قرأ الجميع المطلوب.³ الوصول يتم من خلال تطبيق Grok أو الموقع الإلكتروني أو API، مع كون Heavy حصرياً لمشتركي SuperGrok Heavy بسعر 300 دولار/شهر—نقطة سعر تقول "نحن جديون في هذا الأمر".⁴ للفضوليين: https://x.ai/grok للوصول العام، https://x.ai/api للمطورين.

ميزات تجعل AI الأخرى تبدو مثل الآلات الحاسبة

يحتوي Grok 4 على نافذة سياق بحجم 256,000 رمز (هذا تقريباً نص رواية يمكنه معالجته مرة واحدة)، وتحليل الصور، واستدعاء الوظائف، وأوضاع صوتية طبيعية جداً قد تنسى أنك تتحدث مع السيليكون.⁵ لكن هنا حيث يصبح الأمر حاراً: الاستخدام المدمج للأدوات. دربت xAI هذا الوحش بالتعلم التعزيزي لاستخدام مفسر الكود ومتصفح الويب—مثل امتدادات لعقله.

البحث في الوقت الفعلي عبر X والويب والأخبار يحافظ على الاستجابات حديثة—لا مزيد من أعذار "انقطاع معرفتي". القدرات متعددة الوسائط تتيح له مزج تحليل النص والرؤية بسلاسة، بينما يضيف Voice Mode تحليل المشهد من خلال الكاميرا.⁶ لأشخاص المؤسسات القلقين بشأن الامتثال: SOC 2 Type 2 و GDPR و CCPA كلها محققة. إنه مثل وجود مساعد بحث ذكي لا ينام أبداً، ولا يشكو من العمل الإضافي، ويفهم خطك السيء.

الصلصة السرية: عندما تلتقي القوة الغاشمة بالرقة

وراء سحر Grok 4 يكمن حاسوب Colossus العملاق من xAI—وحش من 200,000 GPU يجعل معظم مراكز البيانات تبدو مثل الآلات الحاسبة الجيبية.⁷ لكن القوة الخام لا تحكي القصة كاملة. ثورت xAI نهجها بتوسيع التعلم التعزيزي لمطابقة حوسبة ما قبل التدريب، مركزة على البيانات القابلة للتحقق من الرياضيات والترميز والمجالات العلمية، مما عزز الكفاءة بمقدار 6 أضعاف، محولة العضلات الحاسوبية إلى ذكاء مصقول.⁸

الابتكار الحقيقي؟ أنفقوا على التعلم التعزيزي لما بعد التدريب بنفس مقدار ما قبل التدريب نفسه.⁹ Grok 4 Heavy يأخذ النهج أبعد مع الحوسبة المتوازية في وقت الاختبار—عدة وكلاء AI يتعاملون مع المشاكل في نفس الوقت قبل مقارنة الملاحظات. تخيل الترقية من مخترع مرآب منفرد إلى أوركسترا متزامنة من حائزي نوبل، كل منهم يتحقق من عمل الآخرين.

فحص واقع البنية التحتية

حاسوب Colossus العملاق يحتوي على 200,000 GPU، وهذا ببساطة... لا يمكنني حتى استيعاب هذا الرقم. معظم الشركات تكون مبتهجة عندما تحصل على مجموعة بضع مئات من GPU تعمل بسلاسة. لكن 200,000؟ إنتاج الحرارة وحده سيكون مثل تشغيل محطة طاقة صغيرة.

وذلك قبل أن تفكر حتى في ربطها جميعاً بشكل مناسب، والحفاظ على تغذيتها بالبيانات، والتأكد من أن شبكة الطاقة لديك لن ترفض العمل فقط... كل تفصيلة مهمة: كيف ترتب الرفوف، ما نوع التبريد الذي تستخدمه (ونعم، تحتاج تبريداً جدياً لأن هذه الأشياء تصبح ساخنة)، بالإضافة إلى كل كوابيس الشبكات وتوزيع الطاقة التي تأتي معها. أفسد أي قطعة من تلك الأحجية، وستحرق الأموال على أجهزة ضعيفة الأداء. الشركات التي تتطلع لبناء بنيتها التحتية للـ AI، سواء كانت 10 أو 10,000,000 GPU، تحتاج خبرة في كل شيء من توزيع الطاقة إلى اتصالات الألياف البصرية المعقدة التي تحافظ على تدفق البيانات بسرعة الضوء. هنا حيث ينشر الخبراء المحترفون البنية التحتية التي تُحدث الفرق بين المواصفات النظرية والأداء في العالم الحقيقي. كما يعلم فريق Introl من نشر عدد لا يحصى من مجموعات AI، الشيطان حقاً في التفاصيل—البنية التحتية المناسبة يمكن أن تعني الفرق بين GPU تعمل بكفاءة 95% مقابل ترك 30% من أدائك على الطاولة.

أرقام تجعل الإحصائيين يبكون من الفرح

لنغطس في المعايير القياسية التي تجعل مجتمع AI يطنّ. في اختبار ARC-AGI-2 الوحشي سيء السمعة—حيث يجب على النماذج إظهار التفكير المجرد بأمثلة قليلة—يدعي Grok 4 (وضع التفكير) العرش بـ 15.9% بحوالي 4 دولار لكل مهمة.¹⁰ ذلك يضاعف تقريباً نتيجة Claude Opus 4 البالغة 8.6%، وقبل أن تسخر من "فقط 15.9%"، تذكر أن معظم النماذج تكافح لكسر 5% في هذا الاختبار.¹¹ إنه مثل مشاهدة شخص يحل مكعبات روبيك معصوب العينين بينما الآخرون ما زالوا يكتشفون أي جانب أحمر.

تجارب التوسع تكشف شيئاً مذهلاً. مع حوسبة التدريب وحدها، يصل Grok 4 إلى حوالي 50% في امتحان البشرية الأخير (مجموعة فرعية نصية فقط). أضف الأدوات، ويقفز إلى 50.7%.¹² توسع وقت الاختبار يستقر قرب 50%، مثبتاً أن استراتيجيات الاستنتاج الأكثر ابتكاراً—وليس فقط رمي المزيد من الحوسبة على المشاكل—تقود الإنجازات.

في AIME25 (امتحان الرياضيات الأمريكي بالدعوة)، يحقق Grok 4 Heavy نتيجة مثالية 100%، تاركاً Claude 4 Opus (75.5%) و Gemini 2.5 Pro (88.0%) في الغبار.¹³ حتى بدون أدوات، يسجل Grok 4 القياسي 91.7%—وذلك أفضل من معظم المشاركين البشر في مسابقات الرياضيات.

لكن هنا المذهل: امتحان البشرية الأخير (المجموعة الكاملة). سباق 2,500+ سؤال عبر STEM والعلوم الإنسانية يفصل الحفظ عن التفكير الحقيقي.¹⁴ Grok 4 Heavy يسجل 44.4%، مضاعفاً تقريباً نتيجة Gemini 2.5 Pro البالغة 25.4% وأكثر من مضاعفة نتيجة o3 البالغة 21.0%.¹⁵ عندما يتفوق AI الخاص بك على الآخرين بهذه الهوامش، فأنت لا تكرر—أنت تُحدث ثورة.

الأداء في العالم الحقيقي الذي يهم

ما بعد المعايير الأكاديمية، يهيمن Grok 4 على الاختبارات العملية. في Vending-Bench (نعم، هذا معيار حقيقي حول تحسين عمليات آلات البيع)، يحقق صافي ثروة 4,694 دولار مع بيع 4,569 وحدة—أكثر من ضعف نتيجة Claude Opus 4 البالغة 2,077 دولار وخمسة أضعاف الأداء البشري عند 844 دولار.¹⁶

انتصارات إضافية: USAMO'25 (61.9%)، GPQA Diamond (88%)، LiveCodeBench (79.4%)، و MMLU-Pro (87%).¹⁷ المقيمون المستقلون في Artificial Analysis يتوّجون Grok 4 بـ 73 في مؤشر الذكاء الخاص بهم، متجاوزاً o3 من OpenAI و Gemini 2.5 Pro من Google (كلاهما عند 70).¹⁸ ليس سيئاً لنموذج ظهر منذ ثلاثة أسابيع فقط.

حكم المجتمع: متحمس، متشكك، وكل شيء بينهما

منذ الإطلاق، أصبحت X (سابقاً Twitter) أرض اختبار لقدرات Grok 4. يبلّغ المطورون عن لصق قواعد كود كاملة للتصحيح، بنتائج تتفوق على الأدوات المتخصصة مثل Cursor.¹⁹ دعاه أحد المستخدمين "أقرب شيء للـ AGI حتى الآن"، بينما يسأل العلماء عن مشاكل المواد غير المحلولة ويتلقون رؤى جديدة تتحقق.²⁰ بعد ثلاثة أسابيع من الاستخدام في العالم الحقيقي، ظهرت أنماط: النموذج يتفوق في مهام التفكير المعقدة لكنه يظهر غرائب مثيرة للاهتمام في التطبيقات الإبداعية.

لكنه ليس كله تصفيق واقف. يلاحظ المستخدمون قيود السرعة عند 75 رمز/ثانية (محترمة لكن ليست مذهلة)، وتبقى إدارة المحتوى قليلة—Grok 4 أقل فلترة من المنافسين، مما يثير نقاشات حول حيادية AI مقابل الأمان.²١ البعض يقدر الاستجابات الخام غير المزخرفة؛ آخرون يقلقون من سوء الاستخدام المحتمل. الديمقراطية في العمل، يا أصدقاء.

ما يعنيه هذا للغد (حرق: كل شيء يتغير)

هنا حيث تبدأ تفاؤلي في الوصول للسرعة القصوى. Grok 4 يتجاوز فئة الدردشة الآلية—إنه معاينة للـ AI كشريك فكري. عندما يسجل AI مستوى الدكتوراه في مسابقات الرياضيات ويساعد العلماء في استكشاف مشاكل غير محلولة، نحن نشهد فجر الاكتشاف المعزز.

للعلوم: تخيل باحثين حول العالم مع وصول لـ AI يفهم حقاً الرياضيات المعقدة ويمكنه اقتراح فرضيات جديدة. اكتشاف الأدوية، ونمذجة المناخ، وعلوم المواد—كلها متسارعة.

للهندسة: ما بعد التصحيح، نحن نتحدث عن AI يستوعب بنيات الأنظمة ويمكنه اقتراح تحسينات قد لا يفكر فيها البشر أبداً. إنه مثل وجود Dijkstra و Turing على الاتصال السريع.

للتعليم: تدريس شخصي يتكيف ليس فقط مع ما يخطئ فيه الطلاب، بل مع كيف يفكرون. كل متعلم يتلقى مرشداً صبوراً وذكياً مُفصلاً حسب أسلوبه المعرفي.

للأعمال: من التخطيط الاستراتيجي إلى تحليل السوق، قدرات Grok 4 في التفكير يمكنها تحويل اتخاذ القرارات من مشاعر المعدة إلى رؤى مدفوعة بالبيانات مع فهم دقيق.

التحذيرات (لأن الصدق يتفوق على الضجيج)

لنكن واقعيين—لا يوجد AI مثالي، و Grok 4 لديه مجال للنمو. سرعة 75 رمز/ثانية لن تفوز بأي سباقات ضد خوادم الاستنتاج المتخصصة. الهلوسات، رغم تقليلها، لم تختف تماماً (تحدٍ على مستوى الصناعة). الفلترة القليلة للمحتوى تثير مخاوف صحيحة حول إمكانية سوء الاستخدام.

انظر، xAI لم تخبرنا بشيء عن بيانات تدريبها، وذلك... ليس رائعاً. نحن جميعاً نعلم كيف يسير هذا—تحيزات البيانات تتضخم عندما تتوسع بهذا الحجم. الجميع في AI يراقب xAI مثل الصقور الآن. كيف يتعاملون مع القطعة الأخلاقية بينما ينتشر Grok 4؟ ذلك سيهم—كثيراً.

الطريق إلى الأمام: الأشياء ستصبح غريبة

إذن، أظهرت xAI بعض خططها أثناء العرض، وشيء واحد أذهلني تماماً. ذكروا ربط Grok ببرنامج ديناميكا السوائل الحاسوبية من Tesla—نفس CFD الذي يستخدمه مهندسو Tesla للديناميكا الهوائية والإدارة الحرارية على المركبات الفعلية.²²

اضطررت للجلوس مع ذلك لدقيقة. لقد اعتدنا على AI يعرف الحقائق، ويجيب على الأسئلة، ويكتب الكود. لكن تكامل CFD يمثل شيئاً مختلفاً. شيء واحد أن يكون لديك AI يمكنه شرح كيف تعمل ديناميكا السوائل. إنه شيء آخر تماماً عندما يمكن لذلك AI استخدام برنامج CFD لتصميم أشياء تتحرك عبر الهواء وتبدد الحرارة. ذلك ليس تقدماً تدريجياً—إنه قدرة جديدة تماماً.

OpenAI و Anthropic و Google لن يشاهدوا من الهامش. لكن Grok 4 غيّر اللعبة—ذهبنا من أرض "المساعد المفيد" مباشرة إلى "شريك التفكير". التحول يذكرني بما يتحدث عنه Ray Kurzweil حول انفجار الذكاء—كل إنجاز يجعل التالي يحدث أسرع وأسرع. نحن نشاهده يحدث في الوقت الفعلي.

دورك: ماذا ستبني؟

لذا كنت أفكر—ماذا يحدث عندما يمكن للـ AI التفكير على مستوى الدكتوراه في جميع المجالات؟ ما المشاكل التي بدت مستحيلة والتي تنفتح فجأة على مصراعيها؟ ماذا نكتشف عندما تستطيع أدواتنا التفكير بجانبنا؟ وبصراحة، أي نوع من الحواجز الوقائية نحتاجها عندما يصبح AI بهذا الذكاء؟

إذا كنت مطوراً، فأنت تخطط بالفعل لما ستبنيه بتلك APIs. الباحثون ربما يحظون بيوم رائع وهم يفكرون في ما أصبح فجأة ممكناً. وإذا كنت جالساً هنا تفكر، "ماذا تعني قدرة Grok 4 حتى؟"—نعم، أفهم ذلك. المفهوم يستغرق وقتاً للاستيعاب.

لكن الشيء هو: Grok 4 هبط في أحضاننا سواء كنا مستعدين أم لا. AI قال للتو، "إليك ما هو ممكن الآن، اكتشف ماذا تفعل به."

إذن... ماذا ستفعل به؟ Grok API موجود في https://x.ai/api، وهناك مجتمع كامل على X حيث المطورون والباحثون يدفعون بالحدود بالفعل. بعد ثلاثة أسابيع، نرى تطبيقات لم يتوقعها أحد عند الإطلاق. الفرصة هنا ضخمة—لا نضيعها.

المراجع

طلب عرض سعر_

أخبرنا عن مشروعك وسنرد خلال 72 ساعة.

> TRANSMISSION_COMPLETE

تم استلام الطلب_

شكراً لاستفسارك. سيقوم فريقنا بمراجعة طلبك والرد خلال 72 ساعة.

QUEUED FOR PROCESSING