منافس «OpenAI».. الإصدار الأول من «Grok» يعالج المعلومات المرئية

منذ شهرين

عرضت شركة xAI، منافس OpenAI التي أسسها إيلون ماسك، الإصدار الأول من Grok الذي يمكنه معالجة المعلومات المرئية.\nويعد Grok-1.5V هو نموذج الذكاء الاصطناعي متعدد الوسائط من الجيل الأول للشركة، والذي لا يمكنه معالجة النص فحسب، بل أيضًا "المستندات والرسوم البيانية والمخططات ولقطات الشاشة والصور الفوتوغرافية".\nووفقا لما ذكره موقع "engadget"، فإنه في إعلان "XAI"، قدم بعض العينات حول كيفية استخدام قدراته في العالم الحقيقي.\nيمكنك، على سبيل المثال، أن تعرض عليه صورة لمخطط انسيابي وتطلب من "Grok" ترجمتها إلى كود "Python"، واطلب منه كتابة قصة بناءً على رسم، بل واطلب منه شرح ميم لا يمكنك فهمه.\nويأتي الإصدار الجديد بعد أسبوعين فقط من كشف الشركة عن Grok-1.5، حيث تم تصميم هذا النموذج ليكون أفضل في البرمجة والرياضيات من سابقه، وكذلك ليكون قادرًا على معالجة سياقات أطول حتى يتمكن من التحقق من البيانات من المزيد من المصادر لفهم استفسارات معينة بشكل أفضل.\nوقالت شركة xAI إن مختبريها الأوائل والمستخدمين الحاليين سيتمكنون قريبًا من الاستمتاع بقدرات Grok-1.5V، على الرغم من أنها لم تقدم جدولًا زمنيًا محددًا لبدء تشغيله.\nبالإضافة إلى تقديم Grok-1.5V، أصدرت الشركة أيضًا مجموعة بيانات قياسية أطلقت عليها اسم RealWorldQA.\nيمكنك استخدام أي من صور RealWorldQA البالغ عددها 700 صورة لتقييم نماذج الذكاء الاصطناعي، حيث يأتي كل عنصر مع أسئلة وأجوبة يمكنك التحقق منها بسهولة، ولكنها قد تعوق النماذج متعددة الوسائط مثل Grok.\nوادعت شركة xAI أن تقنيتها حصلت على أعلى الدرجات عندما اختبرتها الشركة مع RealWorldQA ضد المنافسين، مثل OpenAI's GPT-4V وGoogle Gemini Pro 1.5.

الخبر من المصدر