في خطوة جديدة تعزز سباقها مع «أوبن إيه آي» و«آنثروبيك»، أعلنت «غوغل» عن تطوير قدرات أداة الذكاء الاصطناعي الخاصة بها «جيميناي» لتصبح قادرة على تصفح المواقع الإلكترونية والتفاعل معها بشكل مباشر، تماماً كما يفعل المستخدم البشري.
هذه القدرات الجديدة تأتي ضمن النموذج التجريبي Gemini 2.5 Computer Use، الذي استعرضته الشركة عبر تدوينة رسمية ومجموعة من مقاطع الفيديو توضح كيفية عمل الأداة.
بعكس النماذج السابقة التي كانت تعتمد على واجهات برمجية (APIs) للتكامل مع المواقع، أصبح «جيميناي» الآن قادراً على التعامل مع صفحات الويب مباشرة عبر المتصفح، أي أنه يمكنه النقر، التمرير، ملء النماذج، والبحث في المواقع كما يفعل الإنسان.
ويتيح هذا التطور للأداة مجموعة من المهمات الذكية مثل:
– اختبار واجهات المواقع والتحقق من عملها بشكل صحيح.
– ملء الاستبيانات والنماذج إلكترونياً.
– جمع المعلومات وتحليل محتوى الصفحات بدقة.
كانت «غوغل» قد جرّبت هذه التقنية مسبقاً ضمن عدد من مشاريعها التجريبية، مثل:
– ميزة وضع الذكاء الاصطناعي في محرك البحث.
– مشروع Project Mariner الذي سمح لأدوات الذكاء الاصطناعي بإضافة المنتجات إلى سلة الشراء تلقائياً بناءً على قوائم مُسبقة.
ويؤكد هذا التطور توجه الشركة نحو جعل «جيميناي» أكثر استقلالية وذكاء وظيفياً، بحيث يمكنه أداء مهمات معقدة من دون الحاجة إلى تكامل تقني خارجي.
يتزامن هذا الإعلان مع إطلاق شركة «أوبن إيه آي» لميزة «تطبيقات شات جي بي تي» (ChatGPT Apps)، التي تسمح باستخدام تطبيقات خارجية داخل أداة الدردشة نفسها.
كما قدّمت شركة «آنثروبيك» العام الماضي نموذجاً مماثلاً لمساعدها «كلود»، قادر على تنفيذ أوامر داخل بيئات رقمية محددة.
لكن وفقاً لتقرير موقع «ذا فيرج» التقني، تؤكد «غوغل» أن نموذجها الجديد يتفوّق على المنافسين من حيث الأداء على الحواسيب والهواتف، بفضل تكامله المباشر مع متصفحها.
رغم أن النموذج ما يزال في المرحلة التجريبية ومتاح حالياً للمطورين فقط، فإن «غوغل» تخطط لطرحه تدريجياً للمستخدمين خلال المدة المقبلة.
ويُتوقع أن يشكّل Gemini 2.5 Computer Use نقلة نوعية في طريقة تفاعل الذكاء الاصطناعي مع الإنترنت، إذ سيصبح قادراً على القيام بالمهمات بدلاً من المستخدمين، من البحث والحجز، إلى إدارة المهمات والشراء الإلكتروني.
بهذا التحديث، تثبت «غوغل» أن سباق السيطرة على الجيل الجديد من المساعدات الذكية لم يعد يتعلق فقط بالإجابة عن الأسئلة، بل بمن يستطيع التفاعل فعلاً مع العالم الرقمي.
