آخر تحديث :الخميس-28 نوفمبر 2024-12:24ص

تكنولوجيا


شات جي بي تي الجديد قادر على تحليل ما يراه ويسمعه

شات جي بي تي الجديد قادر على تحليل ما يراه ويسمعه

الأربعاء - 03 يوليو 2024 - 02:19 ص بتوقيت عدن

- جرهم ــ متابعات


حصل شات جي بي تي أخيرًا على أحد أكبر التحديثات حتى الآن، شاملًا مجموعة من الميزات الجديدة المدعومة بنموذج GPT-4o الجديد، التي أُعلن عنها في حدث Spring Update، ومقارنتها بالمساعد الافتراضي في فيلم هير للمخرج سبايك جونز. ما يجعلنا نتساءل متى يمكننا تجربته، لكن الأمر معقد بعض الشيء.

الخبر السار أن GPT-4o، الإصدار الجديد متعدد الوسائط من شات جي بي تي، يمكنه إدراك الصوت والصور والنصوص في الوقت الفعلي، كما تصفه الشركة، طُرح الآن لجميع المستخدمين بنسخة مجانية. أصدرت شركة أوبن إيه آي نسخة يمكنها فقط التعامل مع النصوص والصور من GPT-4o، مع الميزات الرائعة القائمة على الصوت والفيديو التي ستصدر في وقت لاحق.

للعثور على تلك النسخة، يجب تسجيل الدخول إلى حساب المستخدم في متصفح الويب والتحقق من القائمة المنسدلة في الزاوية العلوية اليسرى، إذا كان التحديث متوفرًا، ستكون النسخة معنونة افتراضيًا بـ GPT-4o مع تسمية أسفلها newest and most advanced model خاصة بشركة أوبن إيه آي.

هذه طريقة الوصول إلى نموذج GPT-4o عبر الويب، لكن ماذا عن تطبيقات شات جي بي تي لأنظمة تشغيل آي أو أس وأندرويد وماك؟ يبدو أن أحدث نسخة من شات جي بي تي تُطرح أبطأ قليلًا عن الأنظمة السابقة. لم نتمكن بعد من الوصول إلى إصدار GPT-4o على أنظمة آي أو أس أو أندرويد حتى الآن، في حين ما يزال تطبيق ماك الجديد الخاص بشات جي بي تي قيد التنفيذ.

أعلنت شركة أوبن إيه آي في 13 مايو أنها ستطرح تطبيق ماك أو أس لمستخدمي بلس بدءًا من الآن، وأنه سيكون متاحًا على نطاق أوسع في الأسابيع المقبلة. من الغريب تجاهل مستخدمي ويندوز واستبعادهم من مجموعة تطبيقات شات جي بي تي لسطح المكتب، لكن وفقًا لشركة أوبن إيه آي، تقول: «إننا نخطط أيضًا لإطلاق نسخة ويندوز في وقت لاحق من هذا العام».

ما أثار الإعجاب في عرض إصدار GPT-4o الخاص بشركة أوبن إيه آي التجريبي قدرة النموذج على إجراء محادثات في الوقت الفعلي، فضلًا عن الحيل القائمة على الرؤية التي تسمح له بالرؤية والدردشة في آن واحد.

لسوء الحظ، يبدو أنه سيتعين علينا الانتظار لفترة أطول قليلًا حتى يُنشر على نطاق أوسع. بحسب شركة أوبن إيه آي تقول إنه يمكن للمطورين الآن الوصول إلى إصدار GPT-4o في واجهة برمجة التطبيقات بوصفه نموذجًا يُعنى بالنصوص والرؤية، الذي يختلف عن النموذج القائم على الصور الذي أُصدر بنسختين مجانية ومدفوعة للمستخدمين في وقت سابق.

أما فيما يتعلق بالحيل الصوتية، تقول شركة أوبن إيه آي: «سيُطرح إصدار جديد من Voice Mode مع إصدار GPT-4o في مرحلة ألفا داخل شات جي بي تي بلس مستقبلًا». وتضيف: «إننا نخطط لإتاحة الميزات التي تعتمد على الصوت والفيديو الجديدة لإصدار GPT-4o خاصة بمجموعة صغيرة من الشركاء الموثوقين في واجهة برمجة التطبيقات في الأسابيع المقبلة».

يحمل ذلك قليلًا من الغموض ما يعني أن بعض أروع حيل إصدار GPT-4o تأتي فقط للمختبرين والمطورين من بين مستخدمي شات جي بي تي بالنسخة المدفوعة في الوقت الحالي. لكن الأمر الواضح احتمالية حاجة التكنولوجيا التي تعمل على تشغيل العروض التوضيحية لإصدار GPT-4o الخاص بشركة أوبن إيه آي إلى حواسيب قوية للغاية، لذلك قد يستغرق النشر على نطاق أوسع بعض الوقت.

إنه أمر محبط بعض الشيء فيما يتعلق بالأشخاص المتلهفين للدردشة مع المساعد الذكي الذي يدعمه إصدار GPT-4o في العروض التجريبية المختلفة لشركة أوبن إيه آي. لمشاهدة تلك العروض التجريبية يُنصح بالاطلاع على مقاطع الفيديو التوضيحية المتنوعة لإصدار GPT-4o على موقع أوبن إيه آي، التي تتضمن اثنين من مساعدي الذكاء الاصطناعي يغنيّان لبعضهما، فضلًا عن نسخة شات جي بي تي التي تساعد على الاستعداد لمقابلة ما.

من الناحية الإيجابية، سيكون إصدار GPT-4o متاحًا على نحو مفاجئ بنسخة مجانية ونسخة مدفوعة للمستخدمين، ومع أن النشر الكامل لجميع الحيل التي استعرضتها شركة أوبن إيه آي قد يستغرق بعض الوقت، إلا أن الوعد موجود بالتأكيد.