مايكروسوفت تقدم نموذجًا لغويًا صغيرًا يحلل الصور

تعمل مايكروسوفت على توسيع عائلة النماذج اللغوية الصغيرة Phi-3 من خلال تقديم Phi-3-vision. وعلى عكس أشقائه، لا يركز Phi-3-vision على النص فحسب، بل إنه نموذج متعدد الوسائط يمكنه تحليل الصور وفهمها أيضًا. ويضم هذا النموذج 4.2 معلمة، وهو مصمم للأجهزة المحمولة ويتفوق في مهام التفكير البصري العامة. وأطلقت جوجل في الأسبوع الماضي نموذجها اللغوي الصغير …