El nuevo modelo de lenguaje grande MM1 de Apple desdibuja la línea entre imagen y texto

por José Antonio Niebla Rizo 16 de marzo de 2024

Escrito por José Antonio Niebla Rizo 16 de marzo de 2024

El equipo de investigación de Apple ha dado un gran paso adelante con su nuevo modelo de lenguaje grande multimodal “MM1” . Este interesante desarrollo se detalló en un artículo reciente titulado “MM1: Métodos, análisis e información del entrenamiento previo de LLM multimodal”, y muestra un modelo con capacidades impresionantes tanto en reconocimiento de imágenes como en razonamiento de lenguaje natural.

El modelo está disponible en tamaños de parámetros de 3 mil millones, 7 mil millones y 30 mil millones.

MM1 viene en tres tamaños: 3 mil millones, 7 mil millones y 30 mil millones de parámetros. Los investigadores utilizaron estos modelos para realizar experimentos, identificando los factores clave que influyen en el rendimiento. Curiosamente, la resolución de la imagen y la cantidad de etiquetas de imagen tienen un mayor impacto que los conectores del lenguaje visual, y diferentes conjuntos de datos previos al entrenamiento pueden afectar significativamente la efectividad del modelo.

El equipo de investigación construyó meticulosamente MM1 utilizando una arquitectura de «mezcla de expertos» y un método de «compuerta Top-2». Este enfoque no solo produjo excelentes resultados en los puntos de referencia previos a la capacitación, sino que también se tradujo en un sólido desempeño en los puntos de referencia multimodales existentes. Incluso después de realizar ajustes para tareas específicas, los modelos MM1 mantuvieron un rendimiento competitivo.

Mira también:

Qualcomm presenta el SoC Snapdragon X Elite para portátiles y afirma tener un mejor rendimiento que el Apple M2 Max

TechIsLife lanza la nueva aplicación ChatGPT AI Chatbot

Samsung no reemplazará la Búsqueda de Google con el Chatbot de Bing a partir de ahora

Nuevo cable submarino Arimao inició período de prueba

WhatsApp trabaja en mejorar sus Estados y acá te contamos que se trae

No tener que recordar contraseñas y un desbloqueo facial más seguro se aproximan a Android

Xiaomi lanza el Poco X5 y el X5 Pro y estas son sus novedades

El smartwatch de Meta tiene varias filtraciones interesantes.

La carga rápida de 240W ya está a la vuelta de la esquina con el Realme GT Neo 5

Xiaomi cambia el nombre de Redmi 9 a Redmi 9 Prime

El teléfono con pantalla de desplazamiento de Samsung podría lanzarse este año, ¡se revela el conjunto de chips Galaxy Z Fold4 y Z Flip4!

Las pruebas revelaron que los modelos MM1-3B-Chat y MM1-7B-Chat superan a la mayoría de los competidores de tamaño similar en el mercado. Estos modelos brillan particularmente en tareas como VQAv2 (respuesta de preguntas basada en una imagen y texto), TextVQA (respuesta de preguntas basada en texto sobre una imagen) y ScienceQA (respuesta de preguntas científicas). Sin embargo, el rendimiento general del MM1 no supera del todo a los modelos Gemini de Google o GPT-4 V de OpenAI (todavía). Si bien MM1 puede no ser el líder absoluto todavía, sigue siendo un importante salto adelante para Apple en inteligencia artificial. La compañía también adquirió recientemente DarwinAI, lea más sobre eso aquí .

A continuación deja tu comentario y síguenos en nuestro Blog y redes sociales para estar al día sobre las noticias de ciencia y tecnología. Recuerda visitarnos en nuestro canal de Telegram y de WhatsApp.

apple inteligencia artificial

José Antonio Niebla Rizo

Bienvenido al perfil de José Antonio, el hombre que hace reír a todos con sus ocurrencias. José Antonio es un aficionado a la música, el cine y los videojuegos, y le encanta compartir sus opiniones y experiencias con sus seguidores. Si quieres pasar un buen rato, no dudes en seguirlo y comentar sus publicaciones. José Antonio te espera con una sonrisa y un chiste bajo la manga.

artículo anterior

¿Sabías que toDus está activando los estados al estilo de WhatsApp y Telegram?

artículo siguiente

Android 15 te permite encontrar tu teléfono inteligente incluso cuando está apagado

También te puede gustar

Deja un comentario Cancelar respuesta

Lo siento, debes estar conectado para publicar un comentario.

¿Debería actualizar a HyperOS? Diez razones principales para…

Qualcomm anunció oficialmente su chip Snapdragon X Plus…

Las ventas de iPhone se desaceleran, Android gana…

Evento ‘Let Loose’ de Apple programado para el…

Próximos teléfonos con el potente chip Snapdragon 8…

WhatsApp Business beta iOS agrega lectura en mensaje…

¡Descubre las novedades de Telegram 10.12 Beta!