
Por Marcelo Pérez Peláez (con asistencia de GPT y Grok)
El año 2024 fue testigo de una acelerada evolución en el ámbito de la inteligencia artificial, impulsada por el compromiso de las principales empresas tecnológicas con la apertura de sus modelos más avanzados. La liberación de pesos de estos modelos marcó un hito en la democratización del acceso a herramientas de IA de última generación, promoviendo una cultura de innovación colaborativa en toda la comunidad tecnológica. A continuación, se presenta un análisis técnico de los lanzamientos más destacados de cada mes.
Febrero 2024: Iniciando con Fuerza Stability AI inauguró el año con Stable Diffusion 3, un modelo de difusión con capacidades mejoradas para la generación de imágenes, cuyo código abierto permitió una adopción masiva en proyectos creativos y de investigación. Simultáneamente, Google lanzó CodeGemma, un modelo de generación de código que ofreció soporte para múltiples lenguajes de programación, facilitando la integración de IA en flujos de trabajo de desarrollo de software.
Marzo 2024: Avances en Procesamiento del Lenguaje X Corporation presentó Grok 1.5, una actualización significativa en la línea de modelos de lenguaje de la compañía. La disponibilidad de Grok-1 con pesos abiertos permitió una amplia exploración de sus capacidades en aplicaciones de comprensión y generación de texto.
Abril 2024: Expansión Multidisciplinaria Abril fue un mes clave con la introducción de Stable Audio 2.0 de Stability AI, que extendió las capacidades de generación de audio sintético. Mistral aportó Mixtral 8x22B, un modelo optimizado para tareas de comprensión del lenguaje, mientras que Meta, Microsoft y Apple presentaron modelos como LLaMA 3, Phi-3-mini y OpenELM, que reforzaron la diversidad de herramientas disponibles en el ecosistema de IA abierta.
Mayo 2024: Modelos Multimodales en el Centro del Escenario Meta lanzó Chameleon, un modelo multimodal diseñado para procesar y relacionar datos de diversas fuentes. Mistral AI continuó su trayectoria innovadora con Mistral-7B-Instruct-v0.3 y Codestral, y TII presentó la serie Falcon2, optimizada para tareas de visión por computadora y lenguaje.
Junio 2024: Adaptabilidad y Escalabilidad La versión media de Stable Diffusion 3 ofrecida por Stability AI destacó por su equilibrio entre rendimiento y recursos computacionales. DeepSeekCoderV2 de DeepSeekAI y Florence 2 de Microsoft se posicionaron como herramientas cruciales para aplicaciones de búsqueda y clasificación. Google amplió su portafolio con Gemma 2, mejorando la precisión y eficiencia en la generación de texto.
Julio 2024: Actualizaciones Continuas Meta lanzó Llama 3.1, una versión mejorada de su línea de modelos de lenguaje, mientras que Mistral AI presentó Codestral Mamba, optimizado para instrucciones complejas. Gemma 2 2B de Google reforzó su presencia en el campo de la generación de texto a gran escala.
Agosto 2024: Diversificación en Aplicaciones de IA Con Flux de Black Forest Labs y Hermes 3 de Nous Research, agosto trajo innovaciones significativas en procesamiento de lenguaje y datos estructurados. Microsoft amplió su línea Phi con Phi 3.5, y Cohere introdujo Command R+, optimizado para tareas de recuperación de información.
Septiembre 2024: Consolidación de Modelos Avanzados Allen AI lanzó OLMoE, un modelo orientado a la eficiencia en tareas de mezcla de expertos. Mistral, con Pixtral12B, e IBM, con Granite Code, presentaron modelos diseñados para el análisis y generación de código. Meta cerró el mes con Llama 3.2, una actualización que mejoró el manejo de tareas multilingües.
Octubre 2024: Enriquecimiento del Ecosistema de IA Cohere introdujo Aya Expanse, mientras que Rhymes AI lanzó Aria, ambos con enfoques en procesamiento de lenguaje natural. Stable Diffusion 3.5 de Stability AI se destacó por su capacidad para generar imágenes de alta calidad con un menor consumo de recursos.
Noviembre 2024: Modelos Eficientes y Especializados Alibaba lideró con QwQ 32B Preview y Qwen2.5 Coder 32B, optimizados para tareas de codificación y generación de texto a gran escala. Allen AI presentó Tulu 3, mientras que Hugging Face amplió su oferta con SmolLM 2 y SmolVLM, enfocados en eficiencia y tamaño reducido.
Diciembre 2024: Cierre de Año con Innovaciones Significativas Cohere finalizó el año con Command R7B, mientras que IBM lanzó Granite 3.1. Microsoft introdujo Phi4, y Meta completó el año con Llama 3.3 70B y Apollo, consolidando su liderazgo en el campo de modelos de lenguaje a gran escala. Google y TII lanzaron PaliGemma 2 y la familia Falcon 3, respectivamente, cerrando un año de innovación y colaboración abierta.
El 2024 fue un año decisivo para la inteligencia artificial open source, con avances mensuales que ampliaron el acceso y la capacidad de innovación en el campo. La liberación de pesos permitió a investigadores y desarrolladores explorar nuevas fronteras en el procesamiento de lenguaje, visión por computadora, generación de audio y más, sentando las bases para un futuro de colaboración y progreso compartido.
NMDQ – Hugging Face