Saltar al contenido
NoticiasMDQ

NoticiasMDQ

Identidad marplatense

  • GENERALES
  • DESTACADAS
  • BAIRES
  • REGION
  • IA
Ver online
  • Inicio
  • IA
  • Tülu 3 405B: Un Avance Revolucionario en IA de Código Abierto
  • IA

Tülu 3 405B: Un Avance Revolucionario en IA de Código Abierto

nmdq 4 de febrero de 2025 3 min de lectura
image 3 1

Por Marcelo Pérez Peláez (c0n asistencia de Deepseek, GPT y Grok)

El modelo Tülu 3 405B de Allen AI marca un hito en el desarrollo de inteligencia artificial de código abierto. Con sus 405 mil millones de parámetros, ha sido diseñado para competir con los modelos más avanzados del mercado, como DeepSeek V3 y GPT-4o, superándolos en benchmarks clave, especialmente en razonamiento matemático y seguridad.

Características Principales

Enfoque de Código Abierto: A diferencia de otros modelos, Tülu 3 405B es completamente abierto, lo que significa que tanto su código como sus datos y métodos de entrenamiento están disponibles públicamente. Esto permite a desarrolladores e investigadores adaptar y mejorar el modelo según sus necesidades.

Técnica de Entrenamiento Innovadora: Utiliza Reinforcement Learning with Verifiable Rewards (RLVR), un método que entrena el modelo en tareas con resultados verificables, como la resolución de problemas matemáticos y el seguimiento de instrucciones. Este enfoque ha demostrado ser especialmente efectivo en modelos de gran escala.

Desempeño en Benchmarks: En pruebas como GSM8K (problemas matemáticos de nivel escolar) y MATH (razonamiento matemático avanzado), Tülu 3 405B ha igualado o superado a modelos como DeepSeek V3 y GPT-4o. También ha sobresalido en evaluaciones de seguridad, estableciendo un nuevo estándar en la industria.

Proceso de Entrenamiento

El desarrollo de Tülu 3 405B ha seguido un proceso en cuatro etapas:

  1. Selección Estratégica de Datos: Combinación de conjuntos de datos establecidos con contenido generado específicamente para mejorar habilidades clave como el razonamiento matemático y la codificación.
  2. Mejora de Respuestas: Creación de conjuntos de datos especializados para entrenar habilidades particulares del modelo.
  3. Optimización de Preferencias Directas (DPO): Comparación y ajuste de respuestas para priorizar calidad sobre cantidad.
  4. RLVR: Implementación de un sistema de recompensas verificables que mejora la precisión en tareas técnicas.

Transparencia y Accesibilidad

Allen AI ha publicado todos los detalles del proceso de desarrollo de Tülu 3 405B, desde la preparación de datos hasta la implementación de RLVR. Esta apertura establece un nuevo estándar en el desarrollo de IA de alto rendimiento y fomenta la innovación en la comunidad tecnológica.

Impacto en la Industria de la IA

Tülu 3 405B no solo representa un avance tecnológico significativo, sino que también desafía a los modelos cerrados de grandes corporaciones. Su accesibilidad democratiza el uso de inteligencia artificial avanzada, permitiendo a más investigadores y desarrolladores experimentar con nuevas aplicaciones y metodologías.

Disponibilidad

El modelo está disponible para pruebas en el Ai2 Playground, y su código puede encontrarse en GitHub y Hugging Face. Además, está alojado en Google Cloud y próximamente en Vertex.

En conclusión, Tülu 3 405B se posiciona como una alternativa potente y accesible a los modelos líderes del mercado, combinando transparencia, innovación y un desempeño excepcional en tareas complejas.

NMDQ

Post navigation

Anterior Lucie, la inteligencia artificial francesa que «pensaba» que las vacas ponían huevos
Siguiente Premios Estrella de Mar 2025: el oro fue para Gabriel “Puma” Goity 

Historias relacionadas

Balance 2025: El año de la consolidación y la autonomía de la Inteligencia Artificial a escala global Gemini Generated Image 59ricb59ricb59ri editado
3 min de lectura
  • IA

Balance 2025: El año de la consolidación y la autonomía de la Inteligencia Artificial a escala global

30 de diciembre de 2025
Hardware para Inteligencia Artificial: Las diferencias clave entre GPU y TPU tpu gpu
3 min de lectura
  • IA

Hardware para Inteligencia Artificial: Las diferencias clave entre GPU y TPU

28 de diciembre de 2025
Albania designa al primer ministro generado por IA para combatir la corrupción  ministraia
2 min de lectura
  • IA

Albania designa al primer ministro generado por IA para combatir la corrupción 

14 de septiembre de 2025
  • Instagram
  • Tumblr
  • YouTube
  • Correo electrónico
  • Facebook

Te pueden interesar

El radicalismo bonaerense eligió sus autoridades: Emiliano Balbín es el presidente alineado con Abad WhatsApp Image 2026 05 09 at 10.31.15 AM
1 min de lectura
  • BAIRES

El radicalismo bonaerense eligió sus autoridades: Emiliano Balbín es el presidente alineado con Abad

9 de mayo de 2026
Juliana Santillán mantuvo una importante reunión con el presidente de la Conferencia Episcopal Argentina HHqL6cBXoAgLQpc editado
3 min de lectura
  • INTERES

Juliana Santillán mantuvo una importante reunión con el presidente de la Conferencia Episcopal Argentina

9 de mayo de 2026
Por el caso Adorni, el 42% de los votantes de JxC que respaldaron a La Libertad Avanza pone su voto en duda adorni milei
2 min de lectura
  • INTERES

Por el caso Adorni, el 42% de los votantes de JxC que respaldaron a La Libertad Avanza pone su voto en duda

9 de mayo de 2026
Una marplatense con un proyecto musical único busca hacer su primera película WhatsApp Image 2026 05 08 at 3.10.01 PM 1
2 min de lectura
  • GENERALES

Una marplatense con un proyecto musical único busca hacer su primera película

9 de mayo de 2026
Copyright NoticiasMDQ © Todos los derechos reservados. | DarkNews por AF themes.