Anthropic ha anunciado Claude Opus 4.6, una importante actualización de su modelo insignia de IA centrado en el trabajo de conocimiento y las tareas de codificación agentica.
El modelo está diseñado para completar tareas empresariales largas y complejas de una sola vez, con resultados de mayor calidad en texto, presentaciones y hojas de cálculo que los modelos anteriores publicados por Anthropic.
La generación de código es un foco central de Claude Opus 4.6, que cuenta con una ventana de contexto de un millón de tokens (en versión beta) capaz de usar bases de código completas como referencia al generar salidas de código.
Los modelos de Anthropic son muy valorados por sus capacidades básicas de generación de código, y Claude Opus 4.5 estableció un nuevo estándar en los puntos de referencia de codificación tras su lanzamiento en noviembre de 2025.
Claude Opus 4.6 logra puntajes líderes en la industria en una serie de puntos de referencia populares, incluido 65,4% en el punto de referencia de codificación Terminal-Bench 2.0 y 1,606 en GDPval-AA Elo, que prueba el desempeño del trabajo de conocimiento económicamente valioso.

Esto permite que varios agentes impulsados por Claude Opus 4.6 trabajen juntos en paralelo, coordinándose en un objetivo compartido y reduciendo los cuellos de botella en el procesamiento de los agentes.
Controles API y mejor recuperación de conocimiento
Aprovechando su gran ventana de contexto, Claude Opus 4.6 está pensado para ser mucho más útil para acceder a información contenida en grandes conjuntos de datos, así como para tareas de codificación de formato largo, como detección de errores e implementación de código más complicado.
Si bien modelos de la competencia como Gemini 3, así como la propia familia de modelos Claude Sonnet de Anthropic, han contado con ventanas de contexto similares en el pasado, esta es la primera vez que ocurre esto con la familia Claude Opus.
Anthropic dijo que ha mejorado la capacidad de Claude para mantener el rendimiento incluso cuando se le presenta una gran cantidad de tokens de entrada.
Probado con el parámetro de referencia de ‘aguja en un pajar’ MRCR v2, que evalúa la búsqueda de datos, la atención y el razonamiento del modelo a través de indicaciones largas y complejas, Claude Opus 4.6 obtuvo un puntaje de 76% en comparación con el 18,5% de Claude Sonnet 4.5.
Junto con el nuevo modelo, Anthropic anunció controles adicionales para desarrolladores en la API de Claude.
Los nuevos controles incluyen «pensamiento adaptativo», un valor configurable que establece el grado en el que Claude Opus 4.6 utilizará pistas de contexto para decidir cuándo se necesitan sus capacidades de pensamiento extendidas, así como cuatro niveles de «esfuerzo»: bajo, medio, alto (el predeterminado) y máximo.
Al utilizar este control, los desarrolladores pueden reducir la latencia y los costos de inferencia cuando usan el modelo para problemas menos complejos o para potenciar agentes encargados de cargas de trabajo relativamente simples.
Las conversaciones largas en la API de Claude ahora también utilizarán la compactación de contexto, una oferta en versión beta que resume tokens conversacionales más antiguos para liberar espacio en la ventana de contexto durante tareas largas de ida y vuelta.
La compactación del contexto ocurre cuando las conversaciones alcanzan una longitud específica, que los desarrolladores pueden controlar.
Avances empresariales
Claude Opus 4.6 está pensado para representar un gran avance para la IA empresarial, y las mayores mejoras respecto de su predecesor se encuentran en la recuperación de conocimiento y el uso de herramientas específicas del sector.
En parte, Anthropic está logrando esto a través de nuevas integraciones para Claude directamente dentro de Microsoft 365, con procesamiento de datos mejorado para Claude para Excel y nuevo soporte nativo para presentaciones de diapositivas a través de Claude en PowerPoint.
En un video de demostración, Anthropic mostró cómo se podía usar Claude Opus 4.6 para ingerir hojas de cálculo empresariales y producir análisis detallados de la competencia, generando nuevas hojas de cálculo y una presentación completa de PowerPoint con la información más pertinente.
Los comentarios de los clientes sobre el nuevo modelo resaltan su fortaleza en una amplia gama de tareas empresariales complejas, incluida la migración de bases de código, el uso de herramientas agentic y un extenso trabajo de conocimiento.
“Claude Opus 4.6 manejó una migración de código base de varios millones de líneas como un ingeniero senior”, dijo Gregor Stewart, director de inteligencia artificial en SentinelOne.
“Planificó con antelación, adaptó su estrategia a medida que aprendió y terminó en la mitad del tiempo”.
Los clientes también elogiaron el contexto ampliado del modelo, especialmente para trabajos de conocimiento como el manejo de documentos legales.
«El último modelo de Anthropic representa un salto significativo en el rendimiento en el contexto largo», afirmó Joel Hron, director de tecnología de Thomson Reuters.
En nuestras pruebas, observamos que gestiona grandes volúmenes de información con un nivel de consistencia que refuerza la forma en que diseñamos e implementamos flujos de trabajo de investigación complejos. Los avances en este ámbito nos brindan componentes más robustos para ofrecer sistemas de nivel experto en los que los profesionales pueden confiar.
A principios de esta semana, el gigante legal sufrió una caída del 18% en sus acciones en una ola de ventas que muchos inversores vincularon al lanzamiento de la herramienta empresarial específica de Anthropic, Cowork, que se puede utilizar para automatizar algunos trabajos legales.
“Claude Opus 4.6 se destaca en tareas que requieren un alto razonamiento, como el análisis de múltiples fuentes en contenido legal, financiero y técnico”, afirmó Yashodha Bhavnani, directora de IA en Box.
“La evaluación de Box mostró un aumento del 10% en el rendimiento, alcanzando el 68% frente a una línea base del 58%, y puntajes casi perfectos en dominios técnicos”.
En pruebas prácticas, Claude Opus 4.6 también demostró fuertes capacidades en la gestión de problemas de TI como agente autónomo.
“Claude Opus 4.6 cerró de forma autónoma 13 problemas y asignó 12 problemas a los miembros adecuados del equipo en un solo día, gestionando una organización de aproximadamente 50 personas en 6 repositorios”, afirmó Yusuke Kaji, gerente general de IA en Rakuten.
“Gestionaba decisiones tanto de producto como organizativas, sintetizando el contexto en múltiples dominios y sabía cuándo derivar la solución a un humano”.
Claude Opus 4.6 está disponible al mismo precio que Claude Opus 4.5 a través de la API de Anthropic: $5 por millón de tokens de entrada y $25 por millón de tokens de salida.















