Claude Sonnet 5: novedades, benchmarks y precios del nuevo modelo de Anthropic

Claude Sonnet 5: el Sonnet más agéntico de Anthropic ya está disponible

Anthropic ha lanzado hoy, 30 de junio de 2026, Claude Sonnet 5, sucesor de Sonnet 4.6 (febrero 2026). Lo presentan como el Sonnet más agéntico hasta la fecha: capaz de planificar, usar herramientas como navegador y terminal, y completar tareas de varios pasos sin supervisión constante, algo que hasta hace poco solo conseguían los modelos Opus.

Qué cambia respecto a Sonnet 4.6

Anthropic lleva varias generaciones repitiendo el mismo patrón: la familia Opus abre camino en capacidades agénticas y la siguiente Sonnet recorta distancia a un precio mucho menor. Sonnet 5 es la entrega de ese patrón para este ciclo: mejora a Sonnet 4.6 en razonamiento, uso de herramientas, programación y trabajo de conocimiento, y se acerca al nivel de Opus 4.8 en varios benchmarks.

El dato concreto que ha publicado Anthropic en codificación agéntica:

Modelo	Codificación agéntica
Sonnet 4.6	58,1%
Sonnet 5	63,2%
Opus 4.8	69,2%

Anthropic también publica curvas de coste-rendimiento en dos evaluaciones agénticas, BrowseComp (búsqueda) y OSWorld-Verified (uso de ordenador), probadas a distintos niveles de effort. Con Sonnet 4.6, esas curvas quedaban claramente por debajo de Opus 4.8. Con Sonnet 5, ambos modelos pasan a cubrir un rango continuo: Sonnet 5 da buena capacidad a menor coste, y Opus 4.8 sigue siendo la opción de mayor precisión cuando hace falta. Anthropic no ha publicado las cifras exactas de Sonnet 5 en estas dos pruebas, solo las gráficas comparativas.

Early testers de Cursor, Lovable, Zapier y ClickHouse coinciden en algo concreto: el modelo termina tareas completas (escribir un test que reproduce un bug, aplicar el fix, verificar que el test falla sin el cambio) sin que se le pida cada paso por separado. Eso reduce el número de idas y vueltas en flujos de trabajo agénticos tipo Claude Code o agentes propios construidos sobre la API.

Cambio importante: nuevo tokenizer

Esto es relevante si vienes de Sonnet 4.6 y vas a migrar prompts en producción: Sonnet 5 usa un tokenizer actualizado (el mismo cambio que ya se introdujo con Opus 4.7). El mismo texto de entrada puede generar entre 1,0 y 1,35 veces más tokens según el tipo de contenido. Anthropic ha fijado el precio introductorio para que la migración sea, en la práctica, neutra en coste, pero si calculas coste por caracteres o haces budgeting fino por tokens, conviene revisar tus números tras el cambio de modelo.

Seguridad y cyber safeguards

Sonnet 5 mejora a Sonnet 4.6 en las evaluaciones de seguridad: menor tasa de comportamiento no alineado, mejor resistencia a prompt injection y menor tasa de alucinaciones y de sycophancy (asentir al usuario en vez de corregirlo). En capacidad de ciberseguridad ofensiva sigue muy por debajo de los modelos Opus: en el test de explotación de vulnerabilidades en Firefox 147 (desarrollado con Mozilla), ni Sonnet 4.6 ni Sonnet 5 consiguieron generar un exploit funcional completo (ambos en 0,0%), aunque Sonnet 5 muestra una tasa algo mayor de éxito parcial.

Por ese pequeño aumento, Anthropic ha activado por defecto en Sonnet 5 los mismos cyber safeguards que ya llevan Opus 4.7 y 4.8 (detección y bloqueo en tiempo real de usos peligrosos relacionados con ciberseguridad), menos restrictivos que los aplicados a Fable 5. Para seguridad ofensiva legítima (pentesting, CTFs, investigación), Anthropic sigue recomendando Opus 4.8.

Disponibilidad, precios y rate limits

Modelo por defecto en los planes Free y Pro; disponible también en Max, Team, Enterprise, Claude Code y Claude Platform.
Nombre del modelo para la API: claude-sonnet-5.
Precio introductorio hasta el 31 de agosto de 2026: 2$ / millón de tokens de entrada, 10$ / millón de salida.
Precio estándar a partir de esa fecha: 3$ / millón de entrada, 15$ / millón de salida (Opus 4.8 está en 5$ / 25$).
Anthropic ha subido los rate limits en Chat, Cowork, Claude Code y Claude Platform para soportar el mayor consumo de tokens de los niveles de effort altos.

El parámetro `effort`

Sonnet 5 admite el parámetro effort (se envía dentro de output_config en la API), que controla cuántos tokens gasta el modelo —texto, llamadas a herramientas y thinking— sin tener que activar manualmente extended thinking. Los niveles documentados por Anthropic son low, medium, high (valor por defecto en la API) y xhigh para tareas agénticas largas. Anthropic todavía no ha publicado una guía de niveles recomendados específica para Sonnet 5 como sí existe para Sonnet 4.6 u Opus 4.8, así que lo razonable es probarlo con tus propios casos antes de fijar un nivel por defecto en producción.

Resumen para decidir si migrar

Si tu flujo es agéntico (varias llamadas a herramientas, tareas largas, código en repos grandes) y ya usabas Sonnet 4.6, migrar a Sonnet 5 es directo y el salto de calidad es real según los datos publicados.
Si necesitas la máxima precisión posible y el coste no es el factor limitante, Opus 4.8 sigue rindiendo más.
Revisa el impacto del nuevo tokenizer en tus cálculos de coste antes de dar la migración por completada, sobre todo si facturas a clientes por uso de IA.

Fuentes:

Sigue aprendiendo