#028

Claude Code ahora tiene 1M de tokens de contexto — y no deberías llenarlos

Opus 4.6 incluye 1M de tokens de contexto en planes Max, Team y Enterprise. 5x más que antes, sin coste extra. Pero más contexto no significa mejor resultado.

TL;DR Opus 4.6 incluye 1 millón de tokens de contexto por defecto en planes Max, Team y Enterprise — 5 veces más que antes, sin coste adicional. Pero más contexto no significa mejor resultado. Monitoriza con /context, compacta proactivamente, y no dejes que la sesión se degrade.

Desde la versión 2.1.75, Claude Code usa Opus 4.6 con 1M de tokens como modelo por defecto. La ventana de contexto ha pasado de 200K a 1M — 5 veces más espacio antes de que Claude necesite compactar. Esto significa sesiones más largas, menos interrupciones, y capacidad para trabajar con monorepos completos sin fragmentar el contexto.

Pero hay una trampa: el rendimiento del modelo se degrada con tokens lejanos. Es lo que se conoce como context drift — cuanto más lejos está la información del punto actual de la conversación, menos preciso es el modelo al recuperarla. Que puedas llenar 1M de tokens no significa que debas hacerlo.

Quién tiene acceso

Plan Opus 4.6 1M Sonnet 4.6 1M
Max, Team, Enterprise Incluido Requiere extra usage
Pro Requiere extra usage Requiere extra usage
API (pay-as-you-go) Acceso completo Acceso completo

No hay surcharge — el precio por token es el mismo en toda la ventana. En planes donde está incluido, no consume créditos adicionales.

Pro aún no lo tiene de serie, pero la tendencia de Anthropic con features premium es clara: primero Enterprise/Max, luego baja.

Cómo aprovecharlo sin desperdiciar contexto

1. Monitoriza con /context

Usa el comando /context para ver cuánto contexto estás consumiendo en tiempo real. No esperes a que Claude compacte automáticamente — anticípate.

2. Compacta antes de que lo haga Claude

La auto-compactación se dispara al ~95% de capacidad. A ese punto ya has perdido precisión en tokens antiguos. Compacta proactivamente:

/compact enfócate en el módulo de autenticación

Las instrucciones opcionales le dicen a Claude qué priorizar al resumir.

3. No cargues contexto que no necesitas

Que tengas 1M no significa que debas meter todo el codebase. Carga selectivamente — directorios específicos, archivos relevantes. Claude lee bajo demanda; no necesitas pre-cargar todo.

4. Seleccionar el modelo 1M explícitamente

Si no lo ves activo, selecciónalo manualmente:

/model opus[1m]
/model sonnet[1m]

O al lanzar Claude Code:

claude --model opus[1m]

5. Controlar cuándo compacta

Si quieres que compacte antes del 95%, ajusta el umbral:

export CLAUDE_AUTOCOMPACT_PCT_OVERRIDE=70

Referencia

Aspecto Detalle
Contexto anterior 200K tokens
Contexto actual 1M tokens (5x)
Modelo con 1M Opus 4.6 (incluido en Max/Team/Enterprise)
Alias de modelo opus[1m], sonnet[1m]
Auto-compactación ~95% por defecto, ajustable con CLAUDE_AUTOCOMPACT_PCT_OVERRIDE
Desactivar 1M CLAUDE_CODE_DISABLE_1M_CONTEXT=1
Precio por token Sin surcharge — mismo precio en toda la ventana

Documentación oficial: Model configuration — Extended context

En directo en Twitch

Esto que acabas de leer lo aplico en directo en Twitch. Ven a verlo.

Ver directos

Recibe solo lo esencial

Si no hay nada que decir, no escribo. Si hay algo importante, te aviso. 7.000+ profesionales ya confían en esto.

¿Eres desarrollador/a Web profesional?
No

Cancela la suscripción en cualquier momento.