#004

Acelera las Respuestas de Claude Code con Fast Mode

Fast mode prioriza la velocidad sobre el coste en Opus 4.6: respuestas hasta 2.5x más rápidas con la misma inteligencia. Aprende a activarlo con /fast.

Fast mode es una configuración de Opus 4.6 que prioriza la velocidad de generación de tokens sobre el coste. No es un modelo distinto ni una versión con menos capacidad de razonamiento -- es el mismo Opus 4.6 con la misma inteligencia, solo que con respuestas hasta 2.5x más rápidas. La contrapartida: un coste por token significativamente mayor.

Nota personal: Fast mode acaba de lanzarse a fecha de publicación de este tip. En las tareas medianas con las que he podido probarlo, la diferencia de velocidad se nota, pero no tengo claro todavía si justifica pagar el doble (2x) respecto a Opus estándar. Durante el periodo de descuento del 50% (hasta el 16 de febrero de 2026), fast mode cuesta lo mismo que el modo estándar -- ahí no hay debate.

Es importante no confundir fast mode con el ajuste de effort level. Bajar el effort level sí reduce la calidad de razonamiento a cambio de velocidad. Fast mode no sacrifica nada en calidad -- solo en coste.

Resultado:

> /fast

Fast mode ON · $15/$75 per Mtok (50% off through Feb 16)

Claude Code fast mode output

Setup

1. Activa fast mode

Escribe /fast en cualquier momento de tu sesión:

/fast

Un icono aparece junto al prompt mientras fast mode esté activo.

2. Desactiva cuando no lo necesites

/fast

El mismo comando lo desactiva. Al desactivarlo, sigues en Opus 4.6 (no vuelve al modelo anterior).

3. Activa por defecto (opcional)

Para tenerlo siempre activo, añade a tu configuración de usuario:

{
  "fastMode": true
}

Referencia

Aspecto Detalle
Comando /fast (toggle on/off)
Modelo Opus 4.6 (el mismo, sin cambios en calidad)
Velocidad Hasta 2.5x más rápido en output tokens
Coste (< 200K) $30 / $150 por MTok (input / output)
Coste (> 200K) $60 / $225 por MTok (input / output)
Descuento 50% hasta el 16 de febrero de 2026
Rate limits Separados de Opus estándar; al agotarse, cae a velocidad normal
Persistencia Se mantiene entre sesiones
Disponibilidad Planes Pro/Max/Team/Enterprise con extra usage habilitado

Cuando usarlo

  • Iteración rápida: cambios de código donde esperar 30 segundos importa.
  • Debugging en vivo: sesiones interactivas donde cada segundo cuenta.
  • Trabajo con deadline: cuando la velocidad justifica el coste extra.

Para tareas autónomas largas, batch processing o CI/CD, el modo estándar es más eficiente en coste.

Documentación oficial: Speed up responses with fast mode

Recibe solo lo esencial

Si no hay nada que decir, no escribo. Si hay algo importante, te aviso. 7.000+ profesionales ya confían en esto.

¿Eres desarrollador/a Web profesional?
No

Cancela la suscripción en cualquier momento.