Gemini 3 Flash: El campeón de velocidad de Google iguala a GPT-5.2 a un costo 6 veces menor

Gemini 3 Flash de Google ofrece 90.4% en GPQA Diamond y 78% en SWE-bench a $0.50/M tokens. Lo que el modelo frontera más rápido significa para la infraestructura de IA.

Blake Crosley

Dec 29, 2025 5 min read Disclaimer

Gemini 3 Flash: El campeón de velocidad de Google iguala a GPT-5.2 a un costo 6 veces menor

Resumen

Google lanzó Gemini 3 Flash el 17 de diciembre de 2025, ofreciendo rendimiento de clase frontera a la velocidad y costo de la serie Flash. El modelo alcanza 90.4% en GPQA Diamond y 78% en SWE-bench Verified mientras cuesta solo $0.50 por millón de tokens de entrada, aproximadamente 6 veces más barato que Claude Opus 4.5. Para implementaciones con alta demanda de inferencia, Gemini 3 Flash procesa 218 tokens por segundo, superando a GPT-5.1 (125 t/s) y al modo de razonamiento de DeepSeek V3.2 (30 t/s).

Qué sucedió

Google lanzó Gemini 3 Flash el 17 de diciembre de 2025, un mes después de que Gemini 3 Pro liderara la clasificación de LMArena. El modelo combina el razonamiento de nivel Pro con la latencia y eficiencia de nivel Flash, dirigido a cargas de trabajo de producción de alto volumen donde el costo y la velocidad importan tanto como la capacidad.

Gemini 3 Flash se convirtió inmediatamente en el modelo predeterminado en la aplicación Gemini y en AI Mode en Google Search, señalando la confianza de Google en implementar inteligencia frontera a escala de consumidor.

El modelo supera a Gemini 2.5 Pro en todos los benchmarks mientras funciona 3 veces más rápido según las pruebas de Artificial Analysis. En varios benchmarks, compite de igual a igual con GPT-5.2, el modelo que OpenAI lanzó apresuradamente para contrarrestar a Gemini 3 Pro.

Empresas como JetBrains, Figma, Cursor, Harvey y Latitude ya utilizan Gemini 3 Flash en producción.

Por qué es importante

La ecuación del costo de inferencia para aplicaciones de IA acaba de cambiar. Gemini 3 Flash ofrece razonamiento de clase frontera a precios de commodity, creando nuevas economías de implementación para operadores de centros de datos y desarrolladores de aplicaciones.

Ventaja de costo: A $0.50 por millón de tokens de entrada, Gemini 3 Flash cuesta 6 veces menos que Claude Opus 4.5 ($3.00) mientras logra un rendimiento comparable en la mayoría de los benchmarks. El almacenamiento en caché de contexto permite reducciones de costo del 90% para cargas de trabajo con uso repetido de tokens.

Velocidad de inferencia: Las pruebas de Artificial Analysis registraron 218 tokens de salida por segundo, superando a GPT-5.1 (125 t/s) en un 74% y al modo de razonamiento de DeepSeek V3.2 (30 t/s) en 7 veces. La latencia inferior a un segundo para prompts cortos permite interfaces de chat responsivas e iteraciones rápidas de bucles agénticos.

Flujos de trabajo agénticos: El modelo logró 78% en SWE-bench Verified, superando tanto a la serie 2.5 como a Gemini 3 Pro en tareas de codificación agéntica. Para empresas que construyen agentes de IA, una capacidad comparable a menor costo impacta directamente el ROI de implementación.

Procesamiento multimodal: Resemble AI reportó análisis multimodal 4 veces más rápido comparado con 2.5 Pro, procesando salidas técnicas sin cuellos de botella en el flujo de trabajo.

Detalles técnicos

Especificaciones

Especificación	Gemini 3 Flash
Modalidades de entrada	Texto, imagen, video, audio, PDF
Modalidades de salida	Texto
Tokens máximos de entrada	1,048,576 (1M)
Tokens máximos de salida	65,536
Corte de conocimiento	Enero 2025
Fecha de lanzamiento	17 de diciembre de 2025

Rendimiento en benchmarks

Benchmark	Gemini 3 Flash	Gemini 3 Pro	GPT-5.2	Claude Opus 4.5
GPQA Diamond	90.4%	91.9%	88.4%	88.0%
SWE-bench Verified	78%	76.2%	—	80.9%
MMMU-Pro	81.2%	—	79.5%	—
Humanity's Last Exam	33.7%	—	—	—
LMArena Elo	—	1501	—	—

Gemini 3 Flash supera a 2.5 Flash en todos los aspectos y supera significativamente a 2.5 Pro en varios benchmarks mientras iguala o supera a 3 Pro en áreas que incluyen MMMU Pro, Toolathlon y MPC Atlas.

Comparación de precios

Modelo	Entrada (por 1M tokens)	Salida (por 1M tokens)
Gemini 3 Flash	$0.50	$3.00
Gemini 2.5 Flash	$0.30	$2.50
Gemini 3 Pro	~$2.00	~$10.00
Claude Opus 4.5	$3.00	$15.00
GPT-5.2	~$2.50	~$10.00

Gemini 3 Flash cuesta menos de una cuarta parte de Gemini 3 Pro mientras ofrece capacidad de razonamiento comparable. La API Batch ofrece 50% de ahorro adicional para procesamiento asíncrono con límites de tasa más altos.

Métricas de velocidad

Modelo	Tokens de salida/segundo
Gemini 3 Flash	218
Gemini 2.5 Flash	~280
GPT-5.1 High	125
DeepSeek V3.2 Reasoning	30

Gemini 3 Flash funciona 22% más lento que 2.5 Flash pero significativamente más rápido que los modelos frontera competidores, convirtiéndolo en el líder de velocidad entre los sistemas con capacidad de razonamiento.

Qué sigue

Gemini 3 Flash se implementa ahora en Google AI Studio, Gemini CLI, Android Studio y Vertex AI para implementaciones empresariales. El modelo permanece en estado de vista previa mientras Google recopila retroalimentación de producción.

Para la selección de modelos en diciembre de 2025: - Sesiones largas de codificación y corrección de errores: Claude Opus 4.5 lidera con 80.9% en SWE-bench - Diseño de algoritmos y programación competitiva: Gemini 3 Pro domina con 2,439 Elo en LiveCodeBench - Inferencia de alto volumen a bajo costo: Gemini 3 Flash ofrece la mejor relación calidad-precio - Razonamiento puro y matemáticas: GPT-5.2 alcanza 100% en AIME 2025

La comparación de Artificial Analysis muestra a Gemini 3 Flash con una puntuación de Índice de Inteligencia de 71.3 versus 62.8 de Claude Sonnet 4.5, combinado con tiempos de respuesta 3 veces más rápidos y velocidad de salida 4 veces mejor.

Perspectiva de Introl

Las cargas de trabajo de inferencia de IA de alto rendimiento demandan infraestructura GPU optimizada para un rendimiento consistente de baja latencia. La red de 550 ingenieros de campo de Introl implementa y mantiene clusters de aceleradores en 257 ubicaciones globales. Conoce más sobre nuestra área de cobertura.

Publicado: 29 de diciembre de 2025

Gemini 3 Flash: El campeón de velocidad de Google iguala a GPT-5.2 a un costo 6 veces menor

Resumen

Qué sucedió

Por qué es importante

Detalles técnicos

Especificaciones

Rendimiento en benchmarks

Comparación de precios

Métricas de velocidad

Qué sigue

Perspectiva de Introl

You Might Also Like

AIOps para Centros de Datos: Uso de LLMs para Gestionar Infr...

Balanceo de Carga para Inferencia de IA: Distribución de Sol...

Computación Desagregada para IA: Arquitectura de Infraestruc...

Solicitar Cotización_

Solicitud Recibida_