Gemini 3 Flash: El campeón de velocidad de Google iguala a GPT-5.2 a un costo 6 veces menor

Gemini 3 Flash de Google ofrece 90.4% en GPQA Diamond y 78% en SWE-bench a $0.50/M tokens. Lo que el modelo frontera más rápido significa para la infraestructura de IA.

Gemini 3 Flash: El campeón de velocidad de Google iguala a GPT-5.2 a un costo 6 veces menor

Gemini 3 Flash: El campeón de velocidad de Google iguala a GPT-5.2 a un costo 6 veces menor

Resumen

Google lanzó Gemini 3 Flash el 17 de diciembre de 2025, ofreciendo rendimiento de clase frontera a la velocidad y costo de la serie Flash. El modelo alcanza 90.4% en GPQA Diamond y 78% en SWE-bench Verified mientras cuesta solo $0.50 por millón de tokens de entrada, aproximadamente 6 veces más barato que Claude Opus 4.5. Para implementaciones con alta demanda de inferencia, Gemini 3 Flash procesa 218 tokens por segundo, superando a GPT-5.1 (125 t/s) y al modo de razonamiento de DeepSeek V3.2 (30 t/s).


Qué sucedió

Google lanzó Gemini 3 Flash el 17 de diciembre de 2025, un mes después de que Gemini 3 Pro liderara la clasificación de LMArena. El modelo combina el razonamiento de nivel Pro con la latencia y eficiencia de nivel Flash, dirigido a cargas de trabajo de producción de alto volumen donde el costo y la velocidad importan tanto como la capacidad.

Gemini 3 Flash se convirtió inmediatamente en el modelo predeterminado en la aplicación Gemini y en AI Mode en Google Search, señalando la confianza de Google en implementar inteligencia frontera a escala de consumidor.

El modelo supera a Gemini 2.5 Pro en todos los benchmarks mientras funciona 3 veces más rápido según las pruebas de Artificial Analysis. En varios benchmarks, compite de igual a igual con GPT-5.2, el modelo que OpenAI lanzó apresuradamente para contrarrestar a Gemini 3 Pro.

Empresas como JetBrains, Figma, Cursor, Harvey y Latitude ya utilizan Gemini 3 Flash en producción.


Por qué es importante

La ecuación del costo de inferencia para aplicaciones de IA acaba de cambiar. Gemini 3 Flash ofrece razonamiento de clase frontera a precios de commodity, creando nuevas economías de implementación para operadores de centros de datos y desarrolladores de aplicaciones.

Ventaja de costo: A $0.50 por millón de tokens de entrada, Gemini 3 Flash cuesta 6 veces menos que Claude Opus 4.5 ($3.00) mientras logra un rendimiento comparable en la mayoría de los benchmarks. El almacenamiento en caché de contexto permite reducciones de costo del 90% para cargas de trabajo con uso repetido de tokens.

Velocidad de inferencia: Las pruebas de Artificial Analysis registraron 218 tokens de salida por segundo, superando a GPT-5.1 (125 t/s) en un 74% y al modo de razonamiento de DeepSeek V3.2 (30 t/s) en 7 veces. La latencia inferior a un segundo para prompts cortos permite interfaces de chat responsivas e iteraciones rápidas de bucles agénticos.

Flujos de trabajo agénticos: El modelo logró 78% en SWE-bench Verified, superando tanto a la serie 2.5 como a Gemini 3 Pro en tareas de codificación agéntica. Para empresas que construyen agentes de IA, una capacidad comparable a menor costo impacta directamente el ROI de implementación.

Procesamiento multimodal: Resemble AI reportó análisis multimodal 4 veces más rápido comparado con 2.5 Pro, procesando salidas técnicas sin cuellos de botella en el flujo de trabajo.


Detalles técnicos

Especificaciones

Especificación Gemini 3 Flash
Modalidades de entrada Texto, imagen, video, audio, PDF
Modalidades de salida Texto
Tokens máximos de entrada 1,048,576 (1M)
Tokens máximos de salida 65,536
Corte de conocimiento Enero 2025
Fecha de lanzamiento 17 de diciembre de 2025

Rendimiento en benchmarks

Benchmark Gemini 3 Flash Gemini 3 Pro GPT-5.2 Claude Opus 4.5
GPQA Diamond 90.4% 91.9% 88.4% 88.0%
SWE-bench Verified 78% 76.2% 80.9%
MMMU-Pro 81.2% 79.5%
Humanity's Last Exam 33.7%
LMArena Elo 1501

Gemini 3 Flash supera a 2.5 Flash en todos los aspectos y supera significativamente a 2.5 Pro en varios benchmarks mientras iguala o supera a 3 Pro en áreas que incluyen MMMU Pro, Toolathlon y MPC Atlas.

Comparación de precios

Modelo Entrada (por 1M tokens) Salida (por 1M tokens)
Gemini 3 Flash $0.50 $3.00
Gemini 2.5 Flash $0.30 $2.50
Gemini 3 Pro ~$2.00 ~$10.00
Claude Opus 4.5 $3.00 $15.00
GPT-5.2 ~$2.50 ~$10.00

Gemini 3 Flash cuesta menos de una cuarta parte de Gemini 3 Pro mientras ofrece capacidad de razonamiento comparable. La API Batch ofrece 50% de ahorro adicional para procesamiento asíncrono con límites de tasa más altos.

Métricas de velocidad

Modelo Tokens de salida/segundo
Gemini 3 Flash 218
Gemini 2.5 Flash ~280
GPT-5.1 High 125
DeepSeek V3.2 Reasoning 30

Gemini 3 Flash funciona 22% más lento que 2.5 Flash pero significativamente más rápido que los modelos frontera competidores, convirtiéndolo en el líder de velocidad entre los sistemas con capacidad de razonamiento.


Qué sigue

Gemini 3 Flash se implementa ahora en Google AI Studio, Gemini CLI, Android Studio y Vertex AI para implementaciones empresariales. El modelo permanece en estado de vista previa mientras Google recopila retroalimentación de producción.

Para la selección de modelos en diciembre de 2025: - Sesiones largas de codificación y corrección de errores: Claude Opus 4.5 lidera con 80.9% en SWE-bench - Diseño de algoritmos y programación competitiva: Gemini 3 Pro domina con 2,439 Elo en LiveCodeBench - Inferencia de alto volumen a bajo costo: Gemini 3 Flash ofrece la mejor relación calidad-precio - Razonamiento puro y matemáticas: GPT-5.2 alcanza 100% en AIME 2025

La comparación de Artificial Analysis muestra a Gemini 3 Flash con una puntuación de Índice de Inteligencia de 71.3 versus 62.8 de Claude Sonnet 4.5, combinado con tiempos de respuesta 3 veces más rápidos y velocidad de salida 4 veces mejor.


Perspectiva de Introl

Las cargas de trabajo de inferencia de IA de alto rendimiento demandan infraestructura GPU optimizada para un rendimiento consistente de baja latencia. La red de 550 ingenieros de campo de Introl implementa y mantiene clusters de aceleradores en 257 ubicaciones globales. Conoce más sobre nuestra área de cobertura.


Publicado: 29 de diciembre de 2025

Solicitar Cotización_

Cuéntanos sobre tu proyecto y te responderemos en 72 horas.

> TRANSMISIÓN_COMPLETA

Solicitud Recibida_

Gracias por su consulta. Nuestro equipo revisará su solicitud y responderá dentro de 72 horas.

EN COLA PARA PROCESAMIENTO