# Alguien creó una versión de Gemma 4 llamada gemma4-12b coder, una IA especial...
Canonical: https://social-archive.org/yena/zZ1lY3kd3O
Original URL: https://x.com/FaztTech/status/2066337318697419181
Author: Fazt
Platform: x
## Content
Alguien creó una versión de Gemma 4 llamada gemma4-12b coder, una IA especializada en programar que funciona 100% en tu propia computadora, sin internet y sin pagar nada. La probé hoy en un DGX Spark y aunque esperaba que fuera rapidísima, aprendí dos cosas útiles, sobre todo para no caer en el marketing de los que venden estos modelos como la solución a todo: 1.Lo que hace lenta o rápida a una IA no es lo “potente” que sea tu equipo (el cómputo de la GPU), sino qué tan rápido puede leer su información de la memoria (el ancho de banda). Es como un chef buenísimo atascado porque la despensa está lejos: no importa lo rápido que cocine si tarda en traer los ingredientes. Por eso una versión más comprimida del modelo (un quant más bajo, Q4 en vez de Q8) corrió 57% más rápido. 2.Más grande no siempre es mejor. La versión de máxima calidad (Q8) casi no se nota frente a una más ligera (Q4), que va mucho más rápido y rinde casi igual. Bajar demasiado (a Q2) sí arruina el código. El punto dulce está en el medio. Tener una IA local, privada y gratis está increíble. Pero conviene entender cómo funciona antes de creer que solo se necesita mucha potencia
