Skip to content

El límite real de los 2 MB de Googlebot y por qué el código pesa más que tus textos

Todos queremos que nuestra web luzca increíble.

Compramos temas premium como Avada o Astra, instalamos constructores visuales, añadimos efectos, pop-ups y scripts de seguimiento.

Pero, ¿y si te dijera que todo ese «maquillaje» podría estar empujando tu contenido principal hacia un abismo donde Googlebot ya no mira?

La nueva documentación de Google ha encendido una pequeña alarma roja: existe un límite de procesamiento de 2 MB. Y aunque parece una cifra enorme para un texto, en el ecosistema actual de webs sobrecargadas, es un techo de cristal con el que es más fácil chocar de lo que piensas.

Si te preocupa que tus artículos largos o tus páginas más complejas estén perdiendo visibilidad por culpa de su propio peso, sigue leyendo. Lo que vas a descubrir podría cambiar cómo estructuras tus posts a partir de ahora.

El nuevo "techo de cristal" de Googlebot

Hasta hace poco, la comunidad SEO vivía con una certeza bastante cómoda: si Google rastreaba tu URL, leía tu contenido.

¡Pues se acabó lo que se daba!

Una actualización reciente en la documentación oficial de Google Search Central ha puesto letra pequeña a este contrato tácito.

Google ha especificado claramente cómo gestiona el «peso» de lo que se encuentra en la web, y aquí es donde nace este nuevo techo de cristal:

La diferencia entre "Descargar" y "Leer"

Para entender el riesgo, hay que distinguir dos límites técnicos que Googlebot maneja por separado:

El límite de descarga (15 MB): Googlebot cortará la conexión si un archivo (HTML, PDF, etc.) supera los 15 MB. Esto es el «peso bruto». Si tu web pesa más que eso, directamente no entra en sus servidores.

El límite de procesamiento (2 MB): Aquí está la verdadera novedad y el peligro silencioso. Aunque Google descargue hasta 15 MB de tu página, solo garantiza analizar e indexar los primeros 2 MB de texto/código.

¿Qué significa esto en la práctica?

Imagina que Google es un profesor que te pide un trabajo.

El profesor acepta que le entregues un dossier de hasta 150 páginas (15 MB).

PERO, te advierte que solo va a leer y corregir las primeras 20 páginas (2 MB).

Si has escrito la conclusión más brillante de la historia en la página 25, para ese profesor esa conclusión no existe.

Si hablamos de tu web, esto implica que cualquier contenido textual, enlace o metadato que se encuentre físicamente después de esos primeros 2 MB de código HTML, corre el riesgo de ser invisible para el ranking. Google sabe que está ahí (porque lo descargó), pero no lo procesa para entender de qué trata tu web ni para mostrarlo en los resultados.

Gráfico tipo iceberg que muestra qué parte del HTML lee Google (2 MB) y qué contenido queda fuera del procesamiento

¿Cuánto son realmente 2 MB de contenido?

Si eres redactor o te gusta escribir artículos largos y detallados, respira tranquilo: humanamente, es casi imposible escribir 2 MB de texto puro.

Para ponerlo en perspectiva con datos reales:

  • 1 MB equivale aproximadamente a 1 millón de caracteres.
  • 2 MB son cerca de 350.000 palabras.

Para que te hagas una idea visual: la novela Don Quijote de la Mancha tiene unas 380.000 palabras.

Es decir, podrías pegar casi toda la obra de Cervantes en tu artículo y Googlebot la leería (casi) entera.

Un post estándar de 2.000 palabras apenas ocupa unos 12 KB (un 0,6% del límite).

Entonces, si el texto no es el problema, ¿por qué deberíamos preocuparnos?

El "Impuesto" del Código (o por qué tu WordPress engorda)

El problema no es la «carne» (tu contenido), sino el «pan» (el código HTML que lo envuelve).

En el ecosistema de WordPress, pagamos un «impuesto de bytes» muy alto por usar herramientas visuales. Ten en cuenta que el 43% de las webs usan WordPress.

Cuando usas un Tema comercial potente (como Avada, Divi o incluso un Astra muy vitaminado) o maquetadores visuales (como Elementor), el código fuente de tu página se llena de:

  1. Estructura DOM excesiva: Para hacer una simple columna, el maquetador a veces crea 10 niveles de etiquetas <div> anidadas.
  2. CSS y JS inyectado: Muchos plugins y temas escriben sus estilos y funciones directamente en el HTML en lugar de llamar a un archivo externo.
  3. Datos ocultos: Configuraciones del tema, metadatos JSON y comentarios de código que el usuario no ve, pero que suman peso al archivo.
Comparación visual entre el peso del contenido textual y el tamaño real del HTML generado por WordPress con temas y plugins

El enemigo silencioso: Imágenes en Base64

Hay un caso donde sí puedes romper el límite de los 2 MB en un par de segundos: las imágenes incrustadas.

A veces, para «optimizar» la carga, algunos plugins convierten imágenes pequeñas (iconos, logos) en una cadena larguísima de código (Base64) dentro del HTML.

Si tienes muchas de estas, tu archivo de texto engordará artificialmente y Googlebot dejará de leer antes de llegar al final.

Es decir, que tu artículo de 2.000 palabras está a salvo… siempre y cuando no esté enterrado bajo 1,9 MB de código «basura».

El peligro de la "invisibilidad" en el SEO actual

Si asumimos que Googlebot «corta» la lectura de nuestro HTML a los 2 MB, la pregunta del millón es: ¿Qué se queda fuera?

Por desgracia, en la estructura lógica de cualquier página web, lo que está al final del código suele ser vital para la retención y la autoridad:

1. El cementerio del "Link Juice" (Enlaces internos)

Piensa en cómo estructuras un post:

  • Arriba: Introducción y gancho.
  • Abajo: Conclusión, call to action, artículos relacionados y el pie de página (footer).

Si el corte se produce antes de llegar al footer, Googlebot no verá los enlaces a «Artículos relacionados» ni tu menú inferior.

Esto es un desastre para el SEO On-Page: estás rompiendo la cadena de rastreo interno. Google tendrá más dificultades para descubrir contenido antiguo o profundo de tu web porque los caminos para llegar a él (los enlaces del footer) son invisibles en esa página.

2. AI Overviews: "Si no te leo, no te cito"

Aquí entramos en la era de la Inteligencia Artificial (SGE / AI Overviews).

Como vimos al principio, las respuestas de la IA de Google funcionan mediante sistemas RAG (recuperación de información).

La IA busca datos concretos en tu contenido para construir una respuesta y citarte como fuente.

El escenario de pesadilla: Imagina que has escrito un análisis de mercado exhaustivo.

  • Los datos aburridos están al principio.
  • La «pepita de oro» (el dato clave, la conclusión final o el insight único) está en el último párrafo.

Si tu HTML está sucio y pesado, y Googlebot corta la lectura antes de ese último párrafo, ese dato no existe en su índice. Resultado: Cuando un usuario pregunte a la IA por ese dato, la IA citará a tu competencia (que tiene un código más limpio), aunque tú lo hayas explicado mejor.

Por lo tanto, en el SEO moderno, ya no basta con tener la mejor respuesta; hay que asegurarse de que esa respuesta no esté enterrada en la «zona muerta» del código, más allá de la frontera de los 2 MB.

Cómo saber si tu blog está en la "zona de riesgo"

No necesitas ser un desarrollador experto ni contratar herramientas caras para averiguar esto.

De hecho, tu propio navegador te da la respuesta en menos de 1 minuto.

El objetivo es medir el peso del archivo HTML descomprimido (el código fuente), que es lo que Googlebot tiene que «leer».

Método 1: La prueba del "Bloc de Notas" (La más fácil)

Es el método más rudimentario, pero infalible para ver la realidad cruda:

  1. Abre la página que quieres analizar en tu navegador (Chrome, Edge, Firefox…).
  2. Haz clic derecho en cualquier espacio en blanco y selecciona «Ver código fuente de la página» (o pulsa Ctrl + U en Windows / Cmd + Option + U en Mac).
  3. Verás una pantalla llena de código. Pulsa Ctrl + A para seleccionarlo todo y Ctrl + C para copiarlo.
  4. Abre un Bloc de notas (Windows) o TextEdit (Mac) en blanco.
  5. Pega el código y guarda el archivo en tu escritorio como prueba.txt.
  6. Mira las propiedades del archivo: ¿Cuánto ocupa?

Método 2: La prueba "Pro" con las Herramientas de Desarrollador

Si quieres ser más preciso y ver qué está pasando «bajo el capó»:

En tu página, pulsa F12 (o clic derecho > Inspeccionar) para abrir las DevTools.

Ve a la pestaña Network (Red).

¡Cuidado con los filtros!

Asegúrate de no tener seleccionado ninguno en el desplegable. Revisa que NO tengas activado ningún filtro restrictivo como «3rd-party requests» (peticiones de terceros), porque eso ocultaría tu propio dominio.
No selecciones ningún filtro en el desplegable.
En los demás filtros mira que tengas seleccionado «All» (Todo) o «Doc» en la barra superior. 

Filtro "Doc" seleccionado en el inspector de Chrome

Marca la casilla «Disable cache» (en la barra superior de la pestaña Network) o pulsa Ctrl + F5 (Cmd + Shift + R en Mac) para forzar una recarga limpia y real.

Marca "Disable Cache" en el inspector de Chrome

Localiza tu archivo HTML:

Sube al principio de la lista (Name). El primer archivo suele ser tu documento principal (tendrá el nombre de tu dominio o de la URL del post).

Mira la columna Size:

Si ves dos números (ej: 50 kB / 150 kB), el segundo es el que cuenta.

Si solo ves un número: Pasa el ratón por encima. Aparecerá un cuadro con el detalle; quédate con el dato que dice «Resource size» (Tamaño del recurso).

Este es el tamaño de tu documento HTML

Ese es tu peso real.

Si marca 150 kB, estás en zona verde.

182Kb es mejorable, pero muy habitual en webs de WordPress.

Si marca 1.5 MB… tenemos un problema.

El Semáforo de Riesgo HTML

Una vez tengas tu cifra (del archivo .txt o de la consola), aquí tienes una referencia para saber dónde estás:

🟢 Zona Verde (< 100 KB): Tu código está limpio como una patena. Probablemente usas un tema ligero (tipo GeneratePress) o código a medida. Tienes margen para escribir una enciclopedia.

🟡 Zona Amarilla (100 KB – 500 KB): Es el estándar de un WordPress moderno con un maquetador visual (Elementor, Divi). No es lo ideal para la velocidad, pero estás muy lejos del límite de peligro.

🟠 Zona Naranja (500 KB – 1 MB): Aquí empieza a oler a quemado. Seguramente tienes exceso de plugins, CSS inyectado o mucho código «sucio». Google te lee, pero le cuesta.

🔴 Zona Roja (> 2 MB): Peligro real. Si tu archivo de texto supera esta cifra, Googlebot cortará la lectura. Revisa urgentemente si tienes imágenes en Base64 o logs de errores inyectados en el HTML.

Gráfico por zonas que muestra los niveles de riesgo del tamaño del HTML frente al límite de 2 MB de Googlebot

Nota importante: Recuerda que hablamos solo del HTML. Si tu web carga 10 MB de imágenes, eso afecta a la velocidad, pero no a este límite de indexación de texto (mientras las imágenes sean archivos externos .jpg o .webp).

Checklist para mantener tu HTML a dieta

Si tras hacer la prueba has descubierto que tu web está peligrosamente cerca de la zona roja (o ya vives en ella), no entres en pánico. Aquí tienes la hoja de ruta para «deshinchar» tu código sin perder funcionalidades:

Caza las imágenes en Base64 (El enemigo n.º 1)

Este es el motivo más frecuente de los HTML gigantes. A veces, para ahorrar una petición al servidor, los plugins convierten imágenes pequeñas (iconos, logos o fondos) en un código de texto infinito dentro del propio HTML.

La solución: Asegúrate de que tus imágenes se cargan como archivos normales (.jpg, .webp, .svg) y no incrustadas en el código. Inspecciona tu código fuente: si ves párrafos inmensos de letras y números sin sentido, eso es una imagen Base64.

CSS y JS: Mejor fuera que dentro

Muchos temas de WordPress tienen la manía de escribir los estilos (CSS) y las funciones (JS) directamente en la cabecera del HTML (<style>…</style>).

La solución: Intenta que tu tema o tus plugins carguen estos recursos en archivos externos (estilos.css, script.js). Así, Googlebot descarga el archivo aparte y no cuenta para el límite de los 2 MB de tu contenido.

La trampa del "Copia-Pega" de Word

Parece una tontería, pero es real. Si copias un texto directamente desde Microsoft Word o Google Docs al editor de WordPress, a menudo te traes contigo miles de líneas de código «basura» invisible (etiquetas <span> con estilos extraños).

La solución: Usa siempre el botón «Pegar como texto sin formato» o pasa el texto primero por un Bloc de Notas para limpiarlo.

Minificación: Comprimir el aire

El código fuente suele tener muchos espacios en blanco, saltos de línea y comentarios del desarrollador que la máquina no necesita.

La solución: Usa plugins de optimización como WP Rocket, Autoptimize o LiteSpeed Cache.

Tienen una opción llamada «Minificar HTML» que elimina todo ese espacio vacío.

No hace milagros si tienes un problema grave, pero ayuda a recortar unos cuantos KB valiosos.

Prioriza el contenido (DOM Order)

Si no puedes reducir el peso del código, al menos asegúrate de que lo importante vaya primero.

La solución: Revisa que tu plantilla no cargue megamenús ocultos, pop-ups gigantes o sliders complejos antes de la etiqueta <h1> de tu artículo.

Cuanto más arriba esté tu texto en el código, más seguro estarás.

En la web moderna, la ligereza es poder

El SEO ha evolucionado y ya no basta con tener la mejor respuesta o el contenido más extenso; ahora es imperativo servirlo de la forma más eficiente posible.

El límite de los 2 MB de Googlebot (y de los 15 MB de descarga) no está ahí para asustarnos, sino para recordarnos una verdad fundamental: internet está saturado de ruido.

Si queremos que nos escuchen, que nos indexen hasta el footer y que las nuevas IA nos citen como fuente, debemos asegurarnos de que nuestra voz (nuestro contenido) no esté ahogada por un muro de código mal optimizado.

No dejes que tu mejor argumento se pierda en el abismo digital solo porque tu HTML pesa demasiado.

Revisa tu código, mantén tu casa digital limpia y recuerda: en el SEO de hoy, la ligereza no es solo velocidad. La ligereza es visibilidad.