Te vas a registrar en una web, o a entrar en tu banco, y aparece la misma escena de siempre. Una cuadrícula de fotos, un mensaje que te pide «selecciona todos los semáforos» y unos segundos de paciencia. ¿De verdad es solo una prueba para demostrar que eres humano?
La historia de reCAPTCHA es más amplia y, por lo general, menos conocida. Nació para frenar bots, pero también para convertir pequeños gestos de millones de personas en información útil para máquinas, desde digitalizar texto impreso hasta afinar mapas. Y hoy, incluso cuando no hay puzle, el sistema puede puntuar tu comportamiento en segundo plano.
Una idea con doble uso
A principios de los años 2000, internet se llenó de spam y los sitios necesitaban un filtro sencillo. Ahí entró CAPTCHA, una prueba pensada para que la supere una persona y no un programa automático, un «test rápido» para separar humanos de bots.
En 2007, el informático Luis von Ahn, desde Carnegie Mellon University, lanzó reCAPTCHA con un giro práctico. En vez de mostrar letras sin sentido, aprovechaba palabras que los ordenadores no leían bien en libros y periódicos escaneados, así que cada respuesta ayudaba a digitalizar texto. Google compró la tecnología en septiembre de 2009 y von Ahn lo resumió así, «Google es la mejor opción para reCAPTCHA».
De palabras raras a direcciones en el mapa
Con el tiempo, el tipo de reto cambió. Google explicó que reCAPTCHA «evolucionó del texto distorsionado a números y nombres de calles», antes de pasar a formatos más invisibles.
Ese salto tiene una razón fácil de imaginar. Para que un mapa coloque bien un punto, no basta con ver una dirección escrita, hace falta unirla con una ubicación exacta. En 2014, el Google Online Security Blog contó que el equipo de Street View y el de reCAPTCHA trabajaban en un sistema para ubicar direcciones con más precisión en Google Maps.
Cuando eliges semáforos estás etiquetando datos
Los puzles con imágenes no son solo un juego de reflejos. En la práctica, sirven para «etiquetar» lo que aparece en una foto, es decir, decirle a un sistema «esto es una señal» o «esto es un semáforo» para que aprenda a reconocerlo después. La documentación de reCAPTCHA describe estos retos como selecciones de objetos, por ejemplo señales de calle, dentro de un conjunto de imágenes.
Investigadores de seguridad que analizaron reCAPTCHA a gran escala recopilaron más de diez mil retos y vieron que la mayoría repetía un grupo pequeño de categorías típicas de calle. Entre las más frecuentes estaban autobuses, semáforos, pasos de peatones, coches e hidrantes.
Para la visión artificial, que es la parte de la inteligencia artificial que intenta «ver» como nosotros, lo difícil es aprender en escenas reales. Hay sombras, lluvia, ángulos raros y objetos a medias, justo lo que ves en fotos de la vida cotidiana.
La factura en tiempo que casi nadie cuenta
Este coste no es solo una sensación. En febrero de 2018, durante una charla en la Universidad de Arizona, von Ahn reconoció que cada CAPTCHA te hace perder «unos 10 segundos» y calculó que, con unos 200 millones de pruebas al día, la suma global ronda las 500.000 horas diarias.
Esa intuición conecta con lo que han medido otros equipos años después. En 2023, Andrew Searles, Renascence Tarafder Prapty y Gene Tsudik, de la Universidad de California en Irvine, estudiaron durante más de un año cómo se comportan usuarios reales ante reCAPTCHAv2 y concluyeron que el sistema tiene un coste enorme en tiempo y aporta poca seguridad frente a atacantes avanzados.
La versión invisible que puntúa tu comportamiento
En octubre de 2018, Google presentó reCAPTCHA v3 como una alternativa sin interacción directa. En vez de pedirte que marques imágenes, devuelve una puntuación entre cero y uno que intenta estimar si una interacción parece legítima o sospechosa.
La documentación para desarrolladores insiste en que reCAPTCHA v3 «nunca interrumpe» a los usuarios y que funciona mejor cuando tiene más contexto de lo que ocurre en una web. Por eso recomienda integrarlo no solo en botones o formularios, también en segundo plano para analizar el tráfico.
Lo que sugiere el caso Waymo
Los mismos datos que sirven para que un mapa sea más preciso suelen ser clave en proyectos de conducción autónoma. Un coche sin conductor necesita reconocer semáforos, carriles, peatones y señales en condiciones muy distintas, y para eso hacen falta muchísimos ejemplos bien etiquetados.
Waymo, la filial de Alphabet centrada en robotaxis, es un recordatorio de cuánto valor tiene esa capacidad. En febrero de 2026, Reuters informó de una ronda de financiación que situó su valoración en 126.000 millones de dólares, frente a una valoración de 45.000 millones en 2024.
Ahora bien, aquí conviene bajar una marcha. Google no publica un detalle que permita seguir cada interacción de reCAPTCHA hasta un producto concreto, así que parte del debate se mueve entre inferencias y falta de transparencia. Lo que sí está claro es el patrón, reCAPTCHA convierte acciones humanas pequeñas en señales útiles, y esa materia prima encaja con lo que necesita la visión artificial moderna.
El estudio principal se ha publicado en arXiv.














