Ha estado entrenando la IA de Google gratis durante 15 años, ¡y ni siquiera lo sabía!
Título original: Ha estado entrenando la IA de Google durante 15 años. No tenía ni idea.
Autor original: Sharbel, cofundador de Unfungible
Original Translator: Lila, BlockBeats
Nota del editor: CAPTCHA, los números o imágenes en los que debe hacer clic cada vez que inicia sesión en un sitio web, es familiar para todos los usuarios de Internet. Pero cuando haces clic en "No soy un robot" una y otra vez, podrías pensar que solo estás verificando tu identidad, cuando en realidad estás participando en la producción de datos más grande y secreta del mundo. El reCAPTCHA de Luis von Ahn ha agregado el comportamiento humano disperso en una piedra angular de datos que respalda a Google y a su subsidiaria, la empresa de vehículos autónomos Waymo.
Bajo la fachada de "gratuito" y "seguro", Internet ha remodelado silenciosamente una nueva forma de relación laboral: pasas tiempo demostrando que eres humano, pero en realidad estás contribuyendo a la formación de la IA, y una vez que la IA aprende, este trabajo es completamente reemplazado. Este artículo ha recibido más de 9,5 millones de visitas en Twitter en menos de 20 horas. A continuación, el contenido original:
Aproximadamente 500.000 horas de trabajo humano son explotadas gratuitamente por Google todos los días. Y las personas que contribuyen a esto solo quieren iniciar sesión en la banca en línea.
reCAPTCHA es la operación de datos invisible más exitosa en la historia de Internet. En su punto álgido, 200 millones de personas completaban el proceso de verificación todos los días. Pero casi nadie se daba cuenta de lo que significaba cada clic entre bastidores.
La empresa de coches autónomos de Google, Waymo, tiene ahora un valor de 45.000 millones de dólares. Y la mayoría de sus datos de entrenamiento centrales son proporcionados libremente por usted al acceder a varios sitios web.
Aquí está la historia completa:
Origen: Una idea inteligente
En 2000, los bots de spam estaban causando estragos en Internet. Los foros estaban inundados, las bandejas de entrada estaban desbordadas y los sitios web necesitaban una forma de distinguir entre humanos y máquinas.
El profesor de la Universidad Carnegie Mellon, Luis von Ahn, resolvió este problema. Inventó CAPTCHA: texto distorsionado que solo los humanos podían leer, no los bots.
Pero von Ahn vio más allá. Millones de personas habían dedicado su energía a estos desafíos. ¿Y si esa energía pudiera hacer dos cosas a la vez?
En 2007, introdujo reCAPTCHA. Su genialidad: ya no mostraba texto aleatorio distorsionado, sino dos palabras. Una palabra era conocida por el sistema, la otra era una palabra real escaneada de un libro que las computadoras aún no podían reconocer. Y su respuesta ayudó en la digitalización de estos libros.
Estos libros provenían de los archivos del New York Times y de Google Books, con un total de hasta 130 millones.
Pensaste que simplemente te estabas conectando a un sitio web común y corriente, pero en realidad estabas realizando OCR (Reconocimiento Óptico de Caracteres) para la biblioteca digital más grande del mundo.
En 2009, Google adquirió oficialmente reCAPTCHA.

Más tarde, Google cambió el juego
La era del "texto torcido" terminó alrededor de 2012.
Google enfrentó un nuevo desafío: Los coches de Street View habían fotografiado todas las carreteras del mundo, pero las imágenes eran solo datos crudos. Para que la IA pudiera hacer su magia, necesitaba entender lo que veía: señales de tráfico, pasos de peatones, semáforos, escaparates.
Así que Google rediseñó reCAPTCHA v2. En lugar de texto distorsionado, había cuadrículas de fotos. "Haz clic en todos los cuadrados con semáforos". "Selecciona todos los pasos de peatones". "Identifica los escaparates".
Estas imágenes provienen directamente de Google Street View. Tus clics sirvieron como etiquetas.
Cada selección informaba al modelo de visión artificial de Google: estos píxeles forman un semáforo, esa forma es un paso de peatones. No estabas haciendo una prueba; estabas construyendo un conjunto de datos.

Una escala inimaginable
En su punto álgido, se resolvían 200 millones de reCAPTCHAs al día. Cada desafío llevaba 10 segundos, lo que significaba 2.000 millones de segundos de trabajo humano por día. Eso son 500.000 horas todos los días.
El costo del etiquetado de datos pagado es de aproximadamente $10 a $50 por hora. Calculado a la tasa más baja: el valor diario del trabajo extraído libremente alcanzó hasta $5 millones.
Además, reCAPTCHA no solo existe en una aplicación en particular. Está presente en cada banco, en cada portal gubernamental, en cada sitio web de comercio electrónico. No tienes opción: ¿Quieres iniciar sesión en tu cuenta? Primero, ayuda a anotar el conjunto de datos. Google nunca ha pedido tu opinión, te ha pagado un centavo de salario, o incluso te ha informado sobre esto.

¿A qué ha llevado todo esto?
Estos datos se incorporan directamente en dos productos:
-Google Maps: La herramienta de navegación más utilizada a nivel mundial. Su capacidad para reconocer señales de tráfico, tiendas y la geografía de la ciudad se debe en parte a los miles de millones de anotaciones humanas realizadas mientras se iniciaba sesión en sitios web.
-Waymo: Proyecto de vehículos autónomos de Google. Para una navegación segura, los vehículos autónomos necesitan identificar casi perfectamente miles de patrones visuales.
Los datos de entrenamiento de la verdad en el terreno para ese trabajo de identificación son precisamente los que millones de personas anotan sin saberlo a través de reCAPTCHA. Waymo completó más de 4 millones de viajes pagados en 2024, valorados en 45.000 millones de dólares. Su piedra angular, colocada por esos «usuarios de Internet no remunerados» que solo querían consultar su correo electrónico.
¿Por qué nadie puede replicar este modelo?
La anotación de datos es extremadamente costosa. Empresas como Scale AI, Appen y Labelbox existen para resolver este problema; contratan a cientos de miles de trabajadores, a veces pagando menos de 1 $ por hora.
Google adoptó un enfoque diferente al problema: convirtieron la anotación en un requisito. No se requiere pago, ni consentimiento, pero como un "billete" para entrar a cada rincón de internet. El resultado: miles de millones de imágenes etiquetadas, cobertura global, en todo tipo de clima, en cada ciudad del mundo. Ninguna empresa de anotación puede lograr esto. Internet en sí es una fábrica, y cada internauta es un empleado indocumentado.

Todavía estás participando
reCAPTCHA v3, lanzado en 2018, ni siquiera muestra desafíos. Observa cómo mueves el mouse, la velocidad de desplazamiento, el tiempo de permanencia. Tu huella conductual le informa si eres humano. Estos datos conductuales también se retroalimentan en los sistemas de IA de Google.
Nunca elegiste activamente unirte, nunca hubo una casilla para marcar. Sin embargo, en este momento, en la mayoría de los sitios web que visitas, sigues haciendo esto.
Ironía perturbadora
La intención original de Luis von Ahn era brillante: transformar la energía que los humanos ya estaban desperdiciando en una salida útil. Sin embargo, lo que Google hizo con esta visión es una historia completamente diferente. Tomaron un mecanismo de seguridad que los usuarios tenían que usar, lo implementaron en la web y recogieron los resultados para crear un producto empresarial valorado en cientos de miles de millones de dólares. Los usuarios no obtuvieron nada a cambio, ni siquiera conciencia.
La ironía más profunda es: pasaste años demostrando que eres humano completando tareas de reconocimiento visual que la IA no podía hacer en ese momento. Pero una vez que la IA aprendió a hacer estas tareas, ya no se necesitaban anotaciones visuales humanas.
Demostró que es humano, solo para terminar haciéndose reemplazable.
Te puede gustar

Naval sube personalmente al escenario: El histórico choque entre la gente común y el capital de riesgo.

Criptomonedas a16z: 9 gráficos para comprender las tendencias evolutivas de las stablecoins

Refutación del artículo de Yang Haipo titulado "El fin de las criptomonedas".

¿Puede un secador de pelo generar 34 000 dólares? Interpretación de la paradoja de la reflexividad en los mercados de predicción

El sucesor de Apple enfrenta desafíos inéditos
John Turner se convierte en el nuevo CEO de Apple el 1 de septiembre de 2026, sustituyendo a…

Fundador de 6MV: En 2026, ha llegado el "punto de inflexión histórico" para la inversión en criptomonedas

Abraxas Capital emite 2.890 millones de USDT: ¿Un impulso a la liquidez o simplemente más arbitraje con stablecoins?
Abraxas Capital acaba de recibir 2.890 millones de dólares en USDT recién emitidos de Tether. ¿Se trata de una inyección de liquidez alcista para los mercados de criptomonedas, o es simplemente el día a día de un gigante del arbitraje de stablecoins? Analizamos los datos y el posible impacto en el bitcoin, las altcoins y las finanzas descentralizadas (DeFi).

Un inversor de capital riesgo del mundo de las criptomonedas dijo que la IA es una locura y que ellos son muy conservadores

La historia evolutiva de los algoritmos de contratos: Una década de contratos perpetuos, el telón aún no ha caído.

Noticias sobre ETF de Bitcoin hoy: Entradas de $2.1 mil millones indican una fuerte demanda institucional de BTC.
Las noticias sobre los ETF de Bitcoin registraron entradas de capital por valor de 2.100 millones de dólares durante 8 días consecutivos, lo que supone una de las rachas de acumulación más fuertes de los últimos tiempos. Aquí te explicamos qué significan las últimas noticias sobre los ETF de Bitcoin para el precio de BTC y si el próximo objetivo es superar el nivel de los 80.000 dólares.

Tras haber sido expulsado de PayPal, Musk pretende volver al mercado de las criptomonedas

Michael Saylor: El invierno ha terminado: ¿tiene razón? 5 datos clave (2026)
Michael Saylor tuiteó ayer: «Se acabó el invierno». Es breve. Es atrevido. Y está dando mucho que hablar en el mundo de las criptomonedas.
¿Pero tiene razón? ¿O se trata simplemente de otro director ejecutivo que se está llenando los bolsillos?
Echemos un vistazo a los datos. Seamos neutrales. Veamos si el hielo se ha derretido de verdad.

La aplicación WEEX Bubbles ya está disponible y visualiza el mercado de criptomonedas de un vistazo
WEEX Bubbles es una aplicación independiente diseñada para ayudar a los usuarios a comprender rápidamente los complejos movimientos del mercado de criptomonedas a través de una visualización intuitiva en burbujas.

El cofundador de Polygon, Sandeep: Escribiendo tras la explosión del puente de cadena

Actualización principal en la web: Más de 10 estilos de gráficos avanzados para una visión más profunda del mercado
Para ofrecer herramientas de análisis más potentes y profesionales, WEEX ha lanzado una importante actualización a sus gráficos de comercio web, que ahora admiten hasta 14 estilos avanzados de gráficos.

Informe matutino | Aethir asegura un contrato empresarial de $260 millones con Axe Compute; New Fire Technology adquiere el equipo comercial de Avenir Group; el volumen de operaciones de Polymarket es superado por Kalshi

¿Volverá la Fed a Recortar Tipos de Interés? Los Datos de Esta Noche Son Clave
Los conflictos geopolíticos e inflación creciente generan expectativas de un recorte de tasas por parte de la Fed.…

Publicación Impactante sobre la Preparación Cuántica de XRP para 2028
Vet, validador de XRP Ledger, ha detallado un plan para que XRP se vuelva resistente a amenazas cuánticas.…
Naval sube personalmente al escenario: El histórico choque entre la gente común y el capital de riesgo.
Criptomonedas a16z: 9 gráficos para comprender las tendencias evolutivas de las stablecoins
Refutación del artículo de Yang Haipo titulado "El fin de las criptomonedas".
¿Puede un secador de pelo generar 34 000 dólares? Interpretación de la paradoja de la reflexividad en los mercados de predicción
El sucesor de Apple enfrenta desafíos inéditos
John Turner se convierte en el nuevo CEO de Apple el 1 de septiembre de 2026, sustituyendo a…





