Los jóvenes de un pequeño pueblo etiquetan grandes modelos de IA

By: blockbeats|2026/04/07 13:04:26

Autor | Sleepy.md

En Datong, Shanxi, una ciudad que una vez se sostuvo gracias al carbón y que ahora ha sacudido el polvo del carbón, una afilada picota ha reemplazado a las minas de carbón, dirigiéndose hacia otra mina invisible.

Dentro del edificio de oficinas del Centro Internacional Jinmao en el distrito de Pingcheng, ya no hay pozos mineros ni camiones de carbón. En su lugar, hay miles de estaciones de trabajo informáticas dispuestas de cerca. El Centro de Servicios Inteligentes de Big Data de Shanghai Runxun Cloud Sonic Valley ocupa varios pisos, con miles de jóvenes empleados usando auriculares, mirando fijamente las pantallas, haciendo clic, arrastrando y seleccionando.

Según datos oficiales, a partir de noviembre de 2025, la ciudad de Datong ha puesto en funcionamiento 745,000 servidores, ha introducido 69 empresas de etiquetado de datos de llamada, ha impulsado el empleo de más de 30,000 personas, con un valor de producción de 750 millones de yuanes. En esta mina digital, el 94% de los practicantes son locales.

Y no es solo Datong. En el primer lote de bases de etiquetado de datos identificadas por la Oficina Nacional de Estadísticas, se enumeran condados de la región occidental como el condado de Yonghe en Shanxi, Bijie en Guizhou y Mengzi en Yunnan. En la base de etiquetado de datos del condado de Yonghe, el 80% de los empleados son mujeres. La mayoría de ellas son madres rurales que se quedan en casa o jóvenes rurales que no pueden encontrar empleos adecuados.

Hace cien años, las fábricas textiles de Manchester en el Reino Unido estaban llenas de agricultores sin tierra. Hoy en día, en las pantallas de los ordenadores de estos pueblos de condado remotos, los jóvenes que no pueden encontrar un lugar en la economía real están sentados frente a ellas.

Están comprometidos en un trabajo a destajo futurista pero extremadamente primitivo, produciendo el flujo de datos necesario para los gigantes de la IA en Pekín, Shenzhen y Silicon Valley.

Nadie ve ningún problema con esto.

Una nueva línea de montaje en la meseta de Loess

La esencia del etiquetado de datos es enseñar a las máquinas sobre el mundo.

La conducción autónoma necesita reconocer semáforos y peatones, y los grandes modelos necesitan distinguir entre gatos y perros. Las máquinas no tienen sentido común y deben tener un humano que dibuje una caja en la imagen para decirles "esto es un peatón" antes de que puedan aprender a reconocerlo después de digerir millones de imágenes.

Este trabajo no requiere un alto nivel de educación, solo paciencia y un dedo que pueda hacer clic incesantemente.

Durante la edad de oro de 2017, una simple caja 2D podía costar más de un centavo, y algunas empresas incluso ofrecían un alto precio de medio yuan. Un etiquetador que haga clic rápidamente podría ganar de cinco a seiscientos yuanes trabajando diez horas al día. En la ciudad del condado, esto definitivamente se considera un trabajo bien remunerado y decente.

Pero a medida que los grandes modelos evolucionaban, comenzaba a surgir la dura realidad de este proceso.

Para 2023, el precio unitario de la simple anotación de imágenes se había reducido a 3 a 4 céntimos, una caída de más del 90%. Incluso para las imágenes de nubes de puntos 3D más complejas, donde los puntos son tan densos que los bordes requieren un zoom significativo para discernirse, los anotadores deben dibujar meticulosamente una caja tridimensional en el espacio que abarque longitud, anchura, altura y ángulo de orientación para envolver perfectamente un vehículo o un peatón. Sin embargo, el precio de tal caja 3D compleja es de solo 5 céntimos.

Los jóvenes de un pequeño pueblo etiquetan grandes modelos de IA

La consecuencia directa de esta caída de precios es un aumento dramático en la intensidad laboral. Para poder mantener un salario mensual de dos a tres mil dólares, los anotadores deben mejorar continuamente y sin descanso su velocidad.

Este no es en modo alguno un trabajo de cuello blanco fácil. En muchos centros de anotación, la gestión es tan estricta que es sofocante; a los empleados no se les permite responder llamadas telefónicas durante el trabajo, y los teléfonos móviles deben estar bloqueados en compartimentos de almacenamiento. El sistema registra meticulosamente los movimientos del ratón y el tiempo de inactividad de cada empleado, y si hay una pausa de más de tres minutos, una advertencia del servidor caerá como un látigo.

Aún más frustrante es la tasa de tolerancia. La calificación mínima de la industria suele ser superior al 95 %, y algunas empresas incluso requieren del 98 % al 99 %. Esto significa que si dibuja 100 cajas y comete 2 errores, toda la imagen se enviará de nuevo para su revisión.

Las imágenes dinámicas constan de fotogramas, y los vehículos que cambian de carril quedan ocultos, lo que obliga a los anotadores a usar su imaginación para identificar cada uno de ellos. En las imágenes de nube de puntos en 3D, cualquier objeto con más de 10 puntos debe estar en una caja. En un proyecto complejo de plazas de aparcamiento, si las líneas son demasiado largas o se pierde algo, la inspección de calidad siempre encontrará fallos. Es habitual que una imagen se revise cuatro o cinco veces. Al final, después de dedicar una hora de trabajo, solo ganas unos pocos céntimos.

Una anotadora de la provincia de Hunan publicó su estado de liquidación en las redes sociales, mostrando que, después de un día de trabajo, dibujó más de 700 cajas a un ritmo de 4 céntimos cada una, ganando un total de 30,2 yuanes.

Esta es una escena extremadamente fragmentada.

Por un lado, los brillantes gigantes tecnológicos en conferencias discuten cómo la AGI liberará a la humanidad; por otro lado, en las ciudades del condado en la meseta de Loess y en las montañas del suroeste, los jóvenes miran las pantallas durante ocho a diez horas al día, dibujando mecánicamente cajas, miles, decenas de miles, e incluso soñando por la noche, con los dedos trazando líneas de carril en el aire.

Alguien dijo una vez que la fachada de la inteligencia artificial es un lujoso coche rugiente, pero cuando se abre la puerta, se encuentran cien personas pedaleando bicicletas en el interior, apretando los dientes y pedaleando con fuerza.

Nadie piensa que haya algo malo en esto.

Las máquinas de enseñanza de artesanos a destajo "Cómo amar"

Después de superar el cuello de botella del reconocimiento de imágenes, los grandes modelos han experimentado una evolución más profunda, necesitando aprender a pensar, conversar e incluso mostrar "empatía" como los humanos.

Esto ha dado lugar a la parte más crítica y costosa de la formación de modelos a gran escala: RLHF (Aprendizaje por Refuerzo basado en Retroalimentación Humana).

En términos simples, implica que personas reales califiquen las respuestas generadas por IA, diciéndole qué respuestas son mejores, más alineadas con los valores humanos y las preferencias emocionales.

La razón por la que ChatGPT parece "humano" es porque, detrás de él, hay innumerables anotadores de RLHF que lo están enseñando.

En las plataformas de externalización, estas tareas de anotación suelen tener un precio claro: un coste unitario de entre 3 y 7 RMB. Los anotadores deben proporcionar puntuaciones emocionales extremadamente subjetivas a las respuestas de la IA para evaluar si la respuesta es "cálida", "empática" o "consciente de las emociones del usuario".

Alguien que gana solo unos pocos miles de RMB al mes, luchando en el barro de la realidad, apenas puede atender sus propias emociones, y ahora se le exige que actúe como mentor emocional de la IA y árbitro de valores.

Necesitan descomponer con la fuerza la calidez, la empatía y otras emociones humanas altamente complejas y sutiles en puntuaciones frías que van de 1 a 5. Si sus puntuaciones no coinciden con las respuestas correctas predefinidas del sistema, su precisión se considerará insuficiente, lo que llevará a deducciones de sus magros salarios por obra.

Esto es un agotamiento cognitivo. Las emociones humanas, la moral y la compasión, tan intrincadas y matizadas, se están metiendo a la fuerza en el embudo del algoritmo. En el reino gélido de la cuantificación y las escalas de estandarización, se les está quitando su último resquicio de calidez. Mientras te maravillas ante el ciberbehemoth en la pantalla que ha aprendido a escribir poesía, componer música, mostrar cuidado e incluso ha adoptado una piel de sensibilidad melancólica; fuera de la pantalla, ese grupo de humanos antes animados ha retrocedido, a través de juicios mecánicos diarios, a máquinas de puntuación sin emociones.

Este es el lado más secreto de toda la cadena de la industria, que nunca aparece en ninguna noticia de financiación o en documentos técnicos.

Nadie piensa que haya algo malo en esto.

Titulado de Maestría vs. Jóvenes de pueblos pequeños

El trabajo de línea de montaje de bajo nivel está siendo aplastado por las pisadas de la IA, lo que hace que esta cinta transportadora cibernética se extienda hacia arriba, comenzando a engullir el trabajo cerebral de orden superior.

El apetito de los grandes modelos ha cambiado. Ya no satisfechos con masticar el sentido común básico, ahora requieren devorar la experiencia humana y la lógica avanzada.

En varias plataformas importantes de reclutamiento de empleo, ha comenzado a aparecer con frecuencia un nuevo tipo de trabajo a tiempo parcial, como "Anotación de Razonamiento Lógico de Grandes Modelos" y "Entrenador de Humanidades de IA". Este trabajo a tiempo parcial tiene un umbral extremadamente alto, a menudo requiere una "maestría o superior de universidades del Proyecto 985/Proyecto 211" e involucra campos profesionales como derecho, medicina, filosofía y literatura.

Muchos estudiantes de posgrado de universidades prestigiosas se sienten atraídos y se unen a los grupos de externalización de estos gigantes tecnológicos. Sin embargo, rápidamente se dan cuenta de que esto no es un ejercicio mental fácil, sino más bien una forma de tortura mental.

Antes de asumir formalmente las tareas, deben leer docenas de páginas de documentos de dimensiones de puntuación y criterios de evaluación, y someterse a dos o tres rondas de anotaciones de prueba. Una vez cumplidos los estándares, durante la anotación formal, si su precisión cae por debajo del nivel promedio, perderán su calificación y serán expulsados del chat grupal.

Lo más sofocante de todo es que estos estándares no están fijados en absoluto. Frente a preguntas y respuestas similares, puntuarlas con el mismo proceso de pensamiento puede arrojar resultados completamente opuestos. Es como trabajar en un examen sin fin sin una respuesta estándar. La precisión no puede mejorarse mediante el esfuerzo propio o el estudio; uno solo puede girar en círculos indefinidamente, agotando tanto la energía mental como la física.

Esta es la nueva forma de explotación en la era de los grandes modelos: el plegamiento de clases.

El conocimiento, que antes se veía como una escalera dorada para romper barreras y ascender, ahora se ha convertido en un alimento digital más complejo ofrecido a los algoritmos para que lo mastiquen. Frente al poder absoluto de los algoritmos y los sistemas, los estudiantes de posgrado de universidades de élite en sus torres de marfil y los jóvenes de los pequeños pueblos de la meseta de Loess han emprendido el camino de convergencia más extraño.

Juntos, se sumergen en este pozo sin fondo de la ciberminería, despojados de sus halos, borrando las diferencias, todos convertidos en engranajes baratos en la cinta transportadora que se pueden reemplazar en cualquier momento.

Es lo mismo en el extranjero. En 2024, Apple despidió directamente a un equipo de anotación de voz de IA de 121 miembros en San Diego. Estos empleados eran responsables de mejorar las capacidades de procesamiento multilingüe de Siri. Una vez pensaron que estaban en el núcleo del negocio de un gigante tecnológico, solo para sumergirse instantáneamente en el abismo del desempleo.

A los ojos de los gigantes tecnológicos, ya sea una señora de mediana edad que dirige una tienda de comestibles en un pequeño condado o un entrenador de lógica con una educación prestigiosa, fundamentalmente, todos son "consumibles" que se pueden reemplazar en cualquier momento.

Nadie piensa que haya algo malo en esto.

Una Torre de Babel de mil millones de dólares, construida con unos pocos céntimos de explotación

Según los datos publicados por el Instituto de Investigación de Información y Comunicaciones de China, el mercado chino de anotación de datos alcanzó una escala de 6.080 millones de yuanes en 2023 y se espera que alcance los 20-30.000 millones de yuanes para 2025. Se predice que para 2030, las ventas del mercado global de anotación y servicios de datos se dispararán a 117.100 millones de yuanes.

Detrás de estas cifras hay gigantes tecnológicos como OpenAI, Microsoft y ByteDance, con valoraciones que alcanzan billones de dólares.

Sin embargo, esta riqueza descomunal no ha llegado a quienes realmente "alimentan" la IA.

En la industria de etiquetado de datos de China, es evidente una estructura de subcontratación de pirámide invertida. En la parte superior se encuentran los gigantes tecnológicos que controlan los algoritmos centrales; el segundo nivel está compuesto por grandes proveedores de servicios de datos; el tercer nivel comprende centros de etiquetado de datos y empresas de subcontratación de tamaño pequeño a mediano dispersas por todo el país; solo en la parte inferior encontramos a los soldados de infantería que ganan a precio alzado: los trabajadores de etiquetado.

Cada capa de subcontratación se lleva una parte importante. Cuando las grandes fábricas ofrecen un precio unitario de 0.5 RMB, después de capas de explotación, lo que termina en manos de un trabajador de etiquetado en una ciudad del condado puede ser menos de 0.05 RMB.

En su libro "Techno-Feudalism", el ex ministro de Finanzas griego Yanis Varoufakis presentó un punto de vista penetrante: los gigantes tecnológicos de hoy ya no son capitalistas en el sentido tradicional, sino "Cloudalistas".

No poseen fábricas y maquinaria, sino algoritmos, plataformas y poder computacional, los territorios digitales de la era cibernética. En este nuevo sistema feudal, los usuarios no son consumidores, sino siervos digitales. Cada "me gusta", comentario y navegación en las redes sociales es trabajo gratuito que suministra datos a los Cloudalistas.

Mientras tanto, los trabajadores de etiquetado de datos en los mercados emergentes son los siervos digitales de nivel más bajo en este sistema. No solo tienen que producir datos, sino también limpiar, categorizar y calificar enormes cantidades de datos crudos, transformándolos en un contenido de alta calidad que los grandes modelos puedan procesar.

Este es un movimiento secreto de cercamiento cognitivo. De manera similar a cómo las Leyes de Cercamiento de la Inglaterra del siglo XIX llevaron a los agricultores a las fábricas textiles, la ola de la IA de hoy está empujando a los jóvenes que no pueden encontrar un lugar en la economía física frente a las pantallas.

La IA no ha nivelado la división de clases; en cambio, ha establecido una "cinta transportadora de datos y sudor de sangre" desde los pequeños condados del centro y oeste de China directamente a las sedes de los gigantes tecnológicos en Pekín, Shanghái, Cantón y Shenzhen. La narrativa de la revolución tecnológica siempre es grandiosa y magnífica, pero su fundamento es siempre el consumo a gran escala de mano de obra barata.

Nadie parece pensar que haya algo malo en esto.

Un mañana sin la necesidad de humanos

La conclusión más brutal se acerca rápidamente, cada vez más rápido.

Con el auge de las capacidades de los modelos a gran escala, las tareas que antes requerían trabajo humano día y noche para completarse están siendo asumidas por la propia IA.

En abril de 2023, Li Xiang, el fundador de Ideal Auto, reveló en un foro que, en el pasado, Ideal solía etiquetar manualmente aproximadamente 10 millones de fotogramas de imágenes de conducción autónoma en un año, con costos de subcontratación cercanos a mil millones. Sin embargo, después de que emplearon grandes modelos para la etiquetación automatizada, lo que solía llevar un año en completarse ahora se puede hacer en aproximadamente 3 horas.

La eficiencia es 1000 veces superior a la de los humanos, y se logró ya en 2023. Solo en marzo pasado, Ideals lanzó el motor de anotación automática de próxima generación MindVLA-o1.

En la industria circula un dicho autodespectivo pero cierto: "Cuanto más inteligencia, más artificial". Pero ahora, ha habido una caída abrupta del 40% al 50% en la externalización de la anotación de datos por parte de los gigantes tecnológicos.

Esos jóvenes de pequeños pueblos que han pasado incontables días y noches frente a las computadoras, con los ojos inyectados de sangre por el esfuerzo, han creado personalmente un coloso. Y ahora, este coloso está dando la vuelta, destrozando sus tazones de arroz.

Al caer la noche, los edificios de oficinas del distrito de Pingcheng de Datong permanecen tan brillantes como de día. Los jóvenes de turno intercambian silenciosamente sus cansados cascarones en el vestíbulo del ascensor. En este espacio plegado e impunemente encerrado por innumerables polígonos, a nadie le importa el salto épico de la arquitectura Transformer al otro lado del océano, ni nadie entiende el rugido del poder informático detrás de los cien mil millones de parámetros.

Su mirada está soldada a la barra de progreso roja/verde del escenario que representa la "línea de paso", calculando si los magros números de trabajo a destajo pueden recomponer una vida decente para el final del mes.

Por un lado, la campana de cierre del Nasdaq y la cobertura continua de los medios tecnológicos hacen que los gigantes levanten sus copas en celebración de la llegada de la AGI; por otro lado, estos siervos digitales que han alimentado la IA con su carne y sangre solo pueden, en medio de un sueño adolorido, esperar nerviosamente que el coloso que han levantado con sus propias manos les eche de lado sus cuencos de arroz en una mañana común.

Nadie piensa que haya algo malo en esto.

Te puede gustar

Informe matutino | Coinbase Ventures realiza su primera inversión en ENA; SpaceX planea fijar el precio de su OPI en 135 dólares por acción

Resumen de los eventos importantes del mercado el 3 de junio

Texto completo y análisis del discurso del CEO de SanDisk en la 42.ª Conferencia Anual de Decisiones Estratégicas de Bernstein

El valor fundamental del discurso de Goeckeler reside en que proporciona un marco narrativo altamente transparente y lógicamente claro para la transformación corporativa.

Informe matutino | Strategy vendió 32 BTC y más de 800.000 acciones de MSTR la semana pasada; Binance anunció oficialmente su portal de trading de acciones de EE. UU.; Polymarket alcanzó una asociación exclusiva con OneFootball

Resumen de los eventos importantes del mercado el 1 de junio

Bootcamp de trading WEEXPERIENCE en Polonia: cómo WEEX y FireCrew están haciendo que el trading de criptomonedas sea accesible para todos

WEEX se asoció con Firecrew en Polonia el 29 de mayo para el bootcamp de trading WEEXPERIENCE. Lee el resumen de las sesiones de expertos sobre análisis técnico, psicología de trading y herramientas de IA que demuestran la misión de WEEX de hacer que el trading de criptomonedas sea accesible para todos.

París reina: cómo el PSG truncó el sueño del Arsenal en una final histórica de la Champions League

PSG contra Arsenal, drama, destino y una maldición de 20 años rota. Revive la final de la Champions League 2026 donde el PSG defendió su corona en una tensa tanda de penaltis, mientras el momento estelar de Ousmane Dembélé y un fallo agónico hicieron historia en Budapest.

TaiJi completa una ronda de financiación estratégica de 3,5 millones de dólares, con inversiones de Castrum Capital, Becker Ventures y Coinvestor Ventures

La plataforma de inteligencia de mercado on-chain impulsada por IA para Web3, TaiJi, anunció la finalización de una financiación estratégica de 3,5 millones de dólares, que acelerará la construcción de un nuevo motor de simulación de mercado basado en IA.

¿Bitcoin estancado cerca de los 73 000 $? Cómo los traders encuentran recompensas en un mercado lateral en junio

Bitcoin está estancado cerca de los 73 000 $ a medida que los flujos de los ETF se enfrían y la incertidumbre macroeconómica mantiene a los traders cautelosos. Así es como las campañas de recompensas como Weex Joker Party ayudan a los traders a mantenerse activos durante un mercado lateral en junio.

Cómo hacer staking de Solana: una guía paso a paso para 2026

Encuentra las mejores criptomonedas de IA en 2026 con selecciones basadas en datos: Bittensor, Render y proyectos emergentes. Incluye métricas on-chain, riesgos y guía de trading en WEEX.

Precio garantizado ya disponible en WEEX: opere con mayor precisión

Para ofrecer una experiencia de trading de futuros más fluida, los futuros de WEEX han lanzado una función de "Precio garantizado".

Última investigación del BIS: El futuro de las stablecoins y el panorama monetario global

El informe sostiene que las stablecoins fortalecerán el dominio del dólar estadounidense a corto plazo, planteando riesgos para la soberanía monetaria de los mercados emergentes y las economías en desarrollo, mientras que su trayectoria a largo plazo dependerá de sus modelos de adopción, respuestas regulatorias y la sinergia de...

Entrevista con el maestro de la macroeconomía Raoul Pal: La competencia en IA está dando lugar a una "singularidad económica", no te deshagas fácilmente de tus activos en los próximos cuatro años

En comparación con el Nasdaq, Bitcoin se encuentra actualmente en una posición de sobreventa severa dentro de su tendencia a largo plazo.

La defensa rota de los guardianes de Solana: para atacar a Hyperliquid, ¿han rescatado el guion que alguna vez criticaron de Ethereum?

El auge de HYPE desata una batalla de gigantes. Un líder de Solana critica duramente a Hyperliquid por su centralización, mientras que Arthur Hayes responde con contundencia y una apuesta de 100.000 dólares.

¿Por qué Peter Thiel, el hombre detrás de Palantir, prepara su salida de Argentina?

Palantir, el riesgo político y la autopreservación de los oligarcas tecnológicos.

Informe matutino | Coinbase Ventures realiza su primera inversión en ENA; SpaceX planea fijar el precio de su OPI en 135 dólares por acción

Resumen de los eventos importantes del mercado el 3 de junio

Texto completo y análisis del discurso del CEO de SanDisk en la 42.ª Conferencia Anual de Decisiones Estratégicas de Bernstein

El valor fundamental del discurso de Goeckeler reside en que proporciona un marco narrativo altamente transparente y lógicamente claro para la transformación corporativa.