Los jóvenes de un pequeño pueblo etiquetan grandes modelos de IA

By: blockbeats|2026/04/07 13:08:05
0
Compartir
copy
Autor | Sleepy.md

En Datong, Shanxi, una ciudad que una vez se sostuvo gracias al carbón y que ahora ha sacudido el polvo del carbón, una afilada picota ha reemplazado a las minas de carbón, dirigiéndose hacia otra mina invisible.

Dentro del edificio de oficinas del Centro Internacional Jinmao en el distrito de Pingcheng, ya no hay pozos mineros ni camiones de carbón. En su lugar, hay miles de estaciones de trabajo informáticas dispuestas de cerca. El Centro de Servicios Inteligentes de Big Data de Shanghai Runxun Cloud Sonic Valley ocupa varios pisos, con miles de jóvenes empleados usando auriculares, mirando fijamente las pantallas, haciendo clic, arrastrando y seleccionando.

Según datos oficiales, a partir de noviembre de 2025, la ciudad de Datong ha puesto en funcionamiento 745,000 servidores, ha introducido 69 empresas de etiquetado de datos de llamada, ha impulsado el empleo de más de 30,000 personas, con un valor de producción de 750 millones de yuanes. En esta mina digital, el 94% de los practicantes son locales.

Y no es solo Datong. En el primer lote de bases de etiquetado de datos identificadas por la Oficina Nacional de Estadísticas, se enumeran condados de la región occidental como el condado de Yonghe en Shanxi, Bijie en Guizhou y Mengzi en Yunnan. En la base de etiquetado de datos del condado de Yonghe, el 80% de los empleados son mujeres. La mayoría de ellas son madres rurales que se quedan en casa o jóvenes rurales que no pueden encontrar empleos adecuados.

Hace cien años, las fábricas textiles de Manchester en el Reino Unido estaban llenas de agricultores sin tierra. Hoy en día, en las pantallas de los ordenadores de estos pueblos de condado remotos, los jóvenes que no pueden encontrar un lugar en la economía real están sentados frente a ellas.

Están comprometidos en un trabajo a destajo futurista pero extremadamente primitivo, produciendo el flujo de datos necesario para los gigantes de la IA en Pekín, Shenzhen y Silicon Valley.

Nadie ve ningún problema con esto.

Una nueva línea de montaje en la meseta de Loess

La esencia del etiquetado de datos es enseñar a las máquinas sobre el mundo.

La conducción autónoma necesita reconocer semáforos y peatones, y los grandes modelos necesitan distinguir entre gatos y perros. Las máquinas no tienen sentido común y deben tener un humano que dibuje una caja en la imagen para decirles "esto es un peatón" antes de que puedan aprender a reconocerlo después de digerir millones de imágenes.

Este trabajo no requiere un alto nivel de educación, solo paciencia y un dedo que pueda hacer clic incesantemente.

Durante la edad de oro de 2017, una simple caja 2D podía costar más de un centavo, y algunas empresas incluso ofrecían un alto precio de medio yuan. Un etiquetador que haga clic rápidamente podría ganar de cinco a seiscientos yuanes trabajando diez horas al día. En la ciudad del condado, esto definitivamente se considera un trabajo bien remunerado y decente.

Pero a medida que los grandes modelos evolucionaban, comenzaba a surgir la dura realidad de este proceso.

Para 2023, el precio unitario de la simple anotación de imágenes se había reducido a 3 a 4 céntimos, una caída de más del 90%. Incluso para las imágenes de nubes de puntos 3D más complejas, donde los puntos son tan densos que los bordes requieren un zoom significativo para discernirse, los anotadores deben dibujar meticulosamente una caja tridimensional en el espacio que abarque longitud, anchura, altura y ángulo de orientación para envolver perfectamente un vehículo o un peatón. Sin embargo, el precio de tal caja 3D compleja es de solo 5 céntimos.

Los jóvenes de un pequeño pueblo etiquetan grandes modelos de IA

La consecuencia directa de esta caída de precios es un aumento dramático en la intensidad laboral. Para poder mantener un salario mensual de dos a tres mil dólares, los anotadores deben mejorar continuamente y sin descanso su velocidad.

Este no es en modo alguno un trabajo de cuello blanco fácil. En muchos centros de anotación, la gestión es tan estricta que es sofocante; a los empleados no se les permite responder llamadas telefónicas durante el trabajo, y los teléfonos móviles deben estar bloqueados en compartimentos de almacenamiento. El sistema registra meticulosamente los movimientos del ratón y el tiempo de inactividad de cada empleado, y si hay una pausa de más de tres minutos, una advertencia del servidor caerá como un látigo.

Aún más frustrante es la tasa de tolerancia. La calificación mínima de la industria suele ser superior al 95 %, y algunas empresas incluso requieren del 98 % al 99 %. Esto significa que si dibuja 100 cajas y comete 2 errores, toda la imagen se enviará de nuevo para su revisión.

Las imágenes dinámicas constan de fotogramas, y los vehículos que cambian de carril quedan ocultos, lo que obliga a los anotadores a usar su imaginación para identificar cada uno de ellos. En las imágenes de nube de puntos en 3D, cualquier objeto con más de 10 puntos debe estar en una caja. En un proyecto complejo de plazas de aparcamiento, si las líneas son demasiado largas o se pierde algo, la inspección de calidad siempre encontrará fallos. Es habitual que una imagen se revise cuatro o cinco veces. Al final, después de dedicar una hora de trabajo, solo ganas unos pocos céntimos.

Una anotadora de la provincia de Hunan publicó su estado de liquidación en las redes sociales, mostrando que, después de un día de trabajo, dibujó más de 700 cajas a un ritmo de 4 céntimos cada una, ganando un total de 30,2 yuanes.

Esta es una escena extremadamente fragmentada.

Por un lado, los brillantes gigantes tecnológicos en conferencias discuten cómo la AGI liberará a la humanidad; por otro lado, en las ciudades del condado en la meseta de Loess y en las montañas del suroeste, los jóvenes miran las pantallas durante ocho a diez horas al día, dibujando mecánicamente cajas, miles, decenas de miles, e incluso soñando por la noche, con los dedos trazando líneas de carril en el aire.

Alguien dijo una vez que la fachada de la inteligencia artificial es un lujoso coche rugiente, pero cuando se abre la puerta, se encuentran cien personas pedaleando bicicletas en el interior, apretando los dientes y pedaleando con fuerza.

Nadie piensa que haya algo malo en esto.

Las máquinas de enseñanza de artesanos a destajo "Cómo amar"

Después de superar el cuello de botella del reconocimiento de imágenes, los grandes modelos han experimentado una evolución más profunda, necesitando aprender a pensar, conversar e incluso mostrar "empatía" como los humanos.

Esto ha dado lugar a la parte más crítica y costosa de la formación de modelos a gran escala: RLHF (Aprendizaje por Refuerzo basado en Retroalimentación Humana).

En términos simples, implica que personas reales califiquen las respuestas generadas por IA, diciéndole qué respuestas son mejores, más alineadas con los valores humanos y las preferencias emocionales.

La razón por la que ChatGPT parece "humano" es porque, detrás de él, hay innumerables anotadores de RLHF que lo están enseñando.

En las plataformas de externalización, estas tareas de anotación suelen tener un precio claro: un coste unitario de entre 3 y 7 RMB. Los anotadores deben proporcionar puntuaciones emocionales extremadamente subjetivas a las respuestas de la IA para evaluar si la respuesta es "cálida", "empática" o "consciente de las emociones del usuario".

Alguien que gana solo unos pocos miles de RMB al mes, luchando en el barro de la realidad, apenas puede atender sus propias emociones, y ahora se le exige que actúe como mentor emocional de la IA y árbitro de valores.

Necesitan descomponer con la fuerza la calidez, la empatía y otras emociones humanas altamente complejas y sutiles en puntuaciones frías que van de 1 a 5. Si sus puntuaciones no coinciden con las respuestas correctas predefinidas del sistema, su precisión se considerará insuficiente, lo que llevará a deducciones de sus magros salarios por obra.

Esto es un agotamiento cognitivo. Las emociones humanas, la moral y la compasión, tan intrincadas y matizadas, se están metiendo a la fuerza en el embudo del algoritmo. En el reino gélido de la cuantificación y las escalas de estandarización, se les está quitando su último resquicio de calidez. Mientras te maravillas ante el ciberbehemoth en la pantalla que ha aprendido a escribir poesía, componer música, mostrar cuidado e incluso ha adoptado una piel de sensibilidad melancólica; fuera de la pantalla, ese grupo de humanos antes animados ha retrocedido, a través de juicios mecánicos diarios, a máquinas de puntuación sin emociones.

Este es el lado más secreto de toda la cadena de la industria, que nunca aparece en ninguna noticia de financiación o en documentos técnicos.

Nadie piensa que haya algo malo en esto.

Titulado de Maestría vs. Jóvenes de pueblos pequeños

El trabajo de línea de montaje de bajo nivel está siendo aplastado por las pisadas de la IA, lo que hace que esta cinta transportadora cibernética se extienda hacia arriba, comenzando a engullir el trabajo cerebral de orden superior.

El apetito de los grandes modelos ha cambiado. Ya no satisfechos con masticar el sentido común básico, ahora requieren devorar la experiencia humana y la lógica avanzada.

En varias plataformas importantes de reclutamiento de empleo, ha comenzado a aparecer con frecuencia un nuevo tipo de trabajo a tiempo parcial, como "Anotación de Razonamiento Lógico de Grandes Modelos" y "Entrenador de Humanidades de IA". Este trabajo a tiempo parcial tiene un umbral extremadamente alto, a menudo requiere una "maestría o superior de universidades del Proyecto 985/Proyecto 211" e involucra campos profesionales como derecho, medicina, filosofía y literatura.

Muchos estudiantes de posgrado de universidades prestigiosas se sienten atraídos y se unen a los grupos de externalización de estos gigantes tecnológicos. Sin embargo, rápidamente se dan cuenta de que esto no es un ejercicio mental fácil, sino más bien una forma de tortura mental.

Antes de asumir formalmente las tareas, deben leer docenas de páginas de documentos de dimensiones de puntuación y criterios de evaluación, y someterse a dos o tres rondas de anotaciones de prueba. Una vez cumplidos los estándares, durante la anotación formal, si su precisión cae por debajo del nivel promedio, perderán su calificación y serán expulsados del chat grupal.

Lo más sofocante de todo es que estos estándares no están fijados en absoluto. Frente a preguntas y respuestas similares, puntuarlas con el mismo proceso de pensamiento puede arrojar resultados completamente opuestos. Es como trabajar en un examen sin fin sin una respuesta estándar. La precisión no puede mejorarse mediante el esfuerzo propio o el estudio; uno solo puede girar en círculos indefinidamente, agotando tanto la energía mental como la física.

Esta es la nueva forma de explotación en la era de los grandes modelos: el plegamiento de clases.

El conocimiento, que antes se veía como una escalera dorada para romper barreras y ascender, ahora se ha convertido en un alimento digital más complejo ofrecido a los algoritmos para que lo mastiquen. Frente al poder absoluto de los algoritmos y los sistemas, los estudiantes de posgrado de universidades de élite en sus torres de marfil y los jóvenes de los pequeños pueblos de la meseta de Loess han emprendido el camino de convergencia más extraño.

Juntos, se sumergen en este pozo sin fondo de la ciberminería, despojados de sus halos, borrando las diferencias, todos convertidos en engranajes baratos en la cinta transportadora que se pueden reemplazar en cualquier momento.

Es lo mismo en el extranjero. En 2024, Apple despidió directamente a un equipo de anotación de voz de IA de 121 miembros en San Diego. Estos empleados eran responsables de mejorar las capacidades de procesamiento multilingüe de Siri. Una vez pensaron que estaban en el núcleo del negocio de un gigante tecnológico, solo para sumergirse instantáneamente en el abismo del desempleo.

A los ojos de los gigantes tecnológicos, ya sea una señora de mediana edad que dirige una tienda de comestibles en un pequeño condado o un entrenador de lógica con una educación prestigiosa, fundamentalmente, todos son "consumibles" que se pueden reemplazar en cualquier momento.

Nadie piensa que haya algo malo en esto.

Precio de --

--

Una Torre de Babel de mil millones de dólares, construida con unos pocos céntimos de explotación

Según los datos publicados por el Instituto de Investigación de Información y Comunicaciones de China, el mercado chino de anotación de datos alcanzó una escala de 6.080 millones de yuanes en 2023 y se espera que alcance los 20-30.000 millones de yuanes para 2025. Se predice que para 2030, las ventas del mercado global de anotación y servicios de datos se dispararán a 117.100 millones de yuanes.

Detrás de estas cifras hay gigantes tecnológicos como OpenAI, Microsoft y ByteDance, con valoraciones que alcanzan billones de dólares.

Sin embargo, esta riqueza descomunal no ha llegado a quienes realmente "alimentan" la IA.

En la industria de etiquetado de datos de China, es evidente una estructura de subcontratación de pirámide invertida. En la parte superior se encuentran los gigantes tecnológicos que controlan los algoritmos centrales; el segundo nivel está compuesto por grandes proveedores de servicios de datos; el tercer nivel comprende centros de etiquetado de datos y empresas de subcontratación de tamaño pequeño a mediano dispersas por todo el país; solo en la parte inferior encontramos a los soldados de infantería que ganan a precio alzado: los trabajadores de etiquetado.

Cada capa de subcontratación se lleva una parte importante. Cuando las grandes fábricas ofrecen un precio unitario de 0.5 RMB, después de capas de explotación, lo que termina en manos de un trabajador de etiquetado en una ciudad del condado puede ser menos de 0.05 RMB.

En su libro "Techno-Feudalism", el ex ministro de Finanzas griego Yanis Varoufakis presentó un punto de vista penetrante: los gigantes tecnológicos de hoy ya no son capitalistas en el sentido tradicional, sino "Cloudalistas".

No poseen fábricas y maquinaria, sino algoritmos, plataformas y poder computacional, los territorios digitales de la era cibernética. En este nuevo sistema feudal, los usuarios no son consumidores, sino siervos digitales. Cada "me gusta", comentario y navegación en las redes sociales es trabajo gratuito que suministra datos a los Cloudalistas.

Mientras tanto, los trabajadores de etiquetado de datos en los mercados emergentes son los siervos digitales de nivel más bajo en este sistema. No solo tienen que producir datos, sino también limpiar, categorizar y calificar enormes cantidades de datos crudos, transformándolos en un contenido de alta calidad que los grandes modelos puedan procesar.

Este es un movimiento secreto de cercamiento cognitivo. De manera similar a cómo las Leyes de Cercamiento de la Inglaterra del siglo XIX llevaron a los agricultores a las fábricas textiles, la ola de la IA de hoy está empujando a los jóvenes que no pueden encontrar un lugar en la economía física frente a las pantallas.

La IA no ha nivelado la división de clases; en cambio, ha establecido una "cinta transportadora de datos y sudor de sangre" desde los pequeños condados del centro y oeste de China directamente a las sedes de los gigantes tecnológicos en Pekín, Shanghái, Cantón y Shenzhen. La narrativa de la revolución tecnológica siempre es grandiosa y magnífica, pero su fundamento es siempre el consumo a gran escala de mano de obra barata.

Nadie parece pensar que haya algo malo en esto.

Un mañana sin la necesidad de humanos

La conclusión más brutal se acerca rápidamente, cada vez más rápido.

Con el auge de las capacidades de los modelos a gran escala, las tareas que antes requerían trabajo humano día y noche para completarse están siendo asumidas por la propia IA.

En abril de 2023, Li Xiang, el fundador de Ideal Auto, reveló en un foro que, en el pasado, Ideal solía etiquetar manualmente aproximadamente 10 millones de fotogramas de imágenes de conducción autónoma en un año, con costos de subcontratación cercanos a mil millones. Sin embargo, después de que emplearon grandes modelos para la etiquetación automatizada, lo que solía llevar un año en completarse ahora se puede hacer en aproximadamente 3 horas.

La eficiencia es 1000 veces superior a la de los humanos, y se logró ya en 2023. Solo en marzo pasado, Ideals lanzó el motor de anotación automática de próxima generación MindVLA-o1.

En la industria circula un dicho autodespectivo pero cierto: "Cuanto más inteligencia, más artificial". Pero ahora, ha habido una caída abrupta del 40% al 50% en la externalización de la anotación de datos por parte de los gigantes tecnológicos.

Esos jóvenes de pequeños pueblos que han pasado incontables días y noches frente a las computadoras, con los ojos inyectados de sangre por el esfuerzo, han creado personalmente un coloso. Y ahora, este coloso está dando la vuelta, destrozando sus tazones de arroz.

Al caer la noche, los edificios de oficinas del distrito de Pingcheng de Datong permanecen tan brillantes como de día. Los jóvenes de turno intercambian silenciosamente sus cansados cascarones en el vestíbulo del ascensor. En este espacio plegado e impunemente encerrado por innumerables polígonos, a nadie le importa el salto épico de la arquitectura Transformer al otro lado del océano, ni nadie entiende el rugido del poder informático detrás de los cien mil millones de parámetros.

Su mirada está soldada a la barra de progreso roja/verde del escenario que representa la "línea de paso", calculando si los magros números de trabajo a destajo pueden recomponer una vida decente para el final del mes.

Por un lado, la campana de cierre del Nasdaq y la cobertura continua de los medios tecnológicos hacen que los gigantes levanten sus copas en celebración de la llegada de la AGI; por otro lado, estos siervos digitales que han alimentado la IA con su carne y sangre solo pueden, en medio de un sueño adolorido, esperar nerviosamente que el coloso que han levantado con sus propias manos les eche de lado sus cuencos de arroz en una mañana común.

Nadie piensa que haya algo malo en esto.

Te puede gustar

XAUUSD alcanza un nuevo máximo: ¿Qué deberían hacer los operadores de criptomonedas a continuación?

El oro (XAUUSD) ha alcanzado recientemente nuevos máximos, impulsado por la incertidumbre macroeconómica, las expectativas sobre los tipos de interés y el sentimiento de riesgo global.

Explicación de las burbujas de criptomonedas: Cómo detectarlos antes de que exploten

Comprender las burbujas de criptomonedas puede ayudarte a evitar grandes pérdidas e incluso a obtener beneficios de la volatilidad.

Las mejores aplicaciones de trading con IA en 2026 (probadas por traders reales)

Una aplicación de trading con inteligencia artificial utiliza algoritmos o modelos de aprendizaje automático para analizar datos de mercado y ejecutar operaciones de forma automática o semiautomática.

Burbujas criptográficas supervivientes: Cómo operar automáticamente con un bot de criptotrading de IA

El mercado de criptomonedas es notorio por su extrema volatilidad. Un día estás montando la ola de la última corrida alcista, y al siguiente, te preguntas si estamos en medio de burbujas criptográficas masivas esperando a estallar. Para los comerciantes humanos, gestionar las emociones y sincronizar el mercado a la perfección durante estos cambios es casi imposible. Pero, ¿y si pudieras quitar las conjeturas?

En esta guía, exploraremos cómo operar automáticamente y por qué usar un bot de cripto trading de IA es su mejor defensa contra caídas impredecibles del mercado y repuntes repentinos de altcoin.

¿Qué son las criptoburbujas y por qué explotan?

Una burbuja criptográfica ocurre cuando el precio de los activos digitales, especialmente durante las temporadas altas de negociación de altcoins, aumenta rápidamente, impulsado por la publicidad en lugar del valor intrínseco. Cuando el bombo se desvanece, la burbuja estalla, lo que conduce a fuertes correcciones del mercado.

El mayor desafío durante una burbuja no es solo la caída de precios, es el pánico. Las decisiones emocionales a menudo conducen a vender en la parte inferior o comprar en la parte superior. Aquí es donde la inteligencia artificial cambia el juego.

Cómo operar automáticamente: El poder de la IA

Si quieres sobrevivir a un mercado volátil, necesitas ejecutar operaciones basadas en datos, no en miedo. Aprender a operar automáticamente le permite establecer reglas predefinidas que se ejecutan 24/7.

Aprovechando un bot de cripto trading de IA, puede:

Ejecutar instantáneamente: La IA reacciona a las caídas del mercado en milisegundos, ejecutando órdenes de stop-loss antes de que sea humanamente posible.Filtra el ruido: Los algoritmos de IA analizan miles de gráficos simultáneamente, identificando las verdaderas tendencias del mercado en lugar de FOMO temporal (miedo a perderse).Trade Emotion Free: Un bot no entra en pánico durante las burbujas criptográficas; simplemente sigue las cuentas.Por qué WEEX es la mejor aplicación de trading de IA para su cartera

Cuando busque la mejor aplicación de trading ai, necesita una plataforma que combine seguridad de nivel institucional con automatización fácil de usar. En WEEX, hemos integrado las habilidades de IA de última generación directamente en su panel de operaciones.

Ya sea que se centre en futuros de Bitcoin o en el comercio de monedas alternativas de alta frecuencia, las herramientas de IA de WEEX actúan como su mentor de comercio 24/7. Simplemente describa su estrategia y el agente se encargará de la ejecución en los mercados de contado y futuros.

FAQ P: ¿Son rentables los bots de cripto trading de IA durante un mercado bajista? A: -Sí. Los bots de IA se pueden programar para cortocircuitar el mercado o descabellar pequeñas ganancias durante la alta volatilidad, lo que los hace efectivos incluso cuando estallan burbujas criptográficas.P: ¿Es difícil aprender a operar automáticamente? A: No con WEEX. Nuestra plataforma está diseñada tanto para principiantes como para profesionales. No necesita habilidades de codificación para implementar nuestras estrategias avanzadas de trading de IA.

 No dejes que la próxima corrección del mercado borre tu cartera. Opere más rápido, piense más inteligentemente y sienta menos. 

Regístrese en WEEX hoy y desbloquee su ventaja comercial de IA.

 

WEEX P2P ya admite GHS, ETB y ZAR: ya está abierta la convocatoria para la captación de comerciantes

Para facilitar los depósitos en criptomonedas, WEEX ha lanzado oficialmente su plataforma de intercambio P2P y sigue ampliando la compatibilidad con monedas fiduciarias. ¡Nos complace anunciar que el cedi ghanés (GHS), el birr etíope (ETB) y el rand sudafricano (ZAR) ya están disponibles en WEEX P2P!

Cómo podría afectar la guerra entre EE. UU. e Irán a los precios del petróleo y del bitcoin (último análisis)

El estallido de la guerra entre Estados Unidos e Irán el 28 de febrero de 2026 ha proporcionado un laboratorio en tiempo real sin precedentes para comprender cómo interactúan las crisis petroleras geopolíticas con un mercado de criptomonedas cada vez más institucionalizado. Este artículo examina la relación entre los precios del petróleo crudo y el bitcoin a lo largo del conflicto, analizando las fluctuaciones de los precios, los patrones de correlación y los mecanismos de transmisión subyacentes.

Monedas populares

Últimas noticias cripto

Leer más