La pelea por los datos acaba de subir de nivel. Hasta ahora, los modelos de IA se entrenaban con contenido sacado de internet sin que los creadores o editores pudieran hacer gran cosa. Con el nuevo estándar Really Simple Licensing (RSL) eso podría cambiar: ahora los medios y plataformas pueden poner sus propias reglas y cobrar a las empresas de IA por el uso de sus textos, imágenes o artículos.
Grandes nombres como Reddit, Yahoo o Medium ya han dicho que se unen al movimiento. Y la cosa parece que va en serio.
¿Qué es RSL (Really Simple Licensing)?
RSL es un nuevo estándar de licencias pensado para el mundo de la inteligencia artificial. Su objetivo es simple: que los creadores y editores puedan decidir cómo se usa su contenido en el entrenamiento de modelos de IA y, sobre todo, bajo qué condiciones económicas.
Hasta ahora, la única defensa que teníamos era el clásico robots.txt para bloquear rastreadores. El problema es que eso solo servía para impedir, no para negociar. Con RSL, el juego cambia: puedes permitir el acceso, pero definiendo desde el principio qué tipo de uso es válido y cuánto cuesta.
¿Cómo funciona RSL en la práctica?
RSL introduce una capa de metadatos y licencias que los bots de IA deberían respetar. La idea es que cada web pueda publicar sus condiciones directamente en el robots.txt o en cabeceras HTTP.
Algunos ejemplos de licencias posibles:
- Suscripción mensual → una empresa de IA paga por acceso continuado a todo el contenido de un sitio.
- Pago por rastreo (crawl) → cada vez que un bot recopila datos, genera un coste.
- Pago por inferencia → si un modelo de IA usa ese contenido para dar una respuesta, hay royalties.
¿Por qué es importante para creadores de contenido y medios de comunicación?
Esto es lo guapo:
- Más poder de negociación. Los creadores dejan de estar en manos de los gigantes de IA.
- Recuperar valor perdido. Si antes los modelos se llevaban contenido gratis, ahora hay un marco para pedir compensación.
- Nuevo modelo de negocio. Esto puede abrir la puerta a ingresos adicionales para medios grandes y pequeños.
En un ecosistema donde Google y OpenAI ya han cerrado acuerdos millonarios con medios, RSL busca democratizar esas reglas y que no dependas de un contrato privado para proteger tu contenido.
¿Cuáles son los problemas de RSL?
Pues… no es tan simple:
- Base legal débil. Poner condiciones en un
robots.txt
no tiene tanta fuerza legal si un bot decide ignorarlo.
(Si quieres saber más sobre robots.txt, mira esta guía) - Adopción desigual. Para que funcione, tanto los sitios como las empresas de IA tienen que aceptarlo.
- Riesgo de fragmentación. Si algunos usan RSL y otros inventan sus propios estándares, la movida no funciona.
En resumen: es un buen comienzo, pero no es la solución definitiva.
Conclusión
Un cambio de reglas en la guerra IA vs creadores: RSL todavía está arrancando, pero el movimiento ya tiene peso porque lo apoyan grandes plataformas como Reddit o Medium. Si gana tracción, podría cambiar la relación de poder entre creadores y las empresas de IA que entrenan con sus datos.
¿Será suficiente? Nadie lo sabe. Pero lo que está claro es que estamos pasando de un “los bots hacen lo que quieren” a un “si quieres mi contenido, hablamos de condiciones”. Y eso, para el futuro de la web, ya es un paso enorme.