Sindicador de canales de noticias
Consortium selected to supply driverless suburban trains for København
LLMs.txt es como el robots.txt pero para que los modelos de IA puedan leer cualquier web sin dramas
LLMs.txt es, según indica la propia página que lo define, «como el robots.txt de los sistemas de IA». Dicen sus creadores que a día de hoy las más grandes empresas del ramo, como OpenAI, Anthropic, Google, Apple y Perplexity, ya lo respetan. Minipunto ahí para ellos. LLMs.txt surgió en 2023 y, tras un lento arranque, en enero de 2025 ya había más de 2.000 sitios web relevantes usándolo.
La explicación larga de la iniciativa lo define así:
El LLMs.txt es un formato de archivo estandarizado que permite a los propietarios de sitios web comunicar sus políticas de entrenamiento y uso de contenidos a los rastreadores de IA, a los modelos lingüísticos y a los motores de búsqueda basados en IA.En la práctica el LLMs.txt es un archivo de texto fácilmente legible también por humanos, que se supone que los robots y arañas (bots, spiders y a veces scrapers) leerán y respetarán antes de engullir todo el contenido de una web.
Al igual que en el robots.txt, en el LLMs.txt se pueden indicar zonas prohibidas («no leer»), si el contenido se puede usar para entrenamiento de los modelos, de forma comercial, si hay que citar la fuente, si se puede modificar el contenido, redistribuirlo o recolectar otros datos.
Pero, ¡ojo, cuidao! que nada de esto es obligatorio para los bots: es una recomendación, petición de cortesía y algo voluntario que pueden respetar (o no) quienes los lanzan libremente a la red.
El contenido del LLMs.txt incluye ciertas pistas para «ayudar» a los modelos: cuáles son las páginas más importantes (como el Acerca de, la página de Privacidad, Términos y Condiciones, las Noticias, Artículos y otra Documentación, por encima quizá de páginas intermedias o secundarias. Suena un poco a SEO, pero no es la idea. Simplemente es algo importante teniendo en cuenta que, según la organización, alrededor del 40% de las búsquedas en internet ya comienzan en herramientas conversacionales y los resúmenes automáticos aparecen en hasta el 60% de los resultados.
Una de las principales quejas de mucha gente ha sido que los LLMs han lanzado a sus bots a rastrear y deglutir toda la web sin criterio, aviso previo y sin el más mínimo cuidado, saturando en muchas ocasiones a pequeños servidores. Para evitarlo, el LLMs.txt incluye el campo Crawl‑delay: s, donde se puede indicar, en segundos, cuánto tiempo debería esperar el rastreador antes de solicitar otra página. Ojo de nuevo: que es una petición de cortesía, y no siempre se va a respetar, pero si alguien ve que su servidor cae arrodillado ante un bot de estos, tal vez definiendo un valor entre 1 y 5 segundos puede hacer que la cosa mejore.
A Enrique Dans, que es a través de quien llegué a esto, le parece una idea sensata y de bajo coste para guiar a los sistemas basados en IA hacia el contenido relevante, reduciendo el ruido, los errores de contexto y algunas malas atribuciones, especialmente en sitios grandes. Él ya tiene un LLMs.txt montado y nosotros haremos próximamente otro tanto, en cuanto tengamos un rato. Ya que hay mucho bot de IA por ahí suelto, mejor llevarse bien con ellos (alabado sea Roko).
(Vía Enrique Dans.)
Transit Tech Lab seeks proposals to enhance infrastructure management, modernise data and streamline workflows.
Ouigo explica que las cancelaciones se deben a su falta de trenes y pide perdón por las molestias ocasionadas
Entren en vigor les tarifes del transport públic per al 2026 amb la bonificació del 50% per a la T-usual i la T-jove
AllTranstek to acquire RAS Data Services assets
Three-phase Northern Powerhouse Rail strategy and Manchester – Birmingham studies announced
Rail sector welcomes Northern Powerhouse Rail ambition but calls for more clarity
Comment: A shot across the bows
Marmon Rail repair activities brought together under Transco Rail Services brand
eDreams incorpora la venta de billetes de trenes en su suscripción Prime
Urban transport industry news round-up
Development » Deprecations #2401 (stable)
Development » Ignored Test Scan #3098 (stable)
Development » SpotBugs #2865 (stable)
Del apagón técnico al silencio informativo: cómo ha sido la desconexión de Irán de Internet
90 millones de personas llevan más de 123 horas desconectadas completamente de Internet en Irán, un país con 91 millones de habitantes y tres veces el tamaño de España, que está sumido en un contexto de protestas, disturbios y represión masiva para mantener el control político. The Blackout es un informe publicado por Whisper Security acerca de cómo ha sido esa desconexión técnica de todo un país de Internet. Y no ha sido un fallo accidental, sino una desconexión coordinada y selectiva a nivel nacional.
Un país sin conectividad efectivaDesde el 8 de enero pasado, Irán lleva sufriendo uno de los apagones de internet más profundos y documentados hasta la fecha. Aunque el país ha seguido «técnicamente» conectado, la conectividad efectiva cayó a cerp, afectando a 11 redes principales: móviles, fijas, alojamiento… de forma simultánea.
El detonante técnico fue una «explosión» anómala del tráfico de control de internet. Las actualizaciones de enrutamiento del operador troncal pasaron de 1,2 millones a 5,6 millones en solo 24 horas, un aumento del 368%. Este fenómeno, conocido como route flapping, indica que los routers estaban perdiendo rutas de forma caótica e intentando recuperarlas. No fue un colapso en cascada ni nada «natural»: 10 de las 10 redes principales mostraron picos casi idénticos en la misma ventana de 3 horas: una orden centralizada.
El bloqueo no estaba sucediendo en el interior del país, sino también hacia el exterior. A nivel de censura, se pudieron documentar técnicas como la suplantación de DNS, la manipulación de cabeceras HTTP y el bloqueo selectivo de mensajería cifrada y de las VPN.
El golpe más contundente fue a nivel de protocolos: desapareció el IPv6 por completo a las 24 horas y en IPv4, la visibilidad global se redujo un 82%, pasando de 313 a solo 56 pares BGP, lo justo para mantener accesos críticos del propio Estado.
Una desconexión diseñada para silenciarEl apagón digital funcionó como herramienta técnica y política: una desconexión planificada y ejecutada para silenciar a toda la población mientras sus datos, literalmente, desaparecían de la red.
A día de hoy Irán sigue prácticamente desconectado de internet. La conectividad nacional se mantiene alrededor del 1% de los niveles habituales, lo que significa que la inmensa mayoría de ciudadanos no puede acceder a internet global, comunicarse con el exterior pero tampoco dentro del país.
En ciertos lugares algunos iraníes usan los satélites y la red de Starlink como tecnología alternativa para comunicarse. Pero el acceso a estos sistemas es muy limitado y las autoridades han intensificado sus esfuerzos para localizar, confiscar o interferir con estos equipos.
Lo único que las autoridades han permitido recientemente son llamadas internacionales a móviles, que tienen precios prohibitivos, pero el acceso completo a internet e incluso a los mensajes SMS sigue bloqueado en la mayor parte del país. La situación técnica es de un aislamiento casi total, con sólo una fracción mínima de conectividad para un selecto grupo de la población.
Actualización (14 de enero de 2026) – Según The New York Times, los que pueden conectarse a Starlink están recibiendo el servicio gratis, sin pagar. Una actividad arriesgada, porque el régimen iraní ha prohibido usar Starlink; conectarse conlleva pena de muerte, según un portavoz de la llamada Holistic Resilience.
_____
Foto: Center for Human Rights in Iran.





