Carácter efímero de la información en Internet

Manuel Calvo Hernando
The same post in English

Empezaré con una anécdota personal:

  • A finales de los años ochenta del siglo pasado me hice socio de la Asociación Española de Periodismo Científico, que había creado a principios de los años setenta el famoso divulgador científico Manuel Calvo Hernando, cuyos artículos en el Diario Ya venía yo siguiendo desde los años sesenta. Por entonces yo escribía numerosos artículos de divulgación que me publicó el periódico La Vanguardia, por lo que Calvo Hernando me recibió en la Asociación con alborozo.
  • A caballo entre los dos siglos, esta asociación cambió de nombre y pasó a llamarse Asociación Española de Comunicación Científica (AECC), con lo que sus siglas pasaron a ser las mismas que las de la Asociación Española Contra el Cáncer. Por esta razón, dichas siglas han sido cambiadas recientemente a AEC2.
  • En mayo de 2008 empecé a colaborar con el blog de la AECC, que estaba organizando el profesor de periodismo Juan Carlos Nieto. Desde entonces, hasta junio de 2019, publiqué en dicho blog un total de 121 artículos de divulgación (un artículo al mes), varios de los cuales consiguieron, durante una década, mantenerse en los primeros lugares entre los artículos más visitados del blog.
  • En las discusiones subsiguientes a su publicación, algunos de mis artículos provocaron los debates más largos y apasionados, y con mayor número de comentarios de la historia del blog. Como consecuencia de una de esas discusiones, asociada a uno de mis artículos, que trataba sobre el aborto provocado, alguno de los miembros de la junta directiva intentó que se me expulsara de la Asociación. No lo consiguió, porque el presidente de entonces (Antonio Calvo Roy, hijo del fundador) se opuso a ello, aunque sí se me envió un mensaje oficial en el que se me ordenaba dar por terminada la discusión sobre ese artículo.
  • En abril de 2020, después de treinta años de participación bastante activa, decidí darme de baja en la AEC2. Inmediatamente, todos los artículos que yo había escrito en ese blog desaparecieron, junto con todos los comentarios asociados. No quedó huella. Afortunadamente, casi todos habían sido publicados antes o después en mi propio blog, por lo que todavía es posible encontrarlos. Mi web contiene una lista de todos los artículos publicados en ambos blogs, y aunque los enlaces a mis artículos en el blog de la AEC2 están rotos, he decidido dejarlos, para que quede constancia histórica de que fueron publicados, y cuándo.

Que la información de la Web Wide Web es efímera es algo bien sabido. A veces, la desaparición de algunos documentos se debe a razones de peso, como una posible transgresión de los derechos de autor. Esto ha ocurrido varias veces con artículos científicos, especialmente algunos más o menos famosos, que diversas universidades hicieron públicos, pero después tuvieron que retirarlos, porque protestaron las revistas en las que originalmente aparecieron dichos artículos, pues pretenden seguir vendiendo copias electrónicas de los mismos, aunque haga ya muchas décadas desde su publicación. También ocurre a veces que una web ha sido atacada y se ha perdido información. O que la web ha desaparecido.

Al principio, durante los primeros años de este siglo, en muchos libros aparecían enlaces de Internet, normalmente en notas al pie. Después, como muchos de esos enlaces dejaban de funcionar después de algún tiempo, se puso de moda añadir la siguiente aclaración:

Enlace comprobado el xx/xx/20xx.

Con lo que se quiere indicar que no se garantiza que dicho enlace siga funcionando en fecha posterior a la especificada.

Debido a esto, quizá sería mejor no poner direcciones de Internet en los libros publicados en papel, o enlaces de hipertexto en publicaciones electrónicas, pues es muy probable que no funcionen. A veces es posible encontrar en otra dirección el documento concreto que se busca (como en el caso de mis artículos en el blog de la AEC2), pero suele ser más conveniente utilizar un buen buscador para localizarlo.

Otra cifra que se da con frecuencia es el flujo mundial de datos por Internet, que ha venido creciendo desmesuradamente desde el principio. Así, en el primer párrafo del documento Economía del dato e inteligencia artificial del Ministerio de Asuntos Económicos y Transformación Digital, fechado en noviembre de 2020, se lee esto:

El volumen de datos generado en el mundo en 2018 se calcula en 33 zettabytes y se estima que será de 175 zettabytes en 2025.

donde un zettabyte es igual a 1021 bytes.  Pero ese es el volumen total de datos generados e intercambiados. Cada transacción que se realiza, cuenta. Cada vez que alguien visita una página web, el flujo de datos se cuenta. Sin embargo, la mayor parte de esos datos no los guarda nadie, se transfieren, se leen y se pierden, son efímeros. No sé si este valor es muy útil, salvo para estimar el gasto total de energía en Internet, que también se puede deducir de otras maneras. En el caso paralelo del sistema nervioso humano, no he visto que nadie se haya molestado en calcular cuántas descargas nerviosas se producen por unidad de tiempo, ni sé si dicho dato, si constara, serviría para algo.

Otra cuestión diferente es cuántos datos hay almacenados en la WWW. En 2021 había 1880 millones de sitios webs. De ahí se podría deducir la información total, estimando estadísticamente la que hay en cada web. Hace una década, iba por el exabyte (1018 bytes). Hoy se habla de un zettabyte (1021 bytes). Por otra parte, de todas esas webs, casi un 90% están inactivas (las cifras varían según quien las da), o sea, que la información real disponible no es tan grande.

Hilo Temático sobre Inteligencia Natural y Artificial: Anterior Siguiente

Manuel Alfonseca

Agradezco a Felipe Gómez-Pallete, que me proporcionó el enlace al documento del Ministerio

Este es mi artículo número 400 en este blog


10 comentarios:

  1. Manuel, a mí me interesa particularmente una estimación del consumo energético de internet. Si conoces alguna forma de estimarlo, o fuente donde ya lo hayan hecho, creo que es una información útil (y seguramente preocupante). Habría que ponerlo en relación con el consumo energético global humano. Y no sé si de ahí se puede estimar de alguna manera cuánto consumimos al enviar un mensaje de correo electrónico, por ejemplo. Gracias.

    ResponderEliminar
  2. Y yo te agradezco a ti, Manuel, tu ayuda en el libro "Que los árboles no te impidan ver el bosque. Caminos de la inteligencia artificial" (Editorial Círculo Rojo, 2022), p. 36: https://ccdemocraticas.net/

    ResponderEliminar
  3. Bueno... afortunadamente hay un sitio llamado archive.org en el que se archivan muchos sitios de internet -es la real hemeroteca de internert- He probado al azar con un artículo suyo con el enlace roto de AECC, y ¡bingo! ¡Allí estaba! https://web.archive.org/web/20180702122430/https://aecomunicacioncientifica.org/la-fisica-ciencia-o-literatura/
    Quizá pueda cambiar esos enlace por estos otros... pero es un trabajo, porque muchas veces hay que ir enlace a enlace y averiguar qué día achive.org guardó tal página. Lo bueno es que archivo.org decidiese guardar ese dominio... no lo hace con todos ¡ni micho menos!
    Un saludo
    Javier Lóez

    ResponderEliminar
    Respuestas
    1. Gracias. He podido recuperar dos de los más leídos, incluido el que tuvo más comentarios. En efecto, parece que hay que buscarlos uno a uno, por lo que los iré recuperando poco a poco.

      Eliminar
  4. En este video se dice que, de acuerdo a los trabajos del premio Nobel de física 2022, la realidad no existe. ¿Qué opina Ud. don Manuel?

    https://youtu.be/Ayl3ak9lx3I

    ResponderEliminar
    Respuestas
    1. No dice que "la realidad no existe", sino que "la realidad no es como crees". Se refiere a la teoría cuántica y sus implicaciones, como la paradoja EPR y el teorema de Bell. Bell, que debería haber recibido el Premio Nobel de Física este año, murió en 1990. Hablé de esto en este artículo: La desigualdad de Bell y la causalidad y volveré a hablar de esto en el artículo de la semana que viene.

      Eliminar
  5. Bueno, una pena que el blog sobre la conciencia no permite comentarios. He programado robots con emociones en 1984 y creo que si es posible programar robots concientes hoy. No lo hare, porque creo que no es etico, lo que no significa que otros no lo haran. Ser conciente no necesita ser el ser o la especie mas lista del mundo. Ni es necesario para un robot, ni para un animal. Solo se necesita tener claro que es conciencia y creo que esto ya es claro.

    ResponderEliminar
    Respuestas
    1. Se equivoca. Lo que usted llama "programar robots con emociones" no es tal cosa. Es hacer programas que simulan emociones, cuyo objetivo no es hacer máquinas con emociones, sino engañar a los seres humanos haciéndoles creer que esas máquinas tienen emociones, lo que es mucho más fácil que hacer máquinas con emociones.

      Y lo que dice después es totalmente falso. No se han programado robots conscientes hoy, ni estamos cerca de conseguirlo. Y no tenemos claro lo que es la consciencia. De hecho, no sabemos lo que es la consciencia.

      Eliminar