Linkrot: che cos'è e perché è così importante per il futuro del giornalismo (e non solo)

Nel 2019 BuzzFeedNews ha scoperto e denunciato un mercato losco per la vendita di linkrot - un collegamento ipertestuale su un altro sito divenuto non più accessibile - del New York Times, della BBC, di Forbes, della CNN e di altri importanti siti di notizie, e ha raccontato il caso di un uomo che nel 2012 aveva pubblicato sul NYT un necrologio con un link che puntava ad un sito commemorativo. Il sito invitava i lettori a fare beneficenza in memoria del morto.

Ad un certo punto, dice Dean Sterling Jones, collaboratore di BFN, l’uomo ha smesso di pagare per il nome di dominio, e ciò ha permesso a esperti di SEO e marketing digitale di acquistarlo per rivenderlo a un’azienda che offriva hack sulla Marijuana, notizie e informazioni sulla Cannabis ricreativa e medica, e perfino ricette per tortini a base di erba e video da guardare quando si è sballati.

Il fenomeno dei linkrot è molto esteso. Jenny Halasz, esperta SEO su searchenginejournal.com, dice che i motivi del fenomeno sono riconducibili a quattro cause:

1) errori sul sito live a causa di pagine rimosse o spostate;
2) errori causati da vecchi collegamenti a pagine che non esistono più;
3) malformazione dei link dovuta a errori nella digitazione degli URL in un collegamento. Se guardi i log del server di un qualsiasi sito web, dice Halasz, vedrai tonnellate di questo tipo di errori;
4) Errori 404 sistemici, dovuto a un malfunzionamento della mappa XML del sito che incasina gli URL, oppure a qualcosa nel codice del sito che crea URL non validi che Google trova durante la scansione.


Il 21 maggio scorso, con un tweet, Jonathan Zittrain, Professore di diritto internet e diritto internazionale alla Harvard Law School e Professore di informatica alla Harvard School of Engineering and Applied Sciences, ha annunciato che, insieme al Digital Team del New York Times, ha compilato un elenco di 2,2 milioni di collegamenti ipertestuali (link) che dal sito dal NYT puntano verso siti esterni.

L’obiettivo della ricerca era scoprire quanti di questi link erano diventati dei linkrot.

Il problema, dice Zittrain, va oltre il giornalismo. In uno studio del 2014, ad esempio, abbiamo scoperto che quasi la metà di tutti i collegamenti ipertestuali nelle opinioni della Corte Suprema portavano a contenuti che erano scomparsi da internet.

Quando un host, intenzionalmente o meno, elimina il contenuto di un URL, i lettori trovano un sito Web non raggiungibile. Questo decadimento dei contenuti Web, spesso irreversibile, è comunemente noto come linkrot.

I ricercatori della Harvard Law School, sulla base di un set di dati forniti dal New York Times, hanno esaminato i collegamenti ipertestuali negli articoli del giornale a partire dal lancio del sito web del Times nel 1996 e fino alla metà del 2019.

Il sostanziale linkrot e la deriva dei contenuti che abbiamo trovato, dice Zittrain, riflettono le difficoltà intrinseche del collegamento a lungo termine a parti di un «volatile Web».

Abbiamo scoperto che, dice Zittrain, i 553.693 articoli da noi esaminati contenevano 2.283.445 collegamenti ipertestuali che puntavano a contenuti esterni a nytimes.com. Il 72% di questi erano link diretti, con un percorso a una pagina specifica, come example.com/article, che è dove abbiamo concentrato la nostra analisi.

Il 25% di questi deep link, dice Zittrain, erano completamente inaccessibili. Il Linkrot, dice, è diventato più comune nel tempo: il 6% dei link del 2018 era marcio, rispetto al 43% dei link del 2008 e al 72% dei link del 1998. Il 53% di tutti gli articoli che contenevano link profondi aveva almeno un link marcio (rotted).
Visto lo spostamento sul web di tutti i siti di informazione e di tutte le riviste scientifiche, o il deposito in archivi internet dei libri, in alcuni casi pubblicati solo in formato digitale, il problema dell’archiviazione e della citazione scientifica assume una nuova rilevanza.

È del tutto inutile perseverare nelle pratiche citazionistiche sviluppate per la carta, e ritenere che, una volta indicato il rimando corretto alla fonte, il proprio compito sia stato assolto. Bisogna ripensare i termini dell’archiviazione e il nostro rapporto alla storia. Tenendo a mente il motto di Rosenzweig: l’istante può salvarsi dalla potenza eternamente invecchiante del passato soltanto in quanto viene generato nuovo a ogni istante. Questo incessante rinnovamento del presente però è opera del futuro. Se vogliamo salvare quel bel mondo fatto di carta e pergamene, con tutte le sue pratiche da topo di biblioteca, non si può divinizzare il passato - il futuro ci rimacinerà comunque.

Secondo un’inchiesta dl CJR del 28 marzo 2019 (cjr.org) gli intervistati, spesso (e erroneamente), hanno identificato il backup digitale e l'archiviazione in Google Docs o nei sistemi di gestione dei contenuti, come sinonimi di archiviazione. Non sono la stessa cosa – dice Zittrain. Il backup si riferisce alla creazione di copie per il ripristino dei dati in caso di danni o perdite, mentre l'archiviazione si riferisce alla conservazione a lungo termine, garantendo che i record saranno ancora disponibili anche se le tecnologie di formattazione e distribuzione cambiano in futuro. La mera archiviazione o il salvataggio non garantiscono il corretto funzionamento dei rimandi delle citazioni.

Le soluzioni trovate sino ad adesso, per esempio archive.org, con la sua WayBackMachine, oppure il sistema implementato da Wikipedia per sostituire automaticamente i collegamenti marci con quelli di archiv web, sono apprezzabili, ma non sono sufficienti. E nemmeno il DOI (digital object identifier) sembra, per adesso, rispondere pienamente a questa esigenza, anche se può rappresentare un passo intermedio nella soluzione del problema.

In ogni caso bisogna stare in campana, altrimenti si rischia l'azzeramento della memoria, che non consiste in un lavaggio del cervello, perché il cervello, da solo, non ha la capacità di tenere il passato con la stessa persistenza della carta o del silicio.

Le più recenti da DelikatEssen

On Fire

"Bersagli legittimi". La Russia passa ufficialmente ad una nuova fase del conflitto

di Marinella Mondaini per l'AntiDiplomatico Adesso si fa sul serio, la Russia sta passando ad una nuova fase. A Mosca le indagini proseguono e poco fa le dichiarazioni del presidente Putin, del capo del...

F-16, "bersagli legittimi" e NATO. Cosa ha detto (veramente) Vladimir Putin

di Marinella Mondaini per l'AntiDiplomaticoIl presidente russo Vladimir Putin ha visitato il 344esimo Centro Statale Addestramento e Riqualificazione del personale dell'aviazione militare del Ministero...

Pepe Escobar - Il Collegamento Nuland - Budanov - Crocus

  di Pepe Escobar – Strategic Culture [Traduzione a cura di: Nora Hoppe]   Cominciamo con la possibile catena di eventi che potrebbe aver portato all'attacco terroristico sul Crocus....

Il "piano Draghi": ora sappiamo in cosa evolverà l'UE

di Giuseppe Masala per l'AntiDiplomatico Io credo che le prossime elezioni europee andrebbero inquadrate nel modo più corretto possibile. Provo a dare la mia interpretazione. 1 Si dà troppo...

Copyright L'Antiplomatico 2013 all rights reserved
L'AntiDiplomatico è una testata registrata in data 08/09/2015 presso il Tribunale civile di Roma al n° 162/2015 del registro di stampa