"Щом е в интернет, значи е завинаги" е известен принцип, доказван многократно през годините с помощта на стари срамни снимки, ученически съчинения и всякакво друго потенциално позорно съдържание, което упорито вирее в Глобалната мрежа. Оказва се, обаче, че докато една (най-неподходяща) част от информацията в уеб е "безсмъртна", то в пъти повече е тази, която неусетно сме загубили завинаги.

Над една трета от страниците, съществували през 2013 г., днес ги няма, става ясно от мащабно проучване на изследователския център Pew. Не само това, но даже за само две години са изчезнали около 20% от онлайн съдържанието.

Google губи най-новата интернет война и от това ще пострадаме всички

Google губи най-новата интернет война и от това ще пострадаме всички

Не цялото AI съдържание е спам, но цялото спам съдържание е AI

Авторите на изследването са проследили развитието на интернет чрез сравняване на извадки от масива Common Crawl. Към момента 25% от съществувалите някога през целия период 2013-2023 г. страници ги няма. От тях 9% са били на сайтове, които са прекратили съществуването си, докато други 16% са на домейни, които иначе остават достъпни и в момента.

Ако сравняваме с най-старата извадка - от 2013 г., 38% от страниците не са достъпни.

От Pew посочват, че над 20 на сто от правителствените уеб страници по света съдържат по поне един "счупен" линк. Най-лошо е положението в порталите на местната власт.

При новинарските сайтове процентът на недостъпните страници е по-висок, като няма големи различия между най-четените и по-непопулярните портали.

Специфичният случай на Twitter

От Pew са анализирали и публикации от X/Twitter. Микроблогинг мрежата се оказва едно от местата, в които информацията е най-ефимерна.

Само за периода 8 март - 27 април 2023 г. са били събрани близо 5 млн. публикации, като в края на периода 18% от събраните в началото постове вече ги е нямало. Това засяга близо половината публикации на турски и арабски език.

Twitter се е "обезценил" с близо 72% в ръцете на Мъск

Twitter се е "обезценил" с близо 72% в ръцете на Мъск

Инвеститорите нямат вяра в социалната мрежа

В повечето случаи и профилите, от които са били направени, са минали в поверителен режим или са били баннати или изтрити.

Това може да е показателно за мащабите на роботизирания спам в платформата на Илон Мъск.

Голяма червена лампа

Оцеляването на информацията в онлайн пространството е сериозен проблем, с който се е срещал всеки, който е опитвал да намери източници на по-специфична тематика.

Академичните институции често променят своята дигитална инфраструктура без оглед на това какво преди 20 години е качвал на някой подлежащ днес на бракуване сървър даден отдавна напуснал служител или дипломирал се студент. Хостинг компаниите се появяват и след това затварят врати - а даже и да продължават бизнеса си, те бързо прочистват акаунтите, за които не е платено.

Защо хиляди ценни статии изчезват от интернет и какво можем да направим

Защо хиляди ценни статии изчезват от интернет и какво можем да направим

CNET трие съдържание от зората на Глобалната мрежа, за да се класира по-напред в Google

Медийните сайтове си патят от недомислени миграции на съдържанието и SEO оптимизации, но и от промени в редакционната политика, които изискват "скъсване" с миналото (два от малкото останали български всекидневници са добър пример - опитайте да намерите техни материали от 2013 г...).

Една огромна част от "стария" интернет потъна в забвение след отпадането на Flash като уеб технология. Така хиляди богато анимирани и интерактивни сайтове изчезнаха заедно с цялото си съдържание. При тях това е напълно неспасяемо - за статичните сайтове съществува проектът Internet Archive на Брюстър Кейл, като неговите системи архивират Мрежата от 1996 г. до наши дни.

Проблемът са нестандартните технологии - като Flash в миналото и динамичните социални мрежи днес. Платформите са все по-затворени, което обрича на най-лошото всичко, което сме създали в тях.