Изключително вредна за публичната среда и неясно колко полезна за корпоративните резултати практика тихомълком е започнал да прилага един от най-старите сайтове за технологични новини - CNET. Медията, която от близо 30 години е на пазара, трие стари свои статии в опит да подобри представянето си в търсачките. Така уникална информация с историческо значение изведнъж става изключително трудна за намиране.
Контекст: CNET стартира като телевизионна програма в САЩ през 1992 г., а порталът ѝ е онлайн от 1995 г. Не са много активните в момента сайтове, които могат да се похвалят с толкова дълга история.
Журналистите на CNET през годините са отразявали възхода на Глобалната мрежа, DotCom бума, появата на смартфоните и ред други събития, които са важни не само за света на технологиите.
От 2020 г. обаче CNET е в ръцете на инвестиционна компания, под чието влияние значително се промени съдържанието на сайта. Все по-важна част от него станаха публикациите, създадени единствено с цел да насочат читателите към продукти на партньори и така сайтът да получи комисионна при покупка.
В началото на тази година CNET се оказа в центъра на скандал, след като се оказа, че в него са качени огромно количество генерирани от изкуствен интелект статии, които са пълни с грешки и съществуват единствено с цел да привличат трафик от търсачките. Последваха оставки и съкращения.
Детайли: Липсващите стари статии бяха забелязани първо от Gizmodo. Процесът е започнал в малък мащаб, но се е ускорил драстично през втората половина на юли, когато са били премахнати хиляди публикации.
"Премахването на съдържание от нашия сайт не е решение, което сме взели лесно. Нашите екипи анализират данните, за да преценят дали има страници, които нямат смислена аудитория. Това е възприета в индустрията практика за големите сайтове като нашия, които разчитат предимно на привлечен чрез оптимизация (SEO) трафик. В един идеален свят, ние бихме оставили всичкото си съдържание за вечни времена. За съжаление, модерният интернет ни наказва за това", заяви пред медията маркетинг директорът на CNET Тейлър Кенъда.
Това, за което той говори, е SEO стратегията, позната като content pruning ("подрязване" на съдържанието). Според вътрешна кореспонденция на CNET, с която Gizmodo разполага, екипът на технологичния портал е на мнение, че "премахването на стария линк изпраща сигнал на Google, че CNET е свежо, релевантно и ценно място, което си струва да се разположи по-високо от нашите конкуренти в резултатите при търсене".
От друга страна: Според много експерти, това е ненужно радикално решение. Онлайн изданието Search Engine Land отбелязва, че макар Google преди повече от 12 години да са съветвали "страниците с ниско качество" да се премахват, никога онлайн гигантът не е призовавал нещо да се премахва само защото е онлайн от много време.
Преди два дни самите Google подчертаха в социалните мрежи, че не е вярно, че търсачката им "не харесва" старо съдържание.
Are you deleting content from your site because you somehow believe Google doesn't like "old" content? That's not a thing! Our guidance doesn't encourage this. Older content can still be helpful, too. Learn more about creating helpful content: https://t.co/NaRQqb1SQx
— Google SearchLiaison (@searchliaison) August 8, 2023
Не е изолиран случай: Разтърсваният от скандали CNET със сигурност не е единствената жертва на SEO "гурутата" - просто е първият толкова голям. Колкото и да не ни се иска, през 2023 г. можем да кажем категорично, че не е вярно твърдението, че "всичко онлайн е вечно".
Ценни медийни ресурси изчезват от интернет по множество други причини. В рамките на две десетилетия системите за управление на съдържанието и сървърите, на които се намира то се сменят понякога по една дузина пъти. Всяка една миграция крие риск от частични или пълни загуби - предизвикваме ви да си пуснете видео на повече от 15 години от сайта на произволна българска телевизия. Най-вероятно няма да успеете. По същият начин стои и въпросът със снимките при почти всички по-стари новинарски сайтове у нас.
Понякога това е в резултат на най-обикновена некомпетентност, но в други случаи смяната на собственик/редакционна политика/геополитическа ориентация върви в комплект с изчезването на архива от предходната "епоха". Това у нас е видимо със сайтовете на поне два национални всекидневника - при единия днес не си личи някога да е писал нещо хубаво за един конкретен български политик, а при другия - да е писал нещо лошо за същия.
За съжаление, най-разпространена обаче е ситуацията, в която просто медията фалира или идва нов собственик, който затваря сайта и цялото съдържание от него изчезва. Така един голям български телеком с лека ръка заличи огромна част от историята на българския интернет преди години, след като затвори портала hit.bg.
Какво може да се направи: От CNET бързат да подчертаят, че запазват локално копие от всяка изтрита статия и освен това изпращат нейна версия към проекта Internet Archive. Ако не сте го разглеждали, препоръчваме да му отделите от времето си.
Дигиталната библиотека на активиста Брюстър Кейл събира в себе си огромно количество артефакти от миналото на интернет и, което в случая е важно, е дом на т.нар "машина на времето" - The Wayback Machine. Тя обикаля мрежата и архивира копия на сайтовете от 1996 г. до днес. Когато потърсите даден сайт, получавате достъп до историческите му версии по часове, дни, месеци и години.
Ако попаднете на "мъртъв" линк в мрежата, има голям шанс да го намерите именно в Internet Archive.
Разбира се, като всеки проект на доброволни начала, и тук не всичко е идеално:
- Мултимедийните елементи обикновено не се запазват;
- Поради технически причини някои страници не са част от архивните копия;
- Няма лесен начин да търсите конкретна публикация - трябва да знаете нейната дата или точен адрес;
- Въпросът с авторските права върху архивираното съдържание е най-меко казано спорен.