Після майже 30 років кропіткої роботи ця некомерційна організація зберегла свою трильйонну вебсторінку. Цей момент став визначальною віхою у зусиллях із порятунку цифрових ресурсів, особливо в епоху, коли інтернет став невід’ємною частиною життя, але водночас залишається вкрай нестабільним середовищем.
Читайте также: Anthropic звинувачує китайські компанії в масовій крадіжці можливостей Claude
Цифровий контент за своєю природою є ефемерним: він існує лише доти, доки хтось готовий підтримувати роботу серверів. Показовим прикладом став випадок із соцмережею MySpace у 2019 році, коли через помилку під час міграції даних за одну ніч зникло близько 50 мільйонів пісень, завантажених у період з 2003 по 2015 рік. Інтернет-архів працює саме для того, щоб запобігати подібним катастрофам.
Починаючи з 1996 року, організація створює «постійний запис еволюції інтернету». За допомогою спеціальних вебсканерів та зусиль волонтерів уже збережено понад 866 мільярдів сторінок, 41 мільйон текстів та мільйони інших медіафайлів. Щодня до архіву додається близько 500 мільйонів нових сайтів, що генерує величезний потік даних обсягом приблизно 100 000 терабайт. Для порівняння, таку кількість інформації могли б вмістити 50 000 найпотужніших сучасних смартфонів.
Читайте также: Битва за ресурси у льодовиковий період. Давні мисливці, що жили на території Польщі, вживали в їжу мозок ворогів
Попри свою незамінність для журналістів та науковців, проект стикається з новим тиском. Розвиток штучного інтелекту змусив великі медіакомпанії, такі як The New York Times та The Guardian, обмежувати доступ до свого контенту, щоб захистити авторські права від систем навчання нейромереж. Це створює додаткові труднощі для збереження найбільш крихкої інформаційної екосистеми в історії людства. Фахівці сподіваються, що сторони зможуть знайти компроміс, який дозволить цифровій бібліотеці функціонувати і надалі, зафіксувавши у майбутньому вже двотрильйонний випадок збереження даних.
Читайте также: Що приховує волосся. Новий біомаркер хвороби Паркінсона знайшли у структурі пасма
