INTERNET ARCHIVE:
ЗААРХИВИРОВАННАЯ ВИРТУАЛЬНОСТЬ

Интернет Архив логотипВиртуальный мир — штука весьма сильно подверженная изменчивости.

В самом деле, вчера сайт выглядел так, сегодня у него поменялся дизайн, завтра – объем и количество страниц, а послезавтра он вообще прекратил свое существование. Вследствие тех или иных причин. Навсегда.

Обидно. Досадно. И очень жалко, что вот так легко, быстро и просто — даже путем банального форматирования или в результате поломки жесткого диска на сервере хостера можно лишиться частички виртуального мира. Порой очень важной для человечества.

Начальная идея создания компании со столь скромным и «неглобальным» именем как Internet Archive была не менее скромна в своей глобальности: нужно просто как следует взяться и всего-то навсего сохранить для потомков все(!) web-ресурсы Интернета. Ни больше, ни меньше.

Вот собственно чем, начиная с года своего основания, коим является 1996-й, и занимается Архив Интернета. Регулярно сохраняя в свои электронные анналы образы практически всех сайтов глобальной Сети. Регулярность сохранения зависит от известности (читай — авторитетности) и изменчивости ресурса.

Главная ценность сохранения сайтов в Internet Archive заключается в том, что сохраняются они не в виде «застывшей» простой растровой картинки, а в «живом» функциональном состоянии.

Более того, многие ссылки на другие сайты работают. При условии, что эти сайты также заархивированы. А это значит, что помимо возможности просто увидеть как выглядел сайт в то или иное время, можно по-настоящему вернуться в виртуальную реальность того времени.

Все это стало возможно еще в октябре 2001 года. Когда был запущен проект «виртуальной машины времени» под названием Wayback Machine, в разработке которого помимо специалистов самого Internet Archive принимали самое непосредственное участие инженеры компании Alexa.

На то время объем архива составлял 100 терабайт. А в его анналах хранилось более 10 миллиардов сайтов. Обновление архива проводилось раз в два месяца. И каждое очередное обновление приносило порядка 12 терабайт новой информации.

На сегодняшний день база архива содержит уже более 240 миллиардов web-страниц.

Виртуальный адрес этой виртуальной машины времени http://archive.org.

Для пользования этим сервисом нужно в окне «Web» в строку с «http://» ввести адрес искомого сайта и нажать кнопку «Take Me back»:

Окно WebЕсли сайт заархивирован в Internet Archive сразу откроется календарь со шкалой по годам и месяцами выбранного на этой шкале года, на котором синими кружками будут обозначены даты сохранения копий сайта:

Кроме того, здесь будет присутствовать информация о дате первого сохранения сайта в Интернет Архив (в данном случае официальный сайт компании Alexa — www.alexa.com впервые был заархивирован 30 мая 1997) и сколько с этого времени было создано его «архивчиков» (в данном случае — 2439).

При нажатии на синий кружок запустится сохраненная копия сайта.

А вот если сайт еще не удостоился чести быть увековеченным в Internet Archive, то появится такая заставка:

Wayback Machine - такого сайта в архиве нетКАК САЙТУ ПОПАСТЬ В INTERNET ARCHIVE ?

В отличие от многих web-ресурсов, предоставляющих те или иные web-услуги, для получения оных необходима регистрация на ресурсе или даже денежная оплата, у Internet Archive такого нет.

Как написано на самом официальном сайте Архива Интернета, есть только два способа «заархивироваться»:

Первый способ — наличие сайта-соискателя в мировом каталоге лучших сайтов Open Directory (он же каталог DMOZ), находящийся по адресу http://www.dmoz.org/. А для добавления сайта в его члены нужно посетить страницу http://dmoz.org/add.html, на которой приведен свод правил и инструкции, которым нужно следовать при подаче заявки на принятие сайта в DMOZ. Однако следует иметь в виду, что каталог DMOZ следит за качеством принимаемых в себя ресурсов посредством ручной модерации и попасть в него, мягко говоря, совсем не легко и не быстро. От подачи заявки до принятия сайта-соискателя в каталог может пойти несколько лет(!). Но при попадании сайта в этот каталог гарантируется чуть ли не его автоматическое попадание и в Интернет Архив. Это все хорошо, но сложно.

Поэтому гораздо более реалистичным представляется второй способ — просто иметь внешние ссылки на сайт-соискатель. Причем чем больше, тем лучше. Но каких-либо временных гарантий, а так же количественных (к примеру, есть 100 внешних ссылок на сайт — принимаем на архивацию) здесь так же нет.

В общем, нужно запастись терпением. Всесторонне развивать и продвигать ресурс. И в один прекрасный день он непременно попадет в Архив Интернета.

ЖЕЛЕЗНАЯ РЕАЛЬНОСТЬ INTERNET ARCHIVE

Internet Archive главный офисГлавный офис Internet Archive в настоящее время базируется в Сан-Франциско в здании бывшей христианской церкви.

Колонны которой наводят на мысли о незыблемости и вечности сохраняемой в архиве информации.

Internet Archive сервераВся заархивированная информация Internet Archive хранится на серверах в специальных помещениях с постоянно поддерживаемыми определенными температурными и влажностными режимами.

Но сервер ведь «железный» и вполне может сломаться. Поэтому, в целях дополнительной гарантии сохранности информации, она дублируется.

Так называемые «зеркала» архивных дата-центров расположены в Египте (Александрийская библиотека) и Голландии (Амстердам).

ЦИФРЫ СУХОЙ СТАТИСТИКИ INTERNET ARCHIVE

За один только проект по архивированию Интернета человечество было бы благодарно Брюстеру Кале.

Но он решил не останавливаться на архивировании только web-ресурсов, а замахнулся на глобальное объятие необъятного. И расширил границы архивации практически на все культурно-исторические ценности нашей цивилизации в эпоху развитых интернет-технологий.

Как гласит немного вольное изложение современного девиза Интернетного Архива: «Дайте нам немного времени, и мы заархивируем Вселенную!»

И теперь, помимо архивирования web-ресурсов, Internet Archive собирает в свои архивы электронные копии книг, графические материалы, аудио- и видеозаписи и программное обеспечение.

17 сентября 2009 года в рамках Internet Archive был запущен проект TV News Search & Borrow («ТВ-новости: ищи и качай»), благодаря которому стало возможно архивирование еще и телевизионных новостей. За время существования этого проекта заархивировано уже более 400 000 сюжетов телевизионных новостей.

Кроме этой информации базы Internet Archive содержат более 1 000 000 видеозаписей, около 1 500 000 аудиозаписей и более 100 000 концертов.

Internet Archive сканерПочти 4 000 000 единиц текстовой информации. Среди которых — 2 500 000 оцифрованных книг.

Ежедневно производится сканирование 1000 книг.

Если у читателя возникнет желание почитать книгу, напечатанную на бумаге, то в течение часа будет изготовлен ее бумажный вариант.

Официальный сайт архива может похвастаться посещаемостью 2 000 000 уникальных посетителей в день.

На постоянной основе в Internet Archive трудятся 150 сотрудников.

Партнерами Internet Archive в миссии архивирования являются более 200 государственных и частных организаций во всем мире: музеи, библиотеки, различные хранилища.

Таким образом сегодня Интернет Архив — это не только архив Интернета, но и сохраняемые для потомков в электронном виде аудио- и видеозаписи, теленовости, книги и графические материалы.

Практически все интеллектуальные и культурно-исторические ценности, созданные человечеством за всю свою историю.

ФИНАНСИРОВАНИЕ INTERNET ARCHIVE

25 октября 2012 года размер базы данных архива достиг колоссальной цифры 10 петабайт (1 петабайт равен миллиону гигабайт).

10 петабайт

Может, конечно, это и не столь внушительная цифра для современных хранилищ информации. Например, у Facebook объем только фото- и видеоконтента составляет более 100 петабайт.

Но в отличие от многих компаний, занимающихся сохранением информации, Internet Archive — некоммерческая организация. С самого первого дня своего основания.

И кроме того, что он обеспечивает долгосрочное хранение собранных материалов, еще и предоставляет бесплатный доступ к ним широкой публике.

К тому же еще с 2007 года Internet Archive имеет статус библиотеки.

И все это при достаточно скромном финансировании, поскольку Internet Archive функционирует только за счет финансовой поддержки меценатов.

Ведущие среди них:

компания Alexa Internet.Inc, что вполне естественно, поскольку эта компания собственно и создавалась для того, чтобы нести основное бремя по финансовому обеспечению Internet Archive,

фонд the Kahle/Austin Foundation, созданный Брюстером Кале и его женой, Мэри Остин, который в 2003 году принес для Internet Archive доход в размере 1 787 175 долларов,

а также фонды:
the Alfred P. Sloan Foundation,
the William and Flora Hewlett Foundation,
National Science Foundation,

принимают участие в поддержке Архива Интернета
Библиотека Конгресса США и Prelinger Archives,

оказывает поддержку многопрофильная компания LizardTech, которая с 1992 года занимается разработкой программных продуктов, в том числе для обработки аэро- и спутниковой фотосъемки.

ЗАБАВНО ОБ INTERNET ARCHIVE

Каждый сотрудник, проработавший в Internet Archive более трех лет, получает право «заархивироватся» в статую высотой примерно в половину роста взрослого человека.

Вот так, например, выглядит в «заархивированном» виде сам основатель Internet Archive Брюстер Кале:

Брюстер Кале статуя

Ваше мнение очень важно для меня!
Пожалуйста, оставьте комментарий!