Сохранить копию сайта в веб архив Internet archive Wayback Machine

Сохранить копию сайта в веб архив Internet archive Wayback Machine

В интернете существует очень интересный и полезный проект — веб архив, полностью - Internet archive Wayback Machine. 

В веб архиве, расположенным по адресу: http://archive.org/web/, сохраняется прошлое сайтов в виде полноценных и работающих страниц, со всеми ссылками, изображениями, видео. В общем можно увидеть, какой был сайт в прошлом на дату формирования копии.

Боты архив-машины самостоятельно сканируют сайты и формируют их копии, каков их алгоритм — не известно. Поэтому в архиве можно найти много копий своего сайта со всеми страницами или всего одну, да и то искажённую.

Предположить, в каком виде загрузится и отобразится тот или иной сайт — невозможно. Но как правило, машина периодически сохраняет полноценные копии всего сайта и даже может выдать страницы, которых у вас не было никогда.

Если вы не хотите отдавать судьбу своего сайта в руки ботов ресурса, то можно самостоятельно занести страницу в архив, и в случае непредвиденных случайностей, найти и восстановить её.

Как увидеть архив своего сайта

Откройте Internet archive и в строке поиска введите адрес сайта, далее нажмите «browse history»

 Сохранить копию сайта в веб архив Internet archive Wayback Machine

Здесь будет показано, сколько копий, в каком году и в каком месяце сохранено в архиве.

Выбрав дату и нажав на эти кнопки, можно увидеть копию сайта на тот момент времени. 

Сохранить, увидеть копию сайта в Internet archive Wayback Machine

Как занести сайт в архив

Для этого откройте главную страницу Internet archive Wayback Machine: http:// archive.org/web/.

Далее в рубрике  Save Page Now введите адрес архивируемой страницы и нажмите «SAVE PAGE». Через несколько секунд копия буде сохранена.

Как запретить архивировать мой сайт

Что за дело, кто без моего спроса меня сосчитал? Если вы так думаете, то можно запретить веб-машине сохранять копии вашего сайта

Для этого в файле robots.txt нужно прописать запрещающую директиву для ботов wayback machine.

User-agent: ia_archiver

 Disallow: /


Чтобы позволить архивировать сайт снова, уберите эти строки из файла robots.txt и лучше сразу добавьте главную станицу в архив. Иначе изменений можно дожидаться долго, обновления в системе происходят редко.

Оптимальное решение для развития интернет ресурсов. Зарегистрировать доменное имя на сайте услуг. Выбрать хостинг для магазина и персонального блога.

 ***

Как просмотреть позиции модулей Joomla 2.5

Как сделать резервную копию - бекап файлов сайта

Выделение перемещение и копирование

Заработать на бирже Gogetlinks размещая ссылки на сайте

 

Комментарии  

0 #1 diman 02.07.2016 09:09
Если в данной статье речь идет о сохранение сайта в вебархиве, то в этом комментарии я хочу рассказать о том как восстановить сайт из интересного сервиса архив брошенных сайтов http://sitedrop.info

Сейчас там около 1000 брошенных сайтов со свободными доменами. Итак:

1. Регистрируйтесь в архиве.
2. Пополняете счет на 20 рублей.
3. Выбираете понравившийся сайт.
4. Проверяете занятось домена.
5. Скачиваете архив.
6. Регистрируете домен.

и вот у вас есть свой сайт.
Неправдали очень легко и просто!
Цитировать