Сервисы

10 инструментов для поиска удалённой страницы или сайта

Просмотр удаленных страниц

Вся информация, которая загружается в интернет, остаётся в нём навсегда. Сайты и станицы могут удаляться, однако это вовсе не означает, что данные с них не удастся получить. Для такой манипуляции существует множество общедоступных способов нахождения удалённых страниц.

Поисковые системы

Поисковые системы автоматически копируют все данные веб‑страниц, помещая их в кеш — отдельное облачное хранилище. Во время обновления данных, которое происходит достаточно часто, система полностью перезаписывает сведения, заменяя их свежими. Данные, отображаемые в кеше, редко являются копией последней версии сайта, однако часто они достаточно актуальны. Пользователь сможет просмотреть удалённую страницу только в случае, если он посещал её ранее и она не была удалена из кеша.

Кеш Google

Кеш Google

Google сохраняет текстовые данные всех страниц, чтобы в случае недоступности ресурса пользователи могли их просмотреть. Просмотр страницы из кеша возможен следующими способами:

  1. Найти в браузере ссылку на искомую страницу, используя ключевые слова. После необходимо кликнуть на стрелку, расположенную возле результата поиска, и из меню выбрать пункт «Сохранённая копия».
  2. Ввести в браузерную строку http://webcache.googleusercontent.com/search?q=cache:…, заменив многоточие адресом искомой страницы.

Кеш Яндекса

Кеш Yandex

До кеша Яндекса не получиться добраться, используя прямую ссылку. Для получения данных необходимо ввести адрес требуемой страницы либо ключевые слова в поисковую строку, после чего выбрать из меню ссылки нужного результата пункт «Сохранённая копия». Этот способ будет особенно удобен, если результат, полученный в Google, оказался неудовлетворительным, поскольку данные в кешах поисковиков отличаются.

Кеш Baidu

Baidu – это китайский поисковик, который проводит сохранение кеша значительно реже, чем остальные. Это означает, что в его хранилище может быть сохранена версия сайта, которая недоступна на других ресурсах. Это полезно, когда при поиске удалённых страниц в кеше Google сохранённой оказывается версия, доступ к которой был закрыт. Поэтому использование различных браузеров иногда помогает найти требуемые данные. Переход в кеш Baidu осуществляется аналогичным образом.

Автономный режим браузера

В автономном режиме можно просмотреть удалённые станицы, которые были сохранены в кеше на дисковом пространстве компьютера. Включить его в браузерах можно следующим образом:

  1. Google Chrome. Перейти на страницу chrome://flags/, найти функцию «Автономный режим кеша» и активировать её.
  2. Firefox. Открыть меню браузера, выбрать пункт «Разработка» и кликнуть на «Работать автономно».
  3. Opera. Нажать на кнопку «Opera», выбрать в меню «Настройки» и кликнуть на «Работать автономно».
  4. Internet Explorer. Вызвать меню кнопкой Alt, выбрать пункт «Файл» и кликнуть на «Автономный режим».

Архивные сервисы

Подобных сервисов существует достаточно много, и в них хранятся дубликаты веб‑страниц, сохранённые в разное время. Это позволяет отследить изменение содержимого многих ресурсов. При этом создание новых копий в архивных сервисах проводится гораздо реже, чем в поисковых системах, поэтому содержащаяся в них информация часто оказывается устаревшей.

Для проверки наличия дублей станицы в таких архивах необходимо зайти на их сайт, указать в текстовом поле URL требуемой страницы и запустить поиск.

Wayback Machine

Wayback Machine, иначе именуемый Web Archive, представляет собой часть проекта Internet Archive. В этом архиве хранятся копии изображений, веб‑страниц, видеофайлов, книг и прочего контента, который был опубликован в открытых источниках в самое разное время (с начала 90-х годов). Сервис и проект в целом призван сохранить цифровое культурное наследие.

WebCite

Это архивный сервис, специализирующийся на сохранении публицистических и научных статей. Его удобно использовать для поиска первоисточников, которые были удалены.

Другие инструменты

Существует целый ряд сервисов и плагинов, позволяющих искать старые дубликаты страниц в различных источниках.

CachedView

Этот сервис осуществляет поиск копий требуемой страницы в базах данных Coral Cache, Wayback Machine и в кеше Google. Источник можно выбрать. Аналогичным образом работает сервис CachedPage.

Archive.is

Этот ресурс позволяет пользователю сохранить любую необходимую веб-страницу. На сайте предусмотрен глобальный поиск, охватывающий все версии страниц, которые были сохранены всеми пользователями сервиса.

Web Archives

Это плагин, доступный для поисковиков Firefox и Chrome. Он осуществляет поиск копии страницы, которая открыта в браузере, в базах Google, Wayback Machine, Arhive.Today и иных сервисов. Поиск можно выполнять либо только в одном из них, либо одновременно во всех.

Скачивание с сервера

Не самый надёжный, но иногда действенный способ. Для его реализации необходимо перейти на сайт whoishostingthis.com, чтобы узнать адрес сервера, на котором находится либо находился сайт. После следует открыть терминал и, используя команду curl, скачать требуемую страницу.