10 сентября 2008, 9:28

Новая инициатива Google: газетный архив онлайн

Google сообщает о новой инициативе - на сей раз компания намерена разместить в интернете тысячи оцифрованных снимков старых газет и журналов. В компании отмечают, что все печатные издания, которые планируется отсканировать и разместить в сети, были выпущены еще до эпохи расцвета интернета.

В компании говорят о подписании партнерских соглашений с примерно сотней западных издательств на сканирование и публикацию их архива. По условиям соглашения, Google будет сканировать старые издания полностью, без каких-либо сокращений и вырезок, отмечает CyberSecurity.

"Это огромный объем контента. Мы приводим его в качественно новый формат", - говорит вице-президент Google Марисса Меер.

О новой инициативе компании было объявлено на бизнес-конференции TechCrunch50, ориентированной на начинающий бизнес. Здесь собираются представители стартапов с одной стороны и инвесторы с другой.

По словам Меер, работа по оцифровке газет уже началась и на конференции были показаны снимки из газеты Rome News Tribune, где публиковалась статья о высадке американских астронавтов на Луну. "Можно отследить, как тот или иной момент или событие освещались различными изданиями, кроме того, при изучении таких материалов прекрасно ощущается дух того времени", - говорит она.

Для работы с архивами Google создала несколько модифицированный поисковый алгоритм, который оптимизирован для поиска по заголовкам, авторам и изданиям. Кроме того, алгоритм при нахождении требуемого материала работает таким образом, что в боковом окне отражаются схожие статьи из других газет.

Меер рассказала, что для "газетного проекта" используется алгоритм, схожий с тем, что был применен при работе проекта Google Books.

Напомним, что ранее Google заключила соглашения с наиболее крупными американскими изданиями - New York Times и Washington Post. Однако теперь список издателей был расширен и в него также вошли европейские газеты.

"Такой подход даст нам возможность находить более разнообразные материалы из крупных и небольших газет", - пишет в блоге менеджер Google Панит Сони. "Эта инициатива только что стартовала, мы постоянно подключаем все новых и новых издателей. Наша конечная цель заключается в создании цифрового архива с несколькими миллиардами страниц".

Для того, чтобы как-то заинтересовать газетчиков поделиться своими архивами, Google будет размещать в проекте рекламу, часть прибыли с которой будет получать то или иное издание.

На сегодня самая старая газета, присутствующая в архиве, относится к газете Quebec Chronicle-Telegraph и датирована 1764 годом. Российская тематика в западных СМИ обсуждается также довольно активно. Например, одна из наиболее старых записей, касающаяся России, датирована 1903 годом и относится к реформам министра Керенского. Статья была написана 1 ноября 1903 года в Петрограде корреспондентом NY Times.

Оцените новость:
  • 3 оценки