15 октября 2008, 11:54

Opera создаст поисковик для изучения структуры веб-страниц

Компания Opera Software приступила к созданию поисковой системы, которая позволит изучать структуру веб-страниц во всемирной сети. После своего официального выхода через несколько месяцев, система должна позволить разработчикам браузеров и комитетам по стандартизации совместно создавать более совместимый и соответствующий стандартам интернета.

Поисковая системы MAMA (Metadata Analysis and Mining Application) является детищем инженеров компании и позволяет индексировать разметку, стиль, использование скриптов и других технологий, использованных при создании веб-страниц, пишет CyberSecurity.

Поисковая система MAMA проверяет 3.5 миллиона веб-страниц и результаты проверки позволяют ответить на такие вопросы, как “могу ли я найти все страницы, содержащие не менее 100 ссылок?” или “из чего состоит среднестатистическая веб-страница?” — мечты веб-разработчиков начинают осуществляться.

“Современная всемирная сеть состоит из множества технологических решений, при этом ещё и постоянно развивается. Обширная база данных MAMA предоставляет подробную информацию о том, как и в каком объёме веб-технологии используются разработчиками сети,” сказал Снорре М. Гримсби, вице-президент отдела по контролю качества компании Opera Software. "Для нас качество, совместимость и стабильность наших программных продуктов является основной задачей, и мы хотим поделиться своим опытом со всеми, кому данные знания могут оказаться полезными."

Создаваемая система позволит разработчикам веб-страниц находить примеры использования различных решений и функций, видеть основные тенденции развития сети и получать информацию, способную помочь при работе со своими клиентами и менеджерами. Также данная технология позволит комитетам по стандартизации более точно оценивать те или иные предложения от разработчиков и в конечном счёте сделает Веб более качественным и пригодным к более тесному взаимодействию браузеров.

MAMA также поможет с ответами на такие вопросы, как "сколько веб-сайтов используют CSS (каскадные таблицы стилей)?" (80,4% по данным MAMA), или "сколько ошибок в среднем приходится на каждую веб-страницу?" (47 ошибок), или “сколько символов используется в среднем на веб-страницах?” (16,400), или даже более специфичный "какая страна наиболее активно использует технологию XMLHttpRequest, наиболее важный компонент AJAX?" (Норвегия, набравшая 10,2% по данным MAMA).

MAMA поможет ответить на вопросы, на которые трудно найти ответы, например, "сколько сайтов адаптировано для просмотра с мобильных устройств?" или "насколько распространён Веб-2.0?". Определение страниц, соответствующих термину "Веб-2.0", может содержать множество критериев оценки, включая использование микроформатов, RSS, JSON (JavaScript Object Notation), AJAX и другие. MAMA готова предоставить развёрнутые ответы на вопросы, не имеющие простых ответов.

Как рассказали в пресс-службе компании Opera Software, MAMA является развивающимся проектом, поэтому со временем спектр получаемых с помощью данной поисковой системы данных будет расширяться. Это позволит отслеживать современные тенденции Веб и поможет разработчикам найти реальные образцы  настоящего искусства веб-дизайна для изучения и использования в качестве образца.

 

Оцените новость:
  • 3 оценки