Суббота, 14.12.2024, 22:43 На www.hinam.ucoz.ru Вы сможете найти все для создания и раскрутки сайта.
Главная Регистрация Вход
Приветствую Вас, Гость · RSS

Меню сайта
Категории раздела
про банеры [2]
Поисковые машины [12]
Язык поисковых машин
Оптимизация, раскрутка и реклама [46]
WEB мастеру - на заметку [24]
Разное [21]
про товары и услуги [32]
самое популярное
CyberBoard 1.1 для раскрутки сайтов
Коды ошибок и их расшифровка при работе с Windows
Значение тега DOCTYPE
JavaScript за 24 часа для чайников
Наш опрос
Была ли найдена интересующая вас информация

Всего ответов: 245
 Каталог статей
Главная » Статьи » Поисковые машины

Как работают механизмы поиска.
Средства поиска и структурирования, иногда называемые поисковыми механизмами, используются для того, чтобы помочь людям найти информацию, в которой они нуждаются. Средства поиска типа агентов, пауков, кроулеров и роботов используются для сбора информации о документах, находящихся в Сети Интернет. Это специальные программы, которые занимаются поиском страниц в Сети, извлекают гипертекстовые ссылки на этих страницах и автоматически индексируют информацию, которую они находят для построения базы данных. Каждый поисковый механизм имеет собственный набор правил, определяющих, как собирать документы. Некоторые следуют за каждой ссылкой на каждой найденной странице и затем, в свою очередь, исследуют каждую ссылку на каждой из новых страниц, и так далее. Некоторые игнорируют ссылки, которые ведут к графическим и звуковым файлам, файлам мультипликации; другие игнорируют ссылки к ресурсам типа баз данных WAIS; другие проинструктированы, что нужно просматривать прежде всего наиболее популярные страницы.
Агенты - самые "интеллектуальные" из поисковых средств. Они могут делать больше, чем просто искать: они могут выполнять даже транзакции от Вашего имени. Уже сейчас они могут искать сайты специфической тематики и возвращать списки сайтов, отсортированных по их посещаемости. Агенты могут обрабатывать содержание документов, находить и индексировать другие виды ресурсов, не только страницы. Они могут также быть
запрограммированы для извлечения информации из уже существующих баз данных. Независимо от информации, которую агенты индексируют, они передают ее обратно базе данных поискового механизма. Общий поиск информации в Сети осуществляют программы, известные как пауки. Пауки сообщают о содержании найденного документа, индексируют его и извлекают итоговую информацию. Также они просматривают заголовки, некоторые ссылки и посылают проиндексированную информацию базе данных поискового механизма.
Кроулеры просматривают заголовки и возвращают только первую ссылку. Роботы могут быть запрограммированы так, чтобы переходить по различным cсылкам различной глубины вложенности, выполнять индексацию и даже проверять ссылки в документе. Из-за их природы они могут застревать в циклах, поэтому, проходя по ссылкам, им нужны значительные ресурсы Сети. Однако, имеются методы, предназначенные для того, чтобы запретить роботам поиск по сайтам, владельцы которых не желают, чтобы они были про-индексированы.
Агенты извлекают и индексируют различные виды информации. Некоторые, напри-мер, индексируют каждое отдельное слово во встречающемся документе, в то время как другие индексируют только наиболее важных 100 слов в каждом, индексируют размер документа и число слов в нем, название, заголовки и подзаголовки и так далее. Вид построенного индекса определяет, какой поиск может быть сделан поисковым механизмом и как
полученная информация будет интерпретирована. Агенты могут также перемещаться по Интернет и находить информацию, после чего помещать ее в базу данных поискового механизма. Администраторы поисковых систем могут определить, какие сайты или типы сайтов агенты должны посетить и проиндексировать. Проиндексированная информация отсылается базе данных поискового механизма так же, как было описано выше.
Люди могут помещать информацию прямо в индекс, заполняя особую форму для того раздела, в который они хотели бы поместить свою информацию. Эти данные передаются базе данных.
Когда кто-либо хочет найти информацию, доступную в Интернет, он посещает страницу поисковой системы и заполняет форму, детализирующую информацию, которая ему необходима. Здесь могут использоваться ключевые слова, даты и другие критерии. Критерии в форме поиска должны соответствовать критериям, используемым агентами при индексации информации, которую они нашли при перемещении по Сети.
База данных отыскивает предмет запроса, основанный на информации, указанной в за-полненной форме, и выводит соответствующие документы, подготовленные базой дан-ных. Чтобы определить порядок, в котором список документов будет показан, база дан-ных применяет алгоритм ранжирования. В идеальном случае, документы, наиболее реле-вантные пользовательскому запросу будут помещены первыми в списке. Различные поис-ковые системы используют различные алгоритмы ранжирования, однако основные прин-ципы определения релевантности следующие:
1.Количество слов запроса в текстовом содержимом документа (т.е. в html-коде).
2.Тэги, в которых эти слова располагаются.
3.Местоположение искомых слов в документе.
4.Удельный вес слов, относительно которых определяется релевантность, в общем количестве слов документа. Эти принципы применяются всеми поисковыми сис-темами. А представленные ниже используются некоторыми, но достаточно из-вестными (вроде AltaVista, HotBot).
5.Время - как долго страница находится в базе поискового сервера. Поначалу кажется, что это довольно бессмысленный принцип. Но, если задуматься, как много существует в Интернете сайтов, которые живут максимум месяц! Если же сайт существует довольно долго, это означает, что владелец весьма опытен в данной теме и пользователю больше подойдет сайт, который пару лет вещает миру о правилах поведения за столом, чем тот, который появился неделю назад с этой же темой.
6.Индекс цитируемости - как много ссылок на данную страницу ведет с других страниц, зарегистрированных в базе поисковика.

База данных выводит ранжированный подобным образом список документов с HTML и возвращает его человеку, сделавшему запрос. Различные поисковые механизмы также выбирают различные способы показа полученного списка - некоторые показывают только ссылки; другие выводят ссылки с первыми несколькими предложениями, содер-жащимися в документе или заголовок документа вместе с ссылкой.
Когда Вы щелкаете на ссылке к одному из документов, который вас интересует, этот документ запрашивается у того сервера, на котором он находится.


Три новых продукта для iOS от IK Multimedia: iRig MIX, iRig STOMP, iRig Mic Cast.
LG 3D Max

печать баннеров


Категория: Поисковые машины | Добавил: hinam (21.04.2007)
Просмотров: 1714 | Рейтинг: 3.0/1 |
Всего комментариев: 0
Добавлять комментарии могут только зарегистрированные пользователи.
[ Регистрация | Вход ]
Хостинг от uCoz www.hinam.ucoz.ru - все для создания и раскрутки сайта.
Форма входа
новые регистрации
  • Надя
  • subge
  • kirakoglo
  • marinakarelina90
  • от авторитета
    Free Monitor for Google
    Banner Maker Pro v6.0.7
    Advanced Mass Sender v4.3...
    TheBat! v3.99.3 Professio...
    Наша кнопка
    Разместите, пожалуйста у себя на сайте нашу кнопочку. После этого сообщите нам на @mail и мы добавим ваш сайт в наш каталог ссылок. Спасибо