Ваши рефералы :: Турнирная таблица конкурса рефоводов
+ Ответить в теме
Страница 1 из 5 1 2 3 4 5 ПоследняяПоследняя
Показано с 1 по 10 из 46

Тема: Поисковая Система Яндекс

  1. #1
    Студент Аватар для Andreyy21
    Уровень репутации: 27
    Регистрация: 27.05.2010
    Адрес: Воронеж
    Сообщений: 148
    Спасибо: 2
    Поблагодарили 15 раз(а) в 14 сообщениях
    Файловый архив:
    Скачиваний: 1
    Закачек: 0

    Поисковая Система Яндекс

    Яндекс

    Адрес: ГСП-1, 117333, Россия, Москва, ул. Вавилова, дом 40
    URL: http://www.yandex.ru/
    URL (текстовая версия): http://www.ya.ru/
    URL для добавления сайта: http://webmaster.yandex.ru/

    Описание

    История компании «Яндекс» восходит к 1990 году, когда в компании «Аркадия», возглавляемой Аркадием Борковским и Аркадием Воложем, начались разработки поискового программного обеспечения. Сайт «Яndex» появился в Интернете в 1996 году, после того как руководством CompTek и разработчиками системы было принято решение о дальнейшем развитии поисковых технологий, ориентированных на широкую аудиторию пользователей Интернета.

    За два года работ были созданы две информационно-поисковые системы — Международная Классификация Изобретений, 4 и 5 редакция, а также Классификатор Товаров и Услуг. И до сих пор, особенно по весне, в CompTek обращаются изобретатели-одиночки в надежде на появление новых редакций. Обе системы работали под DOS и позволяли проводить поиск, выбирая слова из заданного словаря, с использованием стандартных логических операторов.

    В 1993 году «Аркадия» стала подразделением CompTek. 1993–1994 годы в результате его сотрудничества с лабораторией Ю. Д. Апресяна (Институт Проблем Передачи Информации РАН) программные технологии были существенно усовершенствованы. В частности, словарь, обеспечивающий поиск с учетом морфологии русского языка, занимал всего 300Кб, то есть целиком грузился в оперативную память и работал очень быстро. С этого момента пользователь мог задавать в запросе любые формы слов.

    На основе новой технологии в 1994 году был создан «Библейский компьютерный справочник» (информационно-поисковая система, обеспечивающая работу с Синодальным переводом Ветхого и Нового Заветов).

    В 1995 году стартовал проект «Академическое издание классиков на CD ROM», разрабатываемый совместно с НТЦ «Информрегистр» и ИМЛИ им. М.Горького РАН при поддержке Роскоминформа. Для этого проекта была создана универсальная технология «Аргонавт», которая включала как средства разметки и отображения текстов, так и средства навигации, а так же различные поиски — и текстовые, и атрибутные. На основе этой технологии вышло 3 издания – справочник стандартов «Информ – Норматив», электронное научное издание «А.С. Грибоедов» и «Пушкин. Электронный фонд русской классической литературы». Также был создан словарь языка Грибоедова.

    В начале 1996 года был разработан алгоритм построения гипотез. Отныне морфологический разбор перестал быть привязан к словарю — если какого-либо слова в словаре нет, то находятся наиболее похожие на него словарные слова и по ним строится модель словоизменения.

    Летом 1996 года руководство CompTek и разработчики поисковой системы пришли к выводу, что развитие самой технологии важнее и интереснее, чем создание прикладных продуктов на базе поиска. Исследования рынка показали своевременность и большие перспективы поисковых технологий. Тогда в Интернете и появился «Яndex».

    Слово «Яndex» придумал за несколько лет до этого один из основных и старейших разработчиков поискового механизма. «Яndex» означает «Языковой index», или, если по-английски, «Yandex» — «Yet Another indexer». За 4 года публичного существования Яndex возникли и другие толкования. Например, если в слове «Index» перевести с английского первую букву («I» — «Я»), получится «Яndex».

    На выставке Netcom'96, 18 октября 1996 года, CompTek анонсировал первые продукты серии Яndex (Яndex.Site, Яndex.Dict). Яndex.Site — поиск по своему сайту — сейчас установлен на сотнях серверов Рунета. Яndex.Dict, морфологическое расширение запроса, используется до сих пор для, например, передачи запроса на AltaVista, хотя сегодня это уже не так актуально — AltaVista индексирует русский Интернет гораздо хуже, чем русские поисковые машины.

    Через полгода появился Яndex.CD — поиск документов на CD ROM, а затем Яndex.Lib — полнофункциональная библиотека Яndex для встраивания в различные приложения и базы данных.

    Еще через полгода стало очевидно, что ничто не отделяет CompTek от создания собственной глобальной поисковой машины. Объем Рунета составлял тогда всего несколько гигабайт. Осенью 1997 года был открыт Yandex.Ru. Необходимость поддерживать работу Yandex.Ru в условиях больших объемов (200 Гб текстов) и больших нагрузок (несколько запросов в секунду) ведет к оптимизации алгоритмов, которые потом используются и в других продуктах Яndex.

    Официально поисковая машина Yandex.Ru была анонсирована 23 сентября 1997 года на выставке Softool. Основными отличительными чертами Yandex.Ru на тот момент были проверка уникальности документов (исключение копий в разных кодировках), а также ключевые свойства поискового ядра Яndex, а именно: учет морфологии русского языка (в том числе и поиск по точной словоформе), поиск с учетом расстояния (в том числе в пределах абзаца, точное словосочетание), и тщательно разработанный алгоритм оценки релевантности (соответствия ответа запросу), учитывающий не только количество слов запроса, найденных в тексте, но и "контрастность" слова (его относительную частоту для данного документа), расстояние между словами, и положение слова в документе.

    Чуть позже в разделе «Сказки» (наблюдения за содержанием русского Интернета) появилась первая сказка Рунета — «Web – гуманизм или чернуха?». А в разделе «Числа» — первая оценка объема Рунета, 5 тысяч серверов и 4Гб текстов.
    Через два месяца, в ноябре 1997 года, был реализован естественно-языковый запрос. Отныне к Yandex.Ru можно обращаться просто «по-русски», задавать длинные запросы, например: «где купить компьютер», «генетически модифицированные продукты» или «коды международной телефонной связи» и получать точные ответы. Средняя длина запроса в Yandex.Ru сейчас — 2,7 слова. В 1997 году она составляла 1,2 слова, тогда пользователи поисковых машин были приучены к телеграфному стилю.

    В 1998 году на Yandex.Ru появилась возможность «найти похожий документ», список найденных серверов, поиск в заданном диапазоне дат и сортировка результатов поиска по времени последнего изменения. За этот год «объем» Русского Интернета удвоился, что привело к необходимости оптимизации поисковых механизмов. И тогда, и сейчас (при объеме в 200 Гб) скорость поиска на Yandex.Ru — доли секунды.

    За 1999 год Рунет вырос на порядок, как в объемах текстов, так и в количестве пользователей. Это был год бурного развития и для Yandex.Ru. Новый поисковый робот позволил оптимизировать и ускорить обход сайтов Рунета. Сегодня поисковая база Yandex.Ru вдвое больше, чем у ближайших конкурентов.

    Новый робот позволил предоставить пользователям новые возможности – поиск по разным зонам текста (заголовкам, ссылкам, аннотациям, адресам, подписям к картинкам), ограничение поиска на группу сайтов, поиск по ссылкам и изображениям, а также выделять документы на русском языке. Появился поиск в категориях каталога и впервые в Рунете было введено понятие «индекс цитирования» — количество ресурсов, ссылающихся на данный.

    В течение всего года продолжалась работа по количественному и качественному анализу Рунета. Был открыт НИНИ-индекс (индекс «Непостоянства Интересов Населения Интернет»), показывающий динамику изменения интересов пользователей Интернета. Открылся поисковый Форум и новый сервис — подписка на запрос, то есть можно оставить свой запрос на Yandex.Ru и регулярно получать по электронной почте информацию о появлении новых и/или измененных документов, соответствующих этому запросу. К началу учебного года был открыт «Семейный Яndex», фильтрация результатов поиска от мата и порнографии.

    Особенности

    Имя поискового робота: Yandex/1.03.00х, где х - тип паука, в зависимости от типа индексации (первичная, полная).

    Русскоязычная поисковая система. На сегодняшний день имеет самую большую базу данных, которая имеет кластерную структуру и размещена на нескольких серверах.

    У Яндекса достаточно быстрый поисковый робот. Но это означает лишь то, что страница будет быстро поставлена в очередь на полную индексацию. После того, как страница проходит полную индексацию, она может пропасть из поисковых результатов, если поисковый робот сочтет ее за спам, либо из-за каких-нибудь технических проблем. Т.е. если ваша станица после первичной индексации вышла на первые места по тому или иному запросу, то после полной индексации, возможно, она будет совсем на других позициях, вывод: положение страницы нужно отслеживать в течение нескольких дней, пока не пройдет полная индексация.

    Не нужно делать очень маленькие или очень большие документы. Яндекс любит документы средних размеров, насыщенные текстом (статьи и т.п.). Следует умеренно повторять ключевые слова. Ключевые слова можно писать в ALT описании, но вес слов в этом тэге ниже.

    Хорошо индексируются страницы созданные скриптами cgi, php. Это касается гостевых книг, форумов и т.п. Для индексации остальных (кроме главной) страниц сайта требуется примерно 2 недели.

    Если сайт на русском языке, а домен не в зоне .ru, то Яндекс все равно проиндексирует.

    Мета тэги keywords и description: ключевые слова в них особенно не помогают достигать хороших позиций. В мета тэгах нужно писать лишь те слова, которые встретятся в тексте страницы.

    Однако мета тег description, используется для выдачи описания страницы в результатах поиска. Это нужно учитывать при его составлении, т.к. это будет один из критериев, по которым пользователь решает приходить к вам, или нет.

    Мета тэги, такие как revisit-after, content - не поддерживаются.

    Учитываются: ключевые слова в: Title, заголовки (h1-h6), содержание страницы, ALT.

    В формулу вычисления релевантности включен Взвешенный Индекс Цитирования, аналог Page Rank в Google. Обычный Индекс Цитирования используется только при сортировке сайтов в каталоге Яндекса. Влияние на положение в результатах поиска оказывает вИЦ .

  2. #2
    Абитуриент Аватар для Дима
    Уровень репутации: 13
    Регистрация: 28.05.2010
    Сообщений: 29
    Спасибо: 4
    Поблагодарили 3 раз(а) в 3 сообщениях
    Файловый архив:
    Скачиваний: 0
    Закачек: 0
    В среду на yandex.com заработал поиск «Яндекса» по зарубежным сайтам. Кроме того, теперь, если ввести запрос на латинице на www.yandex.ru, то над результатами поиска появятся фильтры: «все», «в Рунете» и «в мировом Интернете». Фактически, решив выделить yandex.com в отдельный домен, компания бросила вызов Google в мировом масштабе.

  3. #3
    Студент
    Уровень репутации: 26
    Регистрация: 04.06.2010
    Адрес: Самара
    Сообщений: 121
    Записей в дневнике
    1
    Спасибо: 9
    Поблагодарили 16 раз(а) в 15 сообщениях
    Файловый архив:
    Скачиваний: 0
    Закачек: 1
    Яндекс бы сначала в СНГ доработал поиск, прежде чем соваться в буржунет.

    До google яндексу ой как далеко!
    Последний раз редактировалось yarikseo; 04.06.2010 в 11:57.

  4. #4
    Администратор Аватар для neadb1kvat
    Уровень репутации: 158
    Регистрация: 27.05.2010
    Адрес: RU
    Сообщений: 1,245
    Записей в дневнике
    13
    Спасибо: 49
    Поблагодарили 162 раз(а) в 127 сообщениях
    Файловый архив:
    Скачиваний: 5
    Закачек: 2
    google это уже не поисковик, это религия

  5. #5
    Студент
    Уровень репутации: 26
    Регистрация: 04.06.2010
    Адрес: Самара
    Сообщений: 121
    Записей в дневнике
    1
    Спасибо: 9
    Поблагодарили 16 раз(а) в 15 сообщениях
    Файловый архив:
    Скачиваний: 0
    Закачек: 1
    Точно
    даже если сравнить, сколько сервисов у яндекса и сколько их у google. Да бред мне кажется. Зачем людям, живущим в России и СНГ искать инфу за пределами рунета? Глупо, тем более для этого уже есть webalta, yahoo и google

  6. #6
    Администратор Аватар для WebTalking.ru
    Уровень репутации: 254
    Регистрация: 22.05.2010
    Сообщений: 12,551
    Записей в дневнике
    9
    Спасибо: 140
    Поблагодарили 262 раз(а) в 171 сообщениях
    Файловый архив:
    Скачиваний: 24
    Закачек: 4
    Цитата Сообщение от yarikseo Посмотреть сообщение
    Точно
    даже если сравнить, сколько сервисов у яндекса и сколько их у google. Да бред мне кажется. Зачем людям, живущим в России и СНГ искать инфу за пределами рунета? Глупо, тем более для этого уже есть webalta, yahoo и google
    Ну не скажите! У Яндекса есть все шансы - во-первых "намберуаны", как правило, всегда "расслабляются", во-вторых - у Яндекса есть ноу-хау, которыми не располагает Google. В-третьих, сервисы гугла не на столько интуитивно-понятны и юзабильны, как сервисы Яши. Так что, можно совершенно спокойно смотреть и наблюдать битву титанов Яндекс vs Google на просторах буржунета )

  7. #7
    Студент
    Уровень репутации: 26
    Регистрация: 04.06.2010
    Адрес: Самара
    Сообщений: 121
    Записей в дневнике
    1
    Спасибо: 9
    Поблагодарили 16 раз(а) в 15 сообщениях
    Файловый архив:
    Скачиваний: 0
    Закачек: 1
    у Яндекса есть ноу-хау, которыми не располагает Google
    Можно догадаюсь - это апдейты по определенным датам! Несомненно это фишка!

    Да, было бы интересно посмотреть на это!

  8. #8
    Администратор Аватар для WebTalking.ru
    Уровень репутации: 254
    Регистрация: 22.05.2010
    Сообщений: 12,551
    Записей в дневнике
    9
    Спасибо: 140
    Поблагодарили 262 раз(а) в 171 сообщениях
    Файловый архив:
    Скачиваний: 24
    Закачек: 4
    Цитата Сообщение от yarikseo Посмотреть сообщение
    Можно догадаюсь - это апдейты по определенным датам! Несомненно это фишка!

    Да, было бы интересно посмотреть на это!
    И недостатки тоже Но, поверьте, шансы есть и очень неплохие ))) Недостатки Яндекса можно отнести к "углу зрения на РуНет (в частности)". Что-то нам может нравится, а что-то мы не воспринимаем на уровне "нервных окончаний", но одно надо признать - Яндекс - это система с уникальной ценной парадигмой.

  9. #9
    Студент
    Уровень репутации: 26
    Регистрация: 04.06.2010
    Адрес: Самара
    Сообщений: 121
    Записей в дневнике
    1
    Спасибо: 9
    Поблагодарили 16 раз(а) в 15 сообщениях
    Файловый архив:
    Скачиваний: 0
    Закачек: 1
    Это точно

    насчет интуитивности сервисов, мне кажется весь google заточен под более образованную аудиторию, в плане интернета..
    у меня многие знакомые до сих пор не знаю про google talk, хотя если понять его суть, он намного удобнее любы клиентов icq и др протоколов. ну это отступление

  10. #10
    Администратор Аватар для neadb1kvat
    Уровень репутации: 158
    Регистрация: 27.05.2010
    Адрес: RU
    Сообщений: 1,245
    Записей в дневнике
    13
    Спасибо: 49
    Поблагодарили 162 раз(а) в 127 сообщениях
    Файловый архив:
    Скачиваний: 5
    Закачек: 2
    О чём можно говорить? Гугл - это разработка буржунета, Яндекс - рунета. Логично, что интуитивно RU категория пользователей будет склонятся к своему языку. Сервисы написанные для рунета будут пользоваться большей популярностью. Любая адаптация проходит более болезненно, чем прямой контакт. Оговорка* Я имел ввиду в большинстве своём, конечно, обычных пользователей, а не вебмастеров, программеров, манимейкеров и т.д.

+ Ответить в теме
Страница 1 из 5 1 2 3 4 5 ПоследняяПоследняя


Похожие темы

  1. Поисковая Система Rambler
    от Andreyy21 в разделе Поисковые системы
    Ответов: 38
    Последнее сообщение: 28.08.2017, 07:45
  2. Поисковая Система Google
    от Andreyy21 в разделе Google
    Ответов: 22
    Последнее сообщение: 07.10.2013, 16:32
  3. Поисковая Система Апорт
    от Andreyy21 в разделе Поисковые системы
    Ответов: 13
    Последнее сообщение: 23.03.2012, 23:51
  4. Поисковая Система Яндекс
    от Andreyy21 в разделе Поисковые системы
    Ответов: 30
    Последнее сообщение: 14.07.2010, 20:11
  5. Поисковая Система Google
    от Andreyy21 в разделе Поисковые системы
    Ответов: 13
    Последнее сообщение: 08.07.2010, 00:30

Метки этой темы

Ваши права

  • Вы не можете создавать новые темы
  • Вы не можете отвечать в темах
  • Вы не можете прикреплять вложения
  • Вы не можете редактировать свои сообщения
Счетчик цитирования