webew
Войти » Регистрация
 
MySQL/MariaDB

Поиск по сайту

7 июня 2008, 9:20
Автор: bur
Разносторонний контент сайта хранится в MySQL DB. Хочется сделать грамотный поиск:
- не тормозной;
- с морфологией;
- с функцией Did You Mean.
Что можете посоветовать? Есть ли в MySQL возможность поиска по кириллице с учетом морфологии?

Как относитесь к решению поставленной задачи с помощью Яндекс.XML.
Добавить комментарий
NO USERPIC

rgbeast

В MySQL есть FULLTEXT index, но это нулевое приближение, русским он не владеет. Чтобы построить поиск нужно
- иметь функцию, приводящую слово к основной форме
- индексировать документы, в базе хранить таблицу (номер документа, номер слова)

Это будет не тормозной поиск с морфологией, но без функции Did You Mean, пример можно посмотреть в 7-ом номере PHP Inside. Функцию Did You Mean следует реализовать отдельно в зависимости от потребности - можно просто искать похожие слова в словаре, а можно использовать специальные тезаурусы (например, наберите handheld в поиске на hp.com).

Яндекс.XML полезная вещь, которая хороша всем, кроме пары недостатков:
- ищет только документы, проиндексированные Яндексом (что дает задержку минимум в несколько дней)
- не использует дополнительные знания о сайте и предметной области, специфичные для данного сайта (в частности, не отличает различные типы и назначение размещенных на сайте документов - например, не отличает описание товара, обзор и новость)
07.06.2008, 21:07
Ответить

bur

Спасибо!
А что думаешь о Яндекс.Server? Получится его научить различным типам данных?
09.06.2008, 14:45
Ответить
NO USERPIC

rgbeast

Не использовал, но судя по описанию основное его отличие в возможности управлять индексацией. Кроме того, в списке возможностей http://company.yandex.ru/technology/products/Yandex-Server/features.xml есть следующие:
- неограниченное число зон индексирования в рамках коллекции документов
- структурирование результатов поиска по категориям найденных документов

Интересно, можно ли в Яндекс.сервер загрузить свой словарь синонимов.

Кстати, недавно появилась возможность и большому Яндексу указывать относительную важность документов, см. http://webew.ru/posts/536.webew Карта сайта правда задает лишь относительную важность и не может задать различия в природе документов.
10.06.2008, 09:00
Ответить
© 2008—2024 webew.ru, связаться: x собака webew.ru
Сайт использует Flede и соответствует стандартам WAI-WCAG 1.0 на уровне A.
Rambler's Top100

Реклама: