Date: Tue, 5 Feb 2002 22:55:53 +0300
From: Alex Tutubalin <lexa@lexa.ru>
To: apache-talk@lists.lexa.ru
Subject: [apache-talk] Re: [apache-talk] правильное поведение поисковика по сайту
> > транзакции - т.е. пока все изменения не произошли для собственно поисковика
> > индекс остается старым, либо же делать отдельную транзакцию для каждого
> > документа ?
>
> А смысл? Зачем делать документ транзакцией - понятно.
Был бы смысл - я бы не спрашивал :)
То-есть смысл преследуется простой - если документ изменился, то это
ведет к delete from index; insert into index (update в этом месте
неприменим) т.е. в некоторый момент документа в индексе просто нет,
а это плохо.
Вторая причина - если коммитить реже, то это быстрее работает.
> > с lexa.ru скоро будет удален, равно как и Yandex.Site с apache.lexa.ru :)
>
> А что - fts так крут? Я на него посмотрел, мне стало интересно,
> но не настолько чтобы делать его альтернативным по отношению к многосерчу
> движком.
FTS - понимаем (по меньшей мере мной т.к. я присутствовал при создании
первых версий) - и это достаточная причина.
Ну и по мелочи - хранится координатная информация (позиция слова в док-те)
- что позволяет, лучше сортировать результаты или сделать свой сортировщик,
используются R-деревья, которые на много порядков быстрее если в запросе
несколько слов.
Алексей Тутубалин
mailto: lexa@lexa.ru
= Apache-Talk@lists.lexa.ru mailing list =
Mail "unsubscribe apache-talk" to majordomo@lists.lexa.ru if you want to quit.
= Archive avaliable at http://www.lexa.ru/apache-talk =