Журнал Компьютерра -758   ::   Компьютерра

Страница: 61 из 143

Позволяет из уже

проиндексированных текстов извлекать e-mail, веб-адреса, смайлики (включая азиатские, у них они, оказывается, другие,

вот, например: *_*, слева и справа глаза, а черточка - это нос, то есть у них они не на боку лежат, а прямо стоят. Вот

где проявляется отличие между Востоком и Западом :), ISBN от книг, телефонов и прочее.

10. Средство

"Контексты употребления слов". Допустим, мы хотим узнать, в каких фразах у нас используется слово

"язык". Для этого вводим запрос:

* язык

и программа показывает фразы из

проиндексированных текстов: русский язык, английский язык и т. п. То есть если при обычном поиске мы заранее знаем,

какие слова ищем, то при поиске контекстов мы узнаем, какие слова у нас встречаются возле заданного слова или фразы.

Можно вводить и более сложные запросы:

*ый *ать *

Например, для LibRu программа по

этому запросу выдала такие варианты:

который двадцать лет



способный превращать в



готовый сделать

все

• В настройках индекса есть секция "Разбиение файлов". Это пригодится прежде всего тем

пользователям, у которых много Фидо-сообщений, сохраненных в одном объемном файле. Задаем строку разбиения, и Архивариус

3000 сначала разделяет большой текст на части, а затем уже индексирует как отдельные сообщения. В результате работа с

такими базами сообщений значительно упрощается.

• Средство "Поиск похожих документов".

|< Пред. 59 60 61 62 63 След. >|

Java книги

Контакты: [email protected]