Журнал Компьютерра -758 :: Компьютерра
Страница:
61 из 143
Позволяет из уже
проиндексированных текстов извлекать e-mail, веб-адреса, смайлики (включая азиатские, у них они, оказывается, другие,
вот, например: *_*, слева и справа глаза, а черточка - это нос, то есть у них они не на боку лежат, а прямо стоят. Вот
где проявляется отличие между Востоком и Западом :), ISBN от книг, телефонов и прочее.
10. Средство
"Контексты употребления слов". Допустим, мы хотим узнать, в каких фразах у нас используется слово
"язык". Для этого вводим запрос:
* язык
и программа показывает фразы из
проиндексированных текстов: русский язык, английский язык и т. п. То есть если при обычном поиске мы заранее знаем,
какие слова ищем, то при поиске контекстов мы узнаем, какие слова у нас встречаются возле заданного слова или фразы.
Можно вводить и более сложные запросы:
*ый *ать *
Например, для LibRu программа по
этому запросу выдала такие варианты:
который двадцать лет
способный превращать в
готовый сделать
все
• В настройках индекса есть секция "Разбиение файлов". Это пригодится прежде всего тем
пользователям, у которых много Фидо-сообщений, сохраненных в одном объемном файле. Задаем строку разбиения, и Архивариус
3000 сначала разделяет большой текст на части, а затем уже индексирует как отдельные сообщения. В результате работа с
такими базами сообщений значительно упрощается.
• Средство "Поиск похожих документов".
|< Пред. 59 60 61 62 63 След. >|