Журнал Компьютерра -758   ::   Компьютерра

Страница: 60 из 143





• Поддержка 233 форматовдокументов. Из новых - OneNote, Visio, сообщения QIP, электронные книги пятнадцати

форматов.

• Поддерживаются шрифты (TTF и даже старый добрый CHR от Borland).

• Появился просмотр

графических изображений в самом Архивариусе 3000. Сейчас 52 штуки. Правда, у Adobe Flash (swf) пока только текст

извлекает для поиска, то есть саму анимацию еще не показывает. Но обычные форматы изображений воспроизводит, причем

напрямую и, следовательно, быстро.

• Научился обрабатывать всякие UUEncode, BinHex и прочие кодированные файлы,

которые могут находиться внутри другого текста.

• Набор мелких фильтров, предваряющих индексирование. Эти фильтры

лишь меняют текст для самого Архивариуса 3000, то есть физические файлы не меняются. Есть фильтры, которые убирают

вещественные числа (удобно для текстов со статистическими данными), удаляют пустые строки, заменяют старые Фидо-символы

с латинской "H"на русскую "Н", удаляют теги из текстов от Лексикона.

• Фильтр удаления

рекламы из почтовых сообщений (естественно, само физическое сообщение остается таким же, просто перед индексированием

текст рекламы удаляется, поэтому в индекс он не попадает). Реклама вроде "Do You Yahoo?!", которая вставляется

некоторыми почтовыми серверами в конец письма.

• Средство "Извлечение данных".

|< Пред. 58 59 60 61 62 След. >|

Java книги

Контакты: [email protected]