- Обработка и создание отчета похожести документов, уже находящихся в базе (выявление дублей)

Для определения дублей и ненужных похожих файлов в программе поиска SearchInform используется функция построения отчета анализа похожести. Притом эта операция занимает в десятки раз меньше времени, чем при обычном сравнении.
- Обработка и создание отчета похожести документов, уже находящихся в базе (выявление дублей)
Достаточно распространенное явление содержащиеся в информационной базе предприятия дублирующие друг друга текстовые документы из различных источников или внесенные разными людьми. Так как информация, как правило, накапливалась годами, то чтобы полностью использовать все преимущества поисковой системы SearchInform необходимо вначале избавить информационную систему от ненужных дублей. Для определения дублей и ненужных похожих файлов в программе поиска SearchInform используется функция построения отчета анализа похожести. Притом эта операция занимает в десятки раз меньше времени, чем при обычном сравнении. Для примера, сравнение документов в информационной базе, в которой содержится, скажем, несколько миллионов документов, займет около месяца. А при использовании в поисковой программе SearchInform функции построения анализа похожести - порядка суток.

Основные возможности SearchInform 3.0:
- Фразовый поиск с учетом морфологии и словаря синонимов
- Новая технология поиска похожих документов SoftInform Search Technology
- Высокая скорость индексирования (от 15 до 30 Гб/час)
- Размер индекса 15-25% от реального объема текстовой информации
- Функция кэширования запросов
- Поддержка более 60 распространенных текстовых форматов файлов, электронных сообщений Outlook и TheBat, тэгов mp3 и avi и логов программ мгновенного обмена сообщениями ICQ 99-2005 и Microsoft Messenger)
- Корректная работа с архивами
- Универсальные источники данных (индексирование полей СУБД и различных информационных систем)

О компании СофтИнформ
Компания СофтИнформ была основана в 1995 году и работает в сфере информационных технологий, специализируясь на технологиях поиска, хранения и обработки информации. Спектр предлагаемых компанией разработок весьма широк и включает в себя как тиражные программные продукты, ориентированные на обычного пользователя, так и готовые решения для интеграции в корпоративные системы. Кроме того, огромный опыт участия в различных проектах позволяет компании предлагать свои услуги по разработке под заказ информационных систем любой сложности.

Дополнительная информация на официальном сайте:
http://www.searchinform.ru

По всем возникающим вопросам обращайтесь на mailto:max.shiryaev@softinform.com
Макс Ширяев, руководитель отдела по связям с общественностью СофтИнформ.
11:30
954
RSS
Нет комментариев. Ваш будет первым!
Загрузка...
X
X