DataparkSearch Engine — это полное поиск с открытым исходным кодом в Интернете двигатель, выпущенный в соответствии с общей государственной лицензией GNU и предназначенный для организации поиска веб-сайта, группы веб-сайтов, интрасети или локальной системы. DataparkSearch состоит из двух частей. Первая часть является механизмом индексации (индексатор). Индексер ходит по HTML гипертекст ссылки и магазины нашли слова и новые ссылки в базу данных. Вторая часть веб CGI фронт-конец, чтобы обеспечить поиск с использованием данных, собранных индексером. Основные особенности: Поддержка схем http, https, ftp, nntp и URL-адресов новостей; поддержка виртуальной схемы URL-адресов для индексации баз данных S'L; текст/html, текст/xml, текст/простой, аудио/mpeg (MP3) и типы мим изображений/gif, встроенные в поддержку; Поддержка внешних разборщиков для других типов документов; Возможность индексировать многоязычные сайты с помощью переговоров о содержании; Поиск всех форм слов с помощью аффиксов и словарей ispell; Нечеткий поиск на основе аббревиатур и сокращений. Стопворды и синонимы списков; Поддержка языка запросов Boolean; Сортировка результатов по релевантности, рангу популярности, последнему модифицированному времени и важности (умножение актуальность и ранг популярности); Поддержка различных наборов символов; Акцент бесчувственный поиск; Сегментация фраз для китайского, японского, корейского и тайского языков; mod_dpsearch - поисковый модуль для веб-сервера Apache; Международная поддержка доменных имен; Алгоритм суммарного извлечения.
история версии
- Версия 4.53 размещено на 2010-01-24
Подробная информация о программе
- Категории: Сеть и Интернет > Инструменты поиска/поиска
- Издателя: Datapark Corp.
- Лицензии: Бесплатный
- Цена: N/A
- Версия: 4.53
- Платформы: linux