Arch Search Engine 1.15

Лицензии: Бесплатный ‎Размер файла: 31.07 MB
‎Рейтинг пользователей: 3.5/5 - ‎2 ‎Голосов

Arch — это расширение Apache Nutch с открытым исходным кодом (популярная, высоко масштабируемая поисковая система общего назначения) для поиска в интрасети. Не доволен вашей корпоративной поисковой системы? Не удивительно, очень мало людей. Насколько нам известно, Есть нет интрасети двигателей, которые работают, а также Google глобального веб-поиска делает. Существует фундаментальная причина для этого: алгоритмы, используемые Google в глобальной Сети (или аналогичный) не работают почти так же хорошо на интрасети из-за отсутствия статистических данных. Арка (наконец-то!) решает эту проблему. Он использует новый метод для доставки высокоточных результатов поиска, который прекрасно работает. Не верите? Включены инструменты оценки слепых тестов. Вы можете развернуть Arch и сравнить его производительность с текущей поисковой системой и/или Google (на общедоступной части вашего сайта) с помощью методологии слепого тестирования. В дополнение к отличному качеству поиска, Arch имеет много особенностей, критически важных для корпоративной среды: - Безопасность уровня документов. Пользователи могут найти только документы, которые они уполномочены видеть. - Недорогие обновления индекса. Arch способен держать индексы в курсе и избежать регулярного полного повторного сканирования сайта. - 24/7 availabilty. Всегда есть рабочий индекс, даже если сканирование не удается. - Поддержка одновременной индексации и поиска нескольких веб-сайтов, с возможностью поиска и администрирования любого сайта отдельно, если это необходимо. Динамическое добавление и удаление веб-сайтов легко. - Автоматически сгенерированный каталог сайта. - Низкая стоимость поддержки после развертывания. - Двойной интерфейс (PHP и Java) для легкого развертывания и настройки. - Faceted поиск (цитата;из коробки) цитата;. - Обширный и обширный набор парсеров для разбора различных форматов файлов: HTML, PHP, PDF, MS Office, Open Office и т.д. - Модульная архитектура на основе плагина, которая может быть легко настроена и расширена. - Исходный код включен. - Высокая производительность и масштабируемость. Arch может работать на компьютерных кластерах для индексировать очень большие наборы данных.

история версии

  • Версия 1.15 размещено на 2019-05-17
    Портирован на Nutch 1.15
  • Версия 1.9.2 размещено на 2016-08-18
    Улучшенная разбор документов, портированная на Nutch 1.9.
  • Версия 1.2 размещено на 2010-09-17
    Портированная на Apache Nutch 1.2, обновленная парсер PDF, добавленные инструменты тестирования и настройки, решены проблемы, найденные в бета-версии, включено использование компьютерных кластеров.

Подробная информация о программе