Коллекция скриптов питона для создания и обработки XML корпус (большая коллекция текста для лингвистических целей) из оригинальной базы данных Википедии резервного копирования свалки. Она включает в себя регулярное выражение на основе парсера для языка разметки MediaWiki.
история версии
- Версия 0.1 размещено на 2008-04-01
Несколько исправлений и обновлений - Версия 0.1 размещено на 2008-04-01
Подробная информация о программе
- Категории: Образования > Других
- Издателя: wikipedia2xml.sf.net
- Лицензии: Бесплатный
- Цена: N/A
- Версия: 0.1
- Платформы: windows