Разработана система интеллектуального поиска по тексту Корана

Специалисты из Лидсского университета (Великобритания) разработали программу семантического поиска и анализа текста Корана. Система доступна на сайте Quran Analysis.

Цель проекта, рассчитанного как на учёных, так и на обычных пользователей – создать систему, способную производить семантический поиск по арабскому тексту и английскому переводу Корана, анализировать все аспекты текста, выявлять в нём скрытые ассоциации и паттерны при помощи визуализации.

Интеллектуальная работа системы основана на «онтологии» Корана, т. е. словаре всех встречающихся в тексте понятий и смысловых связей между ними, сформированном методами машинного обучения. Помимо обычных функций поисковых систем (поиск слов, фраз, ответов на вопросы), программа может искать фразы по заданным паттернам (например, «имя собственное + глагол»), слова, похожие на заданное, слова в заданном контексте и т. д. Она выполняет множество задач статистического анализа и визуализации результатов: рисует «облака слов», гистограммы и N-граммы частоты употребления заданного слова, онтологические графы («деревья» связей между понятиями) и др.

Детальное описание системы представлено в диссертации Карима Оуды, защищённой в 2015 г. (pdf, англ.).