TextMiningTheQuran: уникальный ресурс для анализа КоранаДобро пожаловать на страницу проекта TextMiningTheQuran. Это место, где наука о данных встречается с древними текстами. Сайт предста...
Добро пожаловать на страницу проекта TextMiningTheQuran. Это место, где наука о данных встречается с древними текстами. Сайт представляет собой сборник научных публикаций и полезных инструментов для тех, кто хочет изучить Коран с помощью компьютерных технологий. Здесь нет просто красивых картинок, здесь серьезная работа лингвистов и программистов.
Основатель проекта - Абдул-Бакуй Шариф (Abdul-Baquee Sharaf). Он защитил диссертацию в Лидском университете в 2012 году. Его тема была связана с аннотацией концептуальных связей и текстовым анализом Священного Писания. Если вы интересуетесь академической стороной вопроса, то на сайте есть список его работ. Например, статья QurSim, которая помогает оценивать схожесть коротких текстов. Или корпус QurAna, размеченный по местоимениям. Это очень важно для понимания структуры языка.
Также автор делится туториалами. Например, как загрузить текст Корана в программу R или как использовать команды Linux для поиска корней слов. Для тех, кто любит визуализацию, есть примеры графиков по сурам. А еще есть приложения на Python и Angular, которые помогают определить, является ли сура мекканской или мединской, и подсчитать уникальные слова.
Сайт выглядит как рабочий инструмент исследователя. Он не пытается быть развлекательным порталом. Здесь все серьезно и по делу. Спасибо Имарну Шафику за помощь в исправлении ошибок в датасете. Это показывает, что проект живой и развивается.
Автором выступает Абдул-Бакуй Шариф (Abdul-Baquee Sharaf), который получил степень PhD в Лидском университете в 2012 году.
Можно найти данные в форматах SQL, CSV, Excel, а также JSON файлы для работы с корпусом и грамматическими тегами.
Это корпуса, созданные для оценки схожести текстов и аннотации местоименной анафоры в Коране соответственно. Они были представлены на конференции LREC в 2012 году.
Да, там есть скрипты на Python и Angular приложение для таблицы содержания суры, а также примеры визуализации данных.
Domain Name: TEXTMININGTHEQURAN.COM
Registrar: Amazon Registrar, Inc.
Domain Status: active
Creation Date: 2009-12-02T18:04:54Z
Registry Expiry Date: 2026-12-02T18:04:54Z
Updated Date: 2025-10-28T18:09:56Z
Name Server: NS-1263.AWSDNS-29.ORG
Name Server: NS-13.AWSDNS-01.COM
Name Server: NS-1813.AWSDNS-34.CO.UK
Name Server: NS-614.AWSDNS-12.NET
REGISTRAR Contact: Amazon Registrar, Inc.
>>> Last update of RDAP database: 2026-05-16T07:40:52Z
| Posição | Frase | Página | Trecho |
|---|---|---|---|
| 18 | / | ||
| 25 | / | ||
| 28 | / | ||
| 38 | / | ||
| 40 | / | ||
| 41 | / | ||
| 43 | / | ||
| 43 | / | ||
| 46 | / | ||
| 71 | / |