Искусственный интеллект создаст базу древнеславянских текстов
События

Российские ученые при участии комиссии по работе с вузами и научным сообществом при Епархиальном совете Москвы создадут интерактивную базу древнеславянских текстов с помощью технологий искусственного интеллекта, рассказали РИА Новости в пресс-службе НИТУ "МИСиС".

"Коллаборация ученых Института русского языка им. В. В. Виноградова РАН, НИТУ "МИСиС", НИУ ВШЭ при участии комиссии по работе с вузами и научным сообществом при Епархиальном совете г. Москвы запустила масштабный проект по созданию с помощью технологий искусственного интеллекта и машинного обучения уникальной базы древнеславянских рукописных текстов — корпуса", — говорится в сообщении.

Отмечается, что создание корпуса древнеславянского языка даст исследователям-лингвистам и историкам инструмент для изучения всех современных национальных славянских языков и культур, а также станет ключом к пониманию их наследия.

Поясняется, что корпус – это структурированная база данных языка, информационно-справочная система, основанная на собрании в электронной форме текстов на определенном языке. Он представляет собой подобранную и обработанную совокупность текстов, которые используются в качестве основы для исследования лексики и грамматики языка.

"Естественный язык является ключевым полигоном для развития технологий искусственного интеллекта. Именно благодаря этим технологиям задачи машинного перевода, построение диалоговых систем и задачи интерпретации текстов на естественном языке получили мощный толчок в последнее время. В некотором смысле такой проект является мостиком от культуры прошлого к технологиям будущего", — приводит пресс-служба слова Андрея Устюжанина, ведущего эксперта Центра инфраструктурного взаимодействия и партнерства MegaScience НИТУ "МИСиС", руководителя Научно-учебной лаборатории методов анализа больших данных Высшей школы экономики.

Добавляется, что первым этапом проекта станет оцифровка и разметка комплекса древнеславянских миней XI-XVII веков на древнерусском, болгарском и сербском языках – служебных церковных книг, содержащих распорядок служб всех дней церковного года. Рукописи этих книг хранятся в собраниях Государственного исторического музея, Российской национальной и государственной библиотек, Российского государственного архива древних актов, Свято-Троицкой Сергиевой лавры.

 

РИА Новости


Другие публикации на портале:

Еще 9