„Сарадња научника Института за руски језик 'В.В. Виноградов', Руске академије наука, Универзитета 'Мисис', Националног истраживачког универзитета 'Виша школа економије' уз подршку комисије за рад са универзитетима и научном заједницом при Епархијском савету Москве покренула је велики пројекат формирања јединствене базе старословенских рукописних текстова помоћу технологије вештачке интелигенције и машинског учења“, наводи се у саопштењу.
Истиче се да ће корпус старословенског језика пружити истраживачима-лингвистима и историчарима алат за проучавање свих савремених националних словенских језика и култура, а такође ће постати кључ за разумевање њихове баштине.
Како је објашњено, корпус је структурирана база података језика, информативно-референтни систем, заснован на збирци електронских текстова на одређеном језику. Предстваља одабрани и обрађени скуп текстова, који се користе као основа за истраживање лексике и граматике језика.
„Природни језик је кључни полигон за развој технологија вештачке интелигенције. Захваљујући тим технологијама, задаци машинског превођења, изградња система дијалога и задаци интерпретације текстова на природним језицима добили су снажан замах у последње време. У одређеном смислу такав пројекат је мост од културе прошлости до технологија будућности“, саопштио је водећи експерт Центра за инфраструктурну интеракцију и партнерство „Мега сајенс“ Универзитета 'Мисис' Андреј Устјужанин.
Истиче се да ће прва фаза пројекта бити дигитализација и обележавање старословенских минеја XI-XVII векова на староруском, бугарском и српском језику. Реч је о црквеним књигама, које садрже распоред служби свих дана у црквеној години. Рукописи тих књига се чувају у збиркама Државног историјског музеја, Руске националне и државне библиотеке, Руског државног архива старих актова и Тројице-Сергијевој лаври.