Доклад посвящен включению лингвистических данных в электронном корпусе древних славянских текстов. Анализу подвергаются различные современные подходы в этом отношении. Приводятся сведения о форматах, использованных до сих пор в славянской научной традиции, а также делаются параллели с практикой включения языковых данных популярнейших проектов в области электронной обработки современных и древних языков. Подход авторов базирован на технологии языка описательной разметки XML (Extensible Markup Language) и все выводы сделаны на основании этого выбора.
Subject: Language and Literature Studies Electronic corpora Linguistic annotation Lexicographic information Morphlogical and syntactic analysisCopyright © 2024. All rights reserved.