The Linguistic Information in the Electronic Corpus of Old Slavonic Texts

Scripta & e-Scripta vol 6, 2008
  • Author(s):
  • Subject(s): Language and Literature Studies // Electronic corpora // Linguistic annotation // Lexicographic information // Morphlogical and syntactic analysis //
  • Published by: Institute for Literature BAS
  • Print ISSN: 1312-238X
  • Summary/Abstract:

    Доклад посвящен включению лингвистических данных в электронном корпусе древних славянских текстов. Анализу подвергаются различные современные подходы в этом отношении. Приводятся сведения о форматах, использованных до сих пор в славянской научной традиции, а также делаются параллели с практикой включения языковых данных популярнейших проектов в области электронной обработки современных и древних языков. Подход авторов базирован на технологии языка описательной разметки XML (Extensible Markup Language) и все выводы сделаны на основании этого выбора.