Перейти к основному содержанию
База практик ревитализации Состояние языков России Задокументированность языков России

Документация и фиксация

К данной категории относятся практики, направленные на фиксирование языковых материалов, их систематизацию и обеспечение долгосрочного хранения с возможностью многофункционального использования. К языковым материалам относятся образцы речи разных типов, лексические данные, грамматические сведения. Кроме того, к этой же категории относится и описание языковой ситуации на определенный период, или так называемой языковой экологии. Таким образом, фиксируется не только использование и структурные свойства языка, но и контекст, в котором он существует и от которого неотделим.

Запись языковых данных и проведение социолингвистических интервью в нашей Базе относятся к практикам «Сбор языковых материалов» и «Сбор социолингвистических материалов» соответственно. Но стоит отметить, что здесь же подразумевается и первичная обработка записанных данных. Таким образом, результатом данных практик могут быть не сырые коллекции аудиофайлов или полевых тетрадей, но снабженные разметкой и метаданными в такой степени, в которой становится возможной дальнейшая работа с материалами.

Если не ограничиваться минимально необходимой обработкой языковых данных, то на последующих этапов из записанных образцов речи можно составлять корпуса, в том числе, мультимедийные, то есть с аудио- или даже видеосопровождением, и доступные в сети Интернет. В корпусе все примеры использования языка (рассказы, сказки, диалоги, тексты-инструкции и другие) собраны в единую базу, по которой можно вести поиск по тем параметрам, которые отражены в разметке и в метаданных текстов. Лексические материалы могут быть организованы в виде словарей, в том числе, озвученных и доступных онлайн. Материалы о структуре языка могут быть систематизированы и отражены в грамматических очерках. В Базе выделены практики «Корпуса», «Словари» и «Описания языка» для отражения такого рода деятельности.

Обеспечение долгосрочного хранения языковых данных относится к практике «Архивирование материалов». Здесь могут быть представлены как архивы с онлайн-доступом, так и без доступа через сеть Интернет. Данные могут храниться в цифровом или аналоговом форматах. Важно, насколько архив поддерживает актуальность форматов своих коллекций, насколько разработан каталог материалов, насколько легок доступ к материалам, насколько обеспечена безопасность данных.

Документация и фиксация речевых образцов вносит вклад в развитие теоретической лингвистики, предоставляет материалы для разработки языковых инструментов и ресурсов, в том числе, обучающих, и может стать единственным источником данных о языке, языковых примеров, живой речи в условиях, когда других ресурсов уже не остается.

 

Подписаться на Документация и фиксация