Перейти к основному содержанию
База практик ревитализации Состояние языков России Задокументированность языков России

Удаленная документация

Развитие и распространение технологий в последние десятилетия, а также все большая их доступность для представителей сообществ сделали возможным новый удаленный формат документационных проектов. При удаленной документации лингвист работает с участниками исследования дистанционно, не находясь непосредственно в месте проживания языкового сообщества. При этом могут использоваться разнообразные инструменты: электронная почта, мессенджеры и платформы для организации видеоконференций. В англоязычной литературе это называют remote documentation, но в сообществе лингвистов в последнее время обсуждается термин distributed documentation (букв. ‘распределенная документация’).

С 2020 года, с наступлением пандемии Ковид-19, удаленная документация приобрела еще большую актуальность, а технологическая база получила дополнительный толчок к ускоренному развитию. При этом по прошествии нескольких волн, когда пандемия пошла на спад, новый формат документации прочно занял свое место в лингвистической практике. Методология удаленных исследований активно развивается [Williams et al. 2021]. Так, в сентябре 2021 года Программа по документации исчезающих языков (англ. Endangered Languages Documentation Programme, сокр. ELDP) организовала серию воркшопов, посвященных различным аспектам дистанционной работы, на которых лингвисты делились своим опытом проведения удаленных проектов в 2021 году.

В литературе обсуждаются положительные стороны удаленной документации и ограничения, которые она накладывает [Rozhanskiy 2021, Williams et al. 2021, Leemann et al. 2020]. Среди плюсов дистанционного формата упоминаются следующие: исследователю не нужно отправляться в трудоемкую и дорогостоящую поездку; документационную работу можно легко совмещать с другой академической деятельностью, а кроме того, исследователь получает возможность в любое время работать с носителями языка, проживающими в разных местах.
Однако у удаленного формата документации на сегодняшний день есть ряд ограничений, по большей части технических. В России есть еще много отдаленных районов, где нет подключения к сети Интернет или слишком низкая скорость соединения, а также где нет в принципе стабильного электроснабжения. Кроме того, лишь у немногих людей есть доступ к компьютерам. Наиболее распространенным средством связи являются смартфоны, но пока что их возможности более ограничены, чем у компьютеров, хотя и расширяются очень активно. Также, чтобы носители могли участвовать в удаленной документации, они должны обладать базовой компьютерной грамотностью.
При удаленной документации могут возникнуть ограничения и в видах исследовательской деятельности. Так, если аудиозапись языкового материала ведется при помощи платформы ZOOM или через мессенджеры, то добиться качества, необходимого для фонетических исследований, невозможно. Стоит также отметить, что онлайн общение может быть не так комфортно, как личное, и работа в таком формате обычно занимает больше времени. 
Между привычным и дистанционным форматами документационных проектов есть существенные отличия в организации работы. При обычной документации в работе лингвиста можно выделить две основные части: активный сбор материалов в языковом сообществе и обработка и анализ материалов вне сообщества. При этом еще не так давно вопросы, возникшие при анализе материалов, можно было уточнить у носителей только при следующей встрече с ними. Сейчас даже в обычном проекте лингвисты зачастую используют электронные средства связи, чтобы проконсультироваться с носителями по конкретным вопросам. При дистанционной работе сбор и обработка материалов могут идти параллельно, и консультации с носителями могут быть регулярными в течение длительного времени и не привязанными к краткому периоду экспедиции, что с одной стороны делает работу более продуктивной, но с другой стороны требует дополнительной самоорганизации как от исследователя, так и от носителя языка.
Отличия возникают и в выстраивании отношений с участниками исследования, особенно если дистанционный проект начинается с нуля, и лингвист никогда раньше не был в языковом сообществе. Нужно учитывать, что на установление личного контакта и взаимного доверия может уйти больше времени, чем при очном общении. Погружение исследователя в языковую среду, включенность в повседневную жизнь сообщества и совместное времяпрепровождение позволяют не только легче наладить общение, продуктивней работать и получить опыт непосредственного контакта с культурой, но и записать тексты на языке в видеоформате в естественной для носителей обстановке. С другой стороны, когда звучащую речь записывают сами представители сообщества, обстановка может быть еще более естественной, нежели в присутствии внешнего человека (см. например, доклад Leah Pappas «Fostering collaboration, versatility, and sustainability through remote language documentation» на конференции Language Documentation and Archiving в Берлине в октябре 2022 года о ее опыте удаленной документации). В целом дистанционный формат приводит к более активной роли носителей языка в процессе документации, что в том числе позволяет сфокусироваться на целях языкового сообщества и выстроить отношения сотрудничества.

Как и при обычной документации, в удаленных проектах можно реализовать разные исследовательские задачи: сбор языкового материала и/или социолингвистической информации, различные ступени анализа языкового материала (перевод, расшифровка, поморфемная аннотация, субтитры). Решение каждой из этих задач в дистанционном формате имеет свою специфику и требует определенных инструментов. Помимо этого, необходимы, разумеется, и инструменты для общения между участниками проекта и для передачи данных. Соответственно, содержание удаленного проекта зависит от технических возможностей и уровня компьютерной грамотности представителей сообщества, принимающих участие в исследовании. В частности, может быть удачно использовать те инструменты, которыми представители сообщества и так пользуются для других целей.
Основными инструментами для непосредственного общения и для рабочих сессий являются мессенджеры (в российском контексте это WhatsApp или Telegram) и платформы для видеоконференций (например, ZOOM или Skype). Функция демонстрации экрана делает удаленные сессии максимально похожими на очные, но эффективна при наличии компьютера у представителя сообщества. Мессенджеры также позволяют решать организационные вопросы и координировать рабочий процесс и взаимодействие между всеми участниками проекта.
В зависимости от размера передаваемых данных, могут использоваться различные инструменты. Для небольших файлов подойдут мессенджеры или электронная почта, для больших — облачные хранилища. При этом стоит помнить, что мессенджеры ухудшают качество аудио-, видео- и фотоизображений, поэтому если необходимо качество сохранить, лучше воспользоваться другими вариантами
Сбор языкового материала в аудио- и видеоформате может производиться двумя принципиально различными способами. С одной стороны, с участием исследователя через функцию записи на платформах для видеоконференций. С другой стороны, представитель сообщества может самостоятельно записывать звучащую речь, используя диктофон или камеру смартфона или функцию голосовых сообщений в мессенджерах. Кроме того, участник исследования может использовать звукозаписывающее оборудование, в том числе профессиональное.
Анализ данных так же, как и сбор, носитель языка может производить вместе с исследователем или самостоятельно с последующим обсуждением.

Описания удаленных проектов по документации и различных аспектов дистанционной работы появляются в публикациях последних лет все чаще. Например, в [Griscom 2022] рассказывается о том, как можно систематизировать метаданные дистанционного проекта с большим количеством участников. Схема рабочего процесса обработки данных устроена следующим образом: метаданные собираются с помощью программы KoBoToolbox, преобразуются в формат XML с помощью LingMetaX, редактируются в редакторе метаданных Lameta и, наконец, экспортируется из Lameta в архивируемый формат и депонируются. В работе [Grzech, Shaca 2022] описываются все аспекты проекта по документации языка чибулео (разновидность кечуа, на котором говорят в Эквадоре, в андской провинции Тунгурауа). Проект изначально проходил в дистанционном формате, с рабочими сессиями в ZOOM. В записи воркшопа [Neely 2021] рассказывается о некоторых том, как можно использовать мессенджер WhatsApp в документационном проекте. Особое внимание уделяется голосовым сообщениям как основному инструменту для выполнения исследовательских задач. В [Bettinson, Bird 2021] говорится о специализированных приложениях для документационной работы, отвечающих запросу конкретного сообщества, созданных в сотрудничестве с отдаленными сообществами на севере Австралии. В статье [Rice 2021] описывается расшифровка и перевод языковых данных с использованием возможностей платформы YouTube наряду с лингвистическим программным обеспечением (SayMore, FLEx, ELAN). В работе [Leemann et al. 2020] обсуждаются преимущества и недостатки удаленной документации с использованием ZOOM. Авторы провели исследование с участием 36 человек, чтобы выяснить, отличается ли опыт участников при личном сборе данных от участия в виртуальной среде. Результаты выявили значительную степень совпадения в опыте интервью, установив методологическую основу для будущей работы.
Таким образом, с уверенностью можно сказать, что интеграция дистанционных методов в обычную документацию, реализованная в гибридных проектах, может оказать исключительно позитивное влияние на документационную деятельность.