Министерство просвещения Российской федерации

Министерство просвещения Российской Федерации
Томский государственный педагогический университет

СНО ИИЯМС провело семинар для Чувашского государственного университета им. И. Н. Ульянова

25 февраля 2025 г. в продолжение Дня российской науки и 125-летнего юбилея со дня рождения профессора А. П. Дульзона состоялся научный семинар, организованный Студенческим научным объединением и сотрудниками Института иностранных языков и международного сотрудничества ТГПУ для факультета русской и чувашской филологии и журналистики Чувашского государственного университета им. И. Н. Ульянова.

Темой семинара явилось «Использование компьютерных программ анализа лингвистических данных (Toolbox, Fieldworks Language Explorer, Praat, ELAN) и возможностей лингвистической платформы Lingvodoc при документации, анализе и интерпретации языковых данных разносистемных языков». Студенты 3 курса ИИЯМС Лина Гофман (гр. 222), Маргарита Потапова (гр. 224), Александра Абрамова, Екатерина Колупаева (гр. 225), Елизавета Гаммель, София Ермишина (гр. 226), а также выпускница ИИЯМС 2024 г. Эвелина Ягаева представили опыт использования программы обработки лингвистических данных “Toolbox” (полное название - “Field Linguist’s Toolbox”) для редактирования и дополнения словаря лингвистических терминов. Проект стал продолжением работы по публикации “Чувашско-русско-немецко-английского словаря лингвистических терминов” 2008 г. В результате масштабной совместной работы в 2024 г. была издана книга «Чувашская языковая терминология в контексте интерлингвистики» с параллельными лингвистическими терминами на чувашском, русском, немецком, английском и китайском языках.

Необходимость ревизии эквивалентов и добавления новых данных, особенно китайских терминов, возникла в связи с расширением межъязыковых контактов и возрастанием межгосударственных связей, а также развитием китайскоязычного образования в Томском государственном педагогическом университете.

В 2023 г. в результате совещания сотрудников ИИЯМС ТГПУ с коллегами из Чувашского государственного универистета им. И. Н. Ульянова было принято решение о ревизии существующей публикации, добавлении китайских терминов и привлечения студентов к участию в проекте. В качестве куратора китайского направления была приглашена кандидат филологических наук, доцент кафедры перевода и переводоведения Ирина Олеговна Краевская. Весной 2023 г. были проведены лекции и семинары о техническом переводе, русской и иноязычной терминологии, а также объявлен набор в “команду” для работы над переизданием словаря лингвистических терминов.

После прохождения тестовых онлайн-заданий, в команду вошли 10 студентов – 8 обучающихся по направлению подготовки 45.03.02 Лингвистика» и 2 обучающихся по направлению подготовки 44.03.05 Педагогическое образование (с двумя профилями подготовки). Для эффективной работы были созданы группы по языкам: русский и английский (2 студента), немецкий (4 студента) – куратор Валерия Михайловна Лемская; китайский (4 студента) – куратор И.О. Краевская.

Перед началом работы остро встал вопрос выбора программного обеспечения. Популярные сервисы «Google-документы» и «Яндекс.Документы» не подошли из-за неудобств синхронного редактирования большого файла в формате таблицы и слабой системы шифрования. Программа обработки лингвистических данных “Toolbox” использует инфраструктуру, аналогичную организации переводческой среды и технологии памяти переводов (что знакомо студентам), располагает данные линейно в текстовом формате, позволяет конвертировать проект в редактируемый документ для редактора типа “Word”, что облегчает дальнейшую обработку для верстки будущего издания. Кроме того, архитектура проекта предполагает легкое распределение работы между участниками, а работа каждого из них в своем стационарном “Toolbox” предотвращает утечку данных.

Изначально программа “Toolbox” была разработана для документации бесписьменных языков, составления словарей и глоссирования текстов. В Томском государственном педагогическом университете ее успешно применяли в 2005-2018 гг. для исследований исчезающих языков Сибири. Впоследствии в работу была введена программа “FieldWorks Language Explorer” (“FLEx”) с расширенным функционалом, на которую перешли все сотрудники. В то же время, основной принцип работы “Toolbox” – линейная организация данных с возможностью параллельного открытия окон словаря и текстов. “FLEx” работает по принципу гипертекстовой организации данных с кодированием всей информации и не позволяет оперировать данными линейно, что исключает быстрое соединение частей проекта, подготовленных разными пользователями. Таким образом, выбор программы “Toolbox” для работы оказался очевидным, а в процессе работы была доказана эффективность этого программного решения для выполнения задач проекта.

В ходе проекта были выработали алгоритмы работы, проведены мастер-классы по работе в программе и работе в словарях, определен график работы. Основной задачей рабочих групп было проставление рода у существительных на русском и немецком языках и общая верификация терминов, а также контекстуальный поиск в узкоспециализированных корпусах и проверка перевода через профильные переводческие сервисы. При верификации терминов использовались монолингвальные и параллельные лингвистические корпусы, такие как немецкий DeReKo и параллельный подкорпус Национального корпуса русского языка. Работа включала верификацию семантической и грамматической структуры эквивалентов.

Терминология китайского языка отличается от других языков структурой словосочетаний. В русском языке термины часто состоят из двух слов, а в китайском языке определение может быть существительным с частицей 的. В китайском языке часто используют поясняющие слова для уточнения терминов. Контекстуальный поиск и верификация синонимичных и нераспространенных терминов часто вызывают проблемы. Часто в китайском языке существуют два термина для одного понятия, один из которых является калькой с английского, а другой – китайский неологизм, и становится необходимым выбрать наиболее подходящий термин. Для поиска терминов, отсутствующих в словарях, можно использовать китайский сегмент сети «Интернет». Например, для термина «адстрат» находим информацию в китайском Интернете, используя фонетическую кальку или транскрипцию. Если поиск не увенчался успехом, обращаемся за помощью к консультанту.

Использованная в проекте программа “Toolbox” имеет преимущества (простой интерфейс и возможность удаленной работы), однако есть и недостатки: проблемы верстки, неправильное форматирование из-за лишних нажатий клавиши “Enter”, нарушение переноса строк при добавлении китайского пиньиня и др. При расширении проекта и добавлении новых языков рекомендуется перейти от печатной версии на онлайн-версию словаря, либо приложение.

В ходе семинара выпускница ИИЯМС ТГПУ 2024 года Эвелина Ягаева рассказала о своем опыте участия в проекте, она отвечала за редактирование части немецких терминов. По результатам работы совместно с научным руководителем В. М. Лемской была выбрана тема выпускной квалификационной работы: «Лексикографические проблемы перевода и пути их решения (на примере создания мультиязычного словаря лингвистических терминов)». Актуальными лексикографическими проблемами были определены наличие сложных слов, отсутствие однозначного эквивалента, сложности с сокращениями, многозначность терминов и омонимимия, лакуны. Для их решения переводчику необходимо учитывать стилистическую и синтаксическую характеристику лексем, контекст и речевую ситуацию, применять описательный перевод. В ходе исследования было проанализировано 100 терминов – параллельных эквивалентов на русском, немецком и английском языках. Установлено, что при переводе терминов в основном использовались регулярные соответствия и калькирование, реже – конверсия, опущение и субстантивация. Малое количество терминов переведены методом транспозиции, добавления, заимствования латинского слова.

Помимо подробного освещения программы “Toolbox” членами студенческого научного объединения ИИЯМС ТГПУ на семинаре доцентом кафедры языков народов Сибири Сергеем Васильевичем Ковылининым были также освещены нюансы использования программы “FieldWorks” в обработке лингвистических данных и возможности лингвистической платформы «ЛингвоДок», которая позволяет создавать словари, глоссировать тексты, связывать когнаты разных родственных языков, строить этимологии и лингвистические карты. В завершение семинара В. М. Лемская рассказала о том, как используется программа “ELAN” для составления комлпексных файлов с сегментированными и аннотированными языковыми данными, синхронизованными с аудио- и видеозаписями (при проигрывании данных можно видеть в т.ч. «субтитры» на разных языках с поморфемным переводом), а также потенциал программы анализа данных акустической фонетики “Praat” для установления рядности гласных, частоты основного тона, глубины спектра и шума анализируемого сегмента речи.

Декан факультета русской и чувашской филологии и журналистики, доктор филологических наук, Алёна Михайловна Иванова от лица студентов и сотрудников Чувашского государственного университета им. И. Н. Ульянова поблагодарила студентов и сотрудников ИИЯМС за плодотворное сотрудничество и освещение высокотехнологичных программ обработки лингвистических данных, а также пригласила студентов участвовать в Неделе науки и научной конференции в Чувашском государственном университете в начале апреля 2025 г.

Путеводитель по сайту

Чтобы сообщить о найденной на сайте ошибке - выделите текст ошибки и нажмите CTRL + ENTER