Телефон: 8-800-350-22-65
WhatsApp: 8-800-350-22-65
Telegram: sibac
Прием заявок круглосуточно
График работы офиса: с 9.00 до 18.00 Нск (5.00 - 14.00 Мск)

Статья опубликована в рамках: XCV Международной научно-практической конференции «Культурология, филология, искусствоведение: актуальные проблемы современной науки» (Россия, г. Новосибирск, 09 июня 2025 г.)

Наука: Филология

Секция: Языки народов зарубежных стран Европы, Азии, Африки, аборигенов Америки и Австралии

Скачать книгу(-и): Сборник статей конференции

Библиографическое описание:
Астрамецкий В.С. ЛИНГВИСТИЧЕСКИЙ КОРПУС В ИССЛЕДОВАНИИ СИСТЕМЫ ЗНАКОВ ИНОСТРАННОГО ЯЗЫКА // Культурология, филология, искусствоведение: актуальные проблемы современной науки: сб. ст. по матер. XCV междунар. науч.-практ. конф. № 6(81). – Новосибирск: СибАК, 2025. – С. 97-101.
Проголосовать за статью
Дипломы участников
У данной статьи нет
дипломов

ЛИНГВИСТИЧЕСКИЙ КОРПУС В ИССЛЕДОВАНИИ СИСТЕМЫ ЗНАКОВ ИНОСТРАННОГО ЯЗЫКА

Астрамецкий Владислав Сергеевич

ст. преп., соискатель кафедры теории и практики китайского языка, УО «Минский государственный лингвистический университет»,

Республика Беларусь, г. Минск

АННОТАЦИЯ

В статье анализируются теоретические аспекты развития лингвистических корпусов, используемых в исследовании языка как системы знаков; рассматриваются проблемы включения корпусов в методику изучения иноязычной лексики; выявляются основные особенности современной корпусной методологии, а также изучаются возможности использования лингвистического корпуса в исследовании иноязычной лексики.

 

Ключевые слова: лингвистика; электронный лингвистический корпус; метод корпусных исследований; специфика корпусной методологии.

 

Современную корпусную лингвистику выгодно выделяют из общей парадигмы языковых исследований методологическая эффективность и универсальность. Ориентированные на иноязычную речевую практику корпусы представляют собой образования, нацеленные на достижение аутентичных, функциональных, динамичных и прецизионных результатов, а также на обеспечение богатого терминологического аппарата и качественных, в том числе междисциплинарных обобщений. Такое уникальное сочетание характеристик обеспечивает эффективность и целесообразность использования корпусных возможностей в гуманитарной области исследований.

Корпусный подход, ориентированный на обработку лексики иностранного языка и исследование характеристик иноязычной лексики является для исследователей приоритетным инструментом, дающим возможность изучать и обрабатывать языковые явления с разных сторон. Первые исследования в области лингвистики, которые проводились с помощью корпусов, предоставляли возможность подсчёта частотности употребления языковых единиц: слов, словосочетаний, графем, лексем, морфем и т. п. С течением времени возможности обработки и изучения языковых характеристик в корпусе расширились, и они стали использоваться как практически неиссякаемый источник информационных ресурсов. Кроме того, корпусы письменных и устных текстов стали применяться в процессе обучения иностранным языкам, так как на их основе стало возможным формирование списков активной лексики пользователя, списков терминов (глоссарии), необходимых для профессиональной обработки языкового массива. Использовались их результаты и для корректного составления грамматик и словарей, для проверки сложных орфографических и грамматических случаев, а также при осуществлении машинного перевода. Данная система статистических данных, предоставляемая пользователям языкового корпуса, позволяла выделить периодичность / частотность сочетания групп слов и отнесение их «к разряду устойчивых словосочетаний» [1, с. 234].Одной из наиболее важных характеристик корпусов лингвисты называют их прагматичность – качество, которое отличают широкий спектр рассматриваемых языковых явлений, их типичность, сбалансированный объём и контекстуальность, а также возможность неоднократного использования содержащихся в корпусе данных. По мнению авторов, очень важным аспектом функционирования корпуса является также то, что собранные в нём тексты должны иметь конечный установленный размер. Фиксированность текстуального размера выступает важным условием, указывающим на представительность корпуса и репрезентативность языковых данных. Определяя понятие «лингвистический корпус», учёные указывают на наличие таких характеристик корпуса как унификация и разметка в качестве объектов стандартизации. На современном этапе для аннотирования иноязычных текстов корпуса существуют международные стандарты: Corpus Encoding Standard (CES), Text Encoding Initiative (TEI) и др. Языковые корпусы могут быть размеченными (аннотированными) либо не содержать разметку. Безусловно, возможности лингвистических исследований будут значительно шире, если в обработке иноязычной лексики задействованы размеченные корпусы, то есть такие, при создании которых тексты аннотируются специальными метками (англ. tag), содержащими нужную и полезную информацию: сведения об авторе, название текста и его жанровые или стилистические характеристики, описание лексических и грамматических особенностей и т. д. Корпусы также служат одним из самых надёжных источников для разработки разнообразных словарей. В компьютерно-опосредованной среде этот аспект подтверждается тем, что обработка массива лексики при использовании корпусных возможностей позволяет согласовать работу языковедов с требованиями и достижениями современной науки. Опираясь на исследования учёных, В. П. Захаров и С. Ю. Богданова отмечают в своём учебники, что в понятие корпуса лингвистики входит также и корпусный менеджер (англ. corpus manager), представляющий собой специализированную поисковую систему управления данными текста, включающую программный инструментарий для поиска в корпусе необходимых данных, для получения информации статистического характера и для репрезентации пользователю результатов данного поиска. Для лингвистов корпусы служат «экспериментальной базой для проверки гипотез и доказательства своих теорий» [1, с. 234].

На несомненную пользу внедрения корпусного подхода в методике исследования иностранной лексики указывает лингвист Йоне Григалюниене – автор учебника «Корпус в учебном классе» («Corpora in the classroom»). В данном учебнике Йоне Григалюниене приводит несколько неоспоримых аргументов, доказывающих очевидную эффективность и широкие возможности исследования лексического пласта иностранного языка посредством использования лингвистического корпуса: аутентичность, объективность, возможность получения большого количества примеров из языка, новый подход и новое понимание процесса изучения языка, повышение мотивации изучающего иностранный язык. Говоря об исследованиях иноязычной лексики в корпусе лингвистики и указывая на множество достоинств и большой потенциал корпусной обработки текстов, Йоне Григалюниене также говорит о некоторых проблемах, существование которых препятствует широкому использованию возможностей лингвистического корпуса: не смотря на то, что учебный корпус способен оказать колоссальную помощь в обработке и исследовании огромного количества полезной информации  внедрить его использование в учебной группе – трудоёмкое и сложное дело для всех участников образовательного процесса. Поэтому, по мнению автора, чтобы сформировать у студентов представление о том, что они могут узнать из корпусов и как они могут их использовать, их «необходимо обучать и тренировать, как использовать корпусы, знакомить с методами индукции и с корпусным анализом текстов посредством специально разработанных заданий и упражнений» [5, с. 81]. Работая с иноязычной лексикой в корпусе, студенты могут также делать корпусные исследования в различных областях: семантике, фразеологии, синтаксисе и т.д.

Исследователь Е. П. Соснина в своей статье «Корпусная лингвистика и корпусный подход в обучении иностранному языку» даёт характеристику процесса обработки текста и приводит пример лексикографического анализа на базе корпусов, позволяющего раскрыть особенности контекстуальных употреблений тех или иных слов, определить их семантику, выявить частотность сочетаемости с другими словами или использование в разных стилях. Кроме того, учёная отмечает, что целью разработки учебных корпусов, содержащих иноязычные тексты, является предоставление пользователям возможности анализа этих текстов: «Одной из важных особенностей метода анализа на базе корпусов текстов является исследование не только чисто лингвистических явлений (грамматических или лексических функций слов, их связей с другими лексемами), но и таких явлений, как, например, частотности лексем или грамматических конструкций в тех или иных жанрах, диалектах» [4]. Как известно, после создания первых моделей языковых корпусов, по аналогии начали разрабатываться новые корпусы лингвистики – как масштабные, так и узконаправленные. К последним, например, можно отнести учебные корпусы, создание которых предполагает изучение иностранных языков (Learner corpora).

Выявляя возможности корпусного подхода как дидактического метода исследования иноязычной лексики, Е. П. Соснина указывает на такие его характеристики, как надежность (реальность словоупотреблений в естественной языковой среде), достоверность, типичность текстов корпусной базы, наличие программ-конкордансов для анализа в автоматическом и интерактивном режимах обработки текстового материала. Е. П. Соснина также говорит о полезности использования при исследовании иноязычной лексики возможностей конкорданса – программы-поисковика, встроенной в корпус. С помощью конкорданса можно искать не только примеры из аутентичных источников с целыми словами и словосочетаниями для изучения и обработки языковых пластов, но и примеры конкретных морфем, артиклей, аффиксов или флексий.

Указывая на возможность обеспечения автономии преподавателей и студентов, лингвист Л. К. Раицкая в одной из своих статей называет такую возможность одним из главных преимуществ при обработке иноязычной лексики, входящей в фонд электронного лингвистического корпуса. Аргументируя свою мысль, Л. К. Раицкая отмечает, что «конкорданс даёт практически безграничные возможности для разработки заданий для всех уровней обучаемых» [3, с. 123–127], и что это является несомненным положительным моментом ввиду того, что корпус представляет из себя полностью разработанный эффективный ресурс, способный предоставить ответ на практически любой вопрос относительно языковых характеристик текста.

Анализ различных научных подходов к данной проблеме показывает, что вопросы включения лингвистических корпусов в методику исследования иноязычной лексики активно обсуждаются в современной лингводидактике в последнее десятилетие. Неоспоримой считается роль корпусов не только при осуществлении научной обработки текста, но и в формировании иноязычной коммуникативной компетенции обучающихся. «В частности, языковые корпусы предлагается использовать для изучения значения слов, полисемии, употребления близких по семантике слов, управления глаголов, грамматических времён, а также для составления лексико-грамматических тестов [2, с. 283–298].

Таким образом, проведённое нами исследование показывает, что корпусная лингвистика, с самого начала своего появления, является принципиально новой методологической базой, определяющей приоритетные направления репрезентации языка и являющейся одним из основных инструментов методологии, применяемой для интерпретации закономерностей речевой практики посредством компьютерных возможностей. Использование лингвистического корпуса – неотъемлемая часть работы современного лингвиста, переводчика, учёного, историка или исследователя.

 

Список литературы:

  1. Захаров, В. П., Богданова, С. Ю. Корпусная лингвистика: Учебник. 3-е изд., перераб. / В. П. Захаров, С. Ю. Богданова // СПб.: Изд-во С.-Петерб. ун-та, 2020. – 234 с.
  2. Павлова, О. Ю. Использование языковых корпусов в обучении иностранному языку / О. Ю. Павлова // Язык и культура = Language and culture. – Томск, 2021. – № 54. – С. 283–298.
  3. Раицкая, Л. К. Дидактические возможности корпусных интернет-технологий в преподавании иностранного языка в высшей школе / Л. К. Раицкая // Вестник Московского государственного областного университета. Серия: Педагогика, 2009. – № 4. – С. 123–127.
  4. Соснина, Е. П. Корпусная лингвистика и корпусный подход в обучении иностранному языку / Е. П. Соснина [Электронный ресурс]. – Режим доступа: http://ling.ulstu.ru/linguistics/resourses/literature/articles/corpus_linguistics_language_teaching/. – Дата доступа: 15.05.2025.
  5. Grigaliūnienė, J. Corpora in the classroom / J. Grigaliūnienė. – Vilnius University, 2013. – 81 p.
Проголосовать за статью
Дипломы участников
У данной статьи нет
дипломов

Оставить комментарий