Содержание номера
DOI: https://doi.org/10.29025/2079-6021-2026-1-43-53
Подкорпус как инструмент интерпретации и дидактизации дискурса
Резюме:
Предлагаемое исследование посвящено феномену подкорпуса в прикладной лингвистике. Актуальность работы обусловлена тем, что она выполняется в русле Стратегии научно-технологического развития Российской Федерации (п. 21а): «переход к передовым технологиям проектирования и создания высокотехнологичной продукции, основанным на применении интеллектуальных производственных решений, роботизированных и высокопроизводительных вычислительных систем, новых материалов и химических соединений, результатов обработки больших объемов данных, технологий машинного обучения и искусственного интеллекта». Языковым материалом исследования являются актуальные новостные тексты журнала “Der Spiegel” и компании “CNN”, собранные в сбалансированные лингвистические корпусы общим объемом более 5 млн токенов. В качестве технической платформы применяется авторский программный комплекс «Генератор сбалансированного лингвистического корпуса и корпусный менеджер». В процессе работы применялись методы описания, системного анализа и эксперимента. В результате показана технология создания подкорпуса. При этом была решена проблема сохранения идентификационных номеров предложений родительского корпуса. Далее были рассмотрены примеры применения подкорпусов в рамках интерпретации новостного дискурса: извлечены контексты, относящиеся к заданной оператором лексеме, выявлены ее атрибуты, получены частотные списки и пр. В рамках решения лингводидактической задачи исследования были построены подкорпусы, концентрированно содержащие определенные языковые явления: предлоги, союзы, определенные части речи и др. Полученные далее в ходе автоматической процедуры файлы тестовых заданий были успешно интегрированы в систему управления обучением “Moodle”. Были сделаны выводы о том, что работа с подкорпусами значительно расширяет функционал корпусного менеджера и позволяет извлекать широкий спектр данных, необходимых для проведения интерпретации дискурса и составления дидактических материалов, отвечающих требованиям методики обучения иностранным языкам.
Ключевые слова: прикладная лингвистика, лингвистический корпус, подкорпус, родительский корпус, авторское программное обеспечение, корпусный менеджер, интерпретации дискурса, дидактизация.
Для цитирования: Горожанов А.И. Подкорпус как инструмент интерпретации и дидактизации дискурса. Актуальные проблемы филологии и педагогической лингвистики. 2026. №1. С. 43-53. https://doi.org/10.29025/2079-6021-2026-1-43-53.
For citation:
Gorozhanov A.I. Subcorpus as a tool for discourse interpretation and didacticization. Current Issues in Philology and Pedagogical Linguistics. 2026, no 1, pp. 43-53. https://doi.org/10.29025/2079-6021-2026-1-43-53 (In Russ.).
Язык: русский
Об авторе:
Горожанов А.И.
Московский государственный лингвистический университет;
119034, Российская Федерация, Москва,
ул. Остоженка, д. 38, стр. 1;
ORCID ID: 0000-0003-2280-1282;
Web of Science Researcher ID: U-2569-2018;
Scopus Author ID: 57221193252;
SPIN-код: 1753-4920;
e-mail: a.gorozhanov@linguanet.ru
Список литературы:
1. Килина Л.Ф., Колосова Е.И. О грамматической семантике прилагательных человѢчь ичеловѢчьскъ в старорусских летописях. Филология и культура. 2020; 3(61): 62–67. Доступно по: https://cyberleninka.ru/article/n/o-grammaticheskoy-semantike-prilagatelnyh-chelov-ch-ichelov-chsk-v.... Ссылка активна на 10.02.2026.
2. Макарова А.С. Отражение вариантных форм крылатых выражений-галлицизмов в национальном корпусе русского языка: трудности поиска. Проблемы истории, филологии, культуры. 2014; 3(45): 54–55. Доступно по: https://pifk.magtu.ru/doc/pifk-03-2014.pdf. Ссылка активна на 10.02.2026.
3. Радищева В.О. Использование корпусной лингвистики в преподавании иностранных языков. Академический вестник Ростовского филиала Российской таможенной академии. 2020; 1 (38): 135–140. Доступно по: https://akvest.donrta.ru/images/stories/files/vk_full/ab_1_2020_(38).pdf. Ссылка активна на 10.02.2026.
4. Жолобов О.Ф. Контрасты квантификации лексического ряда с глаголами ключитиса – лучитиса и их дериватами в древнерусских рукописях (на материале исторического корпуса «Манускрипт»). Древняя Русь. Вопросы медиевистики. 2024; 3 (97): 158–169. https://doi.org/10.25986/IRI.2024.97.3.014.
5. Матыцина М.С., Прохорова О.Н., Чекулай И.В. Возможности изучения сочетаемости и устойчивости лексических единиц статистическими методами (на примере глагола take). Вестник Волгоградского государственного университета. Серия 2: Языкознание. 2024; 23 (4): 106–118. https://doi.org/10.15688/jvolsu2.2024.4.9.
6. Солнышкина М.И., Гатиятуллина Г.М. История развития корпусной лингвистики (на примере англоязычных корпусов). Вестник Томского государственного университета. Филология. 2020; 63: 132–160. https://doi.org/10.17223/19986645/63/8.
7. Баранов В.А. Исторический корпус средневековых славянских рукописей «Манускрипт» как исследовательский интернет-ресурс (количественно-статистические характеристики существительных брань и рать). Scriptorium slavicum. 2024; 1: 74–84. https://doi.org/10.20913/script-2024-1-06.
8. Кукушкина О.В. Из опыта работы над созданием авторских корпусов текстов. Труды института русского языка им. В.В. Виноградова. 2024; 1: 58–67. https://doi.org/10.31912/pvrli-2024.1.6.
9. Поврозник Н.Г., Исмакаева И.Д. Дискуссии в губернских земствах в отражении текстовых карт: от визуализации к анализу. Вестник Пермского университета. История. 2019; 3 (46): 146–158. https://doi.org/10.17072/2219-3111-2019-3-146-158.
10. Каменский М.В., Бредихин С.Н. Алгоритмические процедуры идентификации рекламных текстов в дискурсивном пространстве средств массовой информации. Вестник Волгоградского государственного университета. Серия 2: Языкознание. 2025; 24(1): 64–78. https://doi.org/10.15688/jvolsu2.2025.1.6.
11. Плунгян В.А. Корпусная лингвистика на современном этапе. Вестник Российской академии наук. 2024; 94 (9): 787–794. https://doi.org/10.31857/S0869587324090018.
12. Бонч-Осмоловская А.А. [и др.] Национальный корпус русского языка 2.0: корпусная платформа, инструменты анализа, нейросетевые модели разметки данных (полная версия). Компьютерная лингвистика и интеллектуальные технологии: по материалам международной конференции «Диалог 2025» 23–25 апреля 2025 г. Доступно по: https://dialogue-conf.org/wp-content/uploads/2025/06/Bonch-OsmolovskayaAAetal.093F.pdf. Ссылка активна на 10.02.2026.
13. Степанова Д.В., Яновская А.С. Языковые средства описания внешности литературного героя: сопоставительный анализ на базе корпуса параллельных текстов. Вестник Московского государственного лингвистического университета. Гуманитарные науки. 2024; 13 (894): 112–120. Доступно по: http://www.vestnik-mslu.ru/Vest/3_884_H.pdf. Ссылка активна на 10.02.2026.
14. Бондарчук Г.Г. Семиотические функции английских наименований одежды в публицистическом тексте (корпусное исследование). Вестник Московского государственного лингвистического университета. Гуманитарные науки. 2024; 4 (885): 23–29. Доступно по: http://www.vestnik-mslu.ru/Vest/4_885_H.pdf. Ссылка активна на 10.02.2026.
15. Котюрова И.А. Применение образовательных данных в предметном обучении в вузе. Вестник Российского университета дружбы народов. Серия: Информатизация образования. 2024; 21 (2): 227–241. Доступно по: https://journals.rudn.ru/informatization-education/article/view/42756. Ссылка активна на 10.02.2026.
16. Горожанов А.И. Теоретико-методологические основы разработки лингвистического корпуса (актуальное состояние и перспектива). Филологические науки. Вопросы теории и практики. 2025; 18 (12): 5556–5565. https://doi.org/10.30853/phil20250748.
Количество показов: 78
ISBN 2619-029X (Online)