Вам может быть интересно:
Архив журнала
Modeling Russian-Slovak Interlingual Homonymy Via Embeddings
- 7
- Article: PDF
DOI: 10.26170/2071-2405-2026-31-1-174-184
Abstract (original): Interlingual lexical interference has long been an object of scholarly research. It is well documented that when learning a foreign language genetically related to the learner’s native language, increased levels of cross-linguistic interference can occur. From this perspective, interlingual homonyms represent particularly high-risk lexical items, as their formal similarity may lead to incorrect mapping between form and meaning. Embedding models capture distributional differences in language use and broader semantic associations. In the present study, static embedding models (fastText and MUSE) and a deep embedding model (OpenAI) were applied to a dataset of Russian-Slovak lexical pairs consisting of interlingual homonyms and translation equivalents (150 items in each category). Based on similarity patterns observed across the models, a five-level typology of interlingual homonymy was proposed (evident-risk, hidden-risk, medium-risk, conceptual-risk, and asymmetric-risk). The predictive potential of the model was tested on a sample of 46 Slovak learners of Russian as a foreign language. A consistent correspondence between model-based risk predictions and learner performance was observed. Lexical items classified as high-risk produced significantly higher error rates among learners, and an asymmetry between productive and receptive tasks was also observed. The results suggest that embedding models may serve as an empirically grounded tool for supporting vocabulary learning in closely related languages.
Key words (original): interlingual homonymy; vector word presentations; predictive didactics; lexica; interference; lexical units; language modeling; embeddings; lexical pairs; interlingual homonyms; Russian language; Russian lexicology; Slovak language; Slovak lexicology; Russian as a foreign language; methods of teaching Russian; Slovak students
Аннотация: Межъязыковая лексическая интерференция на протяжении длительного времени является предметом научных исследований. Хорошо известно, что при изучении иностранного языка, близкородственного родному, может наблюдаться повышенный уровень межъязыковой интерференции. С этой точки зрения межъязыковые омонимы представляют собой лексические единицы повышенного риска, поскольку их формальное сходство может приводить к неправильному соотнесению формы и значения. Модели эмбеддингов отражают как распределительные различия в употреблении языковых единиц, так и более широкие семантические ассоциации. В настоящем исследовании статические модели эмбеддингов (fastText и MUSE), а также глубокая модель эмбеддингов (OpenAI) были применены к корпусу русско-словацких лексических пар, включающему межъязыковые омонимы и переводные эквиваленты (по 150 единиц в каждой категории). На основе выявленных моделей сходства была предложена пятиуровневая типология межъязыковой омонимии (evident-risk, hidden-risk, medium-risk, conceptual-risk и asymmetric-risk). Предиктивный потенциал модели был проверен на выборке из 46 словацких учащихся, изучающих русский язык как иностранный. Было выявлено устойчивое соответствие между прогнозируемым моделью уровнем риска и результатами учащихся. Лексические единицы, классифицированные моделью как высокорисковые, вызывали значительно более высокий уровень ошибок. Кроме того, была зафиксирована асимметрия между продуктивными и рецептивными заданиями. Полученные результаты позволяют рассматривать модели эмбеддингов как эмпирически обоснованный инструмент поддержки освоения лексики при изучении близкородственных языков.
Ключевые слова: межъязыковая омонимия; векторные представления слов; предиктивная дидактика; лексическая интерференция; лексические единицы; языковое моделирование; эмбеддинги; лексические пары; межъязыковые омонимы; русский язык; лексикология русского языка; словацкий язык; лексикология словацкого языка; РКИ; русский язык как иностранный; методика преподавания русского языка; словацкие школьники
Для цитирования:
Гаярски, Л. Моделирование русско-словацкой межъязыковой омонимии с помощью эмбеддингов / Л. Гаярски, М. Кипчатов // Филологический класс. – 2026. – Том 31 • № 1. – С. 174-184. DOI 10.26170/2071-2405-2026-31-1-174-184.
For citation
Gajarsky, L., Kipchatov, M. (2026). Modeling Russian-Slovak Interlingual Homonymy Via Embeddings. In Philological Class. 2026. Том 31 • № 1. P. 174-184. DOI 10.26170/2071-2405-2026-31-1-174-184.
Об авторе (авторах) :
Гаярски Л.
Университет им. Св. Кирилла и Мефодия в Трнаве (Трнава, Словакия)
ORCID ID: https://orcid.org/0000-0001-8090-6977
Кипчатов М.
Университет им. Св. Кирилла и Мефодия в Трнаве (Трнава, Словакия)
ORCID ID: https://orcid.org/0000-0003-3021-6390
Сроки публикации:
Дата поступления: 11.02.2026; дата публикации: 31.03.2026Список литературы:
A comparative evaluation and analysis of three generations of Distributional Semantic Models / A. Lenci, M. Sahlgren, P. Jeuniaux [et al.] // Language Resources and Evaluation. – 2022. – Vol. 56, no. 4. – P. 1269–1313. – DOI: 10.1007/s10579-021-09575-z. – EDN YOSRAP.
BERT: Pre-training of deep bidirectional transformers for language understanding / J. Devlin, M.-W. Chang, K. Lee, K. Toutanova // Proceedings of the 2019 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies (NAACL-HLT). – Association for Computational Linguistics, 2016. – P. 4171–4186.
Boleda, G. Distributional Semantics and Linguistic Theory / G. Boleda // Annual Review of Linguistics. – 2020. – Vol. 6, no. 1. – P. 213–234. – DOI: 10.1146/annurev-linguistics-011619-030303. – EDN BYOZBQ.
Csiriková, M. Zrádná slova v ruštině: Slovník rusko-českých homonym / M. Csiriková, N. Koníčková. – LEDA, 2015.
Deep contextualized word representations / M. E. Peters, M. Neumann, M. Iyyer [et al.] // Proceedings of the 2018 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies (NAACL-HLT). – Association for Computational Linguistics, 2018. – P. 2227–2237.
Gajarský, L. Učebnica rusko-slovenských homonym / L. Gajarský, T. Grigorjanová. – Tribun EU, 2020.
Grigorjanová, T. Slovník rusko-slovenských medzijazykových homonym / T. Grigorjanová, L. Gajarský. – Tribun EU, 2019.
Iermachkova, O. Význam interkultúrnej komunikácie vo vzdelávaní študentov – rusistov / O. Iermachkova, A. Spišiaková // Inovatívne metódy vo výučbe cudzích jazykov z aspektu interkultúrnej komunikácie II : Medzinárodný vedecký zborník recenzovaných štúdií / ed. by M. Vojteková, Z. Slobodová. – Vydavateľstvo Prešovskej university, 2024. – P. 68–76.
Kollár, D. Medzijazyková homonymia / D. Kollár // Studia Academica Slovaca. – 1987. – Vol. 11. – P. 229–233.
Kootstra, G. J. Second language acquisition / G. J. Kootstra, T. Dijkstra, M. Starren // International encyclopedia of the social & behavioral sciences / ed. by J. D. Wright. – 2nd edition. – Elsevier, 2015. – P. 349–359. – DOI: 10.1016/B978-0-08-097086-8.53025-6.
Language models are few-shot learners / T. B. Brown, B. Mann, N. Ryder [et al.] // Advances in Neural Information Processing Systems. Vol. 33 / ed. by H. Larochelle, M. Ranzato, R. Hadsell [et al.]. – Curran Associates, Inc., 2020. – P. 1877–1901. – DOI: abs/10.5555/3495724.3495883.
O’Neill, M. False friends: A historical perspective and present implications for lexical acquisition / M. O’Neill, M. Casanovas Catalá // Bells: Barcelona English Language and Literature Studies. – 1997. – Vol. 8. – P. 103–115.
Odlin, T. Language transfer: Cross-linguistic influence in language learning / T. Odlin. – Cambridge University Press, 1989.
Pančíková, M. Niekoľko príkladov medzijazykovej homonymie – slovinčina, slovenčina / M. Pančíková // Obdobja: Metode in zvrsti v slovenskem jeziku, literatúre in kulturi. – Ljubljana : Center za slovenščino kot drugi/tuji jezik, Filozofska fakulteta, 2003. – P. 495–500.
Text-based Question Difficulty Prediction: A Systematic Review of Automatic Approaches / S. Alkhuzaey, F. Grasso, T. R. Payne, V. Tamma // International Journal of Artificial Intelligence in Education. – 2023. – DOI: 10.1007/s40593-023-00362-1. – EDN WYPOSM.
Uban, A. S. Automatically building a multilingual lexicon of false friends with no supervision / A. S. Uban, L. P. Dinu // Proceedings of the Twelfth Language Resources and Evaluation Conference (LREC 2020). – European Language Resources Association, 2020. – P. 3001–3007.
