Lexical Evolution of English and Uzbek Literary Prose in the Nineteenth and Twentieth Centuries in a Corpus Study
Abstract
This article traces nineteenth–twentieth century lexical change in English and Uzbek literary prose using corpora. Sources include COHA for English, Google Books Ngram, Project Gutenberg, and the Uzbek National Corpus alongside Jadid literature. Frequency profiles, collocations, and diachronic embeddings reveal lexical replacement (phonograph → radio; motor-car → car), semantic shift (English awful, gay; Uzbek millat, tarbiya), and register migration from educated Arabic–Persian elements to Soviet-era Russian internationalisms and post-1991 political lexis. The analysis shows that rates of change correlate with socio-technological cycles; prototype cores and peripheries reconfigure around new practices, leaving measurable traces in fiction. Implications are drawn for terminography, literary translation, and curricula grounded in corpus evidence rather than intuition (Davies, 2010; Michel et al., 2011; Hamilton et al., 2016).
Keywords:
Diachronic corpus lexical change collocation semantic shift Jadid literature English UzbekЛитературный язык редко меняется скачком, но в корпусных данных его движение видно как пульсацию. XIX век в английской прозе наследует архаические формы обращения и синтаксические привычки раннего модерна, однако уже во второй половине столетия частота thou и связанных с ним форм окончательно тает, уступая место стандартному you; рядом исчезают лексемы, связанные с прежними технологиями и бытом – phlogiston, dirigible, gas-light – они сдают позиции словам нового мира – electric, telephone, motor-car, позже car (Davies, 2010; Michel et al., 2011). В художественной прозе это не просто словарь предметов; это способ смещения фокуса опыта: то, что раньше описывалось через свечи и почтовые дилижансы, в XX веке закрепляется через свет неона, радиоэфир и автомобилизацию. Графики Ngram и частотные срезы COHA позволяют видеть перекрёстную динамику: wireless перетекает в radio, затем отступает перед broadcast и station, а эпитет awful смещается от «внушающий благоговейный страх» к усилителю субъективной оценки «очень плохой/ужасный», что сигналят новые коллокации и жанровые контексты (Michel et al., 2011).
В узбекской прозе XIX–XX веков траектория иная, но ритм узнаваем: от книжного слоя с сильной арабо-персидской традицией и чагатайскими формами в джадидской парадигме – к словарю социальной модернизации и советской индустриализации, а затем – к постсоветскому обновлению. На материале романов Абдулла Қодирий (O‘tkan kunlar, 1926/1994) и Чўлпон (Kecha va kunduz, 1936/1991), а также прозы советского периода (Ойбек, П. Қодиров) видно, как стилистическое ядро перестраивается: лексика, коннотативно связанная с адатами и патриархальными институтами, уступает место терминологии государственного строительства, техники и организованного труда: temir yo‘l, zavod, kombinat, traktor, sovxoz/kolxoz, kommunizm – всё это формирует новые тематические гнёзда и устойчивые словосочетания, которые хорошо считываются в ОТМК по росту относительных частот и коллокационным профилям (O‘zbek tilining milliy korpusi, n.d.). В 1990-е меняется семантический пейзаж: слова mustaqillik/istiqlol, bozor, fuqarolik jamiyati закрепляются в публичной прозе и публицистически окрашенной художественной речи, постепенно формируя прототипическое ядро постсоветского лексикона.
Корпусная перспектива помогает уйти от соблазна анекдотов. Сдвиги лучше видны через «паспорт» лексемы: относительная частота по десятилетиям, коллокации с глаголами и прилагательными, типовые синтаксические рамы. В английских романах конца XIX века motor-car сначала живёт как новинка с определителями new, modern, mechanical, но уже к середине XX века сокращается до car и перестаёт маркироваться как необычное – меняется даже профиль прилагательных (из сферы «необычности» в сферу «владения» и «скорости»). В узбекских текстах millat в джадидском дискурсе тяготеет к коллокациям ma’rifat, taraqqiyot, til и дискурсу «uyg‘onish», тогда как в позднесоветском и раннепостсоветском периодах он соседствует с davlat, mustaqillik, siyosat, что отражает семантическое перетягивание от культурно-просветительского к политико-правовому ядру. Подобные переходы фиксируются и моделями диахронических эмбеддингов, где векторы слов группируются с «новыми соседями», а угол между десятилетними представлениями лексемы даёт меру семантического дрейфа (Hamilton et al., 2016).
Скорость обновления лексикона, если судить по английскому материалу, коррелирует с технологическими циклами: периоды массовых инноваций перетасовывают не только инвентарь предметной лексики, но и оценочные маркеры. Слова-усилители, модальные глаголы, прагматические частицы демонстрируют менее драматичный, но устойчивый тренд: появление разговорной нормы в прозе модернизма и постмодернизма, что видно по росту частоты конструкций с just, really, kind of и др. В узбекской прозе цикл ускорений задаётся политическими переломами: джадидская модернизация и советская трансформация кодифицируют заимствования, меняют модели словообразования, выталкивают часть арабо-персидских форм на периферию, а часть – переопределяют в новом дискурсивном окружении. Корпусно регистрируются, например, продолжительные коллокации с tarbiya – от традиционно-морального к «sotsialistik tarbiya» – и обратное смещение после 1991 года к гражданско-нравственному, образовательному контексту.
Важно различать вытеснение и сосуществование. Phonograph практически исчезает из английской художественной речи, но wireless не исчез, а «включился» в новый семантический пучок, вернувшись в XXI веке с цифровыми коннотациями. Узбекское sovxoz редуцируется после 1991 года, но «аграрное» гнездо переинициализируется другими лексемами. Литературный язык, особенно роман, оказывается хроникёром преемственности: он задерживает уходящие слова в архив памяти через ретроспективные сцены, цитаты, стилизацию. В частотах это крошечные «хвосты»; в семантическом плане – мосты между эпохами.
Корпусные методы здесь не самоцель, а способ дисциплинировать интуицию. Сначала собирается репрезентативная выборка по десятилетиям; затем считается относительная частота на миллион слов, строятся коллокационные профили с ограничением на MI/LL-метрики; далее – тестируются «смысловые повороты» с помощью выравнивания векторных пространств по десятилетиям и измерения косинусного сдвига для целевых лексем (Hamilton et al., 2016; Sinclair, 1991). Для узбекского материала критично совмещать ОТМК с авторитетными изданиями классиков и биобиблиографическими справочниками – это снижает жанровый шум и балансирует влияние публицистики, где лексическая мода более волатильна. Наконец, объяснения не должны отрываться от близкого чтения фрагментов: именно сопоставление графиков с конкретными эпизодами у Қодирий, Чўлпон, Ойбек или у Диккенса, Харди, Вулф показывает, что «повороты» языка мотивированы нарративными задачами, а не только внешними событиями.
Практические последствия для гуманитарной инфраструктуры очевидны. Лексикография выигрывает от прототипической организации статей: «ядро» значения задаётся через корпусные коллокации и типовые сцены, периферия документируется как регистровые роли и исторические срезы. Перевод и преподавание литературы обогащаются корпусными замечаниями: переводчик видит, что awful у Диккенса ещё несёт высокий стиль и благоговение, а у авторов XX века – преимущественно негативную оценку; преподаватель показывает в аудитории, как millat в джадидском контексте – программа культурного самосознания, тогда как в позднем советском – часть иного политического дискурса. Наконец, для цифровых гуманитарных проектов важно публиковать не только сиротские частоты, но и открытые ноутбуки/скрипты с параметрами расчётов – это делает результаты воспроизводимыми и пригодными для расширения в школьных и университетских курсах (Michel et al., 2011).
Глобальный вывод прост и, пожалуй, оптимистичен. Литературный язык XIX–XX веков – это лаборатория, где общественные и технологические процессы оставляют измеримую лексическую подпись. Корпусные методы позволяют схватить эту подпись без идеологического тумана, а затем развернуть её в практические решения: от обновления словарей и хрестоматий до уточнения школьных программ. Мы не обязаны выбирать между «интуитивным чувством эпохи» и «сухими частотами»: дисциплинированное чтение, подкреплённое данными, даёт читателю и исследователю ту самую опору, которая удерживает мост между текстом и историей.
References
Cho‘lpon. (1991). Kecha va kunduz (repr. of 1936 ed.). G‘afur G‘ulom Nashriyoti.
Cohen, J. (Ed.). (2006). The Penguin book of Victorian verse. Penguin Classics.
Davies, M. (2010). The Corpus of Historical American English (COHA): 400+ million words, 1810–2009. International Journal of Corpus Linguistics, 15(2), 159–190. https://doi.org/10.1075/ijcl.15.2.02dav
Hamilton, W. L., Leskovec, J., & Jurafsky, D. (2016). Diachronic word embeddings reveal statistical laws of semantic change. In Proceedings of ACL 2016 (pp. 1489–1501). Association for Computational Linguistics.
Michel, J. B., Shen, Y. K., Aiden, A. P., et al. (2011). Quantitative analysis of culture using millions of digitized books. Science, 331(6014), 176–182. https://doi.org/10.1126/science.1199644
O‘zbek tilining milliy korpusi. (n.d.). Retrieved from https://til.korpus.uz/
Project Gutenberg. (n.d.). Retrieved from https://www.gutenberg.org/
Qodiriy, A. (1994). O‘tkan kunlar (repr. of 1926 ed.). Yangi Asr Avlodi.
Sinclair, J. (1991). Corpus, concordance, collocation. Oxford University Press.
Woolf, V. (2000). Mrs Dalloway. Penguin Classics.
Published
Downloads
How to Cite
Issue
Section
License
Copyright (c) 2025 Нигора Сатибалдиева

This work is licensed under a Creative Commons Attribution 4.0 International License.
