Prototype-based categorization of words and senses
Abstract
Prototype-based categorization models lexical membership as graded rather than categorical, with best examples at the center and marginal instances at the periphery (Rosch, 1978; Taylor, 2003). This article argues that polysemy is organized by family resemblance (Wittgenstein, 1953), yielding core–periphery structures whose boundaries can be read off from collocational profiles and distributional vectors (Geeraerts, 2010). Integrating the Generative Lexicon’s notion of complex types with corpus diagnostics, prototypes help distinguish regular polysemy from homonymy, delineate sense boundaries, and inform terminography and translation policies (Pustejovsky, 1995; Murphy, 2002). The conclusion is pragmatic: prototypes are not only a cognitive metaphor but a decision device for lexicography, corpus semantics, and pedagogy, aligning native-speaker intuition with reproducible evidence.
Keywords:
Прототип категоризация полисемия «семейное сходство» коллокации распределительная семантика терминографияЛексическая система редко подчиняется жестким рубежам; она живет вокруг примеров, которые сообщества носителей считают «самыми подходящими». Именно поэтому идея прототипа удерживает внимание уже полвека: она объясняет, почему «чайка» ближе к «птице», чем «пингвин», и почему «стул» легче распознается, чем «табурет», хотя все они принадлежат к одному разряду. Формула проста, но последствия обширны. Если членство в категории градуально, то и смысловые поля слов устроены как плавные градиенты. У значений есть центр, куда «стягиваются» признаки, и периферия, где вариативность управляется практикой и контекстом (Rosch, 1978; Taylor, 2003).
В языке это видно прежде всего на полисемии. Когда мы говорим о «платформе» – технической, социальной, политической, – мы не переключаемся между разными, никак не связанными словами; мы движемся по семейству сходств, где общий образ опоры, основы, среды поддерживает переход от одной роли к другой. Уитгенштейн предложил метафору «семейного сходства» для таких множеств: нет единственного общего признака, есть сеть перекрывающихся сходств (Wittgenstein, 1953). Прототипная оптика позволяет увидеть в этой сети структуру: центральный узел с плотной связностью и отростки, которые еще распознаются как «свои», но требуют больше контекста для устойчивого чтения (Geeraerts, 2010).
В практическом описании это означает, что словарная статья должна начинаться не с абстрактного «минимума определения», а с того, что в сообществе считается лучшим примером – прототипом. Именно он организует критерии типичности: набор свойств, сценариев и коллокаций, которые делаются «по умолчанию». Так у «окна» технического смысла появится устойчивый кружок соседей – «диалог, панель, свернуть/развернуть», – а у архитектурного «окна» – «рама, проём, перемычка». Коллокационные профили фиксируют это различие, а распределительная семантика, вычисляющая близость слов по контекстам, делает его измеримым (Sinclair, 1991; Geeraerts, 2010).
Расплывчатые границы не означают произвола. Наоборот, прототипная структура дисциплинирует объяснение. Границы значений оказываются границами совместимости с типичными предикатами и аргументными рамками. В терминах Generative Lexicon многие ядра связаны «составными типами»: «книга» – физический объект и информация, «университет» – место и учреждение, «обед» – событие и результат. Полисемия здесь регулярна: мы можем без странности совместно приписывать прилагательные к разным аспектам, если они согласуются с прототипом («толстая и интересная книга»), но спотыкаемся на сочетаниях, которые рвут типичность («тяжелая и вдохновляющая полка» – для «полки» как категории мебели нет интеллектуального аспекта) (Pustejovsky, 1995; Murphy, 2002). Такой «тест совместной предикации» работает как диагностика: если два предиката гармонично адресуют разные фасеты той же категории, мы имеем дело с управляемой многозначностью, а не с омонимией.
Корпусная перспектива превращает интуицию в процедуру. Лексемы обладают сигнатурными соседями – устойчивыми глаголами, прилагательными, предлогами, синтаксическими рамками. Частотные срезы показывают, где центр: чем стабильнее и разнообразнее «ядровые» соседи, тем ближе значение к прототипу. Периферия проявляется как кластеры с меньшей стабильностью и большей зависимостью от жанра: техническое «платформа» и политическое «платформа» разведутся по двум орбитам, сохраняя мост из базовой метафоры опоры. В распределительных векторах это видится как ветвление ближайших соседей: одни тянутся к «SDK, совместимость, развертывание», другие – к «программа, курс, обещание». Подобные индикаторы позволяют прописывать в словарях не только дефиниции, но и «паспорт контекста»: жанры, регистры, коллокации, типовые рамки управления (Sinclair, 1991; Geeraerts, 2010; Taylor, 2003).
Прототипная логика переосмысливает вопрос о «жестких дефинициях». Если категория устроена вокруг лучшего примера, то строгие genus + differentia полезны, но не самодостаточны: они фиксируют логическую схему, не всегда захватывая фактическую типичность. Так, определить «птицу» как «теплокровное яйцекладущее позвоночное с перьями» логично, но типичная «птица» в воображении – летающая и чирикающая; пингвин по определению – птица, но далек от центра. В языке этот сдвиг важен: выбор переводческой эквивалентности или терминологической метки должен учитывать, что пользователю ближе – определение или прототипический сценарий (Rosch, 1978; Lakoff, 1987).
Для полисемии это означает практическое правило различения. Если два употребления слова тянутся к одному прототипическому центру и разделяют семейство признаков, их стоит описывать как грани одного значения. Если же ближайшие соседи и предикаты почти не пересекаются, а тест совместной предикации проваливается, разумно признать омонимию. Так, «лук» как «растение/овощ» и «лук» как «оружие» не поддерживают единого семейства сходств; напротив, «окно» интерфейса и «окно» в стене сохраняют мост в виде рамки «проем/граница/видимость», а их расхождение объясняет жанр (Murphy, 2002; Geeraerts, 2010).
Прототипы оказываются особенно плодотворны в лексикографии и терминографии. Словарная статья, устроенная как «прототип → периферия → жанры», лучше поддерживает пользователя, чем плоский перечень значений. Она предупреждает типичные ошибки: указывает, что политическое «платформа» склонно к коллокациям «реформа, программа, обещание», а техническое – к «портировать, совместимость, экосистема». В переводе это снимает соблазн буквального переноса, который рушит типичность целевого языка. В обучении – подсказывает, какие примеры дадут учащемуся надежный центр, а какие стоит вводить как периферию, где без контекстных подсказок легко ошибиться (Taylor, 2003; Geeraerts, 2010).
Часто возражают, что прототипы слишком «психологичны», а язык требует формальных границ. Но именно связка прототипной семантики с формальными и вычислительными инструментами снимает это напряжение. Категориальные центры можно операционализировать через устойчивость коллокаций и плотность векторов; границы – через падение совместимости предикатов и резкий дрейф ближайших соседей при смене жанра. В итоге гибридная методология – психолингвистическая интуиция + корпус + формальная проверка – дает воспроизводимый контур смысла (Geeraerts, 2010; Pustejovsky, 1995).
Наконец, прототипы – это еще и этика описания. Они напоминают, что язык социально распределен: разные сообщества по-разному закрепляют лучший пример. Для одного круга «платформа» – это GitHub, для другого – партийная программа; для третьего «окно» – это GUI-элемент. Хорошее описание признает множественность центров и маркирует их регистрами, не выдавая периферийное за центральное и наоборот. Тогда лексикон перестает казаться набором жестких клеток и предстает тем, чем он является в употреблении: живой картой сходств, где прототипы – ориентиры, а границы – зоны ответственности.
Именно в этом смысле прототипная категоризация – не декоративная теория, а рабочее основание для решений: как писать словари, как обучать, как переводить и как программно распознавать значения. Ее сила – в терпимости к размытости при строгих процедурах диагностики. И чем аккуратнее мы фиксируем центры и периферии, тем предсказуемее становятся наши описания – и тем меньше мы спорим о словах там, где нужно договариваться о делах.
References
Geeraerts, D. (2010). Theories of lexical semantics. Oxford University Press.
Lakoff, G. (1987). Women, fire, and dangerous things: What categories reveal about the mind. University of Chicago Press.
Murphy, M. L. (2002). Lexical meaning. Cambridge University Press.
Pustejovsky, J. (1995). The generative lexicon. MIT Press.
Rosch, E. (1978). Principles of categorization. In E. Rosch & B. Lloyd (Eds.), Cognition and categorization (pp. 27–48). Lawrence Erlbaum.
Sinclair, J. (1991). Corpus, concordance, collocation. Oxford University Press.
Taylor, J. R. (2003). Linguistic categorization (3rd ed.). Oxford University Press.
Wittgenstein, L. (1953). Philosophical investigations. Blackwell.
Published
Downloads
How to Cite
Issue
Section
License
Copyright (c) 2025 Зулфия Тухтаходжаева

This work is licensed under a Creative Commons Attribution 4.0 International License.
