Главная

По литературе

Сколько слов в русском языке.

Пожалуй, ни один академик не ответит вам точно на вопрос, сколько в русском языке слов. Просто никому еще не удалось их точно подсчитать, ибо живой русский язык содержит не только литературные нормы, но и изобилует диалектизмами, профессионализмами и жаргонизмами. Язык постоянно развивается, пополняясь все новыми и новыми словами и формами. Но примерную оценку все же можно сделать…

Кроме того, ученые расходятся в методологии подсчета. Так, например, в Великобритании в справочные издания, такие как Оксфордский или Вебстеровский словари, принято включать в абсолютно все. Там можно найти даже статьи по символам (в том числе обозначение химических элементов, сокращения мер веса, длины и других физических величин, форматы бумаги и т.д.) и специальные термины (например, «WEB 2.0» - это отдельная статья!). В российской научной традиции в словари включаются только полноценные лингвистические единицы литературного языка.

Самым авторитетным отечественным изданием, по которому можно судить о емкости языка, является Большой академический словарь, первое издание которого вышло еще в советские годы. Он насчитывает 131 257 слов русского литературного языка. Сейчас идет работа над новым изданием этого справочника, которое будет содержать уже около 150 000 слов. Дореволюционный словарь В.И.Даля насчитывает более 200 000 слов.

По оценкам профессиональных лингвистов, если к этому добавить диалектизмы, то получится уже более 400 000 слов. Если же еще учесть профессиональные термины, неформальные единицы и новообразования, то число слов перевалит далеко за полмиллиона!

Язык – это живая система. Некоторые слова «умирают», выходя из употребления полностью или оставаясь лишь в литературных произведениях. Но на их место приходят новые. Например, в XX-начале XXI веке русский язык обогатился не менее чем на 40 слов только с корнем «люб»: «книголюб», «природолюб», «однолюбка», «любовь-игра», «любовь-ненависть», «любовь-морковь», «безлюбье» и другие. Новые веяния приносят в нашу жизнь и новые слова, которые образуются либо на основе уже существующих русских лингвистических единиц, либо путем русификации иностранных заимствований: «постить», «смайлик», «океюшки», «лайкать» и т.п.

А вот считать заимствования в любом языке – дело совершенно неблагодарное. За всю историю человечества большинство языков подверглись (и подвергаются до сих пор) очень существенному взаимному влиянию. В русском языке огромное количество заимствований из скандинавских, балтийских, тюркских, арабских, европейских языков и наречий, и, конечно, из латыни и греческого. Некоторые слова были заимствованы так давно, что воспринимаются исконно русскими. А между тем, даже «деревня», «боярин», «кувшин», «ларь», «кнут», «сахар», «свёкла», «фонарь», «телега», «руль», «ботинок» и многие-многие другие – это заимствования из других языков.

Английский язык, из которого сегодня идет наибольший поток заимствований в другие языки, тоже не эталон чистоты. В Вебстеровском словаре только 35% исконных английских слов, остальные 65% - заимствования.

Говорить о «бедности» или «богатстве» какого-либо распространенного языка не совсем корректно. Например, английский и русский языки в целом сопоставимы по количеству слов (лингвисты оценивают реальную емкость английского языка примерно в 470 тыс. слов). Вопрос лишь в их применимости и частоте употребления, а также размере словарного запаса у среднего носителя языка.

В русском языке, согласно «Частотному словарю русского языка» под редакцией Л. Н. Засориной , наиболее употребительными являются около 30 тысяч слов, а наибольшую частоту имеют чуть более 6 тысяч слов. А самых-самых распространенных в повседневной речи – около 2 500 тысяч.

В лексиконе классика русской литературы А.С.Пушкина было примерно 21 тысяча слов (столько насчитали в его произведениях, включая не только основные лексемы, но и производные от них: лист-листик-листочек и т.д.). Словарный запас обычного человека оценивается по-разному. Единства в методике подсчета и результатах нет. Есть противоречивые данные, что словарный запас выпускника школы составляет от 3 000 до 40 000 слов. А у человека с высшим образованием – от 7 000 до 80 000 слов. При таких подсчетах надо учитывать, что словарный запас подразделяется на активный и пассивный. Активный запас состоит из тех, слов, смысл которых человек понимает и использует их в речи, а пассивный – из тех, что понимает, но на практике не пользуется.

Вы сами можете пройти один из тестов на определение пассивного словарного запаса по этой ссылке http://www.myvocab.info/ Для чистоты эксперимента советуем сделать это пару раз. О результатах пишите в комментариях к посту.

P.S. Если у вас есть интересные материалы, справки, советы, лайфхаки абсолютно по любой теме, то присылайте их на почту проекта #Ликбез Этот e-mail адрес защищен от спам-ботов, для его просмотра у Вас должен быть включен Javascript .

Сколько слов в русском языке?

На этот вопрос, казалось бы, ответить очень просто. Стоит только обратиться к самому авторитетному из современных словарей.

Учёные-лингвисты, создавшие «Большой академический словарь» в 17-ти томах, зафиксировали 131 257 слов. Как мы видим, ими подсчитано каждое слово, но есть небольшая ремарка, способная на порядок изменить конечное число.

Языковедами не были учтены на -о , -е , образованные от , например, безмолвно (от прил. безмолвный ), откровенно (от прил. откровенный ).
«Большой академический словарь» включает только слова литературного языка, а это значит, что в нём нет диалектной лексики.
В словаре вы не увидите (сегодня их принято считать самостоятельными словами), терминов и неологизмов.
В языкознании до сих пор нет точного и исчерпывающего определения, что такое слово, и «виноваты» в этом не учёные-языковеды, а чрезвычайная сложность такого явления, как язык. Именно по этой причине учёными были подсчитаны выборочно все сложные прилагательные с первым компонентом , например, двухрублёвый , однодневный , тридцатидневный .

Но даже если взять во внимание и первое, и второе … и четвёртое, сосчитать все слова современного русского языка никто не сможет, поэтому языковеды и лингвисты пришли к единому мнению: язык в количественном отношении неисчислим.

Но несмотря на все богатство и великолепие русского языка, в нём вы не найдете слов, обозначающих следующие чувства, состояния или ощущения:

侘寂 (wabi-sabi, японский) - возможность или даже умение увидеть прекрасное в несовершенстве, например, в отсутствии головы и рук у статуи Ники Самофракийской или в трещине на Царе-Колоколе.

Tartle (шотландский) - паническое состояние, когда вам нужно познакомить с кем-то человека, а вы не можете вспомнить его имени.

Fond de l’air (французский) - «дно воздуха» (дословный перевод). Выражение принято употреблять в следующей ситуации: на улице лето, светит солнце, и вроде бы пора уже легко одеться, но на самом деле жутко холодно, аж до дрожи.

Lagom (шведский) - не слишком много и не слишком мало, а так, чтобы в самый раз. Аналог русского - «точно, как в аптеке» или «тютелька в тютельку», но, правда, у шведов одна языковая единица.

Myötähäpeä (финский) - чувство, знакомое, наверное, каждому: кто-то сделал что-то дурацкое, а стыдно почему-то за это вам.

Iktsuarpok (язык инуитов) - представьте, что вы у себя дома ждёте кого-то в гости. А этот кто-то не идёт и не идёт. И тогда вы не находите себе места - начинаете выглядывать в окно, выбегать на балкон, потом снова - в окно… Как-то так.

Yuputka (язык ульва, индейцев Гондураса и Никарагуа) - ощущение, когда идёшь по лесу, и тебе кажется, что к твоей коже кто-то прикасается, например, призраки.

Cafune (бразильский, португальский) - нежно проводить пальцами по волосам того, кого ты любишь.

Desenrascanco (португальский) - умение выпутаться из сложной ситуации, не имея при этом ни продуманного решения, ни каких-либо возможностей. Самый приблизительный аналог - «родиться в рубашке», но это несколько другое. В русском языке имеется в виду, когда беда прошла стороной.

バックシャン (bakku-shan, японский) - когда барышня со спины кажется привлекательной, а при виде её лица становится страшно. Думаю, здесь лучше всего меня поймут мужчины.

Ilunga (южно-африканское Конго) - человек, который может понять и простить в первый раз, снисходительно отнестись во второй, но в третий раз, если ты его подставишь, - мало не покажется.

Mamihlapinatapai (яганский язык, кочевые племена Огненной Земли) - взгляд, которым люди обмениваются и осознают, что оба хотят одного и того же, но никто не решается начать первым.

Oka (язык ндонга, Нигерия) - если будучи в Нигерии раньше времени объедитесь лягушками, в данном случае, до сезона дождей, то именно это с вами и случится. Oka - затруднённое мочеиспускание. Помните, «Мы лягушками нынче объелись, и у нас животы разболелись!» - тоже, видимо, до сезона дождей лопали.

Kaelling (датский) - видели женщин, которые стоят около песочницы, во дворе, в парке или супермаркете и орут как блаженные на собственных детей? Так вот. Датчане называют их именно так.

Kummerspeck (немецкий) - «бекон горя» (дословный перевод). Обозначает состояние, когда вы начинаете сверх меры есть всё подряд, чтобы заглушить депрессию.

Glaswen (уэльский) - неискренняя улыбка, когда человек улыбается, а ему совсем невесело или, скажем, не до веселья в этот момент.

Koyaanisqatsi (язык индейцев Хопи, США) - «природа, потерявшая баланс и утратившая гармонию» или «стиль жизни, настолько сумасшедший, что это противоречит самой природе». Скажем так: исчерпывающая характеристика жизни современного человека в мегаполисе.

Tingo (паскуальский, Океания) - брать взаймы у друга деньги или вещи, пока у того вообще ничего не останется, кроме голых стен.

Sgiomlaireachd (гэльский, древнейший язык Шотландии) - раздражение, которое вызывают люди, отвлекающие от еды, когда ты безумно голоден.

Nakakahinayang (тагальский, Филиппины) - чувство сожаления, которое испытываешь от того, что не смог воспользоваться ситуацией или предоставленными возможностями, потому что побоялся рискнуть. А у кого-то всё получилось, как надо.

L’esprit d’escalier (французский) - «дух лестницы» (дословный перевод). Чувство, которое испытываешь после разговора, когда была возможность сказать многое, а хорошо сформулировал или вспомнил об этом только сейчас. Одним словом, поздно дошло, что и как нужно было говорить.

Rwhe (язык тсонга, разновидность банту, Южная Африка) - голым в нетрезвом состоянии упасть на полу и заснуть.

חוצפה (chucpe, иврит) - шокирующее, циничное и наглое поведение, которое формально неоспоримо.

Backpfeifengesicht (немецкий) - физиономия, по которой, ой, как чешутся руки заехать. Ближайший аналог в русском языке - «просит кирпича».

눈치 (nunchi, корейский) - искусство быть не backpfeifengesicht, а человеком, вежливым и тактичным. Это тот, кто поймёт настроение собеседника и с уважением его выслушает. Близкий аналог - интеллигент.

P. S. Скрупулезные статистические данные давно известны: в русском языке более полумиллиона слов.

Казалось бы, сосчитать, сколько слов в русском языке, совсем несложно. Достаточно, скажем, обратиться к самому авторитетному из словарей, большому академическому изданию - "Словарю современного русского литературного языка", изданному аж в 17 томах. В словаре этом содержится 131257 слов. Значит ли это, что столько же слов и в русском языке?

Что не вошло в словарь

Количество слов в русском языке на самом деле может значительно отличаться от их числа в словаре. Почему? Да потому, к примеру, что образованные от качественных прилагательных наречия на -о, -е в словаре не рассматриваются как самостоятельные единицы. А сколько их, кто считал?

Кроме того, самый авторитетный из современных словарей русского языка, что ни говори, называется "Словарь современного русского литературного языка". Да, да, именно литературного. А это значит, что он не содержит ненормативную лексику. Не содержит и диалектизмов. Диалектизмы, к слову сказать, нашли отражение в "Толковом словаре живого великорусского языка" Владимира Даля. В нем 200000 слов. Но и там далеко не все слова русского языка.

А термины, обозначающие научные и технические понятия? А неологизмы? А новые слова, появившиеся в эпоху бурных изменений 90-х? А аббревиатуры? Помните, сколько их (на что обратил внимание и посетовал Владимир Маяковский) появилось в первые годы советской власти? А имена собственные? Они, конечно, тоже не нашли отражения в "Словаре современного русского литературного языка".

Кстати, об именах собственных. Кто считал, сколько их в России? Так же, как никто не считал, сколько в России городов, весей, рек, озер. Ведь их названия - это имена собственные, изучением которых занимается специальный раздел языковедения - ономастика. А космические объекты, так называемые астронимы? Ведь практически каждый из них тоже имеет свое имя собственное.

Все слова живого развивающегося языка сосчитать невозможно. К таким выводам пришли языковеды-русисты, которые утверждают, что в количественном отношении язык неисчислим. Язык развивается, а это означает, что какие-то слова выходят из употребления, им на смену приходят новые. Зафиксировать этот процесс невозможно, настолько он неуловим.

Если говорить грубо - например, "web" в современном английском значит "паутина" и "интернет". При этом существует и слово-аббревиатура "internet", засим многие (особенно русские) академики не учитывают "веб" в качестве двух слов. Хотя при этом вполне могут обозначать "мяч", "мяча", "мячу" и другие производные по падежам, как уникальные слова, каждое из которых добавляет +1 в "счетчик" Великого и Могучего.

А тот же китайский вообще слов не имеет в традиционном для нас понимании, у них идеограмматика. Иероглифы меняют значение в зависимости от взаимного местоположения, образуя новые лексемы. Система настолько сложна, что даже имя в паспорте можно писать несколькими разными способами. А если попытаться при этом разобрать его на "слова", вполне стандартное для нас имя может значить "электрическая задница дракона небесных гор" или "сундук немытых палочек всевластия". По этой причине, кстати, автопереводчики с китайского и выдают подобную хрень - на Али, в частности. Это язык контекстов, и если переводить с него на европейские языки без потери смысла худо-бедно удастся, то разложить на какое-то определенное количество слов не представляется возможным ввиду отсутствия в структуре языка самого этого понятия.

Так вот, все эти разночтения в попытках "сравнить" даже такие близкие (в масштабах планеты) русский и английский или там французский и испанский, приводят к тому, что в разных источниках (вполне авторитетных) количество слов в языке может отличаться в разы и даже на порядки. Так что тема спорная и конфликтная, т.к. все смотрят со своей колокольни и считают по-разному.

Просто смиритесь, что это один из немногих научных вопросов, любой ответ на который будет чьей-то нелепой пропагандой или, что вероятнее, просто ошибкой.

Точное число, безусловно, назвать невозможно по целому ряду причин. Но приблизительные данные лингвистами давно обобщены и проанализированы. Напишу о двух языках, с которыми я работаю больше всего.

Английский. Большинство лингвистов сходятся на мнении, что в языке Шекспира и Диккенса примерно 1 миллион слов. В зависимости от того, как именно и что именно считать, примерная погрешность составляет "до четверти миллиона". Словарь Webster"s Third New International Dictionary, Unabridged содержит 470 000 словарных статей (не слов, обратите внимание). The Oxford English Dictionary, Second Edition - примерно столько же.

Русский язык. В словаре Ожегова более 70 000 слов. В словаре Ушакова - более 90 000. БТС содержит примерно 130 000 слов. Эти цифры покрывают, по данным , примерно 50% всех слов, зафиксированных в большой словарной картотеке (БСК) Института лингвистических исследований РАН (ИЛИ РАН). Это позволяет, опять же, примерно, оценить общее число.

Сколько слов в русском языке и сколько слов в английском языке?

Угрожающие попытки "развенчать мифы о великом и могучем"

Хорошо известно, что словарный запас различных языков неодинаков. Лексикон цивилизованного человека может в десятки раз превышать словарный запас представителя какого-нибудь дикого племени Африки. Также понятно, что и в пределах одного и того же языка у разных носителей словарный запас сильно различается: у ребенка и взрослого, у дворника и профессора... В любом случае, ни у кого не возникает сомнений, что более обширный словарь всегда связан с запасом знаний и интеллектуальным превосходством. А теперь внимание: что бы вы подумали, если бы вам официально заявили, что наш русский язык - дикарский, содержит в пять раз меньше слов, чем английский? Конечно, возмущенно оспорили бы эту чушь! Однако подобное "научное мнение" неоднократно транслируется в СМИ. Это не может не настораживать.

Последний раз это утверждение прозвучало с телеэкранов в 2011 году. Но обсуждать и анализировать легче не телепередачи, а печатные материалы, с которыми легче ознакомиться (например, в интернете). Так, можно заглянуть в архив журнала "Наука и жизнь". В 6-м номере за 2009 год опубликована доктора филологических наук (!), некоего Милославского, под издевательским названием "Великий, могучий русский язык". В нем автор "развенчивает мифы" о русском языке. В частности, утверждается, что "по весьма огрубленным подсчетам, словари английского литературного языка содержат порядка 400 тыс.слов, немецкого - порядка 250 тысяч, русского - порядка 150 тысяч". Из чего предлагается сделать выводы о том, что "богатство русского языка - миф" (почти дословная цитата). Вообще, статья написана в духе самооплевывания, характерного для начала 90-х; меня даже несколько поразила ее анахроничность. Не говоря уж о полной ненаучности.

Автор даже не упомянул о сложностях и проблемах подсчета слов и вообще о проблеме возможности и уместности сколь-нибудь научного определения и сравнения словарного запаса целых языков. Считаю необходимым привести следующие возражения.

1) В разных культурах различны критерии "допуска" слов в литературный язык. В континентальной традиции господствует централизованное планирование, тогда как у англосаксов во всем стихия рынка (неформальный подход). Например, у французов лексика проходит строгую цензуру со стороны такого органа как Academie Francais (Академия французского языка). Она решает, какие слова принадлежат литературному французскому языку, а какие нет. В силу такой цензуры сложилась ситуация, когда считается, что во французском языке, со всей его богатейшей литературой, не более 150.000-200.000 слов. В английском же каждый может придумать слово и сразу ввести его в язык. Так, Шекспир писал, что придумал около 1,7 тыс.слов из своего писательского словаря в 21 тысячу слов. Это, кстати, огромное достижение для писателя, его превышает только наш Пушкин: 24 тыс.слов, абсолютный и непревзойденный индивидуальный рекорд активного словаря всех времен - см. "Словарь языка Пушкина" в 4-х томах (М., 1956-1961). Большинство же образованных европейцев активно используют не более 8-10 тыс.слов, а пассивно - 50 тыс. и более.

Очевидно, названные автором той статьи 150.000 русских слов - это слегка округленный объем широко известного Большого Академического словаря русского языка (БАС), который в издании 1970 года в 17 томах насчитывал 131 257 слов. А английские 400.000 - это, по-видимому, последние издания Оксфордского и Вебстера. Причем в предпоследних изданиях этих же английских словарей слов было в несколько раз меньше (конкретику можно посмотреть в интернете). Откуда же такой прирост и почему их словари содержат больше слов, чем наши? Первая причина - беззастенчивый подсчет архаизмов, которые современные англичане и американцы, конечно же, не знают. В английской филологической традиции лексикой современного английского языка считаются все слова со времен Шекспира (современника Ивана Грозного и Бориса Годунова). В российской же традиции вся допетровская, а с подачи знаменитого лексикографа Ушакова - и допушкинская лексика считается древне- или старорусской.

Вторая причина в том, что стали еще менее строгими критерии "приема" новых слов в язык. Подходы к английскому языку становятся всё более смелыми, появляющиеся в интернете оценки просто фантастичны. Так, агентство GLM (Global Language Monitor, сайт www.languagemonitor.com) рапортует о появлении... миллионного слова в английском языке! По тому, какое слово считается миллионным, сразу понятно, за какую свалку мусора они пытаются выдать английский язык: это "слово" Web 2.0! И это наряду с тем, что (the) web ("паутина") считается отдельным словом. Очевидно, Web 1.0 тоже где-то посчитали как отдельное слово! Более того, они не стесняются считать словами словосочетания: в качестве 1 000 001-го слова посчитано "financial tsunami" - "Финансовое цунами". В таком случае и в русском языке наряду со словами "финансовый(-ая,-ое)" и "цунами" есть слово "финансовое цунами", которое можно посчитать. Впрочем, пуристы, составлявшие БАС, вряд ли включили в него слово "цунами", поскольку это иностранное заимствование (об этом см. следующий пункт ниже).

Для справки:

Анализ компании Global Language Monitor состоит из нескольких этапов. На первом этапе подсчитываются слова, которые вошли в известнейшие словари английского языка: Merriam-Webster"s, Oxford English Dictionary, Macquarie"s . При этом стоит заметить, что в последнее издание словаря Merriam-Webster"s вошло только 450 тысяч английских слов. На втором этапе сотрудники компании на основе специального исследовательского алгоритма учитывают все неологизмы английского языка. При этом производится анализ текстов в сети Интернет, включая блоги и другие неформальные сетевые ресурсы. Учитываются периодические издания, как в электронном, так и бумажном виде, новинки литературы различной направленности. Именно этот прием в работе компании Global Language Monitor вызывает шквал критических замечаний со стороны независимых экспертов. Главный упрек сводится к тому, что при подсчетах в лексику английского языка включаются как устаревшие слова и словосочетания, так и сленговые образования. Кроме того, при своем методе учета, компания учитывает и слова, употребляемые только в разновидностях английского языка, к примеру, в Китае и Японии. А это составляет порядка 20% от общего количества слов, которые признаются специалистами компании. Вдобавок ко всему, в качестве лексических новинок английского языка, учтены и языковые ляпы, допущенные Президентом США - Бушем.

Предлагаю: внести в словарь все ляпы Черномырдина и тем самым "перегнать Америку"!

Классические методы учета слов гораздо консервативнее. К примеру, Оксфордский словарь учитывает только 300 тысяч слов.

2) Английский не только создает свои, но и весьма активно заимствует чужие слова из языков всего мира. Мы жалуемся на засилье английских заимствований, но тот слой научно-технической и деловой лексики, который проник в наш язык с падением железного занавеса, - это лишь жалкая горсточка по сравнению с активными заимствованиями, без всякого ложного стеснения производимыми английским языком. Еще со времен Вильгельма Завоевателя он наполовину французский. Получается, что мы заимствуем заимствованное! Или, образно говоря, перекупаем купленное. А теперь, когда миллионы людей в транснациональных компаниях общаются на английском, который для них неродной, возникают целые пласты лексики "китайского английского", "латиноамериканского английского", "японского английского". Эти пласты лексики относятся к так называемым окказионализмам .

Для справки:

Окказионализмы - это слова, созданные спонтанно, для однократного употребления. Встает вопрос - с какого момента считать это слово частью словарного запаса? Сколько нужно повторений этого слова в речи или в печати, чтобы прийти к выводу, что оно перестало быть случайным артефактом и стало полноправной частью лексики?

Существуют также слова, ограниченные очень узкой частью социума. Скажем, одной семьей. Реальный пример: все члены одной известной мне семьи называют вареную картошку, поджаренную с колбасой, словом «второжарёнка». Это их собственное изобретение, и больше я такого слова нигде не встречал. Можно ли считать этот окказионализм полноправной частью русской лексики?

Разделы