Домой / Двери / В каком языке больше слов? Сколько слов в русском языке и сколько слов в английском языке? Сравнение словарного запаса языков мира.

В каком языке больше слов? Сколько слов в русском языке и сколько слов в английском языке? Сравнение словарного запаса языков мира.

С запозданием обнаружил старую новость.

English passed the Million Word mark earlier today, June 10 at 10:22 am GMT
The Global Language Monitor today announced that Web 2.0 has bested Jai Ho , N00b and Slumdog as the 1,000,000 th English word or phrase added to the codex of fourteen hundred-year-old language. Web 2.0 is a technical term meaning the next generation of World Wide Web products and services. It has crossed from technical jargon into far wider circulation in the last six months…

At its current rate, English generates about 14.7 words a day or one every 98 minutes.


These are the fifteen finalists for the one millionth English word, all of which have met the criteria of a minimum of 25,000 citations with the necessary breadth of geographic distribution, and depth of citations.
1,000,000: Web 2.0 - The next generation of web products and services, coming soon to a browser near you.
999,999: Jai Ho! - The Hindi phrase signifying the joy of victory, used as an exclamation, sometimes rendered as “It is accomplished”. Achieved English-language popularity through the multiple Academy Award Winning film, “Slumdog Millionaire”.
999,998: N00b — From the Gamer Community, a neophyte in playing a particular game; used as a disparaging term.
999,997: Slumdog - a formerly disparaging, now often endearing, comment upon those residing in the slums of India.
999,996: Cloud Computing - The ‘cloud’ has been technical jargon for the Internet for many years. It is now passing into more general usage.
999,995: Carbon Neutral — One of the many phrases relating to the effort to stem Climate Change.
999,994: Slow Food — Food other than the fast-food variety hopefully produced locally (locavores).
999,993: Octomom - The media phenomenon relating to the travails of the mother of the octuplets.
999,992: Greenwashing - Re-branding an old, often inferior, product as environmentally friendly.
999,991: Sexting - Sending email (or text messages) with sexual content.
999,990: Shovel Ready - Projects are ready to begin immediately upon the release of federal stimulus funds...


In addition, the 1,000,001 st word is Financial Tsunami - The global financial restructuring that seemingly swept out of nowhere, wiping out trillions of dollars of assets, in a matter of months
Each word was analyzed to determine which depth (number of citations) and breadth (geographic extent of word usage), as well as number of appearances in the global print and electronic media, the Internet, the blogosphere, and social media (such as Twitter and YouTube). The Word with the highest PQI score was deemed the 1,000,000th English language word. The Predictive Quantities Indicator (PQI) is used to track and analyze word usage.
Global Language Monitor has been tracking English word creation since 2003. Once it identifies new words (or neologisms) it measures their extent and depth of usage with its PQI technology.

http://www.languagemonitor.com/news/1000000th-english-word-announced

На 4 октября 2009 г. в английском языке уже 1002116 слов.
http://www.languagemonitor.com/

А сколько слов в современном русском языке?
С какой скоростью увеличивается количество слов в нем?
Ведет ли кто-нибудь его мониторинг?

П.С.
Пока максимальная оценка - Словарь В.Даля, около 200 тыс. слов.

"Словарь Вильяма Шекспира, по подсчёту исследователей, составляет 12 000 слов. Словарь негра из людоедского племени Мумбо-Юмбо составляет 300 слов. Эллочка Щукина легко и свободно обходилась тридцатью"? ("Двенадцать стульев" И. Ильф и Е. Петров).
Словарь языка великого английского драматурга на самом деле содержит не 12, а 15 тысяч слов (по другим данным - порядка 20 тысяч), а в четырёхтомном "Словаре языка Пушкина" (М., 1956-1961) - 21 191 слово. Именно столько слов учёные насчитали во всех произведениях и письмах Пушкина, правда, половину из них он употребил только по одному разу. Есть и другие мнения. В конкордансе Спевака (1968 год) указано, что в произведениях Шекспира насчитывается 29 066 лексем (различных слов - different words) и 884 647 слов в общей сложности (words altogether).
Словарный запас Пушкина подсчитать довольно сложно в силу особенностей русского языка. В среднем, если приблизиться к английской интерпретации, получится около 29 000 уникальных слов.
В повседневном общении мы обычно пользуемся 1000 - 1500 слов. Этого количества нам вполне хватит, чтобы вести несложную бытовую беседу на родном языке (дома, на работе, в магазине) и даже справиться с помощью словаря с чтением простых текстов на другом языке (базовый английский - 850 слов).
Среднестатистический англичанин, американец, канадец и т.д. знает значение около 75 тыс. слов, но далеко не все слова активно использует. В словаре младенца в возрасте от полутора до двух лет - не более пяти десятков речевых единиц.
По подсчётам американских исследователей - The Global Language Monitor - английский стал первым языком, в котором словарный запас перешагнул миллионный рубеж.
В научной строгости их подсчётов, конечно, можно усомниться. Один из наиболее авторитетных в мире специалистов по английской филологии Дэвид Кристал считает, что "инвентаризация" словесного запаса - вообще бессмысленная затея.
Стоит ли ли считать, скажем, словами аббревиатуры наподобие CNN или IBM? Могут ли трактоваться разными словами английский и американский орфографические варианты написания слов? Правильно ли включать в общую статистику научные термины на латыни? Можно ли назвать "словом" обозначение, содержащее в себе цифры (Web 2.0)? И так далее. По оценке Кристала, английский лексикон увеличивается медленнее, чем полагает The Global Language Monitor, - приблизительно на тысячу новых слов в год. Но поскольку других, более достоверных подсчетов нет, как и статистики по русскому языку - тоже, то приходится ориентироваться на официозные публикации. Остается доверять исследованиям и подсчетам данной американской группы исследователей.
Несомненно, что словарь Шекспира гораздо богаче словаря его предшественников и достигает внушительного количества словесных знаков в двадцать с лишним тысяч лексических единиц. Он намного уступает словарю реалистов двадцатого века, например, Голсуорси и Лондона. Даже небольшой по дарованию писатель, описывающий и детализирующий факты окружающей обстановки, в особенности писатель, склонный к натурализму, может обогнать в этом отношении Шекспира. Ну и что? Количество никогда не определяет качество!
В разных культурах разнообразны критерии подходящести, допуска слов в литературный язык. В европейской континентальной традиции господствует централизованное планирование, тогда как у островитян-англосаксов принят неформальный подход.
Например, у французов лексика проходит строгую цензуру со стороны такого института как Academie Francais (Академия французского языка). Он решает, какие слова относятся к литературному французскому языку, а какие нет. В силу такой цензуры сложилась ситуация, когда можно признать, что во французском языке, со всей его богатейшей литературой, не более 150000-200000 слов.
В английском языке легче всего придумать слово и сразу ввести его в язык. Так, Шекспир писал, что придумал около 1,7 тысячи слов из своего писательского словаря в 20 тысяч слов. Это, конечно, огромное достижение для писателя, его превышает только Пушкин: 29 тыс.слов - абсолютный и непревзойденный индивидуальный рекорд активного словаря всех времен.
Большинство образованных европейцев актуально, активно используют не более 8-10 тысяч слов, а пассивно (без адекватного понимания) - 50 тысяч и более.
Общее количество слов в сохранившихся литературных памятниках на древних языках составляет:
- в латыни - около 100 000 слов;
- в древнегреческом - более 100 000;
- в древнеисландском языке - не менее 100 000 слов, из которых около половины сохранено дошедшими до наших дней памятниками письменности;
- в санскрите (литературном языке древней Индии) - более 200 000 слов. Санскрит очень богат сложными словами, составленными из нескольких корней (вроде русских "громогласный" или "быстроскачущий".
Анализ компании Global Language Monitor состоял из нескольких этапов. На первом этапе подсчитывались слова, которые вошли в известнейшие словари английского языка: Merriam-Webster"s, Oxford English Dictionary, Macquarie"s. В последнее издание словаря Merriam-Webster"s вошло 450 тысяч английских слов.
На втором этапе сотрудники компании на основе специального исследовательского алгоритма учитывали все неологизмы английского языка. При этом производился анализ текстов в сети Интернет, включая блоги и другие неформальные сетевые ресурсы. Учитывались периодические издания, как в электронном, так и бумажном виде, новинки литературы различной направленности. Этот прием в работе компании Global Language Monitor вызывает сомнения: при подсчетах в лексику английского языка включаются как устаревшие слова и словосочетания, так и сленговые образования. Кроме того, при этом методе учета, учитываются и слова, употребляемые только в разновидностях английского языка, к примеру, в Китае и Японии. Это составляет порядка 20% от общего количества слов, которые признаются специалистами компании. В качестве лексических новинок английского языка, учтитывались также и языковые ляпы...
Классические методы учета слов гораздо консервативнее. К примеру, Оксфордский словарь учитывает как независимо существующие только 300 тысяч слов.
Английский язык не только создает свои, но и весьма активно заимствует чужие слова из языков всего мира. Еще со времен Вильгельма Завоевателя он наполовину французский. Сейчас, когда миллионы людей в транснациональных компаниях общаются на английском, который для них неродной, возникают целые комплексы лексики "китайского английского", "латиноамериканского английского", "японского английского". Эти комплексы лексики относятся к так называемым окказионализмам: словам, созданным случайно, для однократного употребления.
Существуют также слова, которые используются очень узкой частью общества. Например, одной семьей, социальной группой, территориальным объединением. Или только в одной социальной среде, местности. Можно ли считать этот окказионализм полноправной частью лексики?
Основное ядро языка, как английского, так и русского, содержит не менее 250 и, по мнению специалистов, не более 300 тысяч слов. К этому в обоих языках можно добавить (а можно и не добавлять): архаизмы и диалектизмы (охлобыстнуть, ендова, веретьё, поярковый) – еще около 100-200 тысяч словесных образований; технические термины, преимущественно заимствованные из наук (драйвер, штангенциркуль, молдинг, коньюгация, гибридизация и т.д.) – не менее 300-500 тысяч; жаргон, он же сленг, который бывает бытовым, молодежным, журналистским, профессиональным, бандитским (распил, винда, черкизон, пиарщик, подстава) – еще 100 тысяч. Получается около 700 тысяч. Такой набор слов не сложно "раздуть" до миллиона: в русском – путем включения производных слов типа "переразогревшийся" или "недорассмотренный", "симбиотический", в английском – благодаря заимствованиям из латинского, китайского, арабского и японского. Несложно смоделировать обратную ситуацию, когда в русском языке будет под миллион слов, а в английском – всего 300 тысяч.
Более подробно о словарном запасе Пушкина:http://www.stihi.ru/2010/03/24/1825

В Оксфордском словаре в четыре раза больше слов, чем в БАСе - Большом академическом словаре русского языка. "Великий и могучий" полон английских заимствований. Школьники перестали понимать Пушкина. Что происходит с русским языком? Рождает ли он новые слова? Почему наши словари такие тонкие? На эти вопросы "РГ" отвечает один из авторов Большого академического словаря русского языка - знаменитого БАСа Людмила Кругликова.

Как считают словарный запас? Почему Оксфордский словарь такой толстый?

Людмила Кругликова: Лингвисты избегают такого рода сравнений между языками и словарями. У каждого своя специфика. Скажем, в Вебстеровский словарь в качестве самостоятельных статей включаются символы, например, химических элементов: B (бор), Ba (барий), Be (бериллий), Br (бром) и так далее, сокращенные наименования мер длины, веса, объема: km (километр), kg (килограмм), bbl (баррель)... Мало того, толковые словари английского языка начали включать символы обозначений размеров листов бумаги: А3, А4, А5, а также, например, символ @.

Поэтому вывод о бедности русского языка и богатстве английского на том основании, что Большой академический словарь русского языка (БАС), который начал выходить в 2004 году (опубликовано 22 тома из предполагаемых 33), будет содержать 150 000 слов, а Оксфордский (Тhe Oxford English Dictionary, сокращенно OED) - 600 000, не что иное, как обман. БАС отражает лексику только современного литературного языка, а Оксфордский словарь - слова всех разновидностей и всех вариантов (американского, канадского и т.д.) английского языка начиная с 1150 года, включая мертвые.

А сколько слов в русском языке, если считать по-английски?

Людмила Кругликова: Если мы добавим к 150 000 слов современного русского литературного языка, например, еще и диалектные слова, то получим уже 400 000 слов...

Как объяснить тот факт, что один из самых известных английских словарей Вебстеровский стал резко худеть, и время "похудения" пришлось на Вторую мировую войну и начало "холодной"?

Людмила Кругликова: Не стоит искать в лингвистических процессах какую-то политику. Вебстеровский словарь, появившийся в 1909 году, содержал 400 000 английских слов. В его втором издании (1934 год) содержится 600 000 слов, в третьем (1961 год) - 450 000 слов. На основании этого можно заявить, что с 1934 года началось катастрофическое вырождение английского языка. А причина таких резких скачков всего лишь в том, что у второго и третьего изданий были разные редакторы, а у них разные принципы подхода к отбору слов.

На сайте издательской фирмы Merriam-Webster сказано: "Считается, что словарь английского языка включает примерно миллион слов". Это честная цифра?

Людмила Кругликова: Большинство лингвистов восприняло такую оценку с долей юмора, а некоторые сказали, что они не были бы удивлены, если бы он оценивался в четверть миллиона.

Откуда тогда взялся миллион?

Людмила Кругликова: Начиная с 2006 года некто Дж. Дж. Паяк, специалист по маркетингу и аналитике, основатель компании Global Language Monitor неоднократно заявлял о том, что скоро будет зафиксировано миллионное слово английского языка. Таким словом стало, по версии Паяка, "Web 2.0", которое является техническим термином. Кстати, уже есть и Web 3.0, а в Сети идет речь о скором появлении Web 4.0, Web 5.0. Если включать все подобные образования, то скоро можно будет говорить о миллиардном слове английского языка.

Как англичане и американцы относятся к таким сенсациям?

Людмила Кругликова: Приведу высказывание Нунберга, лингвиста из Школы информации в Калифорнийском университете в Беркли: "Наше восхищение необъятностью английского языка возникает из своего рода лингвистического империализма - ощущения, что "наши словари больше, чем их словари". Но это на самом деле не делает нас сколь-либо богаче лингвистически".

Но и среди исследователей "великого и могучего" есть лингвистические пессимисты, которые считают, что корни русского языка "бесплодны": не рождают новых слов, а большинство неологизмов имеет иностранное происхождение...

Людмила Кругликова: Лингвист и философ Михаил Эпштейн утверждает, что в XIX веке было 150 слов с корнем "люб", а наши современники знают в три раза меньше. Между тем в "Словообразовательном словаре русского языка" Тихонова, насчитывающем около 145 000 слов современного русского литературного языка, имеется 310 слов с корнем "люб". А если считать начиная с первых памятников письменности, то получится 441 слово. В английском языке, по данным OED, только 108 лексем с аналогичным корнем (love) в начале слова.

Новые слова "про любовь" современные россияне производят?

Людмила Кругликова: В начале ХХ века появилось существительное "книголюб", а затем "природолюб", "однолюбка", "любовь-игра", "любовь-ненависть", "любовь-морковь", "безлюбье". При беглом просмотре я насчитала не менее 40 слов с корнем "люб", которые появились в XX - начале XXI века. В английском языке с корнем (love) только пять единиц вошло в язык в ХХ веке (с 1907 по 1989 год), а после этого времени ни одной.

Насколько активны сейчас наши соотечественники в политическом словотворчестве?

Людмила Кругликова: В этом отношении весьма интересно читать комментарии в Интернете. События на Украине вызвали к жизни такие лексемы, как майдауны, майданутые, онижедети, укры, укропы, псакинг, Фашингтон, Гейропа и другие. Приживутся они или нет, покажет время.

Наши депутаты периодически восстают против заимствований. Где их критический предел в языке? 70% - катастрофично?

Людмила Кругликова: По подсчетам лингвистов, во втором издании Вебстеровского словаря только 35% исконных английских слов, остальные 65% - заимствования. Но пока ничего катастрофического не случилось. Русский язык действительно испытывает большое влияние английского. Но обогащение его англицизмами наблюдается прежде всего в сфере необщенародной лексики, среди которой преобладают термины из области спорта, компьютерного дела, экономики, финансов. Плохо, если они начинают влиять на структуру языка. С русским этого не происходит. Иноязычные слова подстраиваются под систему, заимствованные корни обрастают русскими аффиксами, например: постить, смайлик, океюшки, лайкать и даже облайканный.

За 10 лет работы над БАСом сделано 22 тома - это две трети работы. Вас не упрекают за медлительность?

Людмила Кругликова: Над БАСом работают 5 штатных лингвистов, 3 совместителя и несколько сотрудников издательства. В год выходит в среднем по два тома. Над Оксфордским словарем работают 78 лингвистов, 46 внештатных сотрудников, а также 200 консультантов, штат программистов, маркетологов. Когда в нью-йоркском офисе Оксфордского словаря узнали о наших темпах работы мизерными силами, то план работы их сотрудников увеличили, а главного редактора отправили на пенсию.

Сколько слов в русском языке и сколько слов в английском языке?

Угрожающие попытки "развенчать мифы о великом и могучем"

Хорошо известно, что словарный запас различных языков неодинаков. Лексикон цивилизованного человека может в десятки раз превышать словарный запас представителя какого-нибудь дикого племени Африки. Также понятно, что и в пределах одного и того же языка у разных носителей словарный запас сильно различается: у ребенка и взрослого, у дворника и профессора... В любом случае, ни у кого не возникает сомнений, что более обширный словарь всегда связан с запасом знаний и интеллектуальным превосходством. А теперь внимание: что бы вы подумали, если бы вам официально заявили, что наш русский язык - дикарский, содержит в пять раз меньше слов, чем английский? Конечно, возмущенно оспорили бы эту чушь! Однако подобное "научное мнение" неоднократно транслируется в СМИ. Это не может не настораживать.

Последний раз это утверждение прозвучало с телеэкранов в 2011 году. Но обсуждать и анализировать легче не телепередачи, а печатные материалы, с которыми легче ознакомиться (например, в интернете). Так, можно заглянуть в архив журнала "Наука и жизнь". В 6-м номере за 2009 год опубликована доктора филологических наук (!), некоего Милославского, под издевательским названием "Великий, могучий русский язык". В нем автор "развенчивает мифы" о русском языке. В частности, утверждается, что "по весьма огрубленным подсчетам, словари английского литературного языка содержат порядка 400 тыс.слов, немецкого - порядка 250 тысяч, русского - порядка 150 тысяч". Из чего предлагается сделать выводы о том, что "богатство русского языка - миф" (почти дословная цитата). Вообще, статья написана в духе самооплевывания, характерного для начала 90-х; меня даже несколько поразила ее анахроничность. Не говоря уж о полной ненаучности.

Автор даже не упомянул о сложностях и проблемах подсчета слов и вообще о проблеме возможности и уместности сколь-нибудь научного определения и сравнения словарного запаса целых языков. Считаю необходимым привести следующие возражения.

1) В разных культурах различны критерии "допуска" слов в литературный язык. В континентальной традиции господствует централизованное планирование, тогда как у англосаксов во всем стихия рынка (неформальный подход). Например, у французов лексика проходит строгую цензуру со стороны такого органа как Academie Francais (Академия французского языка). Она решает, какие слова принадлежат литературному французскому языку, а какие нет. В силу такой цензуры сложилась ситуация, когда считается, что во французском языке, со всей его богатейшей литературой, не более 150.000-200.000 слов. В английском же каждый может придумать слово и сразу ввести его в язык. Так, Шекспир писал, что придумал около 1,7 тыс.слов из своего писательского словаря в 21 тысячу слов. Это, кстати, огромное достижение для писателя, его превышает только наш Пушкин: 24 тыс.слов, абсолютный и непревзойденный индивидуальный рекорд активного словаря всех времен - см. "Словарь языка Пушкина" в 4-х томах (М., 1956-1961). Большинство же образованных европейцев активно используют не более 8-10 тыс.слов, а пассивно - 50 тыс. и более.

Очевидно, названные автором той статьи 150.000 русских слов - это слегка округленный объем широко известного Большого Академического словаря русского языка (БАС), который в издании 1970 года в 17 томах насчитывал 131 257 слов. А английские 400.000 - это, по-видимому, последние издания Оксфордского и Вебстера. Причем в предпоследних изданиях этих же английских словарей слов было в несколько раз меньше (конкретику можно посмотреть в интернете). Откуда же такой прирост и почему их словари содержат больше слов, чем наши? Первая причина - беззастенчивый подсчет архаизмов, которые современные англичане и американцы, конечно же, не знают. В английской филологической традиции лексикой современного английского языка считаются все слова со времен Шекспира (современника Ивана Грозного и Бориса Годунова). В российской же традиции вся допетровская, а с подачи знаменитого лексикографа Ушакова - и допушкинская лексика считается древне- или старорусской.

Вторая причина в том, что стали еще менее строгими критерии "приема" новых слов в язык. Подходы к английскому языку становятся всё более смелыми, появляющиеся в интернете оценки просто фантастичны. Так, агентство GLM (Global Language Monitor, сайт www.languagemonitor.com) рапортует о появлении... миллионного слова в английском языке! По тому, какое слово считается миллионным, сразу понятно, за какую свалку мусора они пытаются выдать английский язык: это "слово" Web 2.0! И это наряду с тем, что (the) web ("паутина") считается отдельным словом. Очевидно, Web 1.0 тоже где-то посчитали как отдельное слово! Более того, они не стесняются считать словами словосочетания: в качестве 1 000 001-го слова посчитано "financial tsunami" - "Финансовое цунами". В таком случае и в русском языке наряду со словами "финансовый(-ая,-ое)" и "цунами" есть слово "финансовое цунами", которое можно посчитать. Впрочем, пуристы, составлявшие БАС, вряд ли включили в него слово "цунами", поскольку это иностранное заимствование (об этом см. следующий пункт ниже).

Для справки:

Анализ компании Global Language Monitor состоит из нескольких этапов. На первом этапе подсчитываются слова, которые вошли в известнейшие словари английского языка: Merriam-Webster"s, Oxford English Dictionary, Macquarie"s . При этом стоит заметить, что в последнее издание словаря Merriam-Webster"s вошло только 450 тысяч английских слов. На втором этапе сотрудники компании на основе специального исследовательского алгоритма учитывают все неологизмы английского языка. При этом производится анализ текстов в сети Интернет, включая блоги и другие неформальные сетевые ресурсы. Учитываются периодические издания, как в электронном, так и бумажном виде, новинки литературы различной направленности. Именно этот прием в работе компании Global Language Monitor вызывает шквал критических замечаний со стороны независимых экспертов. Главный упрек сводится к тому, что при подсчетах в лексику английского языка включаются как устаревшие слова и словосочетания, так и сленговые образования. Кроме того, при своем методе учета, компания учитывает и слова, употребляемые только в разновидностях английского языка, к примеру, в Китае и Японии. А это составляет порядка 20% от общего количества слов, которые признаются специалистами компании. Вдобавок ко всему, в качестве лексических новинок английского языка, учтены и языковые ляпы, допущенные Президентом США - Бушем.

Предлагаю: внести в словарь все ляпы Черномырдина и тем самым "перегнать Америку"!

Классические методы учета слов гораздо консервативнее. К примеру, Оксфордский словарь учитывает только 300 тысяч слов.

2) Английский не только создает свои, но и весьма активно заимствует чужие слова из языков всего мира. Мы жалуемся на засилье английских заимствований, но тот слой научно-технической и деловой лексики, который проник в наш язык с падением железного занавеса, - это лишь жалкая горсточка по сравнению с активными заимствованиями, без всякого ложного стеснения производимыми английским языком. Еще со времен Вильгельма Завоевателя он наполовину французский. Получается, что мы заимствуем заимствованное! Или, образно говоря, перекупаем купленное. А теперь, когда миллионы людей в транснациональных компаниях общаются на английском, который для них неродной, возникают целые пласты лексики "китайского английского", "латиноамериканского английского", "японского английского". Эти пласты лексики относятся к так называемым окказионализмам .

Для справки:

Окказионализмы - это слова, созданные спонтанно, для однократного употребления. Встает вопрос - с какого момента считать это слово частью словарного запаса? Сколько нужно повторений этого слова в речи или в печати, чтобы прийти к выводу, что оно перестало быть случайным артефактом и стало полноправной частью лексики?

Существуют также слова, ограниченные очень узкой частью социума. Скажем, одной семьей. Реальный пример: все члены одной известной мне семьи называют вареную картошку, поджаренную с колбасой, словом «второжарёнка». Это их собственное изобретение, и больше я такого слова нигде не встречал. Можно ли считать этот окказионализм полноправной частью русской лексики?