Почему англичане говорят “drove”, а не “drived”?
Стоит отметить, что заголовок статьи, опубликованной на днях в “The New York Times”, отсылает к английским неправильным глаголам, с которым сталкивался каждый, кто пытался освоить язык международного общения. Речь в статье идёт об одной из главных нон-фикшн книг этого года на американском рынке – «Неизученное: Большие базы данных как способ взглянуть на человеческую культуру под увеличительным стеклом».
Восемь лет назад студенты последнего курса Гарварда с факультета эволюционной динамики Эрез Эйден и Жан-Батист Майкл задумались над этим вопросом и решили, что тут должны действовать законы естественного отбора. В английском языке окончание “-ed”, маркирующее прошедшее время, вытекает из протоиндоевропейской системы определения времён по звуковым изменениям. И только небольшая группа глаголов, называемых неправильными, воспротивилась этому правилу и сохранила свою особую форму.
Чтобы проверить своё предположение, Эйден и Майкл изобрели механизм, названный ими «культуромиксом». Это механизм способен отслеживать массу цифровой информации, чтобы выявить изменения в языке и в культуре. Это исследование и стало основой книги «Неизученное: Большие базы данных как способ взглянуть на человеческую культуру под увеличительным стеклом». Книга позволяет читателю вместе с авторами совершить увлекательное путешествие в необъятный мир цифровой информации, результаты которого превзошли самые смелые ожидания.
Чтобы разобраться в проблеме “drived/drove”, Эйден и Майкл попросили двух студентов прочесть все учебники по староанглийской грамматике, составить список неправильных глаголов и проследить их метаморфозы в течение последующих веков. Студенты выявили 177 неправильных глаголов в древнеанглийском языке, в среднеанглийском (XIV век, времена Джеффри Чосера) это число сократилось до 145, а в современном языке их осталось лишь 98. Часто используемые глаголы в большинстве своём сохранили свои неправильные формы, а вот редко используемые в 11 случаях из двенадцати приобрели стандартную “-ed”-форму.
Авторы пишут: «Данные говорят, что в культуре действуют примерно те же законы, на которых построены принципы естественного отбора. Наиболее явственно отпечатки этого механизма можно увидеть на примере трансформации неправильных глаголов. Частое употребление благоприятно сказалось на способности этих глаголов сохранять свою форму».
Вдохновлённые успехами на почве лингвистики, Эйден и Майкл отправились за более серьёзной добычей. Они задумались вот над каким вопросом – возможно ли, отталкиваясь от лексикона, используемого в то или иной время, отследить малейшие трансформации в мыслительном процессе человека? Это казалось невозможным – учитывая огромное количество слов и их бесконечное множество сочетаний.
По счастью мегапроект Google Books, целью которого была оцифровка всех 130 миллионов когда-либо напечатанных книг, запускался как раз в тот момент, когда молодые исследователи наметили для себя новую цель.
Состоялось несколько встреч, по результатам которых авторам позволили прибегнуть к помощи новой программы. В 2010 году, работая с Google, они довели до совершенства свою разработку Ngram Viewer. Этот «историк-робот», как его в шутку называют ребята, может осуществлять поиск по 30 миллионам томов, уже оцифрованных в рамках программы Google Books. Он незамедлительно генерирует таймлайн частотности использования того или иного слова, фразы, даты или имени.
Они выделили самых часто упоминаемых людей, рождённых в период с 1800 по 1949, что дало неожиданные результаты. Среди рождённых в 1871 году чаще всего в текстах всплывает имя Корделла Халла, госсекретаря во времена Франклина Делано Рузвельта – он опередил даже Орвилла Райта, одного из братьев – изобретателей самолёта. Также исследование позволяет вычислить время, которое понадобилось тому или иному человеку, чтобы прославиться. В наши дни знаменитостями становятся в гораздо более раннем возрасте, чем, например, полвека назад.
Да и сам объём славы, если можно так сказать, увеличился. Например, авторы пишут, что частота упоминания имени Билла Клинтона в два раза превосходит частоту употребления слова «огурец», и в два раза уступает частоте употребления слова «помидор». А уж сравнивать имя 42-го президента США с овощами второго ряда вроде репы или цветной капусты и вовсе глупо – президента вспоминают в десятки раз чаще.
Один только этот монументальный термин – «культуромикс» – даёт понять, что в планах молодых учёных нечто большее, чем очередная интеллектуальная игра. Журнал “Mother Johns”, восхищённый изобретением, охарактеризовал его как «пожалуй, самое великое приспособление для траты времени в Интернете». Впрочем, Эйден и Майкл не согласны и с этой формулировкой: «Как телескоп Галилео открывал новые прежде невообразимые миры, так и мощная линза «культуромикса» предназначена, чтобы трансформировать гуманитарные науки и коренным образом поменять социологию».
Впрочем, такое заявление кажется немного хвастливым. Нет, конечно, очень интересно узнавать, что английское слово “donut” (пончик) незадолго после открытия в 1950 году первого кафе “Dunkin’ Donuts” вдруг начинает приобретать различные варианты написания. И множество других удивительных фактов также подаются читателю на блюдечке с голубой каёмочкой – однако нельзя сказать, что сочинение это каким-либо образом претендует на то, чтобы выбить почву из-под ног социологов и гуманитариев.
Эта программа даёт ответы на вопросы «что?» и «когда?», но отказывается отвечать на главный – «почему?» Например, возьмём ситуацию с определённым временным периодом. По мере приближения определённого года, о нём начинают упоминать всё чаще, ждут каких-либо связанных с ним событий. Когда этот год наступает, только о нём все и говорят, только его событиями живут. Когда год проходит, внимание общественности концентрируется на следующей цифре, в прошлое заглядывают лишь по необходимости. Чем дальше год от сегодняшнего дня, тем реже о нём вспоминают. Количество упоминаний о 1872 в 1896 сократилось вдвое, на это понадобилось 23 года. А вот чтобы общественность позабыла 1973, времени потребовалось в два раза меньше.
Почему так произошло? Авторы этого не знают: «Пока у нас есть только голые факты – мы можем рассказать только о том, что мы видим, глядя на нашу коллективную память через линзу нового микроскопа. Анализировать увиденное – это следующий этап».
Эта книга началась со статьи в журнале “Science” за декабрь 2010 года, в которой авторы изо всех сил старались убедить то ли читателей, то ли потенциальных издателей, в том, что исследование необходимо издать полноценным томом. Чтобы добавить веса, в конец статьи Эйден и Майкл поместили с полсотни своих отчётов относительно частотности употребления тех или иных слов.
В этом месте они, пожалуй, перестарались. Большинству читателей не требовалось никаких пояснений насчёт нацистской полиции, чтобы узнать причину, по которой на графике частоты упоминания имени Марка Шагала в немецких книгах кривая резко ныряет вниз в 1933 и также стремительно отыгрывает позиции в 1945.
А вот в книге Эйден и Майкл, кажется, напротив, проявили гораздо меньше старания, ограничившись одними наблюдениями. Если бы они копнули глубже и постарались бы выяснить причины описанных метаморфоз, то, может, книга и произвела бы фурор. А так – забава для интеллектуалов, не больше.
Евгений ВИХАРЕВ