Глобальный английский язык как отражение лингвистического и когнитивного своеобразия 101
(ЛЕ) — слов и словосочетаний в текстах, написанных носителями разных языков, но и вы-
явить особенности когниции, свойственные «усредненному» носителю конкретного языка и,
как следствие, конкретной культуры.
Для определения методики построения подобного корпуса и установления возмож-
ностей его использования для лингвистического, культурологического и когнитивного
анализа проведен специальный эксперимент. В рамках эксперимента для создания кор-
пуса параллельных текстов были использованы материалы симпозиума «International
Symposium on Seismic Evaluation of Existing Nuclear Facilities» (Vienna, Austria 25–29 August
2003 IAEA-CN-106), и отчет МАГАТЭ «Seismic Evaluation of Existing Nuclear Power Plants»
(Vienna, Austria, 2003), подготовленный международной группой экспертов специально к
этому симпозиуму. Весь корпус текстов посвящен проблеме выбора методов и параметров
оценки сейсмостойкости объектов повышенного риска (атомных электростанций), все тек-
сты (кроме отчета) написаны по заданной организаторами жесткой схеме и имеют сопос-
тавимый объем.
В результате было сформировано 6 корпусов текстов, которые можно считать псевдопа-
раллельными: это корпуса текстов на «подлинном» английском языке (авторы из Великобри-
тании, США, Канады и Новой Зеландии), на «японском», «французском» (авторы из Франции
и Алжира), «славянском» (авторы из Словении, Чехии, Македонии, Болгарии), «индийском»
(авторы из Индии, Бангладеш и Пакистана), а также «русском» английском языке. Кроме то-
го, отдельный объект (седьмой корпус) был представлен сводным отчетом МАГАТЭ (авторы
из Болгарии, Венгрии, Франции, России, США и Индии). Естественно, проведение полномас-
штабного исследования глобального английского языка в дальнейшем потребует более жес-
ткой «привязки» к различным «родным» языкам авторов и планируется.
Все 7 корпусов текстов были предварительно размечены (в них вручную выделялись про-
стые именные группы) и обработаны с использование средств компьютерного анализа текс-
та. В результате для 7 корпусов были получены алфавитные словари слов и именных слово-
сочетаний по каждому из вариантов глобального английского языка, которые объединены
в сводный распределительный алфавитный словарь с отражением частоты ЛЕ в каждом из
корпусов. Кроме того, получены сводный словарь именных словосочетаний с указанием дли-
ны словосочетания (количество компонентов — отдельно оформленных лексических еди-
ниц), сводной частоты и степени распространенности и словарь моделей именных словосо-
четаний с теми же характеристиками.
Анализ материалов распределительного словаря может вестись по ряду параметров, как
собственно лингвистических, так и культурологических. В качестве культурологических
параметров рассмотрим использование в текстах таких реалий как календарные единицы
(Таблица 1) и географические названия (Таблица 2).
Из приведенной Табл. 1 следует, что в текстах российских авторов нет привязки к времени
проведения исследований с точностью до месяца, столь же незначительна эта привязка для
авторов из различных западно- и южно-славянских государств (Чехии, Словении, Болгарии
и т. д.) и Индии. Большие частоты этих лексических единиц в сводном тексте связаны с тем,
что этот текст представляет собой заключительный отчет по договору с МАГАТЭ, в котором
привязка данных по времени является обязательной.