Найти
16.12.2013 / 11:429РусŁacБел

96% языков для Интернета мертвы. Белорусский язык — живой

Для Интернета существует только 4% мировых языков. Остальные 96% мертвы. В числе безоговорочно живых (unquestionably vital) оказался белорусский — в интернете им пользуются довольно активно. К примеру, две белорусские Википедии, в официальном и классическом правописании, занимают 58-е и 67-е места по количеству статей. Однако белорусский, как и польский или итальянский, нельзя отнести к самым распространенным в Интернете.

Белорусский язык жив, но, как и польский или итальянский, далек от первой десятки языков по активности использования

ЮНЕСКО ведет Атлас языков мира, находящихся под угрозой исчезновения. К этой категории отнесен 2471 язык, с разной степенью уязвимости, белорусский в ней отнесен к «уязвимым» (vulnerable), как и полесскийваллийский или баскский. Число носителей белорусского языка оценивается в 4 миллиона.

Венгерский математик и лингвист Андраш Корнай опубликовал в октябре 2013 года любопытную научную работу «Цифровая смерть языков», в которой исследуется, какие из мировых языков находятся под угрозой вымирания в интернете и в электронных устройствах.

«Компьютерра» приводит описание работы Корная. По мнению ученого, об опасности, грозящей языкам в реальной жизни, свидетельствуют три признака

Во-первых, это утрата функциональности, в то время как какие-то другие языки вытесняют его из обихода в целых областях — например, в повседневном электронном общении, в электронной коммерции или официальном бизнесе. «Если этого нет в интернете, этого не существует». Во-вторых, это потеря престижа, особенно у молодого поколения. И, наконец, утрата языковой компетентности, которая выражается в появлении поколения «полуносителей», которые все еще понимают старшее поколение, но сами выработали для себя серьезно упрощенную версию грамматики или смесь языков.

Те же правила применимы и к интернету и цифровым устройствам, но если ученые давно привыкли наблюдать за упадком языков в реальном мире, то здесь возникает вопрос, возможно ли обратить процесс и сделать умирающие языки жизнеспособными в цифровом мире.

Самые используемые языки Интернета.

Корнай рассматривал 7776 мировых языков и их представленность в интернете. Во внимание принимались пять взаимосвязанных факторов: размер и демографический состав языкового сообщества, престиж языка, его идентификационная функция; уровень поддержки в программном обеспечении и представленность в Википедии.

В частности, для определения степени представленности разных языков в общедоступных онлайн-текстах он измерял объем и число статей в Википедии на каждом из языков. Чтобы установить уровень поддержки языка в программном обеспечении, изучались как локализации интерфейса программ и системы проверки орфографии, так и просто его наличие в стандарте Unicode и других базах данных, позволяющих компьютерным устройствам автоматически опознавать разные языки.

Присутствие языка в Википедии стало одним из важнейших индикаторов его способности выжить в цифровой век.

Поскольку успешность языка в цифровом пространстве означает его активное использование, было необходимо определить по меньшей мере одно популярное онлайн-сообщество, основанное на языке как основном средстве коммуникации. 

Таким сообществом могли быть доски объявлений, рассылки, группы Yahoo или Google, но, по мнению Корная, Википедия всегда становится одним из первых активных цифровых языковых сообществ, которое можно рассматривать в качестве раннего индикатора того факта, что какой-то язык действительно преодолевает «цифровой барьер». 

Чтобы язык получил полномочное представительство в интернете, ему жизненно необходима своя Википедия. Это подтверждает тот факт, что в настоящее время на стадии «инкубатора» находятся 533 языковых заявки, что более чем вдвое превышает число существующих Википедий. Желание обзавестись полноценной работающей Википедией настолько велико, что нередко приводит к манипуляциям с системой ранжирования, которая традиционно оценивает локализованные версии исключительно по числу входящих в них статей. 

Вопиющий пример таких манипуляций — это неизменно занимающая места в первых десятках энциклопедия на искусственном языке волапюк, который фактически не используется сегодня никем, кроме трех десятков энтузиастов. Почти все ее статьи написаны ботами и состоят из чрезвычайно «полезной» информации вроде «Китсеместа — деревня в Эстонии, расположена на широте 8°55′ N и долготе 26°19′ E». В настоящее время ведется дискуссия о перемещении Википедии на волапюке обратно в инкубатор и о предотвращении появления в дальнейшем подобных псевдоэнциклопедий.

На основе полученных в ходе исследования данных все языки были поделены на пять категорий:

процветающие, жизнеспособные, пограничные, наследие (онлайн-присутствие обусловлено исключительно работой ученых по их изучению) и мертвые (вообще не присутствующие ни в онлайне, ни в цифровых устройствах).

Только 170 языков, или всего 2% от всех существующих, можно отнести к категориям процветающих или жизнеспособных в онлайне.

Еще 140, или 1,7%, можно считать пограничными.

Оставшиеся 96,3%, или свыше шести тысяч языков, — «цифровые покойники».

Причем в сложившихся условиях, когда для «цифровой жизни» языка требуются огромная издательская инфраструктура и многочисленные технические средства, у этих «мертвецов» нет никакой перспективы воскрешения. 

Белорусский язык в исследовании Корная назван безоговорочно живым (unquestionably vital), в интернете им пользуются довольно активно.

К примеру, две белорусские Википедии, в официальном и классическом правописании, занимают 58 и 67 места по количеству статей. На белорусском общаются в социальных сетях, читают новости, даже спам время от времени переводят на белорусский. Язык жив, хотя до онлайн-процветания ему далеко. 

Впрочем, в исследовании вряд ли учитывается число «полуносителей» белорусского языка. В какую сторону учет «трасянки» изменил бы результаты?

Инф. tut.by

Хочешь поделиться важной информацией
анонимно и конфиденциально?

Клас
0
Панылы сорам
0
Ха-ха
0
Ого
0
Сумна
0
Абуральна
0
Чтобы оставить комментарий, пожалуйста, включите JavaScript в настройках вашего браузера
Чтобы воспользоваться календарем, пожалуйста, включите JavaScript в настройках вашего браузера
мартапрельмай
ПНВТСРЧТПТСБВС
1234567
891011121314
15161718192021
22232425262728
2930