В обновленной версии Юникода появились сотни новых пиктограмм

Печать: Шрифт: Абв Абв Абв
admin 02 Марта 2011 в 14:59:04
В отличие от договорной теории происхождения государства, существование определенного "общественного" договора при кодировании информации сомнению не подлежит. Иначе ее невозможно было бы правильно декодировать и получить на выходе вместо последовательности битов (единица информации, которая может принимать значения 0 или 1) данный текст на дисплее, свежеотпечатанном листе бумаги или ленте телесуфлера.

Генезис всей IT отрасли, изначально тесно связанный с англоязычными странами, наложил отпечаток и на развитие систем кодирования символов. Уже в 1968 году президент США Линдон Джонсон постановил, что все приобретаемые федеральным правительством компьютеры должны быть совместимыми с американским стандартным кодом для обмена информацией (ASCII), разработанным и использовавшимся для телетайпов, после чего он стал стандартом де-факто в компьютерных системах. ASCII определял позиции 128 элементов (7 бит на символ), в том числе прописных и строчных букв всего одного - английского - алфавита. Для иных национальных знаковых систем повсеместно начали использоваться 8-битные расширения ASCII, предоставлявшие позиции для 128 новых элементов. Первая проблема заключалась в том, что стали появляться несовместимые друг с другом конкурирующие реализации кодировок национальных языков (для русского ими стали Windows-1251 aka CP1251, CP855, CP866, KOI8-R, ISO-IR-111, ISO 8859-5, MacCyrillic и ГОСТ 19768-87). Вторая - в отсутствии возможности использовать одновременно множество разных алфавитов или других систем письменности.

В 1991 году было предложено решение этих проблем. Им стал Юникод (Unicode), состоявший из двух основных компонент: универсального набора символов (для более чем одного миллиона элементов) и системы кодировки этих символов (ныне существующей в нескольких вариациях - UTF-1, UTF-7, UTF-8, UTF-16 и UTF-32). В итоге каждый знак приобрел уникальный порядковый номер, обычно записываемый в шестнадцатеричной системе счисления: так, прописная буква "Я" получила номер U+042F, а строчная "я" - U+044F (современные операционные системы обладают разными методами ввода подобных символов). Постепенно Юникод стал стандартом, включившим в себя не только практически все знаки письменных языков (в том числе вымерших), но и математические и музыкальные символы, грани игральной кости, шахматные фигуры, костяшки домино, символы маджонга, зодиакальные знаки, гексаграммы "Книги перемен" и прочие дивности.

В середине февраля 2011 года некоммерческая организация Unicode Consortium выложила на своем сайте обновленную спецификацию стандарта Юникод, принятую еще осенью прошлого года. В версии 6.0.0 к уже существующим символам, помимо прочего, были добавлены смайлики, алхимические знаки и индийская рупия.

Всего в Юникоде сейчас насчитываются 45 знаков, так или иначе связанных с мировыми валютами: помимо привычных нам доллара (U+0024), цента (U+00A2), фунта (U+00A3) и евро (U+20AC), там есть также украинская гривна (U+20B4), казахстанский тенге (U+20B8), афгани (U+060B) и монгольский тугрик (U+20AE). Прежде чем попасть в сводную таблицу графическое изображение национальной валюты должно быть отобрано и официально утверждено властями страны. Так и произошло с индийской рупией в июле 2010 года, уже через месяц символ (U+20B9) в срочном порядке включили в готовившуюся к публикации новую версию Юникода, а в октябре Ubuntu 10.10 стала первой операционной системой, чей основной шрифт включал в себя новый знак. Россия официальным знаком рубля не обзавелась до сих пор. В 2007 году несколько российских дизайнерских студий разработали и начали активно внедрять собственный вариант (примечательно, что в созданных нашими соотечественниками шрифтах неофициальный знак рубля занимал весь диапазон, зарезервированный под мировые валюты, в том числе и отошедшую индийской рупии позицию). Возможно, Центробанк РФ сдержит свое обещание и в 2011 году российская национальная валюта обзаведется собственным графическим воплощением.

Появлению алхимических знаков (U+1F700..U+1F77F) в Юникоде мы обязаны не тайным последователям древних практик, а ученым из Индианского университета. Базируясь на сводных таблицах из алхимических книг 16-17 веков, они решили зафиксировать сложившуюся в средневековой Европе традицию не только во благо своих коллег, но и для широкой общественности - от писателей и художников до разработчиков компьютерных игр. При этом с особым вниманием к нововведению стоит отнестись российским академикам из комиссии по борьбе с лженаукой и фальсификацией научных исследований. Без своевременного обновления своего ПО они не смогут в должной степени оценить логику и красоту работ своих оппонентов. А то и вовсе упустят нить рассуждения: алхимические тексты в обработке устаревшего софта могут стать подобием распечатки программы, написанной на эзотерическом языке программирования Whitespace, синтаксис которого состоит всего из трех "невидимых" символов - пробела (U+0020), табуляции (U+0009) и перевода строки (U+000A).

Смайлики давно и прочно вошли в нашу письменную речь. Как известно, у создателя и главного архитектора ядра Linux Линуса Торвальдса клавиатура всего с двумя клавишами - "0" и "1", но простым смертным и обычной полноразмерной бывает мало, для них и создают дополнительные устройства для ввода смайликов. При этом в Юникоде до недавнего времени все разнообразие эмотиконов сводилось лишь к трем символам (U+2639..U+263B). Расширение этого списка было вызвано не с особыми эстетическими предпочтениями разработчиков, а практическими соображениями - развитием телекоммуникационного рынка в Японии. Три крупных местных оператора мобильной связи (DoCoMo, KDDI, SoftBank) давно и активно применяли собственные, несовместимые друг с другом кодировки, позволяя пользователям обмениваться эмотиконами и другими пиктограммами (emoji). Для стандартизации востребованных знаков в последнюю версию Юникода были добавлены шесть сотен новых пиктограмм: непосредственно смайликам досталась десятая часть позиций, остальное ушло на символы погоды, изображения растений, фруктов, животных, лики животных и сказочных персонажей, элементы одежды, офисный инвентарь и прочее-прочее-прочее.

В отличие от азбуки Брайля (U+2800..U+28FF), разработанной для слабовидящих и слепых, в Юникоде не нашлось места для азбуки слабослышащих и глухих - дактиля. Возможно, дело в том, что существует несколько десятков национальных систем дактиля, где каждый жест соотносится с конкретной буквой алфавита (эта особенность позволяет использовать специальные шрифты, в которых буквы подменяются жестами). А вместить всю жестовую речь (живую и образную) в рамки ограниченных числом статичных символов вообще не представляется целесообразным. Но несколько жестов все же удостоились размещения в новом Юникоде. Разместившиеся в разделе, выделенном для эмотиконов, одиннадцать жестов тоже оказались тесно связаны с японской культурой: в их числе оказалась вскинувшая обе руки с радостным криком "банзай" фигура человека (U+1F64C), силуэт со сложенными в мольбе руками (U+1F64F), втянувший голову в плечи провинившийся тип (U+1F64D), застывший в глубоком поклоне персонаж (U+1F647) и даже изображения "трех мудрых обезьян" c закрытыми глазами (U+1F648), ушами (U+1F649) и ртом (U+1F64A), воплощающие буддистские идеи "невидения", "неслышания" и "неговорения" о зле.

Из-за концентрации разработчиков нового стандарта на японских реалиях, от их внимания ускользнуло отсутствие такого простого, ясного и очевидного жеста, как facepalm. Создание и привнесение в Юникод подобного эмотикона-смайлика не только позволит сэкономить на драгоценных знаках в смс и твитах, но и устранит языковой барьер, мешающий народам мира понять сей англицизм, а то и станет достойным символом эпохи. И даже если много лет спустя искусственный интеллект не научится распознавать очевидные жесты, наши потомки смогут отправить лаконичное послание, прежде чем навсегда вырубить Скайнет.

Денис Дмитриев
http://lenta.ru/articles/2011/03/01/unicode/
Комментарии, по рейтингу, по дате
  Aulman 02.03.2011 в 15:15:07   # 108924
Спасибо,няня я у них поел!
  Атыгай 02.03.2011 в 18:54:09   # 108944
Что за херня или я не догоняю не понял
  332-712 02.03.2011 в 23:27:53   # 109001
не осилил... Поэтому, Палыч, ты что, поляком стал?
Добавить сообщение
Чтобы добавлять комментарии зарeгиcтрирyйтeсь