doldonius | Закорючки

Критический подляк эпохи — величина задач. Мелкие либо решены, либо будут решены известными способами по мере обнаружения. Остались и копятся те, что не влазят в единственную голову и плохо распараллеливаются.

Массовая подготовка гениев, способных упихнуть в голову намного больше, дело гуманитарной революции и генетической инженерии. Дотуда еще порядка двухсот лет, мы это вряд ли застанем. Решение, которое можно начинать копать уже сейчас, да и потом пригодится — орфоскептика, метанаука о правилах размышления, но и ее создавать, вроде бы, никто не рвется.

Более эффективные методы подбора рабочих групп и организации их внутренних взаимодействий, скорее всего, в ближайший век тоже не появятся. Кое-какие резервы есть. Но даже возможно полное их задействование отодвинет границу решаемых задач не так далеко, как надо бы.

Стало быть, примем, что в ближайшем будущем методы работы человеков с данными качественно измениться не могут. В одной голове мы ограничены объемом и быстродействием, в головах группы — скоростью передачи.

Можем ли мы что-то сделать с самими данными?

Один из очевидных путей — компрессия через создание более компактной и удобной нотации.

Но здесь на пути лежат острые и грязные вилы. По самый XX век великие изобретали современную математическую и физическую нотации, изрядно облегчившие жизнь потомкам, пользуясь ручным орудием письма и бумагой. Если им хотелось изобрести новую закорючку, ее было достаточно собственно изобрести. Проблемы могли возникнуть в типографии, но на этапе собственно разработки нотации их просто не было.

Теперь же мы можем, попотев, выбрать закорючину из довольно-таки большого набора, но только из него. Потому что кодировка.

Напомню, что вычислительные системы изначально были, кхм, вычислительными. Их клепали для пережевывания чисел. До конца пятидесятых никто и не думал о буквах: черепашьи скорости, девичья память, деревянная периферия, а что значит результат — заказчики и сами разбирались, благо доступ к вычислительным машинам был только у интеллектуальных элит. Поэтому когда проблема хранения текстовых данных возникла, ее решили самым экономным, а значит — естественным и правильным на тот момент путем: перенумеровав хранимые знаки.

Проблема в том, что это вынужденное решение было воспринято следующими поколениями как единственно возможное. Чуть позже, когда пользовательский интерфейс сделался хотя бы отчасти графическим, изобрели отдельно хранимые шрифты, но формат шрифтов опять же был заточен в первую очередь на удобство соответствующих вычислений. бНОПНЯ национальных кодировок тоже был решен стереотипным лихим наскоком: намучавшись, добрые (но пойманные в ловушку уже известного решения) люди решили перенумеровать все знаки всех письменностей.

Жаль, что никто не сообразил предложить им перенумеровать все возможные высказывания на всех возможных языках. Глядишь, и попустило бы. Но — увы, увы, увы.

Так мы и оказались запертыми в здоровенный, но конечный и практически нерасширяемый массив знаков. Только то, что утвердили в составе кодировки и только в тех начертаниях, что есть в доступных шрифтах.

Теперь вспомним, как пишет человек. Сначала его учат рисовать отдельные графические элементы. Затем складывать эти элементы в символы соответствующего языка. Причем во многих вариантах: у графемы может быть — и в алфавитных письменностях, как правило, бывает — несколько реализаций. "Вертикальная палочка от середины знакоместа до уровня строки, примыкающая к ней через крючок сверху вертикальная палочка того же размера и примыкающая ко второй через крючок сверху вертикальная палочка того же размера, опционально завершающаяся восходящим крючком справа" значит в русском алфавите ровно то же, что "горизонтальная палочка на высоте в половину знакоместа и примыкающая к ней посередине вертикальная палочка вниз до уровня строки".

Так и получается гибкая, сравнительно компактная и легко перенастраиваемая под другие письменности система, позволяющая в случае надобности легко и с первой попытки нарисовать символ "сигмальфа", подробное объяснение смысла которого занимает, допустим, четыре лекционных часа без учета необходимой для прохождения курса предварительной подготовки. Кстати, и в устном общении группы эту сущность можно будет называть просто сигмальфой. Компрессия? В особо тяжелых случаях — а на переднем крае, где терминология только-только создается, тяжелые случаи норма жизни — еще какая.

Сколько нам понадобится уровней, чтобы сварганить такое в компьютере? А посчитаем.

Уровень графических элементов (палочки, кружочки, точки, галочки, хвостики, черты, резы и все такое). Вероятно, несколько наборов (брусковый, контрастные с разными углами наклона, рубленые и с засечками) либо формальное описание плюс набор формальных описаний стилей ("наклон пера 22°, коэффициент нажима пера 0,03, нажим 10%, радиус перехода к засечкам 3, засечки углом пера, но не менее пикселя" и т. д.), что в любом случае составляет

Уровень стилей элементов.

Уровень глифов (все возможные начертания всех возможных символов). Это именно инструкции по составлению знаков из графических элементов. Список глифов (вероятно, с разными названиями для разных аллографов) и указания, какие элементы куда совать и к чему приделывать — см. выше приблизительные описания двух аллографов буквы "т".

Уровень графем. Список знаков языка, на который ссылаются глифы. Через него мы будем при вводе соотносить нажатые кнопки и знаки.

Уровень шрифтов. Списки знаков, входящих в каждый шрифт, с указанием стиля элементов и конкретных глифов в каждом начертании. Отличается от уровня графем тем, что используется при генерации видимого отображения. То есть кроме графем тут будут и лигатуры ("сочетание fi рисуй так, чтобы i оказалось под концом перекладины f, а точку над i рисовать не надо") и, возможно, некие иные правила, известные и нужные художникам-шрифтовикам.

Уровень верстки. Правила компоновки текста на [виртуальной] странице.

Что еще?

Теперь смотрим, как пользователь создает новый символ. Допустим, ту же самую сигмальфу.

"Создать символ". "Взять за основу → греческая → сигма, заглавная, глиф Σ". Выделяем две нижние палочки, стираем. "Добавить существующий глиф → греческая → альфа, строчная, глиф α". Ставим ее под оставшуюся от сигмы галочку, растягиваем, выбираем нижний конец нисходящей косой черты и верхний хвостик альфы, "привязать". Анаглифы — нет, только заглавная, название "Сигмальфа Долдония", использовать стиль начертания окружающего текста, назначить сочетание клавиш "Compose, s, a", сохранить в документе, сохранить в локальной библиотеке, передать в сетевую библиотеку факультета. Вроде бы, все.

Кто видит косяки и подводные грабли — рассказывайте.

属龙的人

Free Luna!

Закорючки

Закорючки