Список форумов textualheritage.org textualheritage.org
Сообщество "Письменное наследие"
 
 FAQFAQ   ПоискПоиск   ПользователиПользователи   ГруппыГруппы   РегистрацияРегистрация 
 ПрофильПрофиль   Войти и проверить личные сообщенияВойти и проверить личные сообщения   ВходВход 

If you have some trouble reading text and forms in Russian,
please use Google Translate to translate the texts and form titles to your language.
Please, use Google Translate only for titles and texts translating, not for forms filling.

Обсуждение кириллицы в Unicode
На страницу Пред.  1, 2
 
Начать новую тему   Эта тема закрыта, вы не можете писать ответы и редактировать сообщения.    Список форумов textualheritage.org -> Кириллица: кодировка, состав
Предыдущая тема :: Следующая тема  
Автор Сообщение
Victor Baranov



Зарегистрирован: 18.05.2007
Сообщения: 96
Откуда: Ижевск

СообщениеДобавлено: Сб Мар 22, 2008 12:17 am    Заголовок сообщения: Ответ Ответить с цитатой

Можно ли попросить Heinz'a Miklas'a дать обоснования своему предложению об алфавите. Всё-таки "ю" перед "у" (и другое) - это просит обоснования. Алфавитом-то будут люди пользоваться.

Я буду ему писать на днях. У меня тот же вопрос.

_________________
В.А.Баранов
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
А.В.Коваленин



Зарегистрирован: 03.06.2007
Сообщения: 16
Откуда: Новосибирск

СообщениеДобавлено: Сб Мар 22, 2008 4:15 pm    Заголовок сообщения: Ответить с цитатой

Спасибо за пояснение.
Меня интересовал сам способ обсуждения, потому что я думаю, что подход к кодированию символов для диахронического корпуса должен отличаться от кодирования символов конкретной орфографической традиции. В обсуждениях это часто упускается, и все просто набрасывают символы, каких им лично не хватает, требуя для каждого символа отдельного кода. (Показатель - глаголицу кодируют отдельно, как другую систему, хотя это вполне можно считать просто другим почерком, что и показала таблица проф. Миклоса.). Ваш ответ на четвертый вопрос показал, что обсуждение было всё же более глубоким. Но, конечно, хотелось бы и других подробностей - может быть, уже в Казани.
Да, ещё из простых вопросов. В таблицах есть и отдельные элементы (например, правый и левый знаки йотирования), и сложные символы, их включающие. Что это значит?
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
Victor Baranov



Зарегистрирован: 18.05.2007
Сообщения: 96
Откуда: Ижевск

СообщениеДобавлено: Сб Мар 22, 2008 4:24 pm    Заголовок сообщения: Ответить с цитатой

К сожалению, универсальность принципов Unicode не позволяет подходить к современным и историческим графическим системам по-разному.
Считаю, что глаголица является другим алфавитом. Но проф. Миклас действительно сумел показать, что они могут рассматриваться как абсолютно идентичные, что позволяет разместить и тот и другой алфавит в одном диапазоне.
Подробности. Очень надеюсь, что в Казань смогут приехать те, кто готовит сейчас предложения.
Элементы буквенных символов. Сам не понимаю, для чего они нужны.

_________________
В.А.Баранов
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
Victor Baranov



Зарегистрирован: 18.05.2007
Сообщения: 96
Откуда: Ижевск

СообщениеДобавлено: Вт Июл 01, 2008 10:09 pm    Заголовок сообщения: Последняя версия предложений Белградской группы Ответить с цитатой

На странице http://manuscripts.ru/mns/portal.main?p1=4&p_lid=1 опубликован июньский вариант предложений по совершенствованию кириллицы, а также комментарии к нему на русском и английском языках.
_________________
В.А.Баранов
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
Victor Baranov



Зарегистрирован: 18.05.2007
Сообщения: 96
Откуда: Ижевск

СообщениеДобавлено: Вт Июл 15, 2008 11:15 pm    Заголовок сообщения: Окончательный вариант Стандарта Белградской группы Ответить с цитатой

На странице http://manuscripts.ru/mns/portal.main?p1=4&p_lid=1 опубликован июльский (окончательный) вариант предложений по совершенствованию кириллицы, а также комментарии к нему на сербском, русском и английском языках.
_________________
В.А.Баранов
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
al_zobnin



Зарегистрирован: 25.08.2007
Сообщения: 5
Откуда: Москва

СообщениеДобавлено: Чт Сен 04, 2008 12:50 am    Заголовок сообщения: Ответить с цитатой

Уважаемые коллеги!

Я выложил свои соображения по технической стороне стандарта старославянского кириллического письма и его регистрации в Unicode на страничке http://shade.msu.ru/~al_zobnin/OCSDiscussion.htm .

Жду ваших комментариев.



Алексей Зобнин.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
А.В.Коваленин



Зарегистрирован: 03.06.2007
Сообщения: 16
Откуда: Новосибирск

СообщениеДобавлено: Вс Сен 07, 2008 2:03 pm    Заголовок сообщения: Ответить с цитатой

Сейчас только выскажусь о том, что важно перед Охридом, поскольку до него осталось несколько дней (а позднее постараюсь подготовить полный текст моего выступления в Казани).
В Охриде будет обсуждаться работа, проделанная Белградской группой, представленная в Казани Зораном Костичем. Надо правильно понять значение этой работы.
1. Это результат важной и большой работы филологов, притом представленной в удачной форме. Это необходимая форма представления работы филологов информатикам – в частности, тем, кто будет заниматься совершенствованием Уникода, но и работающим на других платформах. (То есть я говорю об условном разделении труда: информатики – это, в частности, могут быть и те же люди, что филологи, но в своём другом качестве.) Это, однако, не достаточная форма для того, чтобы даже сами филологи были способны оценить проделанную работу (тем более, чтобы её могли оценивать информатики со своих точек зрения): узкий специалист по конкретной локально-временной традиции может лишь увидеть какой-то упущенный символ (например, мне не хватает «о» в виде не закрытого сверху квадрата), но не может оценить обоснованность всех представленных различений.
2. Представленный результат не годится в качестве предложения по стандарту. Авторы и не претендовали на совместимость со стандартом Уникод (сетуя на непоследовательность принципов Уникода), но предлагали это как некий отдельный стандарт для славистики. На самом деле, принципы Уникода (несмотря на нечёткость отдельных формулировок) направлены на то, что нам и нужно – их, разве что, следует «не отменить, но исполнить», а авторы документа неправильно понимают задачи стандартизации с точки зрения информатики.

Алексей правильно пишет, что (1) «кодировка не должна иметь никакого отношения к корректности отображения глифов на экране». Но так же верно и другое: (2) проблема стандартизации не имеет никакого отношения к технологиям ввода символов. Количество позиций, которыми представлен знак в стандарте, никак не связано с количеством нажатий на клавиши, которые делает необходимым для его ввода конкретная программа ввода.
Пользователи, привыкшие набирать тексты в системах wysiwyg, привыкли:
а) считать необходимыми и достаточными для компьютеризации своей работы ввод и адекватное отображение текста;
б) представлять процесс ввода/отображения как пишущую машинку, молоточки которой наносят на бумагу (экран) то, что нарисовано на клавише. Они также знают, что есть «символы нулевой ширины» – как у пишущей машинки есть клавиша backspace.
В результате (3) проблема стандарта выглядит как проблема набора нужных молоточков – то есть проблема создания шрифта с полным набором необходимых начертаний.

На самом деле:
1. Проблема стандартизации – ни проблема ввода, ни проблема вывода. Это проблема хранения текста в корпусе. Пользователь wysiwyg не видит, как текст хранится – ему должно быть совершенно всё равно, хранится ли ударный аз одним кодом или двумя.
2. Проблема станлартизации – не проблема создания шрифта. Если её можно поставить как шрифтовую, то только как создание условного шрифта, не похожего ни на одну конкретную традицию (но, кстати, вполне пригодного для критических изданий текстов из диахронического корпуса). Стандарт для хранения описывает больше, чем видимые символы, а шрифт – лишь часть реализации стандарта, но зато берущая на себя больше деталей конкретной традиции. Шрифтовое представление каждой традиции в итоге может иметь разное количество характерных для этой традиции начертаний.
3. То, что действительно важно для работы с корпусами (и в чём задача стандарта) –
а) чтобы стандарт одинаково кодировал то одинаковое, что в разных рукописях выглядит по-разному;
б) чтобы стандарт различал то, что, хотя и выглядит в разных рукописях одинаково, на самом деле имеет разный смысл.
То есть стандарт должен опираться на перечень «сущностей», представляя собой способ их представления (в частности, кодами). А вопросы о том, сколько позиций в кодировке шрифта должна занимать реализация конкретной «сущности» - вопрос не стандарта, а шрифтовой технологии.

То, что нужно от филологов, не должно выражаться в терминах шрифтовых технологий – их результаты одинаково нужны и создателям шрифтов, и работающим на платформах, не связанных со шрифтами. Поэтому им (в своём профессиональном качестве – например, в Охриде) не стоит обсуждать вопросы композитности/некомпозитности, конкретных кодов и глифов. То, что от них требуется – это обоснованно представить перечень различаемых сущностей со всеми их вариантами реализации (не боясь и того, что какие-то реализации разных сущностей окажутся одинаковыми). Может быть, сначала сформулировать, что это за «сущности». Найти (не техническое, а технологическое) решение, как поступать (что набирать), когда в конкретной традиции теряют смысл противопоставления знаков, которые в каких-то других традициях противопоставлены. Вот этого хочется от Охрида. Потом, когда эта филологическая работа будет проделана, можно будет вернуться и к вопросу о стандартизации – отдельно для Уникода, отдельно для транслитерационных платформ.

Поэтому то, что сделала Белградская группа – это как раз то, что нужно, даже «с лишком». Но не всё, что нужно. Нужно ещё позаботиться об обоснованности представленного, для каждой кодируемой сущности отдельно. Важно также, чтобы были зафиксированы и решения, ранее отказавшие какому-то знаку в праве на самоопределение. Идеальный вариант такой фиксации - сводная таблица традиций, в которой бы для каждой конкретной графико-орфографической традиции (в самом узком смысле) были выписаны все необходимые содержательные противопоставления графем, на основании которых можно было бы обсуждать сам состав требуемых для стандартизации «сущностей». Такая таблица была бы одновременно накопительной формой представления результатов работы филологов, и техническим заданием для информатиков. То есть это форма организации работы филологов, предваряющей работу информатиков по стандартизации.

Пример. Я вижу, что «зело» в Путятиной минее изображается зеркально по сравнению с «зело» позднего извода. Я делаю вывод, что это – дело почерка, а их код должен быть одинаков. Но в Белградском предложении «зеркальное зело» имеет отдельный код. Я задаюсь двумя вопросами – как раз такими, ответы на которые я жду от филологов:
1) В какой традиции эти два «зело» содержательно противопоставляются?
2) Должен я оглядываться на эту традицию при наборе Путятиной минеи, если там такого противопоставления нет, или я могу кодировать «зеркальное зело» как обычное?
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
al_zobnin



Зарегистрирован: 25.08.2007
Сообщения: 5
Откуда: Москва

СообщениеДобавлено: Пт Сен 19, 2008 8:23 am    Заголовок сообщения: Ответить с цитатой

На сайте Kodeks появилась статья "Character Set Standardization for Early Cyrillic Writing after Unicode 5.1" (авторы - D. Birnbaum, R. Cleminson, S. Kempgen, K. Ribarov). Насколько мне известно, это обсуждалось на конгрессе в Охриде.

Я полностью согласен с авторами статьи: точно такие же аргументы я приводил здесь.


Алексей Зобнин.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
Victor Baranov



Зарегистрирован: 18.05.2007
Сообщения: 96
Откуда: Ижевск

СообщениеДобавлено: Сб Окт 04, 2008 6:10 pm    Заголовок сообщения: Закрытие темы Ответить с цитатой

Тема закрыта в связи с выполнением заявленных задач.
После обсуждения этой проблемы на съезде славистов и достижения договоренностей между разработчиками предложений к Unicode после выхода версии 5.1 и представителями Белградской группы цели и задачи совершенствования кодировки и состава кириллицы изменились.
Продолжение обсуждения проблемы в теме After Unicode 5.1 на http://forum.textualheritage.org/viewtopic.php?t=35

_________________
В.А.Баранов
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
Показать сообщения:   
Начать новую тему   Эта тема закрыта, вы не можете писать ответы и редактировать сообщения.    Список форумов textualheritage.org -> Кириллица: кодировка, состав Часовой пояс: GMT + 4
На страницу Пред.  1, 2
Страница 2 из 2

 
Перейти:  
Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах
Вы не можете добавлять вложения в этом форуме
Вы можете просматривать вложения в этом форуме


Powered by phpBB © 2001, 2005 phpBB Group