fosstodon.org is one of the many independent Mastodon servers you can use to participate in the fediverse.
Fosstodon is an invite only Mastodon instance that is open to those who are interested in technology; particularly free & open source software. If you wish to join, contact us for an invite.

Administered by:

Server stats:

9.9K
active users

#unicode

12 posts11 participants0 posts today
Replied in thread

@notjustbikes Unicode consortium in the 90s and 00s:
well, we can add the letter "A" three times for Latin, Greek and Cyrillic, but will unify the idiographs into single codespaces for Chinese, Japanese and Korean, even in cases when there are important differences between how they are written in each language.

Unicode consortium in the '20s: you get no "no cars" emoji, but here's a face with bags under the eyes.

From time to time (since this represents a tremendous amount of translation/adaptation work), a French version of the "code charts" gets published by the Unicode Consortium: the latest one is for Unicode 16.0:

unicode.org/Public/16.0.0/char

This is especially useful for French speakers in #Canada, #France, #Belgium, #Switzerland, etc. but may soon be obsolete for #Quebec, in case it gets "absorbed" by a neighboring country whose official language is now English only...

#Unicode:

#ChatGPT hinterlässt #unsichtbare #Zeichen im #Text

In den neueren #Sprachmodellen von #OpenAI hinterlässt die KI offenbar absichtlich unsichtbare Zeichen.

Dem Bericht nach hinterlassen die Modelle #GPT- #o3 und #o4-mini unsichtbare #Unicode-Zeichen in dem generierten Text. #OpenAI kündigte diese Maßnahme bisher nicht an.

golem.de/news/wasserzeichen-ch

Golem.de · Wasserzeichen: ChatGPT hinterlässt unsichtbare Zeichen im Text - Golem.deBy Andreas Donath

De temps en temps (cela représente un énorme travail d'adaptation), une version française des "code charts" est publiée par le Consortium Unicode, la dernière en date est pour Unicode 16.0:

unicode.org/Public/16.0.0/char

Malheureusement, celle-ci risque d'être bientôt obsolète pour les francophones de la belle province de Québec, dans le cas où celle-ci serait «absorbée» par un pays voisin dont la langue officielle est désormais uniquement l'anglais...

Problem with special characters - PDF/UA - Screenreader:

I ran into a problem with two glyphs – 🅭 and 🅯 – when creating an accessible PDF. Text set in Source Sans 3.
Tests with InDesign/MadeToTag export and LibreOffice PDF/UA export show the following:
The PDF(s) pass the PDF/UA checks with PAC and pdfToolbox but 🅭 and 🅯 are not read aloud e.g. by Acrobat.

Is this a known issue?

🅭 (1F16D - CIRCLED CC)
🅯 (1F16F - CIRCLED HUMAN FIGURE)

🚀 Who knew memorizing #ASCII codes was #rocket science? In a world where #Unicode reigns supreme, one brave soul clings to #Ada and the digital relics of the '80s like it's a #tech Woodstock reunion. 🎸🎹 Maybe next, they'll write a utility for Morse code in COBOL. 🤖
coniferproductions.com/ada/ohy #Science #Retro #HackerNews #ngated

coniferproductions.comASCII lookup utility in Ada | Conifer ProductionsASCII lookup utility in Ada

Как досадить редактору: мастер-класс от юникодоведа для юникодоводов

#Unicode

Хочешь утончённо свести с ума редактора? Не нужно банальностей: не пиши капсом, не вставляй Comic Sans, не сыпь ошибками. Это всё слишком топорно. Включи изящную пакость: добавь после каждой буквы невидимый, непробельный, нерушимый символU+2060! А лучше несколько.

В чём суть?

  • Его не видно даже в режиме показа непечатных символов.
  • Все буквы разделены, так что проверка орфографии предательски молчит.
  • Внешне слово выглядит нормально, но ломает поиск.
  • Курсор тупо застревает в тексте, что-то исправить нереально.
  • Статистика не считает этот символ пробелом, так что число символов покажет такое, что Толстой позавидует.

Пример:

П⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠р⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠и⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠в⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠е⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠т⁠⁠⁠⁠⁠⁠,⁠⁠⁠⁠ ⁠⁠⁠⁠р⁠⁠⁠⁠⁠⁠е⁠⁠⁠⁠⁠⁠⁠⁠⁠д⁠⁠⁠⁠⁠⁠⁠⁠⁠а⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠к⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠т⁠⁠⁠⁠⁠⁠⁠⁠⁠о⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠р⁠⁠⁠⁠⁠⁠⁠⁠⁠!⁠⁠⁠⁠ ⁠⁠⁠⁠К⁠⁠⁠⁠⁠а⁠⁠⁠⁠⁠⁠к⁠⁠⁠⁠ ⁠⁠⁠⁠н⁠⁠⁠а⁠⁠⁠⁠⁠⁠с⁠⁠⁠⁠⁠⁠т⁠⁠⁠⁠⁠⁠р⁠⁠⁠⁠⁠о⁠⁠⁠⁠⁠е⁠⁠⁠⁠⁠⁠н⁠⁠⁠⁠⁠⁠и⁠⁠⁠⁠⁠е⁠⁠⁠⁠⁠?

(между буквами — рандомное количество U+2060).

Что получаем?

  • На экране — нормальный текст.
  • Внутри — козьи какашки («ощущение наступления на дерьмо» ©).
  • Поиск по слову — не находит.
  • Проверка орфографии — молчит.
  • Подозрения — смутные.
  • Редактор — в ярости.

Предупреждение:

  • Работа в любом приложении не гарантируется! Word и Notepad ведутся, Notepad++ отображает квадратики.
  • Проверка орфографии всё же дуреет от такой прикормки (в зависимости от количества добавленных символов).
  • Если срать юникодом не после каждой буквы, а в конце слова, то орфография даст добро, при этом бонусы по объему текста и глючному курсору — сохраняются.