Возможно ли кодирование UTF-8 без условных переходов?

Кодирование UTF-8 обычно использует ветвления для определения количества байтов, необходимых для представления кодовой точки. Однако, использование последовательных логических сравнений, которые преобразуются в целочисленные значения 0 или 1, позволяет рассчитать длину UTF-8 без явных условных операторов. Суммируя результаты этих сравнений и вычитая маски, основанные на суррогатах и недопустимых значениях, можно точно определить количество байтов.
Возможно ли кодирование UTF-8 без условных переходов?
Изображение носит иллюстративный характер

Первоначальная реализация использовала таблицу поиска и функцию подсчета ведущих нулей для определения длины кодовой точки. Этот подход зависел от встроенной функции подсчета ведущих нулей, которая, как оказалось, сама по себе могла включать условный переход на уровне ассемблера. Кроме того, эта реализация включала проверки границ массивов, которые, хоть и были минимальными, также создавали ветвления в ассемблерном коде.

Устранение ветвлений в функции длины кодовой точки позволяет компилятору оптимизировать код, убрав проверки границ массивов. Это достигается благодаря тому, что длина определяется только путем сложения булевых результатов сравнений, преобразованных в целочисленные значения. Результирующий код не содержит условных операторов (if), циклов и других ветвлений, за исключением тех, что есть на аппаратном уровне.

Хотя данная реализация свободна от ветвлений на уровне языка, это не гарантирует, что она является наиболее оптимизированной для скорости или производительности. Важно отметить, что существуют альтернативные методы, такие как использование детерминированных конечных автоматов (DFA) или SIMD, которые могут обеспечить лучшую производительность в зависимости от аппаратного обеспечения. Таким образом, этот подход служит демонстрацией концепции, а не заменой для существующих высокопроизводительных библиотечных реализаций.


Новое на сайте

20065[b]СПКЯ стало СПМЯ: почему переименование болезни, затрагивающей миллионы женщин, заняло... 20064[b]Почему великая пирамида Гизы пережила все землетрясения за 4500 лет[/b] 20063[b]Генетика Homo erectus: что зубная эмаль рассказала о наших предках[/b] 20062[b]Кости в бухте эребус: что кости моряков Франклина рассказывают спустя полтора века[/b] 20061[b]Крупнейший плавучий ветрогенератор в мире: Китай испытывает установку у берегов... 20060[b]Карие глаза младенца стали индиго после лечения от COVID-19[/b] 20058[b]Почему серебряная чаша с Афиной пролежала в немецком лесу две тысячи лет?[/b] 20057[b]Дыра в атмосфере солнца: вспышка достигла пика и может зажечь полярное сияние[/b] 20056[b]Динго возрастом 950 лет: кто и зачем кормил могилу животного сотни лет?[/b] 20055[b]Томоэ гозэн: женщина-самурай, которая существовала на самом деле[/b] 20054[b]Что видели астронавты «Аполлона-12» над лунным горизонтом?[/b] 20053[b]Восковой блокнот на латыни и шёлковая туалетная бумага: кто посещал средневековый... 20052[b]Хантавирус на борту: 41 человек под наблюдением после рейса MV Hondius[/b] 20051[b]Зелёные камни в пещере Пиренеев: четыре тысячи лет медной металлургии[/b]
Ссылка