Калькулятор длины строки

Рассчитайте длину строки в символах, байтах (UTF-8) и кодовых единицах UTF-16.

Ввод

Часто задаваемые вопросы

Почему байты и символы различаются?

UTF-8 использует от 1 до 4 байт на символ. ASCII-символы занимают 1 байт, тогда как эмодзи и многие нелатинские символы — от 2 до 4 байт.

Что такое кодовые единицы UTF-16?

Кодовые единицы UTF-16 — это то, что возвращает string.length в JavaScript. Большинство символов используют 1 единицу, но эмодзи используют 2 (суррогатные пары).