Что такое таблица кодировки? Какие существуют таблицы кодировки?


Что такое таблица кодировки? Какие существуют таблицы кодировки?
Рейтинг: 5.0/1
Просмотров: 52 | Добавил: (08.02.2021) (Изменено: 08.02.2021)

Всего ответов: 5

Обсуждение вопроса:
Всего ответов: 5
Аватар
0

08.02.2021 оставил(а) комментарий:
Таблицы кодировки — таблицы, где каждому символу, буквам, цифрам, а также специальным знакам присвоен уникальный номер — код символа. Существует множество разнообразных кодировок, наиболее распространённой и универсальной на данный момент является кодировка UTF-8 (на основе Unicode). Также существуют такие таблицы, как ASCII, Win-1251, КОИ8-R и многие другие.
Аватар
0

08.02.2021 оставил(а) комментарий:
В вычислительных машинах символы не могут храниться иначе, как в виде последовательностей бит (как и числа). Для передачи символа и его корректного отображения ему должна соответствовать уникальная последовательность нулей и единиц. Для этого были разработаны таблицы кодировок.

ASCII7 — первая кодировка, пригодная для работы с текстом. Помимо маленьких букв английского алфавита и служебных символов, содержит большие буквы английского языка, цифры, знаки препинания и другие символы.

КОИ8-R — первая русская кодировка. Символы кириллицы расположены не в алфавитном порядке. Их разместили в верхнюю половину таблицы так, чтобы позиции кириллических символов соответствовали их фонетическим аналогам в английском алфавите. Это значит, что даже при потере старшего бита каждого символа, например, при проходе через устаревший семибитный модем, текст остается "читаемым".

Windows-1251 — русская кодировка, использовавшаяся в русскоязычных версиях операционной системы Windows в начале 90-х годов. Кириллические символы идут в алфавитном порядке. Содержит все символы, встречающиеся в типографике обычного текста (кроме знака ударения).

Юникод или Уникод (англ. Unicode) — это промышленный стандарт обеспечивающий цифровое представление символов всех письменностей мира, и специальных символов.

Юникод имеет несколько форм представления (англ. Unicode Transformation Format, UTF): UTF-8, UTF-16 (UTF-16BE, UTF-16LE) и UTF-32 (UTF-32BE, UTF-32LE).

UTF-8 — представление Юникода, обеспечивающее наилучшую совместимость со старыми системами, использовавшими 8-битные символы.

UTF-16 — один из способов кодирования символов (англ. code point) из Unicode в виде последовательности 16-битных слов (англ. code unit).

UTF-32 — один из способов кодирования символов из Юникод, использующий для кодирования любого символа ровно 32 бита. Остальные кодировки, UTF-8 и UTF-16, используют для представления символов переменное число байт. Символ UTF-32 является прямым представлением его кодовой позиции (англ. code point).
Аватар
0

08.02.2021 оставил(а) комментарий:
Таблица кодировки - это таблица, где каждой букве алфавита (а также цифрам и специальным знакам) присвоен уникальный номер - код символа.

Первой широко используемой кодировкой, в которую вошли символы кириллицы, была KOI8.

Семейство ОС Windows 9.x преподнесло нам Win-1251. Наконец, от международной организации по стандартам ISO нам досталась кодировка ISO-8859-5.

Сейчас идет активная работа над перспективной кодировкой UNICODE
Аватар
0

08.02.2021 оставил(а) комментарий:
Таблица кодировки - это таблица, где каждой букве алфавита (а также цифрам и специальным знакам) присвоен уникальный номер - код символа.

Сейчас Unicode — это основной стандарт кодирования символов, включающий в себя знаки почти всех письменных языков мира.

Unicode можно себе представить как огромную таблицу символов. В памяти компьютера записываются не сами символы, а номера из таблицы. Записывать их можно разными способами. Именно для этого на основе Unicode разработаны несколько кодировок, которые отличаются способом записи номера символа Unicode в виде набора байт. Они называются UTF — Unicode Transformation Format. Есть кодировки постоянной длины, например, UTF-32, в которой номер любого символа из таблицы Unicode занимает ровно 4 байта. Однако наибольшую популярность получила UTF-8 — кодировка с переменным числом байт. Она позволяет кодировать символы так, что наиболее распространённые символы занимают 1-2 байта, и только редко встречающиеся символы могут использовать по 4 байта.
Аватар
0

08.02.2021 оставил(а) комментарий:
Модель представления текста в памяти весьма проста. За каждой буквой алфавита, цифрой, знаком препинания и иным общепринятым при записи текста символом закрепляется определенный двоичный код, длина которого фиксирована. В популярных системах кодировки (Windows-1251, КОI8 и др.) каждый символ заменяется на 8-разрядное целое положительное двоичное число; оно хранится в одном байте памяти. Это число является порядковым номером символа в кодовой таблице.

Поскольку в мире много языков и много алфавитов, постепенно совершается переход на международную систему кодировки Unicode, в которой используются многобайтовые коды.
avatar