Кодування (encoding)
Кодування (encoding) – подання текстових і мовних даних у встановленому форматі, однозначність застосувань якого до оброблення різних мов визначається міжнародним Стандартом кодування корпусу (Corpus Encoding Standard = CES) [Демська-Кульчицька]. Кодування безпосередньо пов'язане з поняттям анотації (annotation), яке інтерпретується, по-перше, як практика додавання визначеної лінгвістичної інформації до машиночитаного тексту, по-друге, – як наявність цієї інформації у тексті, і, по-третє, – як сама така інформація. У межах проекту Ініціативи кодування тексту (ТЕІ) розроблено вісім базових наборів теґів для: (1) прозових текстів; ( 2 ) поезії; (3) драми; (4) транскрибованого усного мовлення; (5) листів і меморандумів; (6) словникових статей; (7) термінологічних статей; (8) корпусів і фондів [Демсъка-Кульчицъка].
Набі́р си́мволів, кодува́ння си́мволів, табли́ця си́мволів — певна таблиця кодування скінченної множини символів. Така таблиця зіставляє кожному символу послідовність довжиною в один або більше байт [Вікіпедія].
Нерідко замість терміна набір символів неправильно вживають термін кодова сторінка, що означає насправді окремий випадок набору символів з однобайтовим кодуванням. Термін кодування (в комп'ютерному контексті) є синонімом терміна «набір символів». Зараз в основному використовуються кодування двох типів: сумісні з ASCII і сумісні з EBCDIC. Переважна більшість кодувань, в тому числі UTF-8 Юнікода, – сумісні з ASCII. Кодування на базі EBCDIC (наприклад, ЄС ЕОМ ДКОІ-8) використовуються тільки на деяких мейнфреймах. Спочатку в кожній операційній системі використовувався один набір символів. Тепер використовувані набори символів стандартизовані та залежать від типу операційної системи лише за традицією й установлюються відповідно до локалі [Вікіпедія].
⠀ 1. Орися Демська-Кульчицька. Базові поняття корпусної лінгвістики/ [Електронний ресурс]// – Режим доступу: http://ekmair.ukma.edu.ua/ bitstream/handle/123456789/1686/Demska_Bazovi%20poniattia%20korpusnoi%20linhvistyky.pdf
⠀ 2. [Електронний ресурс]// – Режим доступу: https://uk.wikipedia.org/wiki/