Парсинг
Синтаксична розмітка (парсинг) базується на морфологічній і розкриває характер синтаксичних зв’язків між одиницями. Вона може здійснюватися на базі різних синтаксичних теорій: структури залежностей, граматики безпосередніх складових, граматики структурних схем, традиційного синтаксичного вчення про члени речення, функціональної граматики, семантичного синтаксису. Синтаксичні розмітки є багатозначними і різняться передусім в деталях, ніж принципово. Також зберігається розрізнення корпусів морфологічного та синтаксичного типу. Водночас корпус із синтаксичною розміткою обов’язково включає в себе морфологічні характеристики одиниць.
Синтакси́чний ана́ліз – в інформатиці це процес аналізу вхідної послідовності символів, з метою розбору граматичної структури згідно із заданою формальною граматикою [Вікіпедія].
Синтаксичний розбір, або синтаксичний аналіз (parsing) – це процес фіксації синтаксичної структури корпусного тексту, який здійснюється після ідентифікації базових морфолого-синтаксичних категорій відповідних елементів тексту. Є два типи синтаксичного розбору: (1) повний синтаксичний розбір (full parsing) – тип розбору, метою якого є забезпечення якомога повнішого та детальнішого аналізу речення; і (2) схематичний розбір (skeleton parsing), чи такий тип аналізу, який фактично стосується лише загальної структури синтаксичної одиниці. А синтаксично розмічений корпус (parsed corpus) – це корпус текстів природної мови, синтаксично проаналізований і відповідно розмічений [Демська-Кульчицька].
Баранов, А.М. (2003). Введение в прикладную лингвистику. – М.: Едиториал УРСС.
Демська-Кульчицька, О. М. (2003). Базові поняття корпусної лінгвістики. Українська мова. (с. 40-45).
Демська-Кульчицька, О. (2005). Основи національного корпусу української мови. – К.: Інститут української мови національної академії наук України.
Широков, В. А., Бугаков, О. В., Грязнухіна, Т. О. (2005). Корпусна лінгвістика. Київ: Довіра.