Електронний багатомовний

термінологічний словник

Electronic Multilingual Terminological Dictionary


Лінгвістика

Автоматичне опрацювання тексту

Автоматичний аналіз тексту включає ряд етапів: граматичний аналіз; морфологічний аналіз; синтаксичний аналіз; семантичний аналіз. Існує кілька підходів до обробки природної мови. В основі статистичного підходу до обробки природної мови лежить припущення, що зміст тексту може бути визначено за найуживанішими словами. Основним завданням даного підходу є визначення кількості повторень конкретного слова та словосполучень в тексті [Слюсар]. Латентно-семантичний підхід є різновидом статистичного методу та базується на ідеї, що сукупність усіх контекстів, у яких зустрічається або не зустрічається дане слово, визначає множину взаємних обмежень для виявлення схожостей у значеннях слів. Основна проблема, з якою стикаються статистичні підходи, полягає в розгляді тексту як набору слів без смислового зв'язку. Лінгвістичний підхід до обробки природної мови складається з чотирьох рівнів: графематичного, морфологічного, синтаксичного та семантичного[ Діковицький, Шишаєв]. Перший рівень полягає у виділенні окремих елементів тексту/документу, наприклад, розділів, абзаців, речень і т. д. Другий рівень полягає у визначенні морфологічних характеристик окремого слова. Третій рівень відповідає за визначення синтаксичної залежності слів у реченнях. Останній рівень пов'язаний зі смисловим розумінням тексту, що включає розробки у сфері штучного інтелекту. Дослідницькі досягнення у цій сфері є дуже обмеженими у зв'язку зі складністю людської мови. Символічний підхід до обробки природної мови здійснює глибинний аналіз лінгвістичних явищ та базується на явному представленні знань, що здійснюється шляхом використання добре досліджених схем представлення знань та алгоритмів, що працюють з ними.

Джерела:

Дарчук, Н.П.Автоматизований морфологічний аналіз тексту.URLhttp://linguist.univ.kiev.ua/courses_morph.htm

Частина мови Іменник
Рід Середній
Істота/неістота неістота
Називний Автоматичне опрацювання тексту
Родовий Автоматичне опрацювання тексту
Давальний Автоматичному опрацюванню тексту
Знахідний Автоматичне опрацювання тексту
Орудний Автоматичним опрацюванням тексту
Місцевий Автоматичному опрацюванні тексту