Електронний багатомовний

термінологічний словник

Electronic Multilingual Terminological Dictionary


Лінгвістика

Комп’ютерна лексикографія

Комп’ютерна лексикографія – це сукупність методів і програмних засобів обробки текстової інформації для створення словників [Григоренко]. Завдання комп’ютерної лексикографії полягає у розробці комп’ютерних алгоритмів, програм, систем та технологій для укладання та використання словників.
У своїй розвідці Є. Купріянов зазначає, що однією з перших розробок у зазначеній галузі став комп’ютерний корпус сучасного американського варіанту англійської мови, або просто Брауновський корпус (Brown University Standard Corpus of Present-Day American English, або просто Brown Corpus), який було укладено у 1960 році в університеті Брауна дослідниками Генрі Кучера та Нельсоном Френсісом. Брауновський корпус являв собою ретельно укладений матеріал з американської англійської мови обсягом 1 млн. слів, підібраних з багатьох джерел. Кучера і Френсіс провели на цьому матеріалі різноманітні комп’ютерні аналізи, завдяки яким науковці отримали багатий та різноманітний твір, який увібрав у себе елементи лінгвістики, психології, а також статистики та соціології. Корпус широко використовувався у комп’ютерній лінгвістиці і протягом багатьох років був одним із найпопулярніших ресурсів у цій галузі [Brown Corpus]. До електронних словників, розроблених LADL, належать багатомовні словники флексій DELAF. Такий словник містить близько 600 тис. словоформ для простих слів і близько 150 тис. словоформ для складних слів (DALACF). Основні слова в цих словниках наведені як автомати кінцевих станів, що дає можливість здійснити потужне індексування текстів. Просте слово подано як автомат кінцевого стану, яке містить морфологічну і синтаксичну інформацію [Черницький, с. 18]. Перші комп’ютерні словники, що являли собою машинні версії паперових словників, з’явилися у кінці 70-х та початку 80-х років ХХ ст. Вони слугували дослідникам як зручний матеріал для лексикографічних досліджень. У Великобританії було створено такі машинні версії традиційних словників англійської мови, як Oxford Advanced Learner’s Dictionary (OALD), Dictionary of Contemporary English (LDOCE) і Collins Cobuild English Dictionary (COBUILD). На початку 1980-х років з’явився машинний словник Longman Dictionary of Contemporary English (LDOCE). Автори під час його підготовки використовували комп’ютерні засоби перевірки послідовності дефініцій слів. Словник LDOCE став першим машинозчитуваним словником, створеним з використанням комп’ютера [C. Magee, с. 25–26]. Першим словником, створеним на базі ЕОМ, став 15-томний «Словник французької мови» (8 тис. словникових статей). Це була лише частина автоматичної картотеки слів із прикладами, що охоплювала корпус текстів у 90 млн. слововживань. У свою чергу, із виникненням машинозчитуваних словників стало можливим їх видання на CD-ROM, тобто на лазерних дисках. Текст першого видання Оксфордського словника став доступним у 1988 році. Згодом, з’явилися три електронних версії другого видання. Перша версія (1992 р.) була за змістом ідентичною до паперового аналога, але сам диск був незахищеним від копіювання. Друга версія (1999 р.) мала деякі доповнення й удосконалене програмне забезпечення та більш зручні засоби пошуку, але існували недоліки у захисті від копіювання. Третя версія (2002 р.) містить додаткову кількість слів та більш досконале програмне забезпечення, хоча й залишилися недоліки у захисті копіювання, як і в попередніх версіях. Інтернет-версія Оксфордського словника стала доступною у березні 2000 року [Oxford English]. Зародження української комп’ютерної лексикографії припадає на середину 80-х років ХХ ст., коли вийшла програма ДКНТ СРСР зі створення національних машинних фондів СРСР. У рамках вищеназваної програми вченими з кафедри програмного забезпечення та електротехніки «Львівської політехніки» була створена система підтримки багатомовних термінологічних словників під назвою «СЛОВО». У ній відпрацьовані технологічні проблеми підготовки словників до друку. Так, була розроблена комп’ютерна версія англо-українсько-англійського словника термінів інформаційних технологій обсягом близько 9 тис. слів. У 2001 році випущено перший повномасштабний український словник на лазерному диску у вигляді інтегрованої лексикографічної системи "Словники України", яка містить унікальний набір словникових функцій: у реєстрі 152 тис. одиниць. У ньому унаочнено повну словозмінну парадигму і транскрипцію згідно з правилами української орфографії та орфоепії; в системі подано понад 56 тис. фразеологізмів, близько 9 тис. синонімічних рядів, понад 2,1 тис. антонімічних пар. За своїми лінгвістично-інформаційними параметрами система «Словники України» не має аналогів у світі і є незамінною в комп'ютерному діловодстві, навчанні української мови, редакційно видавничій діяльності та проведенні лінгвістичних досліджень. З метою популяризації досягнень вітчизняної лінгвістики було проведено низку презентацій випусків серії «Словники України», які широко висвітлювалися засобами масової інформації. Найпопулярніші серед мережевих лексикографічних платформ:

1. Великий тлумачний онлайн-словник сучасної української мови (slovnyk.net) нараховує понад 207 000 словникових статей та близько 18 000 фразеологізмів.
2. Проєкт «Словник.Нет» базується на другому виданні Великого тлумачного словника СУМ (гол. ред. В. Бусел. – Київ : Ірпінь: ВТФ «Перун», 2005) і розрахований на широке коло користувачів, які вивчають українську мову, послуговуються нею у повсякденному житті, цікавляться українською культурою. Важливим є те, що він активно поповнюється новими словами, які ще не ввійшли до ВТС СУМ.
3. Словник Лінгво добре відомий українським користувачам, оскільки представлений на ринку вже 15 років у 3-х варіантах: паперовому, електронному на СД-диску та електронному в мережі інтернет.
4. СЛОВНИК.ua містить тлумачний словник української мови – понад 130000 тлумачень із сучасної української літературної мови та понад 21 000 тлумачень, доданих командою та користувачами СЛОВНИК.ua. Словоформи (орфографічний словник української мови) для понад 260 000 слів. Сервіс звертання містить понад 2600 імен та по батькові. Сервіс транслітерації містить офіційну «паспортну» (КМУ 2010) транслітерацію. СЛОВНИК.ua містить Помічника, який допоможе вам уникнути суржику та підкаже правильне слово. База «антисуржика» містить понад 700 слів та виразів.

Джерела:

⠀ Григоренко, А.М. Особливості укладання лексикографічних праць http://molodyvcheny.in.ua/files/ journal/ 2020/3.1/6.pdf

⠀ Комп’ютерна лексикографія: [Навч. посібник] / Черницький В.Б. – Нац. ун-т кораблебудування ім. адм. Макарова. – Миколаїв: НУК, 2004.

⠀ C. Magee Computational Lexicography B.A. (Mod.) CSLL Final Year Project, May 2000, Supervisor: Dr. Carl Vogel.

⠀ Oxford English Dictionary http://en.wikipedia.org/wiki/Oxford_English_ Dictionary #Electronic_versions.

Частина мови Іменник
Рід жіночий рід
Істота/неістота неістота
Називний комп’ютерна лексикографія
Родовий комп'ютерної лексикографії
Давальний комп’ютерній лексикографії
Знахідний комп’ютерну лексикографію
Орудний комп’ютерною лексикографією
Місцевий у/в комп’ютерній лексикографії