Lematyzacja
To sprowadzanie form fleksyjnych wyrazu do formy podstawowej, hasłowej, czyli leksemu (lemmy). (Paryzek, P.).
W ten sposób w języku angielskim oraz polskim, na przykład, rzeczowniki sprowadzane są do mianownika liczby pojedynczej (jeżeli forma ta oczywiście istnieje), zaś czasowniki – do bezokolicznika. Zmniejsza się wówczas ogólna liczba różnych słów w korpusie, a dzięki takiemu przetworzeniu tekstu można łatwo znaleźć wszystkie wystąpienia danego słowa niezależnie od formy fleksyjnej, którą w danym kontekście przyjmuje, a w rezultacie – przeprowadzić badania statystyczne występowania danego leksemu. (Paryzek, P.).
Lematyzację – wykonywaną za pomocą tzw. algorytmów stemmingu wykorzystuje się głównie w badaniu języków charakteryzujących się mniej złożonym systemem fleksyjnym, w tym w języku angielskim. (Paryzek, P.).
⠀ 1. Paryzek, P. (2011). Pozyskiwanie danych leksykalnych z tekstówelektronicznych (na materiale czasopisma naukowego). Retrieved from: https://repozytorium.amu.edu.pl/bitstream/10593/1422/1/Piotr%20Paryzek.pdf