کتابخانه‌ی Lemmatization

این کتابخانه برای ریشه‌یابی تصریف‌های اسمی طراحی شده است. تصریف‌های اسمی زبان فارسی شامل صرف شدن اسامی و ضمایر با پسوندهای تصریفی شامل نشانه‌ی جمع «ها»، نشانه‌ی جمع «ان»، ضمایر ملکی و مفعولی، فعل‌های اسنادی، «ی» نسبت، «ی» نکره، «ی» بدل از کسره، صرف شدن صفت‌ها با پسوند‌های صفات تفصیلی، و صرف شدن اعداد با پسوندهای ترتیبی مبهم و ترتیبی شمارشی است. این کتابخانه ترکیب پسوندهای تصریفی (مثلا ترکیب نشانه‌ی جمع «ها» + ضمایر ملکی و مفعولی + فعل‌های اسنادی) را نیز مورد پوشش قرار می‌دهد که برای یک اسم می‌تواند بیش از ۲٬۸۰۰ حالت تصریفی متفاوت ایجاد کند. همچنین، این کتابخانه قواعد آوایی زبان را نیز در ترکیب پسوندها مورد پوشش قرار می‌دهد. به عنوان مثال ترکیب ضمیر ملکی اول شخص مفرد «م» به سه کلمه‌ی «کتاب»، «خانه» و «گاری» به صورت «شرکتم»، «خانه‌ام» و «گارییم» خواهد بود.