Яндекс.MyStem (ru_RU, минус числа, плюс предложения)
Snowball
Stemka
Числа игнорируются
Латиница не обрабатывается
Данные про слова из Яндекс.Mystem 3.1. Все таблицы и описания оттуда же.
Для каждого слова указываются только три наиболее вероятных описания.
[email protected]:~#
mystem -i -s --weight -e utf-8 --eng-gr --format json --generate-all <path_to_file> Используемые параметры
flag | txt |
---|
-i | Печатать грамматическую информацию, расшифровка ниже. |
-s | Печатать маркер конца предложения (только при включенной опции -c). |
-e | Кодировка ввода/вывода. Возможные варианты: cp866, cp1251, koi8-r, utf-8 (по умолчанию). |
--eng-gr | Печатать английские обозначения граммем. |
--format | Формат вывода. Возможные варианты: text, xml, json. Значение по умолчанию — text. |
--generate-all | Генерировать все возможные гипотезы для несловарных слов. |
--weight | Печатать бесконтекстную вероятность леммы. |
Расшифровка граммем из документации
Части речи
en | txt |
---|
a | прилагательное |
adv | наречие |
advpro | местоименное наречие |
anum | числительное-прилагательное |
apro | местоимение-прилагательное |
com | часть композита - сложного слова |
conj | союз |
intj | междометие |
num | числительное |
part | частица |
pr | предлог |
s | существительное |
spro | местоимение-существительное |
v | глагол |
Время (глаголов)
ru | en | txt |
---|
наст | praes | настоящее |
непрош | inpraes | непрошедшее |
прош | praet | прошедшее |
Падеж
ru | en | txt |
---|
им | nom | именительный |
род | gen | родительный |
дат | dat | дательный |
вин | acc | винительный |
твор | ins | творительный |
пр | abl | предложный |
парт | part | партитив (второй родительный) |
местн | loc | местный (второй предложный) |
зват | voc | звательный |
Число
ru | en | txt |
---|
ед | sg | единственное число |
мн | pl | множественное число |
Репрезентация и наклонение глагола
ru | en | txt |
---|
деепр | ger | деепричастие |
инф | inf | инфинитив |
прич | partcp | причастие |
изъяв | indic | изьявительное наклонение |
пов | imper | повелительное наклонение |
Форма прилагательных
ru | en | txt |
---|
кр | brev | краткая форма |
полн | plen | полная форма |
притяж | poss | притяжательные прилагательные |
Степень сравнения
ru | en | txt |
---|
прев | supr | превосходная |
срав | comp | сравнительная |
Лицо глагола
ru | en | txt |
---|
1-л | 1p | 1-е лицо |
2-л | 2p | 2-е лицо |
3-л | 3p | 3-е лицо |
Род
ru | en | txt |
---|
муж | m | мужской род |
жен | f | женский род |
сред | n | средний род |
Вид
ru | en | txt |
---|
несов | ipf | несовершенный |
сов | pf | совершенный |
Залог
ru | en | txt |
---|
действ | act | действительный залог |
страд | pass | страдательный залог |
Одушевленность
ru | en | txt |
---|
од | anim | одушевленное |
неод | inan | неодушевленное |
Переходность
ru | en | txt |
---|
пе | tran | переходный глагол |
нп | intr | непереходный глагол |
Прочие обозначения
ru | en | txt |
---|
вводн | parenth | вводное слово |
гео | geo | географическое название |
затр | awkw | образование формы затруднено |
имя | persn | имя собственное |
искаж | dist | искаженная форма |
мж | mf | общая форма мужского и женского рода |
обсц | obsc | обсценная лексика |
отч | patrn | отчество |
прдк | praed | предикатив |
разг | inform | разговорная форма |
редк | rare | редко встречающееся слово |
сокр | abbr | сокращение |
устар | obsol | устаревшая форма |
фам | famn | фамилия |