Яндекс.MyStem (ru_RU, минус числа, плюс предложения)

Строка текста:

Snowball
Stemka
Числа игнорируются
Латиница не обрабатывается
у MYSTEM же были разные базы слов?

Данные про слова из Яндекс.Mystem 3.1. Все таблицы и описания оттуда же.

Для каждого слова указываются только три наиболее вероятных описания.

mio@mio:~# mystem -i -s --weight -e utf-8 --eng-gr --format json --generate-all <path_to_file>

Используемые параметры

flagtxt
-iПечатать грамматическую информацию, расшифровка ниже.
-sПечатать маркер конца предложения (только при включенной опции -c).
-eКодировка ввода/вывода. Возможные варианты: cp866, cp1251, koi8-r, utf-8 (по умолчанию).
--eng-grПечатать английские обозначения граммем.
--formatФормат вывода. Возможные варианты: text, xml, json. Значение по умолчанию — text.
--generate-allГенерировать все возможные гипотезы для несловарных слов.
--weightПечатать бесконтекстную вероятность леммы.

Расшифровка граммем из документации

Части речи

entxt
aприлагательное
advнаречие
advproместоименное наречие
anumчислительное-прилагательное
aproместоимение-прилагательное
comчасть композита - сложного слова
conjсоюз
intjмеждометие
numчислительное
partчастица
prпредлог
sсуществительное
sproместоимение-существительное
vглагол

Время (глаголов)

ruentxt
настpraesнастоящее
непрошinpraesнепрошедшее
прошpraetпрошедшее

Падеж

ruentxt
имnomименительный
родgenродительный
датdatдательный
винaccвинительный
творinsтворительный
прablпредложный
партpartпартитив (второй родительный)
местнlocместный (второй предложный)
зватvocзвательный

Число

ruentxt
едsgединственное число
мнplмножественное число

Репрезентация и наклонение глагола

ruentxt
деепрgerдеепричастие
инфinfинфинитив
причpartcpпричастие
изъявindicизьявительное наклонение
повimperповелительное наклонение

Форма прилагательных

ruentxt
крbrevкраткая форма
полнplenполная форма
притяжpossпритяжательные прилагательные

Степень сравнения

ruentxt
превsuprпревосходная
сравcompсравнительная

Лицо глагола

ruentxt
1-л1p1-е лицо
2-л2p2-е лицо
3-л3p3-е лицо

Род

ruentxt
мужmмужской род
женfженский род
средnсредний род

Вид

ruentxt
несовipfнесовершенный
совpfсовершенный

Залог

ruentxt
действactдействительный залог
страдpassстрадательный залог

Одушевленность

ruentxt
одanimодушевленное
неодinanнеодушевленное

Переходность

ruentxt
пеtranпереходный глагол
нпintrнепереходный глагол

Прочие обозначения

ruentxt
вводнparenthвводное слово
геоgeoгеографическое название
затрawkwобразование формы затруднено
имяpersnимя собственное
искажdistискаженная форма
мжmfобщая форма мужского и женского рода
обсцobscобсценная лексика
отчpatrnотчество
прдкpraedпредикатив
разгinformразговорная форма
редкrareредко встречающееся слово
сокрabbrсокращение
устарobsolустаревшая форма
фамfamnфамилия