Яндекс.MyStem (ru_RU, минус числа, плюс предложения)

    Строка текста:
    Snowball
    Stemka
    Числа игнорируются
    Латиница не обрабатывается

    Данные про слова из Яндекс.Mystem 3.1. Все таблицы и описания оттуда же.

    Для каждого слова указываются только три наиболее вероятных описания.

    [email protected]:~# mystem -i -s --weight -e utf-8 --eng-gr --format json --generate-all <path_to_file>

    Используемые параметры

    flagtxt
    -iПечатать грамматическую информацию, расшифровка ниже.
    -sПечатать маркер конца предложения (только при включенной опции -c).
    -eКодировка ввода/вывода. Возможные варианты: cp866, cp1251, koi8-r, utf-8 (по умолчанию).
    --eng-grПечатать английские обозначения граммем.
    --formatФормат вывода. Возможные варианты: text, xml, json. Значение по умолчанию — text.
    --generate-allГенерировать все возможные гипотезы для несловарных слов.
    --weightПечатать бесконтекстную вероятность леммы.

    Расшифровка граммем из документации

    Части речи

    entxt
    aприлагательное
    advнаречие
    advproместоименное наречие
    anumчислительное-прилагательное
    aproместоимение-прилагательное
    comчасть композита - сложного слова
    conjсоюз
    intjмеждометие
    numчислительное
    partчастица
    prпредлог
    sсуществительное
    sproместоимение-существительное
    vглагол

    Время (глаголов)

    ruentxt
    настpraesнастоящее
    непрошinpraesнепрошедшее
    прошpraetпрошедшее

    Падеж

    ruentxt
    имnomименительный
    родgenродительный
    датdatдательный
    винaccвинительный
    творinsтворительный
    прablпредложный
    партpartпартитив (второй родительный)
    местнlocместный (второй предложный)
    зватvocзвательный

    Число

    ruentxt
    едsgединственное число
    мнplмножественное число

    Репрезентация и наклонение глагола

    ruentxt
    деепрgerдеепричастие
    инфinfинфинитив
    причpartcpпричастие
    изъявindicизьявительное наклонение
    повimperповелительное наклонение

    Форма прилагательных

    ruentxt
    крbrevкраткая форма
    полнplenполная форма
    притяжpossпритяжательные прилагательные

    Степень сравнения

    ruentxt
    превsuprпревосходная
    сравcompсравнительная

    Лицо глагола

    ruentxt
    1-л1p1-е лицо
    2-л2p2-е лицо
    3-л3p3-е лицо

    Род

    ruentxt
    мужmмужской род
    женfженский род
    средnсредний род

    Вид

    ruentxt
    несовipfнесовершенный
    совpfсовершенный

    Залог

    ruentxt
    действactдействительный залог
    страдpassстрадательный залог

    Одушевленность

    ruentxt
    одanimодушевленное
    неодinanнеодушевленное

    Переходность

    ruentxt
    пеtranпереходный глагол
    нпintrнепереходный глагол

    Прочие обозначения

    ruentxt
    вводнparenthвводное слово
    геоgeoгеографическое название
    затрawkwобразование формы затруднено
    имяpersnимя собственное
    искажdistискаженная форма
    мжmfобщая форма мужского и женского рода
    обсцobscобсценная лексика
    отчpatrnотчество
    прдкpraedпредикатив
    разгinformразговорная форма
    редкrareредко встречающееся слово
    сокрabbrсокращение
    устарobsolустаревшая форма
    фамfamnфамилия