Вопросы с тегом 'nltk'

Инструментарий Natural Language Toolkit представляет собой библиотеку Python для вычислительной лингвистики.
6

Что такое "энтропия и получение информации"?

Я читаю эту книгу (NLTK), и это сбивает с толку. Энтропия определяется как: Энтропия - это сумма вероятности каждой метки раз лог-вероятность той же метки Как я могу применить энтропию и максимальную энтропию в терминах интеллектуального анализа...
07 дек. '09 в 11:54
13

Ошибка загрузки english.pickle с помощью nltk.data.load

При попытке загрузить токенизатор punkt... import nltk.data tokenizer = nltk.data.load('nltk:tokenizers/punkt/english.pickle') ... a LookupError был поднят: > LookupError: > ***********************************************************...
01 февр. '11 в 19:43
8

Как проверить, является ли слово английским словом с Python?

Я хочу проверить программу Python, если слово находится в английском словаре. Я верю, что интерфейс nltk wordnet может быть способом, но я не знаю, как использовать его для такой простой задачи. def is_english_word(word): pass # how to I implem...
24 сент. '10 в 16:01
10

Как избавиться от пунктуации с помощью токенизатора NLTK?

Я только начинаю использовать NLTK, и я не совсем понимаю, как получить список слов из текста. Если я использую nltk.word_tokenize(), я получаю список слов и знаков препинания. Мне нужны только слова. Как я могу избавиться от пунктуации? Кроме того,...
21 мар. '13 в 12:22
8

Какова истинная разница между леммитацией и вытеканием?

Когда я использую каждый? Также... является ли ЛИМКТ-зависимость ЛДПЛ зависимой от частей речи? Не было бы более точным, если бы это было?
24 нояб. '09 в 0:48
9

Как удалить стоп-слова с помощью nltk или python

Итак, у меня есть набор данных, который я хотел бы удалить стоп-слова из stopwords.words('english') Я пытаюсь использовать это в своем коде, чтобы просто вынести эти слова. У меня уже есть список слов из этого набора данных, часть, с которой я бор...
30 мар. '11 в 12:36
25

проблема при установке практически любой библиотеки

У меня есть трудное время, использующее pip для установки почти чего угодно. Я новичок в кодировании, поэтому я подумал, что, возможно, это то, что я делаю неправильно, и отказался от easy_install, чтобы получить большую часть того, что мне было нужн...
04 мая '13 в 4:29
14

Ресурс u'tokenizers/punkt/english.pickle 'не найден

Мой код: import nltk.data tokenizer = nltk.data.load('nltk:tokenizers/punkt/english.pickle') Сообщение ERROR: [[email protected] sentiment]$ python mapper_local_v1.0.py Traceback (most recent call last): File "mapper_local_v1.0.py", line 1...
26 окт. '14 в 7:52
13

n-граммов в питоне, четыре, пять, шесть граммов?

Я ищу способ разделить текст на n-граммы. Обычно я бы сделал что-то вроде: import nltk from nltk import bigrams string = "I really like python, it pretty awesome." string_bigrams = bigrams(string) print string_bigrams Я знаю, что nltk предлагает т...
08 июл. '13 в 16:35
19

Стэнфордский Парсер и НЛТК

Можно ли использовать Stanford Parser в NLTK? (Я не говорю о Стэнфордском ПОС.)
14 дек. '12 в 17:12
6

Каковы все возможные позиционные метки NLTK?

Как найти список со всеми возможными позиционными тегами, которые используются в наборе инструментов Natural Language Toolkit (nltk)?
13 мар. '13 в 14:59
3

Создание нового корпуса с NLTK

Я считал, что ответом на мой заголовок часто является то, чтобы пойти и прочитать документацию, но я пролистал книгу НЛТК, но она не дает ответа. Я немного новичок в Python. У меня есть куча .txt файлов, и я хочу иметь возможность использовать функ...
09 февр. '11 в 23:19
6

Python: tf-idf-cosine: найти сходство документа

Я следовал учебному пособию, которое было доступно в части 1 и части 2. К сожалению, у автора не было времени на последний раздел, в котором использовалось косинусное сходство, чтобы найти расстояние между двумя документами. Я следовал за примерами ...
25 авг. '12 в 2:41
3

Практические примеры использования НЛТК

Я играю с Natural Language Toolkit (NLTK). Документация (Book и HOWTO) довольно громоздки, и примеры иногда немного продвинуты. Есть ли хорошие, но базовые примеры использования/приложений NLTK? Я думаю о таких вещах, как статьи NTLK в блоге Stream...
08 февр. '09 в 21:41
6

Как настроить каталог данных nltk из кода?

Как настроить каталог данных nltk из кода?
19 авг. '10 в 13:42