"35.172.217.40 - 35.172.217.40"

Вопросы с тегом 'text-segmentation'

Сегментация текста - это процесс разделения письменного текста на значимые единицы, такие как слова, предложения или темы.
10

Как разбить строку на список?

Я хочу, чтобы моя функция Python разделяла предложение (вход) и сохраняла каждое слово в списке. Мой текущий код разбивает предложение, но не хранит слова в виде списка. Как я могу это сделать? def split_line(text): # split the text words =...
13 апр. '09 в 12:48
17

Как получить первое слово предложения в PHP?

Я хочу извлечь первое слово переменной из строки. Например, возьмите этот ввод: <?php $myvalue = 'Test me more'; ?> Результат должен быть Test, который является первым словом ввода. Как я могу это сделать?
19 мар. '10 в 11:26
13

Преобразование строки в список слов?

Я пытаюсь преобразовать строку в список слов, используя python. Я хочу сделать что-то вроде следующего: string = 'This is a string, with words!' Затем преобразуется в нечто вроде этого: list = ['This', 'is', 'a', 'string', 'with', 'words'] Обра...
31 мая '11 в 0:09
7

Python: Отключить последнее слово предложения?

Какой лучший способ отрезать последнее слово из блока текста? Я могу думать о Разделите его на список (пробелами) и удалите последний элемент, затем сверяйте список. Для замены последнего слова используйте регулярное выражение. В настоящее время ...
07 июн. '11 в 14:26
4

Есть ли какой-либо хороший открытый или свободно доступный китайский алгоритм сегментации?

Как сформулировано в вопросе, я ищу свободный и/или открытый текст-алгоритм сегментации для китайцев, я понимаю, что это очень трудная задача, так как существует множество неоднозначностей. Я знаю, что есть API Google, но это скорее черный ящик, т.е....
29 апр. '11 в 15:59
13

Как разбить строку на слова. Пример: "stringintowords" &#8594; "String Into Words"?

Каков правильный способ разбить строку на слова? (строка не содержит пробелов или знаков препинания) Например: "stringintowords" → "String Into Words" Не могли бы вы сообщить, какой алгоритм следует использовать здесь? ! Обновление: для тех, кто ...
12 авг. '10 в 11:10
6

Разделить строку на строку допустимых слов, используя динамическое программирование

Мне нужно найти алгоритм динамического программирования для решения этой проблемы. Я попытался, но не мог понять. Вот проблема: Вам предоставляется строка из n символов s [1... n], которая, как вы считаете, является поврежденным текстовым документом...
15 мар. '11 в 11:02
3

Жизнеспособное решение для разложения слов кхмера?

Я работаю над решением расщепления длинных строк кхмера (камбоджийского языка) на отдельные слова (в UTF-8). Кхмер не использует пробелы между словами. Есть несколько решений, но они далеки от адекватных (здесь и здесь), и эти проекты упали на обочин...
01 февр. '11 в 10:48
7

Определение границ предложения php

Я хотел бы разделить текст на предложения в PHP. В настоящее время я использую регулярное выражение, которое обеспечивает точность ~ 95% и улучшает работу с использованием лучшего подхода. Я видел инструменты NLP, которые делают это в Perl, Java и C,...
17 февр. '11 в 17:14
11

Разделить предложение на отдельные слова

Мне нужно разделить китайское предложение на отдельные слова. Проблема с китайцами в том, что нет пробелов. Например, предложение может выглядеть так: 主楼怎么走 (с пробелами: 主楼 怎么 走). На данный момент я могу думать о одном решении. У меня есть словарь...
26 янв. '10 в 15:03
6

фиксировать слова с пробелами, используя словарь, искать в python?

Я извлек список предложений из документа. Я предварительно обрабатываю этот список предложений, чтобы сделать его более разумным. Я столкнулся со следующей проблемой: У меня есть предложения, такие как "more recen t ly the develop ment, wh ich is a...
30 окт. '13 в 6:14
5

Извлечь последнее слово в предложении/строке?

У меня есть массив строк различной длины и содержимого. Теперь я ищу простой способ извлечь последнее слово из каждой строки, не зная, сколько времени это слово или как долго строка. что-то вроде; array.each{|string| puts string.fetch(" ", last)
02 мар. '12 в 13:40
2

Разделение абзацев на предложения с регулярным выражением и PHP

Я regexp noob и пытаюсь разделить абзацы на предложения. На моем языке мы используем довольно много аббревиатур (например: bl.a.) в середине предложений, поэтому я пришел к выводу, что мне нужно искать пунктуации, за которыми следует одиночный а зате...
06 апр. '13 в 16:14
6

Как отделить слова в "предложении" с пробелами?

Фон Глядя на автоматизацию создания доменов в JasperServer. Домены - это "представление" данных для создания специальных отчетов. Имена столбцов должны быть представлены пользователю понятным для пользователя способом. Проблема Есть более 2000 в...
04 окт. '10 в 15:24
8

Вставить параграф в предложения в PHP

Я использовал explode(".",$mystring) чтобы разделить абзац на предложения. Однако это не распространяется на предложения, которые были заключены с различными пунктуациями, такими как!?:; Есть ли способ использовать массив как разделитель вместо ...
08 мая '12 в 7:09