Вопросы с тегом 'text-segmentation'
Сегментация текста - это процесс разделения письменного текста на значимые единицы, такие как слова, предложения или темы.
10
Как разбить строку на список?
Я хочу, чтобы моя функция Python разделяла предложение (вход) и сохраняла каждое слово в списке. Мой текущий код разбивает предложение, но не хранит слова в виде списка. Как я могу это сделать? def split_line(text):
# split the text
words =...
13 апр. '09 в 12:48
17
Как получить первое слово предложения в PHP?
Я хочу извлечь первое слово переменной из строки. Например, возьмите этот ввод:
<?php $myvalue = 'Test me more'; ?>
Результат должен быть Test, который является первым словом ввода.
Как я могу это сделать?
19 мар. '10 в 11:26
13
Преобразование строки в список слов?
Я пытаюсь преобразовать строку в список слов, используя python. Я хочу сделать что-то вроде следующего:
string = 'This is a string, with words!'
Затем преобразуется в нечто вроде этого:
list = ['This', 'is', 'a', 'string', 'with', 'words']
Обра...
31 мая '11 в 0:09
7
Python: Отключить последнее слово предложения?
Какой лучший способ отрезать последнее слово из блока текста?
Я могу думать о
Разделите его на список (пробелами) и удалите последний элемент, затем сверяйте список.
Для замены последнего слова используйте регулярное выражение.
В настоящее время ...
07 июн. '11 в 14:26
4
Есть ли какой-либо хороший открытый или свободно доступный китайский алгоритм сегментации?
Как сформулировано в вопросе, я ищу свободный и/или открытый текст-алгоритм сегментации для китайцев, я понимаю, что это очень трудная задача, так как существует множество неоднозначностей. Я знаю, что есть API Google, но это скорее черный ящик, т.е....
29 апр. '11 в 15:59
13
Как разбить строку на слова. Пример: "stringintowords" → "String Into Words"?
Каков правильный способ разбить строку на слова?
(строка не содержит пробелов или знаков препинания)
Например: "stringintowords" → "String Into Words"
Не могли бы вы сообщить, какой алгоритм следует использовать здесь?
! Обновление: для тех, кто ...
12 авг. '10 в 11:10
6
Разделить строку на строку допустимых слов, используя динамическое программирование
Мне нужно найти алгоритм динамического программирования для решения этой проблемы. Я попытался, но не мог понять. Вот проблема:
Вам предоставляется строка из n символов s [1... n], которая, как вы считаете, является поврежденным текстовым документом...
15 мар. '11 в 11:02
3
Жизнеспособное решение для разложения слов кхмера?
Я работаю над решением расщепления длинных строк кхмера (камбоджийского языка) на отдельные слова (в UTF-8). Кхмер не использует пробелы между словами. Есть несколько решений, но они далеки от адекватных (здесь и здесь), и эти проекты упали на обочин...
01 февр. '11 в 10:48
7
Определение границ предложения php
Я хотел бы разделить текст на предложения в PHP. В настоящее время я использую регулярное выражение, которое обеспечивает точность ~ 95% и улучшает работу с использованием лучшего подхода. Я видел инструменты NLP, которые делают это в Perl, Java и C,...
17 февр. '11 в 17:14
11
Разделить предложение на отдельные слова
Мне нужно разделить китайское предложение на отдельные слова. Проблема с китайцами в том, что нет пробелов. Например, предложение может выглядеть так: 主楼怎么走 (с пробелами: 主楼 怎么 走).
На данный момент я могу думать о одном решении. У меня есть словарь...
26 янв. '10 в 15:03
6
фиксировать слова с пробелами, используя словарь, искать в python?
Я извлек список предложений из документа. Я предварительно обрабатываю этот список предложений, чтобы сделать его более разумным. Я столкнулся со следующей проблемой:
У меня есть предложения, такие как "more recen t ly the develop ment, wh ich is a...
30 окт. '13 в 6:14
5
Извлечь последнее слово в предложении/строке?
У меня есть массив строк различной длины и содержимого.
Теперь я ищу простой способ извлечь последнее слово из каждой строки, не зная, сколько времени это слово или как долго строка.
что-то вроде;
array.each{|string| puts string.fetch(" ", last)
02 мар. '12 в 13:40
2
Разделение абзацев на предложения с регулярным выражением и PHP
Я regexp noob и пытаюсь разделить абзацы на предложения. На моем языке мы используем довольно много аббревиатур (например: bl.a.) в середине предложений, поэтому я пришел к выводу, что мне нужно искать пунктуации, за которыми следует одиночный а зате...
06 апр. '13 в 16:14
6
Как отделить слова в "предложении" с пробелами?
Фон
Глядя на автоматизацию создания доменов в JasperServer. Домены - это "представление" данных для создания специальных отчетов. Имена столбцов должны быть представлены пользователю понятным для пользователя способом.
Проблема
Есть более 2000 в...
04 окт. '10 в 15:24
8
Вставить параграф в предложения в PHP
Я использовал
explode(".",$mystring)
чтобы разделить абзац на предложения. Однако это не распространяется на предложения, которые были заключены с различными пунктуациями, такими как!?:;
Есть ли способ использовать массив как разделитель вместо ...
08 мая '12 в 7:09