Вопросы с тегом 'similarity'

Меры сходства определяют количество одинаковых объектов (например, документов, векторов объектов).
7

Найти метрику подобия между двумя строками

Как получить вероятность того, что строка будет похожа на другую строку в Python? Я хочу получить десятичное значение, например 0,9 (что означает 90%) и т.д. Предпочтительно со стандартным Python и библиотекой. например. similar("Apple","Appel") #...
30 июн. '13 в 7:35
22

Лучший алгоритм ранжирования сходства для строк переменной длины

Я ищу алгоритм сходства строк, который дает лучшие результаты по строкам переменной длины, чем те, которые обычно предлагаются (расстояние levenshtein, soundex и т.д.). Например, Указанная строка A: "Роберт", Затем строка B: "Эми Робертсон" буде...
17 мар. '09 в 6:10
4

Проверка изображений для сходства с OpenCV

Поддерживает ли OpenCV сравнение двух изображений, возвращая некоторое значение (возможно, в процентах), которое указывает, насколько похожи эти изображения? Например, 100% будет возвращено, если одно и то же изображение было передано дважды, 0% буд...
18 июл. '12 в 12:15
5

Вычислить подобие косинуса с учетом 2 строк предложения

Из Python: tf-idf-cosine: чтобы найти сходство документов, можно вычислить сходство документа с помощью tf-idf cosine. Без импорта внешних библиотек, есть ли какие-либо способы вычисления косинусного сходства между двумя строками? s1 = "This is a fo...
02 мар. '13 в 10:06
3

Как найти похожие результаты и отсортировать по сходству?

Как запросить записи, упорядоченные по сходству? Eg. поиск "Переполнение запаса" вернет Переполнение стека Переполнение SharePoint Переполнение Math Политическое переполнение Переполнение VFX Eg. поиск "LO" вернется: pabLO picasso Michela...
26 июл. '10 в 20:49
14

Алгоритм поиска статей с похожим текстом

У меня есть много статей в базе данных (с заголовком, текстом), я ищу алгоритм для поиска X самых похожих статей, например Qaru "Вопросы, относящиеся", когда вы задаете вопрос. Я попробовал поиск по сайту, но нашел только страницы о других проблемах...
29 окт. '08 в 14:16
3

Библиотека Java для сравнения сходства изображений

Я потратил довольно много времени на изучение библиотеки, которая позволяет мне сравнивать изображения друг с другом в Java. Я действительно не нашел ничего полезного, возможно, мой навык GoogleSearch недостаточно высок, поэтому я подумал, что спрош...
27 дек. '11 в 13:00
6

Сравнение строк с допуском

Я ищу способ сравнить строку с массивом строк. Выполнение точного поиска довольно легко, но я хочу, чтобы моя программа терпела орфографические ошибки, отсутствующие части строки и т.д. Есть ли какая-то структура, которая может выполнять такой поиск...
26 февр. '10 в 19:40
7

Как рассчитать мера сходства расстояния заданных 2 строк?

Мне нужно рассчитать сходство между двумя строками. Итак, что именно я имею в виду? Позвольте мне объяснить на примере: Настоящее слово: hospital Ошибочное слово: haspita Теперь моя цель - определить, сколько символов мне нужно изменить ошибочное ...
26 февр. '12 в 14:05
7

Какой самый быстрый способ в Python вычислить подобие косинуса при использовании разреженных матричных данных?

Учитывая список разреженных матриц, какой лучший способ вычислить сходство косинусов между каждым из столбцов (или строк) в матрице? Я бы предпочел не перебирать n-select-два раза. Скажем, что входная матрица: A= [0 1 0 0 1 0 0 1 1 1 1 1 0 1 0] ...
13 июл. '13 в 5:18
12

Оценка сходства строк/хеш

Есть ли способ вычислить что-то вроде общей "оценки подобия" строки? В некотором смысле, что я не сравниваю две строки вместе, но я получаю некоторое число (хеш) для каждой строки, которая позже может сказать мне, что две строки являются или не похож...
01 дек. '10 в 11:44
3

Python: оценка семантического сходства для строк

Существуют ли библиотеки для вычисления оценок семантического подобия для пары предложений? Я знаю семантическую базу WordNet и как я могу сгенерировать оценку для двух слов, но я ищу библиотеки, которые выполняют все задачи предварительной обработк...
10 июн. '13 в 11:20
2

Сравнить алгоритмы подобия

Я хочу использовать функции сходства строк для поиска поврежденных данных в моей базе данных. Я наткнулся на несколько из них: Яро, Яро-Винклер, Левенштейн, Евклид и Q-грамм, Я хотел знать, в чем разница между ними и в каких ситуациях они рабо...
23 мар. '12 в 15:43
10

Вычисление сходства двоичных данных

Я видел несколько вопросов, связанных с определением сходства файлов, но все они связаны с определенным доменом (изображениями, звуками, текстом и т.д.). Методы, предлагаемые в качестве решений, требуют знания базового формата файлов сравниваемых фай...
24 февр. '09 в 0:21
4

как вычислить сходство между двумя строками в MYSQL

если у меня две строки в mysql: @a="Welcome to Stack Overflow" @b=" Hello to stack overflow"; есть ли способ получить процент подобия между этими двумя строками с помощью MYSQL? здесь, например, 3 слова похожи, и, таким образом, сходство должно ...
16 мар. '11 в 8:57