Вопросы с тегом 'iconv'

iconv - это библиотека и API для преобразования различных кодировок символов.
23

Как удалить акценты из символов в строке PHP?

Я пытаюсь удалить акценты из символов в строке PHP в качестве первого шага к тому, чтобы строка использовалась в URL-адресе. Я использую следующий код: $input = "Fóø Bår"; setlocale(LC_ALL, "en_US.utf8"); $output = iconv("utf-8", "ascii//TRANSLIT"...
19 июн. '09 в 12:06
10

Как записать файл в формате UTF-8?

У меня есть куча файлов, которые не входят в кодировку UTF-8, и я конвертирую сайт в кодировку UTF-8. Я использую простой script для файлов, которые я хочу сохранить в utf-8, но файлы сохраняются в старой кодировке: header('Content-type: text/html...
29 янв. '11 в 21:01
5

Сила кодируется из US-ASCII в UTF-8 (iconv)

Я пытаюсь перекодировать кучу файлов из US-ASCII в UTF-8. Для этого я использую iconv: iconv -f US-ASCII -t UTF-8 file.php > file-utf8.php Thing - мои исходные файлы, кодированные US-ASCII, что делает невозможным преобразование. По-видимому, э...
03 июл. '12 в 1:37
5

Преобразование кодировки в java

Есть ли свободная библиотека Java, которую я могу использовать для преобразования строки в одной кодировке в другую кодировку, что-то вроде iconv? Я использую Java версии 1.3.
23 окт. '08 в 8:54
13

R tm заблокировать недопустимый ввод в 'utf8towcs'

Я пытаюсь использовать пакет tm в R для выполнения некоторого текстового анализа. Я связал следующее: require(tm) dataSet <- Corpus(DirSource('tmp/')) dataSet <- tm_map(dataSet, tolower) Error in FUN(X[[6L]], ...) : invalid input 'RT @noXforU ...
09 мар. '12 в 16:10
2

PHP: обработка специальных символов с помощью iconv

Я все еще не понимаю, как работает iconv. Например, $string = "Löic & René"; $output = iconv("UTF-8", "ISO-8859-1//TRANSLIT", $string); Получаю, Примечание: iconv() [function.iconv]: Обнаружен незаконный символ во входных данных строка в....
25 янв. '11 в 14:29
3

iconv: Преобразование из Windows ANSI в UTF-8 с помощью спецификации

Я хочу использовать iconv для конвертирования файлов на моем Mac. Цель состоит в том, чтобы перейти от "Windows ANSI" к "независимо от того, что сохраняет Блокнот Windows, если вы говорите ему использовать UFT8". Это то, что я хочу: anders-johansen...
06 дек. '10 в 7:32
2

libiconv не ссылается на проект iOS

Я пытаюсь скомпилировать MailCore в приложение iOS, которое я создаю, и компоновщик продолжает жаловаться, что libiconv не связан. По крайней мере что я думаю, что он жалуется. Это то, что он выплевывает: Undefined symbols for architecture i386: "...
18 сент. '11 в 22:21
11

Пакетное преобразование файлов latin-1 в utf-8 с помощью iconv

У меня есть этот один PHP-проект на моем OSX, который находится в latin1 -encoding. Теперь мне нужно преобразовать файлы в UTF8. Я не очень похож на кодер, и я попробовал что-то, что я нашел из Интернета: mkdir new for a in `ls -R *`; do iconv -f ...
28 дек. '10 в 8:24
3

как получить список поддерживаемых кодировок библиотекой iconv в php?

Возможно ли это как в библиотеке mcrypt с функцией mcrypt_list_algorithms(). Существует ли функция iconv_list_encodings?
07 нояб. '11 в 16:14
6

iconv любая кодировка для UTF-8

Я пытаюсь указать iconv в каталог, и все файлы будут преобразованы UTF-8 независимо от текущей кодировки Я использую этот script, но вы должны указать, какую кодировку вы собираетесь ОТ. Как я могу заставить его автоматически определить текущую код...
22 мар. '12 в 15:01
5

Транслитерируйте любой конвертируемый utf8 char в ascii-эквивалент

Есть ли хорошее решение, которое делает эту транслитерацию в хорошей манере? Я пробовал использовать iconv(), но очень раздражает, и он не ведет себя так, как можно было бы ожидать. Использование //TRANSLIT попытается заменить то, что может, ост...
28 нояб. '12 в 21:19
4

Как обнаружить неверную строку utf-8 в PHP?

Функция iconv иногда дает мне ошибку: Notice: iconv() [function.iconv]: Detected an incomplete multibyte character in input string in [...] Есть ли способ обнаружить, что в строке utf-8 есть недопустимые символы, прежде чем помещать данные в incon...
17 июл. '11 в 11:36
2

Смайлики в Twitter Анализ настроений в r

Как мне обрабатывать/избавляться от смайликов, чтобы я мог сортировать твиты для анализа настроений? Получение: Ошибка в sort.list(y): недопустимый ввод Спасибо и вот как смайлики выходят из твиттера и в r: \xed��\xed�\u0083\xed��\xed�� \xed��\xe...
01 апр. '13 в 17:25
5

libiconv и MacOS

Я пытаюсь скомпилировать GCC 4.5.1 в Mac OS X Lion. У меня проблема с libiconv. Сначала он жаловался на символы undefined для архитектуры x86_64, которые были: _iconv, _iconv_open и _iconv_close. Я узнал, что версия libiconv MacPorts переименовывае...
27 сент. '12 в 10:45