Чтобы добавлять сообщения и комментарии, .

@max630:
max630

@vt ещё раз для забаненых в гугле — можно ли что-нибудь сделать чтобы байтовое API utf-8 использовало, и как? в мане на selocale написано, что If you provide a code page value of UTF-7 or UTF-8, setlocale will fail, returning NULL: msdn.microsoft.com

@Balancer:
Balancer

В копилку. Есть распространённая ошибка, когда в MySQL дефолтовый с latin1 пишут utf8. После исправления или при выставлении нормального чарсета русский превращается в тыкву типа «Ð”ÐµÐ»Ð¾Ð²Ð°Ñ� Ð�виациÑ�».

Такое преобразование исправляет ошибку средствами самого mysql без всяких дампов/загрузок:

CONVERT(CAST(CONVERT(field USING latin1) AS BINARY) USING utf8)

Т.е. что-то типа:

UPDATE ox_campaigns SET campaignname = CONVERT(CAST(CONVERT(campaignname USING latin1) AS BINARY) USING utf8) WHERE campaignname LIKE '%Ð%';

Последний LIKE — чтобы не перекодировались строки, куда уже после исправления кодировки соединения корректный русский запишется.

@den-po:
den-po

тАУ : Имя "тАУ" не распознано как имя командлета, функции, файла сценария или выполняемой программы.это оно символ "–" встретило

@exception13:
exception13

linux.org.ru

>Перешёл на рабочей машине с koi8-r на unicode
17.03.2015 12:03:05

@alexkuklin:
alexkuklin

Где-то здесь должен быть конец utf8 стро�

@Aweal:
Aweal

все что скачено с рутрекера приходится перекодировать:
find /home/shared/Mus/Tequilalazzz\ -\ Избранное\ 1995-2000/ -type f -iname "*.cue" -print0 | while IFS= read -r -d $'\0' line; do echo "$line"; iconv -f cp1251 -t utf8 "$line" -o "$line" ; done

@admincheg:
admincheg

Устанавливаем для пользователей машины кодировку UTF-8 по умолчанию.
Для начала открываем файл /etc/login.conf и правим секцию russian|Russian Users Accounts (Меняем KOI8-R на UTF-8)
После редактирования файла перегенерируем базу настроек: cap_mkdb /etc/login.conf
И последним этапом переключаем нужных пользователей: pw usermod -n admincheg -L russian
И вуаля, locale выдаёт нам ru_RU.UTF-8.

@Tishka17:
Tishka17

А в utf-8 может встретиться байт 0x1f кроме как в однобайтовом символе?

@mirivlad:
mirivlad

Конвертирование тегов mp3 в utf8 на Ubuntu
mirvir.ru

@den-po:
den-po

и добавить нечего

@Pavel81:
Pavel81

Пытаюсь накатить бакап БД в MySQL, попытка заканчивается неудачей с такой строкой "ERROR 1062 (23000) at line 2539: Duplicate entry '????' for key 'wrd_txt'" все способы перепробовал, которые нашёл в инете, помоги победить, жуйк!

@Shura:
Shura

Оставлю себе на заметку. Работа с utf-8 в perl
nestor.minsk.by

@arbue:
arbue

Итак, чтобы в Slackware посмотреть список сгенерированных локалей, надо выполнить 'locale -a' В 13.37 по дефолту сгенерены все, в т.ч. ru_RU.UTF-8 (замечу что в 'locale -a' она называется ru_RU.utf8). Итак, чтобы изменить язык системы и всех программ на русский (которые это поддерживают, конечно, а их большинство) следует в файле /etc/profile.d/lang.sh отредактировать строчку 'export LANG=', где после = указать русскую локаль ru_RU.UTF-8. Однако, если английского не боитесь, то я рекомендую указать en_US.UTF-8. Возможность чтения и набора русских символов никуда не денется, ибо UTF-8, а вот система, man, и все другие приложения останутся на нативном английском языке без тонкостей (и толстостей) перевода.

@Crazy-Owl:
Crazy-Owl

В общем, чтобы использовать utf-8 литералы в тексте, пишу сейчас некий аналог gettext, лол

@Crazy-Owl:
Crazy-Owl

Вопрос возник — как кодировать utf-8 литералы в эрланговом коде? Документация говорит, что нельзя писать символы не из latin. Это верно?

@Drino:
Drino

GNU Typist не пашет с русским языком в ютф8! ГОВНО @ ОПАРЫШИ

@zweipluse:
zweipluse

BarCode Scaner не понимает кириллицу QR кодах сделанных с помощью гугла. Кто что может на эту тему посоветовать?

@fuze:
fuze

September 2, 1992, Pike и Thompson придумали за обедом utf8, а затем реализовали её, и система plan9 стала всюду использовать utf8.

UTF-8 (8-bit Unicode Transformation Format). RFC 3629.

Таблица перевода:
000000-00007F: 0xxxxxxx
000080-0007FF: 110xxxxx 10xxxxxx
000800-00FFFF: 1110xxxx 10xxxxxx 10xxxxxx
010000-10FFFF: 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx

Пример:
Я: 0x042f: 10000101111 -> 10000.101111 -> 11010000 10101111 -> D0 AF
va: 76 61
Яva: D0 AF 76 61

@nixon89:
nixon89

Ололобля! Вот оно — самый простой способ сделать читаемыми русские тэги в линксовых плеерах!
"Конвертирование музыкальной библиотеки в кодировку utf-8.
Для полного конвертирования всей музыкальной библиотеки будем использовать скрипт mid3iconv, который поставляется в комплекте пакета python-mutagen. Для правильной работы пакет python-mutagen должен быть версией не ниже 1.1.
Устанавливаем пакет python-mutagen:
Debian, Ubuntu, Kubuntu..:
# sudo apt-get install python-mutagen
Переходим в директорию с Вашей музыкальной библиотекой:
# cd /home/ВАШ_ЛОГИН/Музыка
Возможно директория с музыкальной библиотекой у Вас будет другой.
Конвертируем библиотеку:
# find -iname '*.mp3' -print0 | xargs -0 mid3iconv -eCP1251 --remove-v1
"
Источник: itshaman.ru

@zbx:
zbx

Дамы и господа, у кого были проблемы с кодировками в Pidgin, попробуйте прописать кодировки CP1251,UTF-8 прям так, в строчку и через запятую. Вроде бы помогло, проверил на мобильном старом jimm и на товарищах )

@griffin:
griffin

*utf8 конвертнул mp3 теги в utf8, а то стремно крякозябры видеть вместо нормальных букв. конвертил вот этим — sourceforge.net
Рекомендую к использованию)

@zweipluse:
zweipluse

Функция Length в Lazaruse один символ кириллицы считает за два. В итоге получаем общее количество символов, чуть больше, чем в два раза больше. Может кто знает решение? s:='ф'; m:=Length(s); m=2 или s:='ф в'; m:=Length(s); m=5

@advicecat:
advicecat

Есть куча музыки в mp3, разбросанной по папкам, при этом теги через раз в кривожопой кодировке. Как бы это так хитро извернуться, чтобы всё разом привести к utf8?

@ivann:
ivann

В флешплеере 10.1 адоб исправил баг с вводом русских букв в линуксе (баг номер FP-40). Полтора года прошло с того момента, как создан баг-репорт. За время ожидания баг дошел до 2ого места в рейтинге самых популярных багов флешплеера.