to post messages and comments.

Уж версия 5.3.6.0, а воз все там. Как поломали в 3+ определение кодировки, так до сих пор кавно с собой тащат. Ну как такими мудаками можно быть.

З.Ы.: Гугл тоже красавчики, с KOI8-R выебнулись. Чем им UTF8 не проконал :/

1. Открываем нужное нам письмо (то что с крякозябрями)
2. Вызываем окно "Настройка панели быстрого доступа" (правой кнопкой мыши по ленточном меню)
3. Вместо "Часто используемые команды" выбираем "Все команды"
4. Ищем "Кодировка", добавляем в колонку "Настройка панели быстрого доступа", та что правее
5. Жмём "ОК"!
6. Подбираем нужную нам кодировку письма
7. Закрываем письмо с внесением изменений

По умолчанию, MS Word сохраняет документы в кодировке ASCII. а не ASCII символы кодирует как escape последовательности HTML. В итоге, если руками внутри править строки, то в Word'е кирилица выйдет кракозяброй. Исправляется это легко. Вверху, ищется <head> и в <meta http-equiv=3DContent-Type content=3D"text/html; charset=3Dus-ascii"> меняем 3Dus-ascii на 3Dwindows-1251. И будет вам счастье. Можно в любом редакторе править строки не парясь о "escape-кодировке" HTML'а (или правильнее SDML'а), и MS Word поймет это, и даже не ругнется нифига.

Расскажу я вам историю о двух друзьях: Серафиме и Сигизмунде. Серафим живет в Украине, а Сигизмунд — в Германии. Оба они являются пользователями MS Windows, Серафим — украинской версии, а Сигизмунд — немецкой.

-------------
Сигизмунд отправляет текстовый файл Серафиму. Серафим открывает полученный файл, а там кракозябры (текстовый файл с кодировкой windows-1252 декодируется с использованием кодовой таблицы windows-1251).

Серафим отправляет Сигизмунду свою фотографию. К фотографии он добавляет комментарий и теги. Сигизмунд открывает полученную фотографию, но вместо комментария и тегов видит кракозябры. Дело в том, что Серафим пользуется программой Picasa, которая пишет метаданные согласно стандарту IPTC, не оговаривающий кодировку. Picasa делает все правильно, записывая текст в кодировке по умолчанию, которая для Серафима является windows-1251, а для Сигизмунда — windows-1252.

Серафим отправляет Сигизмунду композицию своего любимого исполнителя. Сигизмунд поражен тем, что Серафим, оказывается, слушает такую андерграундую музыку, и группа носит очень необычное имя ÇÅÌÔÈÐÀ. Он находит, что на last.fm всего 268 слушателей данного коллектива (http://www.lastfm.ru/music/ÇÅÌÔÈÐÀ). Оказывается, Серафим отправил mp3-файл с тегами, записанными в ID3v1. Данный стандарт предусматривает единую кодировку — ISO-8859-1, которая не поддерживает кириллические символы. Соответственно, программы, пишущие в ID3v1 пишут туда текст в кодировке по умолчанию. Они-то и отличаются на операционных системах Серафима и Сигизмунда. Кстати, израильтяне предпочитают слушать ַולפטנא (http://www.lastfm.ru/music/ַולפטנא) (150 слушателей), а турки — Çåìôèğà (http://www.lastfm.ru/music/Çåìôèğà) (52 слушателя).

Сигизмунд в ответ тоже захотел поделиться любимой музыкой. Он, будучи меломаном, не сумел определиться с одной композицией, и поэтому решил отправить несколько. Для этого Сигизмунд выбранные файлы добавил в ZIP-архив и переслал Серафиму. Серафим испытал удивление, увидев необычные имена исполнителей и композиций в названиях файлов. Оказывается, в спецификациях ZIP до версии 6.3.0 не было оговорена кодировка для имен файлов, и Explorer не подозревая о существовании таких стандартов, пишет имена файлов в кодировке по умолчанию.
-------------

Можно было бы «понять» политику Microsoft, если бы проблема совместимости проявлялась только с другими операционными системами. Но принципиальная проблема существует в совместимости продукции Microsoft.

Раньше я почти уверен был, что переход Windows на UTF-8 в качестве кодировки по умолчанию для записи данных в файлы — вопрос времени. Время идет, а ничего не меняется. Неужели в Windows никогда не будет UTF-8?

при проигрывании русских радиостанций в убунте моей не отображались теги — ну вы в курсе :) Нашёл работающий способ исправить ситуацию — вот он ==>
Проверьте настроена ли у вас русская локаль с кодировкой cp1251:
locale -a | grep ru_RU
В выводе команды должна присутствовать строка:
ru_RU.cp1251
Если нет, то её необходимо добавить:
sudo gedit /var/lib/locales/supported.d/ru
и добавляем строку:
ru_RU.CP1251 CP1251
и перекомпилируем:
sudo locale-gen
Осталось поменять только параметры запуска программы, создаем сами значок на панели или раб.столе и в команде пишем
sh -c "export LC_ALL=ru_RU.CP1251 ; rhythmbox %U"

`--% for i in *; do echo $i | iconv -f CP1251 -t UTF8; done (0:22)
Укуренные – Чич и Чонг Корсиканские братья.avi
Укуренные (Cheech.and.Chongs.Up.in.Smoke).1978.avi
Укуренные — Приятных снов (Cheech & Chong — Nice Dreams 1981).DVD.Rip.avi
Укуренные- Снова в кумаре (Cheech & Chong's Still Smokin 1980).DVD.Rip.avi
Укуренные в хлам (Cheech & Chong — Still Smokin 1983).DVD.Rip.avi
Укуренные Затруднительные обстоятельства (Things Are Tough All Over 1982). DVD.Rip.avi
.-(~/desktop/media/down/torrents/Ukurennye_Collection) ([email protected])-
`--% for i in *; do mv -v "${i}" `echo "${i}" | iconv -f CP1251 -t UTF8`; done
mv: target `братья.avi' is not a directory
mv: target `(Cheech.and.Chongs.Up.in.Smoke).1978.avi' is not a directory
mv: target `1981).DVD.Rip.avi' is not a directory
mv: target `1980).DVD.Rip.avi' is not a directory
mv: target `1983).DVD.Rip.avi' is not a directory
mv: target `DVD.Rip.avi' is not a directory

В ответ на #856694, мне @Livid подсказал (#856694/6) что в буржуйской винде используется кодировка cp1250 (хотя не понятно причём тут буржуи, рипы то наши люди делают. видимо дело в кодировке программы).
Соответственно, iconv -f cp1250 -t utf-8 some.cue > new.cue исправляет cuesheet-файл.
Чудесно :)

Ну почему cp1251??? Почему?? Нет, ну я понимаю обычных пользователей, они не знают что это такое... Но зачем рипать диск в flac/ape + .cue, при этом делая .cue-файл не в utf-8????
Блин, utf-8 это же так хорошо! Так правильно! Нет, надо обязательно запортить теги...
Такое название песни на самом деле: Vermächtnis
Такое если читать в utf-8: Verm�chtnis
Такое будет у Виндузятников: Vermдchtnis
Может я чего то не понимаю и не так делаю, но прежде чем писать пост негодования, проверил в религиозно-правильном, расово-верном фубаре. Там именно последний вариант отображается.
Не пойму что с этим делать, надоедает вручную править.

Жуйк, назрел вопрос. Имеется зип архив, с музычкой. Названия на русском, и кодировка вероятно cp1251. При распаковке вместо имен файлов — куча корявок. Как это дело перегнать в utf-8? Так понимаю iconv в помощь, но я вчера, увы, ниасилил( Может кто уже решал подобный вопрос?

Чтобы самому потом не искать (мало ли что). Решение проблемы кракозябр в убунте в gedit:
"открываем консоль, набираем gconf-editor. Появляется Редактор конфигураций. Переходим в папки: apps – gedit-2 – preferences – encodings. В правом окне открываем конфигурацию «auto-detect». И передвигаем WINDOWS-1251 на второе место после UTF, и на третье место – KOI8R. После этого жмем ок. Все, проблема решена – можете смело открывать вин-файлы через gedit. "
Источник: elv.su

Жуйк, скажи, как бы мне определить кодировку терминала для правильного вывода из скрипта? Пока в голову пришло только такое:
use utf8;
require encoding;
import encoding ('utf8', 'STDOUT' => &SetEncoding);
sub SetEncoding {
if ($^O =~ /^MSWin\d{2}$/i) {
return 'cp866';
}
elsif ($^O =~ /^cygwin$/i) {
return 'cp1251';
}
elsif (тут условие для линухи) {
return 'utf8';
}
ну и дальше сколько нужно можно продолжать
}