to post messages and comments.

Есть отсканированный журнал ~150 страниц в TIFF. Есть сильное, нефиговое прям такое желание перегнать в DjVU.
Есть веб-сервис Any2DjVu, который всё делает правильно, сам выдляет фон (и жмёт сильно) и текст (и жмёт качественно). Он реально всё делает сам и хорошо.
Есть DjVuLibre, которая состоит из набора тулзов, работающих довольно тупо и делающих только то, что скажут.
В общем мне нужно как Any2DjVu, только локально.
Что делать?

а че, есть какая-нибудь прога, которая читает djvu и позволяет сделать закладку на картинку с другой страницы и быстро посмотреть ее, находясь на другой странице?

Написал простенький скрипт для записи метаданных DjVu.
ix.io
Скрипт пытается на основе плохеньких регулярок угадать данные по имении файла «Автор А.А. — Название (год).djvu», потом через временный файл пишет их в сам djvu.
Насколько я знаю, поля метаданных DjVu не стандартизированны, но на каком-то сайте на народе я видел предложение стандарта. Там же и было предложено поле exlibris.

Жуйк, как лучше всего сканировать книжки в djvu под линаксом, чтоб на выходе что-то приличное получалось? Я пока освоил такую технологию:

1) Сканирую из xsane в TIFF 600 dpi (deflate сжатие, jpeg размывает сканы)
2) Обрабатываю сканы в scantailor. Мощнейшая программа. И режет сама, и поворачивает, и обрезает.
3) На выходе из scantailor получаю готовые ч/б TIFF'ы, уже без фона и пятен, которые собираются в djvu однострочником на баше:
for i in .tiff; do cjb2 -dpi 600 $i $i.djvu; done && djvm -c output.djvu .djvu

Кстати, по поводу сканнера. Мне достался на халяву Epson Perfection 1260 PHOTO, который завёлся под sane без каких-либо танцев. Только себя в группу scanner добавил. Он древний и сканирует медленно, но вроде качественно.

Под виндой 56 мегабайт jpeg DjVuSolo скомпилировал в 3.9 мегабайт. Под линухом с44 в 4.7. Настройки на первый взгляд одинаковые, качество тоже устраивает в обоих случаях. Подправленный скриптик со всем справляется.

Ловлю себя на том, что тупо скопировать скрипт для конвертации картинок в DJVU просто и даже доставляет удовольствие. Надо в нем (скрипте) разобраться, надо. Но только не в половине второго ночи.

в 10.04 некоторые книжки никак не хотят печататься. судя по логам, проблема где-то на уровне преобразования из djvu в postscript. вот небольшой обход: поставить djview4 и из него печатать в postscript. полученный ps-файл можно печатать через evince как обычно.

Мне непонятна логика работы распознавалки файнридера. Вот распознала она текст в djvu, всё отлично. Конвертирует в pdf — текст получается рубленый, корявый. Чуть ли не хуже оригинала. Почему так?