Чтобы добавлять сообщения и комментарии, .

@OCTAGRAM:
OCTAGRAM

Не знаю, было ли раньше, но, похоже, в Юбилейке запилили печать в PDF. Я вижу и PDFCreator, и Microsoft print to PDF

@OCTAGRAM:
OCTAGRAM

Images2PDF некогда была всем доступна, а потом разработчики решили, что хватит, и оставили её только в составе платного PDFCreator Plus. Однако, если скачать из архива старых версий PDFCreator-2_1_2-setup.exe, то там оно всё ещё есть, а в следующей версии уже вырезали. Установщик, к сожалению, сделан так, что установить свежий PDFCreator поверх старого с сохранением Images2PDF не получится, но вроде и не сильно надо. И так хорошо работает.

Мне нравится его возможность делать PDF из кучи JPEG без пережатия. Наверное, и в других утилитах есть, но к этой я уже привык.

@Vugluskr:
Vugluskr

В пдф не хранится текст, рамочки и прочая эта ваша хрень. В нём, грубо говоря, хранятся инструкции для плоттера, типа — ставим жало сюда, рисуем отсюда до туда, по такому-то маршруту. Так рисуется всё, что не картинки (они немного иначе). Ну так вот. Есть у вас, предположим, задача — распарсить прайс-лист. Который в табличке. Только табличку вы не можете просто вот взять и получить. Вы можете получить инструкции плоттера. Глифы с буковками распознать довольно просто — словари по шрифтам там же и лежат. И блоки с текстом найти. А составить из этой херни табличку структурированную — это уже только догадками по позиционированию. И самые чудеса начинаются, когда в одной ячейке таблицы несколько строк, да разным шрифтом, да с разными отступами. Тут начинается математический пиздец. Усреднение позиций, выравнивание по этим медианам, нормализация по количеству столбцов/строк. Получается почти всегда. Почти, блядь.
Сильно зауважал ABBYY.

@kamenev:
kamenev

convert -density 150 arc1231_1261_1280ml__ENG_.pdf -background white -alpha remove -quality 90 output.png

@mismatch:
mismatch

github.com — небольшая обертка вокруг wkhtmltopdf, написанная на scala. С ее помощью можно генерировать PDF из HTML + CSS. Со страницей Википедии справилась неплохо. Правда, wkhtmltopdf без Xvfb отказывался работать.

@kamenev:
kamenev

mogrify -resize 3536 -quality 85 -compress jpeg -format pdf -define pdf:fit-to-page=true -page 1190x842 *.jpg

1190x842 — это размер страницы соответствующий A3
Все размеры тут imagemagick.org

@Scobar:
Scobar

Комраден, подскажите чем удобнее всего создавать с нуля/редактировать .pdf в этих самых линуксах ?

@qnikst:
qnikst

а что под линуксами умеет адобовые комментарии в пдф-ках смотреть?

@schors:
schors

в очередной раз столкнулся с задачей, в чём бы таком печатные документики хранить. и чем бы их в pdf конвертировать. и как бы ещё rtf получать (чтобы в редких случаях можно было редактировать итоговый документ). сейчас используем pisa и reportlab для конвертации из html+css в pdf. и что-то мне сегодняшнее изучение вопроса подсказывает, что наиболее универсальным и хорошим решением будет.... LaTeX! а что ты используешь, username?

@Strephil:
Strephil

Как много в системе pdf-ок, о существовании которых я даже не подозревал, и никогда не буду их читать.
$ find usr -name '*.pdf' | wc -l
367

Помойка в Linux начинается с Linux.

@Greevous:
Greevous

Скачал pdf-книжку для электронной читалки, а там все страницы "landscape" и на каждой текст в две колонки (разворот книги — 2 страницы). Читать такое с небольшого экрана некомфортно, перерыл репы в поисках того, что бы могло разбить страницы файла на книжные странички. Перепробовав несколько утилиток и перечитав к ним маны, наткнулся таки на нужное — программулину под названием pdfposter. Она может из одной странички сделать несколько, разбив содержимое на части. Создать плакат можно без проблем. Книжку обработала довольно быстро, правда в итоге все странички лежали "на боку" как и исходные. pdfmod'ом повернул все странички как надо и выкинул пустые. Размер файла увеличился в три раза с лишним, но это не критично.
Команда в терминале: pdfposter -mA6 -pA5 inputfile.pdf outputfile
где -mA6 — формат бумажных листов, на которых "печатаем"; -pA5 — формат итогового изображения.
Т.е. два А6 нам дают один А5. Можно взять -mA5 и -pA4, но прога режет исходные страницы на три части — две страницы и узкую полоску.

Если кто делает такие "операции" другим способом, то прошу в комменты :)

@Ost:
Ost

Народ, насоветуй виртуальный pdf-принтер для виндоус. Такой, чтоб умел корректную кириллицу (ну, чтоб потом можно было юзать поиск в pdf-документе) и ссылки. Желательно, бесплатный без рекламных врезок в конечный документ. Есть примеры чуда?

@den-po:
den-po

Page 36 of 22

@segfault:
segfault

А есть у нас чем погенерировать PDF? Желательно, чтобы могло в юникод и верстку.

@EVILTOYTHING:
EVILTOYTHING

книга"
"Белая книга"
docs.google.com

@silentos:
silentos

Самый простой способ разрезать pdf, содержащий сканированые развороты книги, в обычный постраничный вариант: is.gd

@nixon89:
nixon89

Воу воу воу, а чем сжимать pdf-файлы в linux'е так же охуительно (или близко к тому), как acrobar reader pro?

@waterlaz:
waterlaz

Вот всем мне нравится imagemagick. Даже pdf делает.
Но вот то, что для этого он должен сперва все изображения в память загрузить — не очень хорошо)

@sandr1x:
sandr1x

Народ, чем собрать PDF из нескольких JPG в убунте?

@segfault:
segfault

А новый evince-то просто свистяще быстрый, быстрее окуляра даже, раньше тормозилово было.

@SIO:
SIO

На чем нынче удобно читать pdf-книги (техническая и научная литература, без картинок никак)? Планшеты не маловаты? Большие e-ink появились?

@ighost:
ighost

Есть годный pdf reader под винду? кроме adobe.

@moscowpan:
moscowpan

Чем обрезать в одном pdf-документе все страницы по шаблону одной (слишком много белых полей)?

@gavardhan:
gavardhan

свежие выпуски журнала "Благодарение" radhakrishna.clan.su

@gvard:
gvard

Между прочим, pdfimages из состава poppler (видимо, в отличие от версии в составе xpdf) может выдавать весьма информативный список изображений, содержащихся в pdf. Например, вывести список картинок на страницах с 6 по 8: pdfimages -list -f 6 -l 8 some.pdf ('f' = first, 'l' = last). WRT superuser.com
Бинарники для винды легко находятся в гугле, только для последних версий неплохо бы иметь библиотеки M$VCR.

@trapdoor:
trapdoor

hackage.haskell.org

Типографику вручную запилитвать, это конечно не 2013-way, но всё же может полезным оказаться...

@4DA:
4DA

Жаль, никто в детстве не показал мне эту книгу:

алгебраическая топология с элементарной точки зрения
/It is shown how in the course of solution of interesting geometric problems (close to applications)
naturally appear main notions of algebraic topology (homology groups, obstructions and invariants, characteristic classes)/
mccme.ru

@supershurik:
supershurik

У меня в винде по-умолчанию до сегодняшнего дня документы PDF открывались Акробат Ридером, который я сейчас решил нахрен снести. Во-первых, в нем постоянно находят дыры, через которые особым образом сформированные документы заносят вирусную заразу в комп. Во-вторых, эта пакость часто обновляется через интернет, причем, этот сраный вьювер документов требует после обновления перезагрузку всей операционки. В-третьих, эта зараза загружается на моем ноуте примерно 5 минут, прежде чем покажет, наконец, нужный документ. И еще минуту, прежде чем даст его прокручивать и распечатывать. Причем, если переключишься из окна с документом в другое окно а потом через некоторое время вернешься к нему — документ может прорисовываться и вспоминаться еще минуту-две.
Второй по скорости открытия PDFов — это Яндекс.Браузер. Он открывает файлы примерно за 3 минуты за счет долгой подгрузки библиотек foxit reader'а. Слишком долго.
Самый быстрый открывальщик PDFов на моем компе — это родной Гугл Хром. Прорисовывает документы примерно за 30 секунд и не тупит.
Гуглу респект. Адобу и Яндексу есть над чем поработать.

@nixon89:
nixon89

Кто знает где найти книгу в pdf: ISBN 978-5-384-00260-4

@zweipluse:
zweipluse

Русские танки goo.gl

@zweipluse:
zweipluse

Коллекция журналов ''Мировая авиация. Полная энциклопедия'' goo.gl

@nixon89:
nixon89

man -t manpage | ps2pdf — filename.pdf Печать man'а в pdf 0_о

@Tishka17:
Tishka17

Эдаб ридер заметно быстрее поляриса рендерит страницы.

@DancingWolf:
DancingWolf

Корпоративный гадёныш-Касперский считает мой Foxit Reader адварью. На себя бы посмотрел, скотина.

@mdma:
mdma

Жуйк, а подскажи программу, с помощью которой можно легко упаковать изображения в PDF. На подобии Image to PDF Converter Free только не его. Эта програмулина конечно хороша, но с большими изображениями не может работать :( Больше 10 картинок размером 4000х7000 в него пихаешь и кирдык — на выходе PDF с белыми листами.

@NokitaKaze:
NokitaKaze

Сука, если б я только знал как я накаркаю в #2105226, я бы промолчал!

@4DA:
4DA

Для всех тех, кто, как и я плохо понимает как работает подсистема VM в linux.

Understanding linux vm system
ompldr.org

@KukuRuzo:
KukuRuzo

А либреоффис оказывается неплохо распознает PDF файлы, только-что скормил ему альбом чертежей на 80 листов и он съел.

@anton0xf:
anton0xf

почему некоторые pdf'ки при открытии софтом, юзающим poppler (вероятно проблема с ним, но яхз), могут выглядеть как говно (шрифт плохо-читаемый, а пробелы не на месте)?:
savepic.su — okular, в evince то же самое
savepic.su — в mupdf все ок

@kostanakis:
kostanakis

Сидел себе под Минтой, копировал из пдф карцинки в ворд, все гут. Но приспичило меня перегрузиться в Выньду. И что вы думаете? Акробат Ридер заявляет, что файл запаролен, then я не могу оттуда ничего копипастить! WTF, черт возьми?