• Linux ? book paper Жуйк, а какой есть софт для разметки/индексирования коллекции текста с возможностью поиска по названиям/меткам/тексту. Желательно свободное и CLI-friendly.

Replies (8)

  • @Kim, долго пытался найти что-то такое, в итоге использую grep и такую вот дурацкую систему тэгов : cs.tt-m.ct-fp.hs-a-TMR-Issue13.pdf
    категория CS, подкатегория type theory, категория math, подкатегория category theory (что этот тэг делает у Monad Reader, ошибка классификации), категория fp подкатегория haskell, статья (-a-, есть -b-, книга/монография, классификатор -a-/-b- всегда стоит последним в метаданных).
  • @tum, В таком случае тебе рядом с каждым pdf файлом надо хранить результат работы pdftotext, сконвертированный в кодировку твоей системы, чтобы действительно можно было что-то искать грепом.

    Плюс полноценный каталогизатор мог бы, например, и bibtex генерировать.
  • @Kim, Тоже искал, не нашёл. По моему только писать самому (
  • @PineappleZombie, Есть ещё mendeley, но оно проприетарное. И я не знаю удовлетворяет ли оно твоим требованиям
  • @Kim, бтв, мне Mendeley не подошел тем, что он не умеет смотреть внутрь djvu, а у меня часть литературы в нем
  • @PineappleZombie, Понятно. Собственно десятиминутный поиск говорит, что полнотекстовый поиск возможен стандартными индексаторами, а конкретно каталогизаторы литературы с полнотекстовым поиском ищутся только проприетарные.
  • @tum, Редкая djvu'шка содержит OCR слой.
  • @Kim, Смотрите какую я штуку нагуглил: docear.org

    Может кому пригодится.