• opencv tesseract Кто хочет поупражняться в распознавании обьектов на изображениях за деньги? :)
    Нужен код который возьмет фотографию, найдет на ней пластиковую карточку удостоверения личности, обрежет все ненужное, развернет картинку и сохранит только изображение пластиковой карточки.
    Дальше нужно будет распознать текст с некоторых участков этой карточки, но это потом. Для начала хотелось бы просто найти и привести к единому формату.
    Язык програмирования — Python или Java. Есть база изображений для тренировки, но передать её не могу по очевидным причинам. Дедлайнов нет, но затягивать тоже не хотелось бы. Возможен OpenSource. :)
    Кому интересно?

Replies (5)

  • @ugnich, Допустимые ошибки, скорость работы? Виолу—Джонса можно?
  • @veet, Ошибаться крайне нежелательно, но можно отвечать "не получается обработать изображение, дайте картинку по-лучше".
    Работать будет на скромном виртуальном сервере в Azure. Разрешение оригинальных изображений — до 10Мб. Чем быстрее, тем лучше, но милисекунды считать никто не будет. Желательно не больше секунды.
    Алгоритмы — на ваше усмотрение, я в них не разбираюсь.

    Большинство изображений будут такими: карточка снята на камеру мобильного телефона крупным планом, лежит в центре картинки на какой-то текстурной поверхности.
    Проблемы (те, что сходу приходят в голову): часто изображения перевернуты, иногда сняты под небольшим углом; встречаются ксерокопии карточек, их можно отсекать; часто встречаются блики и засветки.
  • @ugnich, Кстати, неужели нет никакого проекта с открытым кодом, который бы решал эту задачу (подготовка фотографии к распознаванию текста)?
  • @ugnich, всех опенсорсных по распознованию, на корню гугл скупает
  • @ugnich, Не актуально. Самостоятельно получилось быстрее.