The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

OCRFeeder 0.7.1a - новая версия графической оболочки для OCR-программ

13.11.2010 12:48

Вышла новая версия OCRFeeder - одной из наиболее развитых графических оболочек для программ оптического распознавания символов. Код программы распространяется под лицензией GPLv3.

Среди возможностей OCRFeeder:

  • Автоматическое определение установленных OCR-программ, включая tesseract и cuneiform;
  • Автоматическое распознание структуры документа с использованием собственного алгоритма (пакет Ocroupus не используется, поскольку собственный алгоритм был написан до его появления);
  • Импорт изображений со сканера;
  • Графический интерфейс для проверки орфографии в распознанном тексте.

Поддержка распознавания для языков, отличных от английского, в настоящее время не полная: для распознавания текстов на русском языке необходимо добавить "-l rus" в настройках каждой системы распознавания, а для правильной проверки русской орфографии помечать распознанный текст как русский.

  1. Главная ссылка к новости (http://www.joaquimrocha.com/20...)
  2. OpenNews: Релиз системы распознавания текста Tesseract 3.0 с поддержкой русского языка
  3. OpenNews: Графический интерфейс к системе распознавания текста Cuneiform под Linux
  4. OpenNews: Релиз YAGF 0.6.1, графической оболочки для системы распознавания текста Cuneiform
  5. OpenNews: Первый стабильный релиз системы распознавания текстов Cuneiform 1.0
Автор новости: gregg128
Лицензия: CC BY 3.0
Короткая ссылка: https://opennet.ru/28644-tesseract
Ключевые слова: tesseract, cuneiform, ocr, gui
При перепечатке указание ссылки на opennet.ru обязательно


Обсуждение (24) Ajax | 1 уровень | Линейный | +/- | Раскрыть всё | RSS
  • 1.1, Аноним (-), 13:35, 13/11/2010 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Как я понял, это альфа версия гуя для гнома. Не полностью работоспособная, но другой пока нет.
     
     
  • 2.2, yaleks (??), 15:08, 13/11/2010 [^] [^^] [^^^] [ответить]  
  • +/
    http://symmetrica.net/cuneiform-linux/yagf-ru.html
     
     
  • 3.3, Аноним (-), 15:14, 13/11/2010 [^] [^^] [^^^] [ответить]  
  • +/
    Это для кед. И есть еще одна, тоже для кед.
     
     
  • 4.7, ZaWertun (ok), 17:41, 13/11/2010 [^] [^^] [^^^] [ответить]  
  • –1 +/
    цитата с сайта:
    "YAGF необходимы библиотеки Qt 4.x и пакет проверки орфографии aspell."

    надеюсь для вас "для кед" != "для Qt" ?

     
     
  • 5.8, Аноним (-), 18:11, 13/11/2010 [^] [^^] [^^^] [ответить]  
  • +/
    Я за то, чтобы у каждого рабочего окружения были свои программы. Пока было только два гуя для программ распознавания и обе на КуТе. Считаю они уместнее в Кедах, а не в Гноме.
     
     
  • 6.16, Аноним (-), 10:04, 14/11/2010 [^] [^^] [^^^] [ответить]  
  • +/
    Да пожалуйста - не пользуйся. Раз уместнее на ГТК - напиши.
     
     
  • 7.17, Аноним (-), 14:31, 14/11/2010 [^] [^^] [^^^] [ответить]  
  • +/
    Так написали. Обсуждаем. :)
     
  • 3.6, gregg128 (ok), 15:32, 13/11/2010 [^] [^^] [^^^] [ответить]  
  • +/
    YAGF не развивается. Последняя версия за 2009 год.
     
     
  • 4.13, yaleks (??), 21:07, 13/11/2010 [^] [^^] [^^^] [ответить]  
  • +/
    Чего вам не хватает в нем?
     
     
  • 5.19, gregg128 (ok), 15:13, 15/11/2010 [^] [^^] [^^^] [ответить]  
  • +/
    Поддержки тессеракт, выделения зон распознавания, работы с пдф и т.п. и т.д.
     
     
  • 6.22, Аноним (-), 15:50, 17/11/2010 [^] [^^] [^^^] [ответить]  
  • +/
    Насчет тессеракт незнаю, а остальное - враньё.
     
     
  • 7.24, gregg128 (ok), 16:57, 18/11/2010 [^] [^^] [^^^] [ответить]  
  • +/
    > Насчет тессеракт незнаю, а остальное - враньё.

    Посмотрел - действительно можно выделить зону (хотя указать её свойства нельзя). Но поддержка только кьюниформа = fail.

     
  • 2.9, paulus (ok), 19:19, 13/11/2010 [^] [^^] [^^^] [ответить]  
  • +/
    >другой пока нет

    на http://sourceforge.net/projects/gimagereader/
    A graphical GTK frontend to tesseract-ocr

     
     
  • 3.12, gregg128 (ok), 20:53, 13/11/2010 [^] [^^] [^^^] [ответить]  
  • +/
    А лэйаут оно распознаёт ? А кроме тессеракта что-нибудь понимает ? То-то.
    Жаль, конечно, что опять люди будут по пять раз делать одну и ту же работу (Ведь ещё есть tesseract-gui.py и прочие).


    >>другой пока нет
    > на http://sourceforge.net/projects/gimagereader/
    > A graphical GTK frontend to tesseract-ocr

     
     
  • 4.21, paulus (ok), 21:01, 16/11/2010 [^] [^^] [^^^] [ответить]  
  • +/
    >> на http://sourceforge.net/projects/gimagereader/
    >> A graphical GTK frontend to tesseract-ocr

    и с рус. больше дружит и распознает, а тот же tesseract+OCRFeeder нет. '-l rus' не помогает...


     
     
  • 5.23, gregg128 (ok), 16:55, 18/11/2010 [^] [^^] [^^^] [ответить]  
  • +/
    >>> на http://sourceforge.net/projects/gimagereader/
    >>> A graphical GTK frontend to tesseract-ocr
    > и с рус. больше дружит и распознает, а тот же tesseract+OCRFeeder нет.
    > '-l rus' не помогает...

    Как это не помогает ? Ещё как помогает, распознаёт на счёт раз. Я уже массу всего так распознал. Куда вы вставили этот -l rus ? Какая у вас версия тессеракта, установлен ли пакет с русским ?


     

  • 1.4, Аноним (-), 15:28, 13/11/2010 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    http://live.gnome.org/OCRFeeder

    Тут еще картинки есть. Функционал вроде неплохой.

     
  • 1.5, gregg128 (ok), 15:30, 13/11/2010 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Функционал простенький, но лучше, чем у других. Если будет развиваться - получится вполне себе замена файнридеру, хотя и упрощённая.
     
     
  • 2.10, paulus (ok), 19:28, 13/11/2010 [^] [^^] [^^^] [ответить]  
  • +/
    > Если будет развиваться - получится вполне себе...

    +1, главное, что создает ODT и работает с tesseract и cuneiform - сейчас заценим... правда только 0.7.0


     
     
  • 3.11, gregg128 (ok), 20:22, 13/11/2010 [^] [^^] [^^^] [ответить]  
  • +/
    дебы с git-версией, близкой к 0.7.1 есть у http://notesalexp.org/ . Там же есть deb-ы тессеракта 3.0 со всеми-всеми патчами из git, и то же самое для cuneiform. Владелец этого репозитария вообще рулит не по детски - спасибо ему. Собирает новьё, не ленится. Жаль только, что ведёт свой стэндэлоун репозиторий, а не PPA на ланчпаде, но дарёному коню...
     
     
  • 4.14, Аноним (-), 23:23, 13/11/2010 [^] [^^] [^^^] [ответить]  
  • +/
    Жалко сам автор не выкладывает сборки. А АлексуП респект! Он уже по моему несколько лет собирает все касающееся распознавания.
     
  • 4.15, Аноним (-), 00:43, 14/11/2010 [^] [^^] [^^^] [ответить]  
  • +/
    https://launchpad.net/~alex-p/+archive/notesalexp
     
     
  • 5.18, gregg128 (ok), 14:55, 14/11/2010 [^] [^^] [^^^] [ответить]  
  • +/
    > https://launchpad.net/~alex-p/+archive/notesalexp

    Ага! Большое спасибо.

     
  • 4.20, paulus (ok), 20:54, 16/11/2010 [^] [^^] [^^^] [ответить]  
  • +/
    да знаю я, только на тот момент на http://notesalexp.org/ был 0.7.0
     
     Добавить комментарий
    Имя:
    E-Mail:
    Текст:



    Партнёры:
    PostgresPro
    Inferno Solutions
    Hosting by Hoster.ru
    Хостинг:

    Закладки на сайте
    Проследить за страницей
    Created 1996-2024 by Maxim Chirkov
    Добавить, Поддержать, Вебмастеру