The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



Вариант для распечатки  
Пред. тема | След. тема 
Форум Разговоры, обсуждение новостей
Режим отображения отдельной подветви беседы [ Отслеживать ]

Оглавление

Выпуск Wine 2.11, opennews (??), 23-Июн-17, (0) [смотреть все]

Сообщения [Сортировка по времени | RSS]


28. "Выпуск Wine 2.11"  +/
Сообщение от iLex (ok), 24-Июн-17, 17:00 
Поставлю вопрос шире: а как вообще под Linux делать такую типичную для любого офиса задачу, как распознавание текстов? За последние 10 лет тут прогресса ровно ноль, поэтому Linux как среда всё ещё не слишком пригодна для офисных работников. Первый же скан чека/документа, который нужно распознать, поставит крест на попытках уйти от винды.
Ответить | Правка | К родителю #12 | Наверх | Cообщить модератору

29. "Выпуск Wine 2.11"  +/
Сообщение от Anonymos (?), 24-Июн-17, 17:46 
Tesseract.
Ответить | Правка | Наверх | Cообщить модератору

30. "Выпуск Wine 2.11"  +1 +/
Сообщение от iLex (ok), 24-Июн-17, 18:09 
Вы его хоть раз запускали? Максимум, для чего он годится - так это для построения консольных ботов, распознающих примитивную капчу.
Потому что оно даже абзацы распознать не способно, так и гонит текст сплошной стеной. Уж молчу про распознавание заголовков, начертания шрифтов (жирный/курсив). Ну, а таблицы оно и через 1000 лет распознавать не научится.
CuneiForm гораздо больше похоже на распознавальщик, как минимум путём некоторого шаманства его можно заставить распознавать абзацы и даже в некоторых случаях жирный шрифт. Но это максимум, а глючность и падучесть у него крайне высоки.
Фактически, единственным приемлемым решением в масштабах Linux-офиса остаётся сервер на винде с установленным FineReader, к которому все и подключаются для распознавания.
Ответить | Правка | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру