![]() |
Пред. тема | След. тема | ||
Форум Разговоры, обсуждение новостей | |||
---|---|---|---|
Изначальное сообщение | [ Отслеживать ] |
"Выпуск системы распознавания текста GNU Ocrad 0.28" | +/– | ![]() |
Сообщение от opennews (??), 21-Янв-22, 08:30 | ||
После трёх лет с момента прошлого выпуска сформирован релиз системы распознавания текста Ocrad 0.28 (Optical Character Recognition), развиваемой под эгидой проекта GNU. Ocrad может применяться как в форме библиотеки для интеграции функций OCR в другие приложения, так и в форме обособленной утилиты, которая на основе переданного на вход изображения выдаёт текст в UTF-8 или 8-битных кодировках... | ||
Ответить | Правка | Cообщить модератору |
Оглавление |
Сообщения | [Сортировка по ответам | RSS] |
1. Сообщение от Аноним (1), 21-Янв-22, 08:30 | +31 +/– | ![]() |
> поддержка кириллицы отсутствует | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Ответы: #3 |
2. Сообщение от Аноним (2), 21-Янв-22, 08:33 | +6 +/– | ![]() |
GNU как обычно собирает лучших представителей. Большой успех за 19+ лет разработки. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
3. Сообщение от Аноним (3), 21-Янв-22, 08:43 | –5 +/– | ![]() |
распознавание символов - это буквально самое первое, чему учат в TensorFlow. Эдакий хелловорлд от нейросетей. В этой связи нафиг нужен сабж, да еще и без кириллицы - не ясно. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #1 Ответы: #6, #14, #23, #33 |
4. Сообщение от lockywolf (ok), 21-Янв-22, 08:44 | +3 +/– | ![]() |
А можно ли его научить показывать автобусы, лодки, или самолёты на картинке? Спрашиваю для сестры. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Ответы: #5, #7, #15 |
5. Сообщение от _hide_ (ok), 21-Янв-22, 10:29 | +/– | ![]() |
Можно, но это он научится делать лет через 15-20 (((-: | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #4 |
6. Сообщение от Аноним (6), 21-Янв-22, 10:48 | +2 +/– | ![]() |
Если кому-то нужны не шашечки, а ехать тот же tesseract можно обучать самому. А сабж походу не обучаемый, как минимум бегло в мануле я про это ничего не нашел. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #3 Ответы: #9 |
7. Сообщение от Аноним (6), 21-Янв-22, 10:49 | +2 +/– | ![]() |
В tesseract можно. Юникодный моноцветный думаю легко можно научить распознавать. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #4 |
8. Сообщение от Аноним (8), 21-Янв-22, 12:26 | +1 +/– | ![]() |
А есть что готовое кроме Tesseract и CuneiForm, что можно легко и быстро использовать (включая кириллицу)? | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Ответы: #13 |
9. Сообщение от rvs2016 (ok), 21-Янв-22, 12:33 | +/– | ![]() |
> Если кому-то нужны не шашечки, а ехать тот же tesseract | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #6 |
10. Сообщение от Аноним (10), 21-Янв-22, 12:41 | +1 +/– | ![]() |
Отсутствие поддержки кириллицы просто означает, что надо найти энтузиастов, организовать их и запилить поддержку. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Ответы: #22 |
11. Сообщение от Аноним (11), 21-Янв-22, 14:13 | +1 +/– | ![]() |
Самая убогая из программ распознавания. Доля ошибок 10-70% в идеальных условиях, когда Tesseract и CuneiForm дают менее 1%. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Ответы: #12, #17, #19 |
12. Сообщение от Аноним (12), 21-Янв-22, 14:27 | +/– | ![]() |
Ты не понимаешь, это всё не важно. Единственно важные вещи: слово GNU в названии, лицензия GPL и передача копирайтов фонду GNU. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #11 |
13. Сообщение от lockywolf (ok), 21-Янв-22, 14:37 | –1 +/– | ![]() |
Abbyy fine reader server for Linux. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #8 Ответы: #38 |
14. Сообщение от Урри (ok), 21-Янв-22, 16:40 | +1 +/– | ![]() |
Сабж нужен чтобы взять и запустить, а не учиться тензорфлоу, программировать и, главное, долго и нудно обучать. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #3 Ответы: #16 |
15. Сообщение от Урри (ok), 21-Янв-22, 16:43 | +/– | ![]() |
Возьми https://pjreddie.com/darknet/yolo/, она умеет из коробки. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #4 Ответы: #27 |
16. Сообщение от Андрей (??), 21-Янв-22, 17:50 | +/– | ![]() |
так у тессеракта также - просто собираешь и скармливаешь ему нужную сетку/словарь, только с поддержкой кучи языков | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #14 Ответы: #18, #36 |
17. Сообщение от Аноним (17), 21-Янв-22, 18:14 | +/– | ![]() |
когда программа пытается думать и заменяет целые слова? особенно смешно, когда новообразование вписывается в контекст и вычитка становится нетривиальной | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #11 |
18. Сообщение от Урри (ok), 21-Янв-22, 18:27 | +/– | ![]() |
Ну я просто рассказал о том, что знаю и использовал. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #16 Ответы: #28 |
19. Сообщение от Аноним (-), 21-Янв-22, 18:35 | +1 +/– | ![]() |
CuneiForm разве живой? - это убогое Г из 90-ых. Оно сдохло вроде, но выкинув исходники. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #11 Ответы: #20, #21, #30 |
20. Сообщение от Аноним (-), 21-Янв-22, 18:36 | +1 +/– | ![]() |
да, забыл сказать - код их овно. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #19 |
21. Сообщение от Аноним (11), 21-Янв-22, 19:45 | –1 +/– | ![]() |
В таком случае, ocrad -- убожество, которое было стыдно показывать в 1980х. Даже до появления свободных Cuneiform и Tesseract он сливал свободному gocr. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #19 |
22. Сообщение от Тот_Самый_Анонимус (?), 21-Янв-22, 23:38 | –1 +/– | ![]() |
Или послать нах гнутое поделие и пользоваться нормальным софтом. Как тебе такое, анон? | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #10 Ответы: #26 |
23. Сообщение от Аноним (23), 21-Янв-22, 23:55 | +1 +/– | ![]() |
Дядя. Распознаванию символов учили ещё в самом начале девяностых. И уже тогда это сносно работало. Двигай со своим TensorFlow в Windows 3.1, давай! | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #3 |
24. Сообщение от Аноним (23), 21-Янв-22, 23:56 | –2 +/– | ![]() |
По сравнению с ABBYY это. конечно, говнo? | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Ответы: #25, #31, #40 |
25. Сообщение от Аноним (23), 22-Янв-22, 00:05 | –1 +/– | ![]() |
А, под винду бинарников нет. Не нужно. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #24 |
26. Сообщение от Аноним (10), 22-Янв-22, 00:19 | +/– | ![]() |
Хороший специалист всегда востребован. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #22 Ответы: #34, #37 |
27. Сообщение от Аноним (28), 22-Янв-22, 00:19 | –4 +/– | ![]() |
Оно запущено через дев сервер от джанги. Ржу всем офисом над этой поделкой. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #15 Ответы: #29 |
28. Сообщение от Аноним (28), 22-Янв-22, 00:24 | +/– | ![]() |
Распознавал капчу tesseract, а картинку подготавливал плагинами для GIMP на питоне. Все работало точность распознавания была выше 50%. Чего хватало. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #18 |
29. Сообщение от Урри (ok), 22-Янв-22, 14:24 | +4 +/– | ![]() |
> Оно запущено через дев сервер от джанги. Ржу всем офисом над этой | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #27 |
30. Сообщение от Аноним (30), 22-Янв-22, 14:43 | +/– | ![]() |
apt install cuneiform -y | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #19 |
31. Сообщение от Аноним (30), 22-Янв-22, 16:53 | +/– | ![]() |
> По сравнению с ABBYY | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #24 Ответы: #32, #35 |
32. Сообщение от Аноним (32), 22-Янв-22, 19:23 | –1 +/– | ![]() |
Документ на русском языке | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #31 |
33.
Сообщение от Nuzhny![]() | +3 +/– | ![]() |
Распознавание символов никому не нужно. Все хотят распознавание документов с пониманием его внутренней структуры (таблицы, колонки, графики, чертежи), превращение скана в читабельный документ, исправление ошибок от засветки, геометрических и оптических искажений, понимания языка всего текста и его частей (термины на другом языке внутри текста), семантическое выделение отдельных частей (заголовки, шапки, подписи, даты и т.п.) | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #3 |
34. Сообщение от IRASoldier_registered (ok), 23-Янв-22, 04:04 | –1 +/– | ![]() |
>Поэтому недопиленные проекты -- это возможности для тех, кто | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #26 |
35. Сообщение от IRASoldier_registered (ok), 23-Янв-22, 04:07 | +2 +/– | ![]() |
Предмет сравнения инструментов есть всегда - результат работы этих инструментов. А как и из чего производились инструменты интересно или узкому кругу специалистов, которые делают инструменты или религиозным фанатикам, боящимся оскверниться "нечистым" инструментом. Так что в первую очередь надо сравнивать качество сканов. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #31 |
36. Сообщение от лютый жабби__ (?), 23-Янв-22, 08:50 | +/– | ![]() |
>просто собираешь и скармливаешь ему нужную сетку/словарь, только с поддержкой кучи языков | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #16 |
37. Сообщение от Тот_Самый_Анонимус (?), 23-Янв-22, 09:09 | +1 +/– | ![]() |
> Поэтому недопиленные проекты -- это возможности для тех, кто может. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #26 |
38. Сообщение от Аноним (38), 24-Янв-22, 08:16 | +/– | ![]() |
это оно? | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #13 Ответы: #39 |
39. Сообщение от lockywolf (ok), 24-Янв-22, 08:43 | +/– | ![]() |
> это оно? | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #38 |
40. Сообщение от Аноним (40), 25-Янв-22, 01:54 | +/– | ![]() |
Он говно по сравнению с ABBYY, tesseract, cuneiform, ReadIris и, наверняка, ещё кучей. Хотя в 2010 году существовали и успешно продавались сливавшие ему коммерческие системы. | ||
Ответить | Правка | Наверх | Cообщить модератору | ||
Родитель: #24 |
Архив | Удалить |
Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема |
Закладки на сайте Проследить за страницей |
Created 1996-2025 by Maxim Chirkov Добавить, Поддержать, Вебмастеру |