Вариант для распечатки |
Пред. тема | След. тема | ||
Форум Разговоры, обсуждение новостей | |||
---|---|---|---|
Изначальное сообщение | [ Отслеживать ] |
"Новая система оптического распознавания текста EasyOCR" | +/– | |
Сообщение от opennews (??), 08-Июл-20, 22:49 | ||
Проектом EasyOCR развивается новая система оптического распознавания текста, поддерживающая более 40 языков, включая английский, немецкий, французский, японский, китайский, корейский, узбекский, азербайджанский и литовский. Языки на основе кириллицы пока не поддерживаются, но их добавление в списке планов. Код написан на языке Python c использованием фреймворка PyTorch и распространяется под лицензией Apache 2.0. Для загрузки предоставляются готовые модели для языков на основе латинского алфавита и иероглифов... | ||
Ответить | Правка | Cообщить модератору |
Оглавление |
Сообщения | [Сортировка по времени | RSS] |
1. "Новая система оптического распознавания текста EasyOCR" | +5 +/– | |
Сообщение от Аноним (1), 08-Июл-20, 22:49 | ||
Годно, нужно, не тессерактом единым. Правда, у abby распознавание работало лучше, чем у тессеракта ещё 20 лет назад и это было до хайпа на нейронки. Тессеракт уже овер 500 лет развивается всякими гуглами, этот проект уже может с ним конкурировать, какие у него преимущества в наличии? У меня были проблемы с распознаванием китайского в тессеракте, даже в монохромных изображениях, гугл наверное использует что-то другое или он зажал нормальные модели. | ||
Ответить | Правка | Наверх | Cообщить модератору |
3. "Новая система оптического распознавания текста EasyOCR" | –1 +/– | |
Сообщение от Ivan_83 (ok), 08-Июл-20, 23:22 | ||
Я с ним совсем пало игрался, но мне помогло запскейлить изображение раза в 2-4 и потом уже скормить тессеракту. | ||
Ответить | Правка | Наверх | Cообщить модератору |
5. "Новая система оптического распознавания текста EasyOCR" | +/– | |
Сообщение от artenaki (ok), 09-Июл-20, 01:01 | ||
Чтобы распознавалки хорошо распознавали надо чистить изображения от лишнего, как сказано здесь http://subs.com.ru/page.php?al=videosubfinder_hardsub | ||
Ответить | Правка | Наверх | Cообщить модератору |
31. "Новая система оптического распознавания текста EasyOCR" | –1 +/– | |
Сообщение от анон (?), 09-Июл-20, 12:30 | ||
Теряется шум от букв, а это уже важная информация. | ||
Ответить | Правка | Наверх | Cообщить модератору |
8. "Новая система оптического распознавания текста EasyOCR" | +14 +/– | |
Сообщение от Аноним (-), 09-Июл-20, 02:22 | ||
Пора понять и смириться, что под Linux ничего даже близко подобного FineReader не будет. Не появилось за 27 лет и в ближайшем будущем тоже не предвидится... (да-да, знаю, свой движок ковыряйте сами, я про готовый продукт для конечного пользователя). С помощью FineReader я распознавал сотни книг еще в бородатых 90х... и это было мощь! Под Linux ни один проект до сих пор такого уровня распознавания не имеет, это один из немногочисленных минусов Linux, но ктож виноват, что разработчики FineReader такие жлобы и не хотят портировать его... За 27 лет могли бы озаботиться. Есть какие-то проекты, в т.ч. от гугла, но русский распознает там просто г**но - тестил на сотнях книг. Слишком уникальный и сложный софт, здесь только один игрок, который давно порешал весь рыночек, и Linux любовью обделил... | ||
Ответить | Правка | К родителю #1 | Наверх | Cообщить модератору |
12. "Новая система оптического распознавания текста EasyOCR" | +3 +/– | |
Сообщение от Аноним (1), 09-Июл-20, 02:57 | ||
Ну вообще-то, линукс поддерживается, просто это не та пользовательская приложуха. https://www.abbyy.com/ocr-sdk/technical-specifications/ | ||
Ответить | Правка | Наверх | Cообщить модератору |
14. "Новая система оптического распознавания текста EasyOCR" | –4 +/– | |
Сообщение от iPony129412 (?), 09-Июл-20, 04:24 | ||
> но ктож виноват, что разработчики FineReader такие жлобы и не хотят портировать его... | ||
Ответить | Правка | К родителю #8 | Наверх | Cообщить модератору |
17. "Новая система оптического распознавания текста EasyOCR" | –4 +/– | |
Сообщение от Аноним (17), 09-Июл-20, 08:39 | ||
> Десктопный линукс с 1-2% 🤷♂ | ||
Ответить | Правка | Наверх | Cообщить модератору |
36. "Новая система оптического распознавания текста EasyOCR" | +6 +/– | |
Сообщение от хотел спросить (?), 09-Июл-20, 12:49 | ||
яки ён табе бацька, сабака? | ||
Ответить | Правка | Наверх | Cообщить модератору |
15. "Новая система оптического распознавания текста EasyOCR" | –4 +/– | |
Сообщение от Тот_Самый_Анонимус (?), 09-Июл-20, 08:14 | ||
> но ктож виноват, что разработчики FineReader такие жлобы | ||
Ответить | Правка | К родителю #8 | Наверх | Cообщить модератору |
18. "Новая система оптического распознавания текста EasyOCR" | +/– | |
Сообщение от And (??), 09-Июл-20, 09:08 | ||
Косяк в набросе - уж очень явное враньё. | ||
Ответить | Правка | Наверх | Cообщить модератору |
19. "Новая система оптического распознавания текста EasyOCR" | –1 +/– | |
Сообщение от iPony129412 (?), 09-Июл-20, 09:37 | ||
Разработчики в курсе? | ||
Ответить | Правка | Наверх | Cообщить модератору |
30. "Новая система оптического распознавания текста EasyOCR" | +2 +/– | |
Сообщение от Клыкастый (ok), 09-Июл-20, 11:56 | ||
> Разработчики в курсе? | ||
Ответить | Правка | Наверх | Cообщить модератору |
37. "Новая система оптического распознавания текста EasyOCR" | –2 +/– | |
Сообщение от iPony129412 (?), 09-Июл-20, 13:11 | ||
> хомяки, смузихлёбы, розовыхявапоней | ||
Ответить | Правка | Наверх | Cообщить модератору |
39. "Новая система оптического распознавания текста EasyOCR" | +/– | |
Сообщение от artenaki (ok), 09-Июл-20, 13:25 | ||
> XP-нутых вообще сразу посылать | ||
Ответить | Правка | Наверх | Cообщить модератору |
41. "Новая система оптического распознавания текста EasyOCR" | +/– | |
Сообщение от iPony129412 (?), 09-Июл-20, 13:29 | ||
> Вон две какие подделки есть, а ещё Total Commander собирают под Windows XP | ||
Ответить | Правка | Наверх | Cообщить модератору |
42. "Новая система оптического распознавания текста EasyOCR" | +/– | |
Сообщение от artenaki (ok), 09-Июл-20, 13:42 | ||
Что исключение? Еще множество софта XP поддерживает, это факт. | ||
Ответить | Правка | Наверх | Cообщить модератору |
43. "Новая система оптического распознавания текста EasyOCR" | +/– | |
Сообщение от artenaki (ok), 09-Июл-20, 13:48 | ||
> две какие подделки есть | ||
Ответить | Правка | К родителю #41 | Наверх | Cообщить модератору |
46. "Новая система оптического распознавания текста EasyOCR" | +/– | |
Сообщение от Клыкастый (ok), 09-Июл-20, 17:20 | ||
> А разработчикам это как-то не сдалось. | ||
Ответить | Правка | К родителю #37 | Наверх | Cообщить модератору |
48. "Новая система оптического распознавания текста EasyOCR" | +/– | |
Сообщение от iPony129412 (?), 09-Июл-20, 17:59 | ||
> Активно используют. | ||
Ответить | Правка | Наверх | Cообщить модератору |
38. "Новая система оптического распознавания текста EasyOCR" | +/– | |
Сообщение от iPony129412 (?), 09-Июл-20, 13:17 | ||
> тоже есть баги XP-w7-32/64 и прочие специфичные. | ||
Ответить | Правка | К родителю #30 | Наверх | Cообщить модератору |
40. "Новая система оптического распознавания текста EasyOCR" | –1 +/– | |
Сообщение от iPony129412 (?), 09-Июл-20, 13:25 | ||
Потому что ты думаешь не головой а другим местом. | ||
Ответить | Правка | К родителю #30 | Наверх | Cообщить модератору |
47. "Новая система оптического распознавания текста EasyOCR" | +/– | |
Сообщение от Клыкастый (ok), 09-Июл-20, 17:53 | ||
Ты меня явно с кем-то путаешь. И про Pidgin с бровями - не ко мне, и опенсорс сообщество я далеко не идеализирую. Вопрос совершенно простой - вой про ужасный линукс, под который "нормальные конторы" разрабатывать не могут - это вой не про линукс, а про отрицание новых подходов и традиций (которые - есть) на новом рынке (насколько он интересен - вопрос второй). При чём если рынок неинтересен, так и разговор короткий, и спорить не о чем. А вот длинные и мутные описания проблем чаще всего пузырьки над глубинным "не хочу учиться/меняться/осваивать". При чём если посмотреть что коммерсанты осваивали и заставляли сотрудников осваивать, так в общем багтрекеры с гитами и не проблема вовсе. | ||
Ответить | Правка | Наверх | Cообщить модератору |
49. "Новая система оптического распознавания текста EasyOCR" | –1 +/– | |
Сообщение от iPony129412 (?), 09-Июл-20, 18:05 | ||
> Ты меня явно с кем-то путаешь. И про Pidgin с бровями не ко мне | ||
Ответить | Правка | Наверх | Cообщить модератору |
57. "Новая система оптического распознавания текста EasyOCR" | +/– | |
Сообщение от Клыкастый (ok), 14-Июл-20, 21:02 | ||
> А да, перепутал и аватарки и риторика детского максимализма похожа. | ||
Ответить | Правка | Наверх | Cообщить модератору |
32. "Новая система оптического распознавания текста EasyOCR" | –1 +/– | |
Сообщение от апрар (?), 09-Июл-20, 12:34 | ||
балабол. Собери, запакеть и поддерживай еще под каждый дистр сперва, а есть еще и роллинги... | ||
Ответить | Правка | К родителю #18 | Наверх | Cообщить модератору |
50. "Новая система оптического распознавания текста EasyOCR" | –2 +/– | |
Сообщение от Тот_Самый_Анонимус (?), 09-Июл-20, 19:32 | ||
> Косяк в набросе - уж очень явное враньё. | ||
Ответить | Правка | К родителю #18 | Наверх | Cообщить модератору |
58. "Новая система оптического распознавания текста EasyOCR" | +/– | |
Сообщение от Клыкастый (ok), 14-Июл-20, 21:15 | ||
> Слишком толсто. То-то я погляжу под линух целая очередь популярных программ выстроилась. | ||
Ответить | Правка | Наверх | Cообщить модератору |
24. "Новая система оптического распознавания текста EasyOCR" | +2 +/– | |
Сообщение от Аноним (24), 09-Июл-20, 10:56 | ||
>> но ктож виноват, что разработчики FineReader такие жлобы | ||
Ответить | Правка | К родителю #15 | Наверх | Cообщить модератору |
51. "Новая система оптического распознавания текста EasyOCR" | –1 +/– | |
Сообщение от Тот_Самый_Анонимус (?), 09-Июл-20, 19:34 | ||
> опенсорс проектам достаточно выкладывать исходники, чтобы майнтейнеры опакечивали, в этом проблем нет. | ||
Ответить | Правка | Наверх | Cообщить модератору |
55. "Новая система оптического распознавания текста EasyOCR" | +1 +/– | |
Сообщение от elsin (?), 09-Июл-20, 22:22 | ||
https://www.winehq.org/ так вот же фотошоп, МСО или файнридер | ||
Ответить | Правка | Наверх | Cообщить модератору |
56. "Новая система оптического распознавания текста EasyOCR" | +/– | |
Сообщение от Тот_Самый_Анонимус (?), 09-Июл-20, 23:55 | ||
> https://www.winehq.org/ так вот же фотошоп, МСО или файнридер | ||
Ответить | Правка | Наверх | Cообщить модератору |
27. "Новая система оптического распознавания текста EasyOCR" | +1 +/– | |
Сообщение от artenaki (ok), 09-Июл-20, 11:13 | ||
Статически можно линковать. Не проблема, имхо. Да и стандарт LSB не просто так придумали, спросите Зенитара. | ||
Ответить | Правка | К родителю #15 | Наверх | Cообщить модератору |
44. "Новая система оптического распознавания текста EasyOCR" | +1 +/– | |
Сообщение от Аноним (24), 09-Июл-20, 13:49 | ||
> Статически можно линковать. Не проблема, имхо. Да и стандарт LSB не просто | ||
Ответить | Правка | Наверх | Cообщить модератору |
45. "Новая система оптического распознавания текста EasyOCR" | +/– | |
Сообщение от Аноним (45), 09-Июл-20, 14:44 | ||
Причем тут зоопарк, сложно не сложно. Выгодно будут - сделают (хоть под один дистр). Просто распиарен Linux мало = мало пользователей. Сильная хватка нужна для %. Та же история с Firefox и Opera, кстати. | ||
Ответить | Правка | К родителю #15 | Наверх | Cообщить модератору |
52. "Новая система оптического распознавания текста EasyOCR" | –1 +/– | |
Сообщение от Тот_Самый_Анонимус (?), 09-Июл-20, 19:36 | ||
> Причем тут зоопарк, сложно не сложно. Выгодно будут - сделают (хоть под один дистр). Просто распиарен Linux мало = мало пользователей. Сильная хватка нужна для %. Та же история с Firefox и Opera, кстати. | ||
Ответить | Правка | Наверх | Cообщить модератору |
26. "Новая система оптического распознавания текста EasyOCR" | +/– | |
Сообщение от artenaki (ok), 09-Июл-20, 11:09 | ||
> Пора понять и смириться, что под Linux ничего даже близко подобного FineReader не будет. Не появилось за 27 лет и в ближайшем будущем тоже не предвидится | ||
Ответить | Правка | К родителю #8 | Наверх | Cообщить модератору |
29. "Новая система оптического распознавания текста EasyOCR" | +/– | |
Сообщение от artenaki (ok), 09-Июл-20, 11:18 | ||
Проверьте сами, если не верите https://finereaderonline.com/ru-ru | ||
Ответить | Правка | Наверх | Cообщить модератору |
35. "Новая система оптического распознавания текста EasyOCR" | +/– | |
Сообщение от анон (?), 09-Июл-20, 12:43 | ||
> Без Windows не обойтись | ||
Ответить | Правка | Наверх | Cообщить модератору |
54. "Новая система оптического распознавания текста EasyOCR" | –2 +/– | |
Сообщение от Аноним (54), 09-Июл-20, 21:11 | ||
И что характерно: с 12по 15 версию даже по Вайном не запускается. | ||
Ответить | Правка | К родителю #8 | Наверх | Cообщить модератору |
16. "Новая система оптического распознавания текста EasyOCR" | –2 +/– | |
Сообщение от апрар (?), 09-Июл-20, 08:18 | ||
Тессекракт просто текст ищет. Для индексирования это норм, но как для оцифровки документов это никочем. | ||
Ответить | Правка | К родителю #1 | Наверх | Cообщить модератору |
60. "Новая система оптического распознавания текста EasyOCR" | –1 +/– | |
Сообщение от надоело (?), 18-Июл-20, 12:13 | ||
> Ну и отсутствие второго по популярности языка в интернете при наличии вот этих вот 30и.... | ||
Ответить | Правка | Наверх | Cообщить модератору |
25. "Новая система оптического распознавания текста EasyOCR" | +/– | |
Сообщение от Аноним (25), 09-Июл-20, 11:01 | ||
Просто тесеракт надо уметь готовить (обучать самому) и будет сносно работать. | ||
Ответить | Правка | К родителю #1 | Наверх | Cообщить модератору |
34. "Новая система оптического распознавания текста EasyOCR" | +/– | |
Сообщение от анон (?), 09-Июл-20, 12:40 | ||
У адоба оцр в несколько проходов, это даже видно по времени и загрузке ядер. И да, у меня есть огромное количество текстов, которые может прочитать человек, но даже адоб не справится с половиной, но вот все остальное - без проблем. Я даже специально портил тексты, чтобы понять, что лучше справится, чтобы быть уверенным в том, что перечитывать не придется. Ответ - все распознают одинаково ужасно. | ||
Ответить | Правка | К родителю #1 | Наверх | Cообщить модератору |
2. "Новая система оптического распознавания текста EasyOCR" | +/– | |
Сообщение от Erley (ok), 08-Июл-20, 23:22 | ||
Было бы интересно узнать чем это лучше/хуже Tesseract | ||
Ответить | Правка | Наверх | Cообщить модератору |
11. "Новая система оптического распознавания текста EasyOCR" | +2 +/– | |
Сообщение от Аноним (-), 09-Июл-20, 02:29 | ||
Хорошо бы... Когда узнаешь, возвращайся и расскажи нам. ;) | ||
Ответить | Правка | Наверх | Cообщить модератору |
13. "Новая система оптического распознавания текста EasyOCR" | +/– | |
Сообщение от Аноним (13), 09-Июл-20, 03:11 | ||
Написано же: "для определения и распознавания текста на изображении применяются методы машинного обучения". Распознавание символов -- это вообще буквально хелло-ворлд в теме NN, первое, чему обучаются нy6aри. | ||
Ответить | Правка | К родителю #2 | Наверх | Cообщить модератору |
21. "Новая система оптического распознавания текста EasyOCR" | +/– | |
Сообщение от Erley (ok), 09-Июл-20, 10:01 | ||
Так Tesseract тоже на нейронках работает. | ||
Ответить | Правка | Наверх | Cообщить модератору |
4. "Новая система оптического распознавания текста EasyOCR" | +/– | |
Сообщение от Аноним (45), 09-Июл-20, 00:58 | ||
Насколько хорошо китайский распознает? Надо распознать хардсаб https://www.youtube.com/watch?v=MEQd_FJjuAU | ||
Ответить | Правка | Наверх | Cообщить модератору |
6. "Новая система оптического распознавания текста EasyOCR" | +/– | |
Сообщение от Аноним (45), 09-Июл-20, 01:07 | ||
И корейский тоже https://www.youtube.com/watch?v=91g5n0FlbaE но тут, наверное, проще будет распознать французскую речь. | ||
Ответить | Правка | Наверх | Cообщить модератору |
10. "Новая система оптического распознавания текста EasyOCR" | +1 +/– | |
Сообщение от Аноним (10), 09-Июл-20, 02:28 | ||
Поставь, проверь, а заодно и нам расскажешь. ;) | ||
Ответить | Правка | К родителю #4 | Наверх | Cообщить модератору |
7. "Новая система оптического распознавания текста EasyOCR" | –2 +/– | |
Сообщение от Ingener (??), 09-Июл-20, 01:37 | ||
Во время 90х про программы Easy* шутили так - Изя*. Например Изя-поинт (EasyPoint). Сорри, просто вспомнил шутку. | ||
Ответить | Правка | Наверх | Cообщить модератору |
9. "Новая система оптического распознавания текста EasyOCR" | +5 +/– | |
Сообщение от Аноним (-), 09-Июл-20, 02:25 | ||
Русский не поддерживается... значит ненужно! | ||
Ответить | Правка | Наверх | Cообщить модератору |
62. "Новая система оптического распознавания текста EasyOCR" | –1 +/– | |
Сообщение от надоело (?), 18-Июл-20, 12:17 | ||
Тебе всe равно китайский учить в скором времени, так что пофиг. | ||
Ответить | Правка | Наверх | Cообщить модератору |
22. "Новая система оптического распознавания текста EasyOCR" | +2 +/– | |
Сообщение от Аноним (22), 09-Июл-20, 10:22 | ||
Программа не поддерживает ни иврит, ни идиш, поэтому для Изи она бесполезна. | ||
Ответить | Правка | К родителю #7 | Наверх | Cообщить модератору |
20. "Новая система оптического распознавания текста EasyOCR" | +1 +/– | |
Сообщение от Аноним (22), 09-Июл-20, 09:38 | ||
В приложениях для OCR основная проблема не распознавание сырого текста, а восстановление форматирования текста (включая таблицы и детектирование шрифтов, красныx строк и мягких переносов) и вычистка артефактов распознавания и печати. В этом ABBYY FineReader нет равных. | ||
Ответить | Правка | Наверх | Cообщить модератору |
28. "Новая система оптического распознавания текста EasyOCR" | –2 +/– | |
Сообщение от Аноним (25), 09-Июл-20, 11:14 | ||
В гимпе порежь на кусочки как нравится распознай отдельно, а потом вставь форматированно отдельно в либреофис. Что характерно и для гимпа и для либры можно написать плагины для этого, но почему-то этим не заморочился. | ||
Ответить | Правка | Наверх | Cообщить модератору |
53. "Новая система оптического распознавания текста EasyOCR" | +2 +/– | |
Сообщение от Аноним (-), 09-Июл-20, 21:08 | ||
Сам нарезай, извращенец... | ||
Ответить | Правка | Наверх | Cообщить модератору |
23. "Новая система оптического распознавания текста EasyOCR" | –1 +/– | |
Сообщение от Аноним (23), 09-Июл-20, 10:28 | ||
>Новая система оптического распознавания текста EasyOCR | ||
Ответить | Правка | Наверх | Cообщить модератору |
33. "Новая система оптического распознавания текста EasyOCR" | +1 +/– | |
Сообщение от прототипы (?), 09-Июл-20, 12:38 | ||
Python? Господь простит... | ||
Ответить | Правка | Наверх | Cообщить модератору |
59. "Новая система оптического распознавания текста EasyOCR" | +/– | |
Сообщение от artenaki (ok), 17-Июл-20, 00:22 | ||
Стреляйте в пианиста. | ||
Ответить | Правка | Наверх | Cообщить модератору |
61. "Новая система оптического распознавания текста EasyOCR" | +/– | |
Сообщение от надоело (?), 18-Июл-20, 12:15 | ||
Напиши на pure С, лoх чтоли? | ||
Ответить | Правка | К родителю #33 | Наверх | Cообщить модератору |
64. "Новая система оптического распознавания текста EasyOCR" | +/– | |
Сообщение от gilbertelyhopper (ok), 04-Сен-22, 06:37 | ||
OCR — действительно крутая технология, я также знаю сайт, где они неплохо используют оптическое распознавание. Я также регулярно использую его на работе, это бесплатно и онлайн. | ||
Ответить | Правка | Наверх | Cообщить модератору |
Архив | Удалить |
Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема |
Закладки на сайте Проследить за страницей |
Created 1996-2024 by Maxim Chirkov Добавить, Поддержать, Вебмастеру |