1.1, Аноним (1), 22:49, 08/07/2020 [ответить] [﹢﹢﹢] [ · · · ]
| +5 +/– |
Годно, нужно, не тессерактом единым. Правда, у abby распознавание работало лучше, чем у тессеракта ещё 20 лет назад и это было до хайпа на нейронки. Тессеракт уже овер 500 лет развивается всякими гуглами, этот проект уже может с ним конкурировать, какие у него преимущества в наличии? У меня были проблемы с распознаванием китайского в тессеракте, даже в монохромных изображениях, гугл наверное использует что-то другое или он зажал нормальные модели.
| |
|
2.3, Ivan_83 (ok), 23:22, 08/07/2020 [^] [^^] [^^^] [ответить]
| –1 +/– |
Я с ним совсем пало игрался, но мне помогло запскейлить изображение раза в 2-4 и потом уже скормить тессеракту.
| |
2.8, Аноним (-), 02:22, 09/07/2020 [^] [^^] [^^^] [ответить]
| +14 +/– |
Пора понять и смириться, что под Linux ничего даже близко подобного FineReader не будет. Не появилось за 27 лет и в ближайшем будущем тоже не предвидится... (да-да, знаю, свой движок ковыряйте сами, я про готовый продукт для конечного пользователя). С помощью FineReader я распознавал сотни книг еще в бородатых 90х... и это было мощь! Под Linux ни один проект до сих пор такого уровня распознавания не имеет, это один из немногочисленных минусов Linux, но ктож виноват, что разработчики FineReader такие жлобы и не хотят портировать его... За 27 лет могли бы озаботиться. Есть какие-то проекты, в т.ч. от гугла, но русский распознает там просто г**но - тестил на сотнях книг. Слишком уникальный и сложный софт, здесь только один игрок, который давно порешал весь рыночек, и Linux любовью обделил...
| |
|
3.14, iPony129412 (?), 04:24, 09/07/2020 [^] [^^] [^^^] [ответить]
| –4 +/– |
> но ктож виноват, что разработчики FineReader такие жлобы и не хотят портировать его...
Десктопный линукс с 1-2% 🤷♂
А так «серверная» версия есть, для интеграции с различными разработками.
| |
3.15, Тот_Самый_Анонимус (?), 08:14, 09/07/2020 [^] [^^] [^^^] [ответить]
| –4 +/– |
> но ктож виноват, что разработчики FineReader такие жлобы
Линух и виноват. Под виндой была одна платформа — винНТ. У линя зоопарк дистров. Кому придёт в голову разрабатывать комерческий продукт хз под какие условия? И этот зоопарк дистров живёт всего на 1% компов.
Кстати, разработчики гнома тоже жлобы: они не портирую на вин гномегеймс. Облейте дeрмецом и их.
| |
|
4.18, And (??), 09:08, 09/07/2020 [^] [^^] [^^^] [ответить]
| +/– |
Косяк в набросе - уж очень явное враньё.
Из-за косяка сразу эффект не так забавен.
Как раз достоинство Л. в том, что под любым дистром из зоопарка работает Ок.
| |
|
|
6.30, Клыкастый (ok), 11:56, 09/07/2020 [^] [^^] [^^^] [ответить]
| +2 +/– |
> Разработчики в курсе?
Разработчики - в курсе. Про смузихлёбов "я тут [с трудом] собрал экзешник, хочу чтоб он работал везде и всегда [второй раз я на такой подвиг не отважусь, да и не получится]" не в курсе, пытай их сам.
> Это всё загромождает багтрекер, и причём сразу и не понятно, в чём баг.
Такое у них свойство, у багов - они не бегают по экрану с табличками "алё, пофикси с строке ### в сорце ####". И такое у них свойство - у пользователей, излагать проблемы так, что без длительного допроса с пристрастием вообще зачастую непонятно о чём речь.
Но есть и обратная сторона опенсорсных багтрекеров. Иногда на них заходят парни и девушки, понимающие чуть больше, чем офисный хомячок и к своим немногословным претензиям они присовокупляют патчи и PRы.
Ну вот как-то так.
И да, не знаю как в мире розовыхявапоней (может там всё проще, типа нихрена не работает да и ладно) но в багтрекерах вендовых софтин (ну где они есть, потому что схема "давай денег и иди на юх" не подразумевает такого) тоже есть баги XP-w7-32/64 и прочие специфичные. Чем это отличается от DE-специфичных?
| |
|
7.37, iPony129412 (?), 13:11, 09/07/2020 [^] [^^] [^^^] [ответить]
| –2 +/– |
> хомяки, смузихлёбы, розовыхявапоней
> Иногда на них заходят парни и девушки, понимающие чуть больше, чем офисный хомячок и к своим немногословным претензиям они присовокупляют патчи и PRы.
А разработчикам это как-то не сдалось. И если продукт тем более проприетарный (ещё Adobe поучи как бизнес надо делать), то тут уж.
Это всё давно обсосано, опенсорс или не опенсорс модели работают по разному и нет однозначго ответа типа "закрытая/открытая модель лучше для всего"
Поэтому эти глупости детского максимализма и вот такого ЧСВ оставь при себе.
> тоже есть баги XP-w7-32/64 и прочие специфичные. Чем это отличается от DE-специфичных?
Да, кончено. Но зоопарк гораздо меньше и проще.
Ну а XP-нутых вообще сразу посылать. Особо в 2020 году-то...
До линуксов с несколько дистрибутивов * несколько звуковых серверов * несколько видео серверов ; несколько ДЕ - это в ни какое сравнение не идёт. Да, конечно, это всё не всегда и не для каждого ПО бабахает, но бабахает всё же.
| |
7.38, iPony129412 (?), 13:17, 09/07/2020 [^] [^^] [^^^] [ответить]
| +/– |
> тоже есть баги XP-w7-32/64 и прочие специфичные.
И не забывай, что XP - это 2001. Тогда даже "дефолтного" ныне линукса Ubuntu не было...
| |
7.40, iPony129412 (?), 13:25, 09/07/2020 [^] [^^] [^^^] [ответить]
| –1 +/– |
Потому что ты думаешь не головой а другим местом.
Это ты же мне заяснял бредятину, что в Pidgin не засовывают видеозвонки, потому что нужны ВебКамеры проекту и с хорошим качеством передачи (а то же как на средней камере разрабатывать, если брови чётко не видно), а не то, что рук нет.
Тебе всё само как-то должно делаться, и прибегать волшебное опенсорс сообщество.
А это хорошо для сказок. А вот в реальности далеко не всегда прибегает.
| |
|
|
5.32, апрар (?), 12:34, 09/07/2020 [^] [^^] [^^^] [ответить]
| –1 +/– |
балабол. Собери, запакеть и поддерживай еще под каждый дистр сперва, а есть еще и роллинги...
Снапы всякие тру линуксоиды хэйтят, натив хотят
| |
5.50, Тот_Самый_Анонимус (?), 19:32, 09/07/2020 [^] [^^] [^^^] [ответить]
| –2 +/– |
> Косяк в набросе - уж очень явное враньё.
> Из-за косяка сразу эффект не так забавен.
> Как раз достоинство Л. в том, что под любым дистром из зоопарка работает Ок.
Слишком толсто. То-то я погляжу под линух целая очередь популярных программ выстроилась. Потому что под ним всё ОК.
Вин, Мак, Ондройд — вот под них делают версии, ибо есть стандарт. А под линь — нет, ибо зоопарк. У тебя в голове мозги, или кю?
| |
|
6.58, Клыкастый (ok), 21:15, 14/07/2020 [^] [^^] [^^^] [ответить]
| +/– |
> Слишком толсто. То-то я погляжу под линух целая очередь популярных программ выстроилась.
> Потому что под ним всё ОК.
Не поверишь - популярные программы есть и под линух. И многие из них собираются под BSD и макось. То, что "разработчики популярных программ" в твоей интерпретации напоминают баранов, впадающих в ступор от новых ворот - сугубо их особенность.
> Вин, Мак, Ондройд — вот под них делают версии, ибо есть стандарт.
POSIX, FHS и прочее - стандарты на месте. А то что разработчики "популярных программ" их не осиливают, то это проблема не стандартов. Да и то сказать - они и под венду так пишут. Сколько популярных программ не переживут систему на диске D:? Как давно они научились писать софт который не требует админских прав? Когда вендовые программы перестанут систему превращать в лоскутное одеяло, отрисовывая каждая своё обрамление? Можно не отвечать.
| |
|
|
4.24, Аноним (24), 10:56, 09/07/2020 [^] [^^] [^^^] [ответить] | +2 +/– | Ну, допустим есть коммерческие продукты под коммерческую же красношляпу, зачасту... большой текст свёрнут, показать | |
|
5.51, Тот_Самый_Анонимус (?), 19:34, 09/07/2020 [^] [^^] [^^^] [ответить]
| –1 +/– |
> опенсорс проектам достаточно выкладывать исходники, чтобы майнтейнеры опакечивали, в этом проблем нет.
Речь о проекте с закрытым кодом
> Проприерасты же без проблем договариваются с продакшон-дистрами, на поставку бинарей, которые также опакечиваются, тем более что продакшон дистра всего два с половиной это красношляпа с сусей и убунтодебиан. Причём как правило достаточно одной rpm для красношляпы и одной deb для бубунты.
Где фотошоп, МСО или файнридер?
> Всякие школорачи и прочие болгеносы это не энтерпрайз и не ЦА проприерастов.
Да и остальные, как видим, тоже не ЦА. Так что обделавшись подотритесь.
| |
|
4.27, artenaki (ok), 11:13, 09/07/2020 [^] [^^] [^^^] [ответить]
| +1 +/– |
Статически можно линковать. Не проблема, имхо. Да и стандарт LSB не просто так придумали, спросите Зенитара.
| |
|
5.44, Аноним (24), 13:49, 09/07/2020 [^] [^^] [^^^] [ответить]
| +1 +/– |
> Статически можно линковать. Не проблема, имхо. Да и стандарт LSB не просто
> так придумали, спросите Зенитара.
За статическую линковку я уже давно говорил, что её от разработчика вполне достаточно, если это опенсорсный продукт, то и не нужно создавать гору пакетов для разных дистров, достаточно статической линковки и распространять тарболом.
Этого вполне достаточно, чтобы ознакомиться с программой, кому надо, тот для своего дистрибутива соберёт. Ну и само собой - сорцы выложить.
А проприерасты и так договорятся с продакшон-дистрстрами, примеры есть.
| |
|
4.45, Аноним (45), 14:44, 09/07/2020 [^] [^^] [^^^] [ответить]
| +/– |
Причем тут зоопарк, сложно не сложно. Выгодно будут - сделают (хоть под один дистр). Просто распиарен Linux мало = мало пользователей. Сильная хватка нужна для %. Та же история с Firefox и Opera, кстати.
| |
|
5.52, Тот_Самый_Анонимус (?), 19:36, 09/07/2020 [^] [^^] [^^^] [ответить]
| –1 +/– |
> Причем тут зоопарк, сложно не сложно. Выгодно будут - сделают (хоть под один дистр). Просто распиарен Linux мало = мало пользователей. Сильная хватка нужна для %. Та же история с Firefox и Opera, кстати.
20 лет всё никак. Не судьба, значит.
| |
|
|
3.26, artenaki (ok), 11:09, 09/07/2020 [^] [^^] [^^^] [ответить]
| +/– |
> Пора понять и смириться, что под Linux ничего даже близко подобного FineReader не будет. Не появилось за 27 лет и в ближайшем будущем тоже не предвидится
> разработчики FineReader такие жлобы и не хотят портировать его
Есть онлайн версия. Платная, естественно. Бесплатно дается 5 или 10 страниц в месяц. Удобно, что на сервере самая последняя версия (14, которая на XP уже не ставится, 13 они пропустили, а зря) и не гадит. Но в ней нет смысла. Потому что бесплатный https://onlineocr.net распознает лучше. Вот как раз тот корейский текст FineReader вообще не увидел. Возможно, ему нужна предварительная обработка, которую делает onlineocr.net.
Конечно, как с оффлайн версией не получится схитрить, утянув с торрентов. Правда, я думаю, что онлайн все-таки невыгоден по ценам. Да и FineReader далеко не идеал, сколько я с ним мучался.
| |
|
|
5.35, анон (?), 12:43, 09/07/2020 [^] [^^] [^^^] [ответить]
| +/– |
> Без Windows не обойтись
>20x2
>линуксоиды не могут в виртуалки | |
|
|
3.54, Аноним (54), 21:11, 09/07/2020 [^] [^^] [^^^] [ответить]
| –2 +/– |
И что характерно: с 12по 15 версию даже по Вайном не запускается.
| |
|
2.16, апрар (?), 08:18, 09/07/2020 [^] [^^] [^^^] [ответить]
| –2 +/– |
Тессекракт просто текст ищет. Для индексирования это норм, но как для оцифровки документов это никочем.
Нужно чтобы структуру документа еще определял примерно.
Ну и отсутствие второго по популярности языка в интернете при наличии вот этих вот 30и....
| |
|
3.60, надоело (?), 12:13, 18/07/2020 [^] [^^] [^^^] [ответить]
| –1 +/– |
> Ну и отсутствие второго по популярности языка в интернете при наличии вот этих вот 30и....
По версии первого канала, конечно же? пора вaтанам просветиться уже, 2k20 на дворe.
Гуглу и прочим банально нафиг не уперся твой пусский, надо - дeлай сам или вали поднимать венду для файнридера.
| |
|
2.25, Аноним (25), 11:01, 09/07/2020 [^] [^^] [^^^] [ответить]
| +/– |
Просто тесеракт надо уметь готовить (обучать самому) и будет сносно работать.
| |
2.34, анон (?), 12:40, 09/07/2020 [^] [^^] [^^^] [ответить]
| +/– |
У адоба оцр в несколько проходов, это даже видно по времени и загрузке ядер. И да, у меня есть огромное количество текстов, которые может прочитать человек, но даже адоб не справится с половиной, но вот все остальное - без проблем. Я даже специально портил тексты, чтобы понять, что лучше справится, чтобы быть уверенным в том, что перечитывать не придется. Ответ - все распознают одинаково ужасно.
| |
|
|
2.13, Аноним (13), 03:11, 09/07/2020 [^] [^^] [^^^] [ответить]
| +/– |
Написано же: "для определения и распознавания текста на изображении применяются методы машинного обучения". Распознавание символов -- это вообще буквально хелло-ворлд в теме NN, первое, чему обучаются нy6aри.
| |
|
3.21, Erley (ok), 10:01, 09/07/2020 [^] [^^] [^^^] [ответить]
| +/– |
Так Tesseract тоже на нейронках работает.
Похоже что на данный момент Tesseract более продвинутый продукт - больше языков, больше алгоритмов.
А EasyOCR - только питоновская библиотека, но довольно удобная в использовании.
| |
|
|
1.7, Ingener (??), 01:37, 09/07/2020 [ответить] [﹢﹢﹢] [ · · · ]
| –2 +/– |
Во время 90х про программы Easy* шутили так - Изя*. Например Изя-поинт (EasyPoint). Сорри, просто вспомнил шутку.
| |
|
2.22, Аноним (22), 10:22, 09/07/2020 [^] [^^] [^^^] [ответить]
| +2 +/– |
Программа не поддерживает ни иврит, ни идиш, поэтому для Изи она бесполезна.
| |
|
1.20, Аноним (22), 09:38, 09/07/2020 [ответить] [﹢﹢﹢] [ · · · ]
| +1 +/– |
В приложениях для OCR основная проблема не распознавание сырого текста, а восстановление форматирования текста (включая таблицы и детектирование шрифтов, красныx строк и мягких переносов) и вычистка артефактов распознавания и печати. В этом ABBYY FineReader нет равных.
| |
|
2.28, Аноним (25), 11:14, 09/07/2020 [^] [^^] [^^^] [ответить]
| –2 +/– |
В гимпе порежь на кусочки как нравится распознай отдельно, а потом вставь форматированно отдельно в либреофис. Что характерно и для гимпа и для либры можно написать плагины для этого, но почему-то этим не заморочился.
| |
|
1.23, Аноним (23), 10:28, 09/07/2020 [ответить] [﹢﹢﹢] [ · · · ]
| –1 +/– |
>Новая система оптического распознавания текста EasyOCR
Это последнй пазл, который нехватал GNU/Linux! Всё! OS Windows мертва!
| |
|