The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

Представлен Unredacter, инструмент для определения пикселизированного текста

16.02.2022 21:33

Представлен инструментарий Unredacter, позволяющий восстановить изначальный текст, после его скрытия с применением фильтров на основе пикселизации. Например, программа может использоваться для определения конфиденциальных данных и паролей, пикселизированных на скриншотах или снимках документов. Утверждается, что реализованный в Unredacter алгоритм превосходит ранее доступные аналогичные утилиты, такие как Depix, и в том числе успешно использован для прохождения теста на определение пиксилизированного текста, предложенного лабораторией Jumpsec. Код программы написан на TypeScript и распространяется под лицензией GPLv3.

Для восстановления текста в Unredacter применяется метод обратного подбора, в соответствии с которым выполняется сравнение части исходного пикселизированного изображения с вариантом, синтезированным путём перебора пар символов, пикселизируемых с различными сдвигами и изменёнными характеристиками. В ходе перебора постепенно подбирается вариант, наиболее близко соответствующий исходному фрагменту. Для успешной работы требуется правильно угадать размер, тип и параметры отступов шрифта, а также вычислить размер ячейки в сетке пикселизации и позицию наложения данной сетки на текст (варианты смещения сетки перебираются автоматически).

Дополнительно можно отметить проект DepixHMM, в рамках которого подготовлен вариант утилиты Depix, переведённый на алгоритм на базе скрытой марковской модели, благодаря которому удалось добиться повышения точности воссоздания символов.

  1. Главная ссылка к новости (https://bishopfox.com/blog/unr...)
  2. OpenNews: Depix, утилита для воссоздания пикселизированных паролей на скриншотах
  3. OpenNews: Google представил технику реконструкции пикселизированных изображений
  4. OpenNews: В рамках проекта subpixel подготовлена нейронная сеть для восстановления изображений
  5. OpenNews: Facebook предложил новый метод восстановления забытых паролей
  6. OpenNews: Google открыл код SyntaxNet, системы восприятия естественного языка
Лицензия: CC BY 3.0
Короткая ссылка: https://opennet.ru/56713-unredacter
Ключевые слова: unredacter, pixel
При перепечатке указание ссылки на opennet.ru обязательно


Обсуждение (51) Ajax | 1 уровень | Линейный | +/- | Раскрыть всё | RSS
  • 1.1, Аноним (1), 21:38, 16/02/2022 [ответить] [﹢﹢﹢] [ · · · ]  
  • –3 +/
    ммм класс
     
     
  • 2.2, ИмяХ (?), 21:41, 16/02/2022 [^] [^^] [^^^] [ответить]  
  • +27 +/
    >>ммм

    Куплю жене новые сапоги

     
     
  • 3.14, Аноним (14), 23:22, 16/02/2022 [^] [^^] [^^^] [ответить]  
  • +5 +/
    Это просто, Лёня! АО МММ
     
     
  • 4.29, Аноним (29), 07:41, 17/02/2022 [^] [^^] [^^^] [ответить]  
  • +/
    Но для начала нужно обналичить счета всяких видеоблогеров этим методом. А что они все равно ничего не делают, а бaбло гребyт лопатой.
     
  • 3.33, Lost Inside (ok), 08:23, 17/02/2022 [^] [^^] [^^^] [ответить]  
  • +/
    Верно, Леня, мы - партнеры!
    АО МММ
     
     
  • 4.40, Аноним (40), 12:18, 17/02/2022 [^] [^^] [^^^] [ответить]  
  • +/
    МММ давно загнулась, Лёня экскаватор продал, фамилию поменял. Теперь программистом стал.
     

  • 1.3, Аноним (3), 21:43, 16/02/2022 [ответить] [﹢﹢﹢] [ · · · ]  
  • +4 +/
    Вы тоже помните времена, когда эта технология была всего лишь шуткой?
    https://img-9gag-fun.9cache.com/photo/2078832_460s.jpg
     
     
  • 2.6, Аноним (6), 22:34, 16/02/2022 [^] [^^] [^^^] [ответить]  
  • +2 +/
    Это другая технология
     
     
  • 3.8, pda (ok), 22:49, 16/02/2022 [^] [^^] [^^^] [ответить]  
  • +/
    Да, это DLSS...
     
  • 3.10, kusb (?), 22:55, 16/02/2022 [^] [^^] [^^^] [ответить]  
  • +/
    Но тоже можно. Нужно знать с учётом того, какая именно камера, какой кодек и т.п. какие пиксели будут выбраны при каком состоянии фотографируемого мира. Зная шрифт номера машины, предыдущие кадры...
     
  • 2.27, iPony129412 (?), 07:23, 17/02/2022 [^] [^^] [^^^] [ответить]  
  • –1 +/
    Да оно и сейчас…
    Тут обычный текст распознаётся так себе (с ошибками) даже лучшими решениями на рынке.
    Тут же вообще лютая угадайка.
     

  • 1.4, VladSh (?), 21:56, 16/02/2022 [ответить] [﹢﹢﹢] [ · · · ]  
  • –1 +/
    Было бы здорово, если бы это впилили для распознавания текста или в утилиты восстановления сканов типа ScanTailor и Кромсатор.
     
  • 1.5, kusb (?), 22:29, 16/02/2022 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Напоминает хеши и обратный подбор по ним?
     
     
  • 2.45, Аноним (-), 15:41, 17/02/2022 [^] [^^] [^^^] [ответить]  
  • +2 +/
    > Напоминает хеши и обратный подбор по ним?

    Если с уточнением "не криптографические", то да.


     
     
  • 3.46, kusb (?), 15:55, 17/02/2022 [^] [^^] [^^^] [ответить]  
  • +/
    >> Напоминает хеши и обратный подбор по ним?
    > Если с уточнением "не криптографические", то да.

    А как работают криптографические? Я не разбираюсь в математике, я часто понимаю чего они хотят достигнуть с её помощью, но не понимаю как это работает.

     
     
  • 4.47, n00by (ok), 17:31, 17/02/2022 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Криптографическая хеш-функция не является обратимой (пример обратимой функции: y = x + 1; зная y, можно вычислить x). Зная это свойство, Аноним машинально среагировал на слово "обратный" рядом с "хеш" и принялся уточнять. На самом деле тут следует разобраться, откуда взялась формулировка "метод обратного подбора". Перебираются исходные варианты текста и сравниваются с результатом, точно так же как берётся из словаря вариант пароля, хешируется, и сравнивается с хешем. Хеш функция применяется "прямо".

    В оригинале reverses употребляется для описание наблюдаемого результата, а не алгоритма:

    I wrote a tool called Unredacter that takes redacted pixelized text and reverses it back into its unredacted form.

     

  • 1.7, Аноним (7), 22:42, 16/02/2022 [ответить] [﹢﹢﹢] [ · · · ]  
  • +9 +/
    Обожаю опенсурц. Специальные проги пишут для тех дебилов, которые заморачиваются, блин, с тем, чтобы потратить время на поиск нужного для этого софта и пикселезацию своих паролей на скриншоте вместо того, чтобы за секунду закрасить их черным прямоугольником в пэйнте. Браво.
     
     
  • 2.9, kusb (?), 22:52, 16/02/2022 [^] [^^] [^^^] [ответить]  
  • +/
    Это выглядит забавнее. И интереснее придумать дурные способы защиты (не просто например не учитывать состояние прямоугольника при пикселизации, а учитывать другое)
     
  • 2.20, Аноним (20), 02:26, 17/02/2022 [^] [^^] [^^^] [ответить]  
  • +/
    прикол если paint сохраняат слои?
     
     
  • 3.21, Аноним (21), 02:53, 17/02/2022 [^] [^^] [^^^] [ответить]  
  • +3 +/
    Надо просто вырезать и все. Я угораю с замазчиков и пикселизаторов. Зачем?
     
     
  • 4.28, iPony129412 (?), 07:24, 17/02/2022 [^] [^^] [^^^] [ответить]  
  • –1 +/
    Так это суть тоже самое.
     
  • 3.26, Аноним (7), 06:47, 17/02/2022 [^] [^^] [^^^] [ответить]  
  • +3 +/
    Где сохраняет? В png файле? jpg или bmp? Не смешите мои тапки.
     
     
  • 4.42, kusb (?), 13:35, 17/02/2022 [^] [^^] [^^^] [ответить]  
  • +2 +/
    У каждого файла есть так называемая "тень", которая не хранится в нём, но передаётся другими способами. Это сделано теневым правительством. Сам код обслуживания тени явно не выполняется на процессоре.
     
     
  • 5.54, X86 (ok), 14:07, 23/02/2022 [^] [^^] [^^^] [ответить]  
  • +/
    А вы думаете зачем эти все сопроцессоры и TPM.
     
  • 4.52, Харитон (?), 17:53, 18/02/2022 [^] [^^] [^^^] [ответить]  
  • +/
    а сколь знает /dev/null...
     
  • 2.35, Аноним (35), 08:44, 17/02/2022 [^] [^^] [^^^] [ответить]  
  • +3 +/
    Можно вместо паролей написать "depix moron, ***k you", и уже потом пикселизовывать.
     

  • 1.11, Аноним (11), 22:56, 16/02/2022 [ответить] [﹢﹢﹢] [ · · · ]  
  • –2 +/
    много чего вручную нужно задать заранее, плюс фон чисто белый, наверно мала где подойдет эта штука
     
  • 1.12, Аноним (12), 23:04, 16/02/2022 [ответить] [﹢﹢﹢] [ · · · ]  
  • –1 +/
    Пробовал. Ни работает оно нифига.
     
  • 1.13, Аноним (13), 23:08, 16/02/2022 [ответить] [﹢﹢﹢] [ · · · ]  
  • +1 +/
    Какой-то плагин для gimp который перед пикселизацией пишет случайные символы... просто черный или белый прямоугольник как-то не оч...
     
     
  • 2.18, VINRARUS (ok), 00:17, 17/02/2022 [^] [^^] [^^^] [ответить]  
  • +/
    >просто черный или белый прямоугольник как-то не оч...

    На: https://upload.wikimedia.org/wikipedia/commons/b/b0/%D0%A4%D0&#

     
  • 2.34, . (?), 08:27, 17/02/2022 [^] [^^] [^^^] [ответить]  
  • +/
    О, хорошая идея, так и буду теперь делать.

    (Только зачем же случайные? Как раз неслучайные. Чтоб любители подглядывания куда не просили трахались-трахались, а там - УЙ! В прямом смысле.)

     

  • 1.15, Аноним (15), 23:26, 16/02/2022 [ответить] [﹢﹢﹢] [ · · · ]  
  • +2 +/
    Такую пикселизацию есть шанс разгадать даже без специальных программ: попробуйте сильно уменьшить изображение или посмотреть на него с большого расстояния.
     
  • 1.16, амоним (?), 23:33, 16/02/2022 [ответить] [﹢﹢﹢] [ · · · ]  
  • +4 +/
    да ладно.100% делали, чтобы азиатскую порнуху распикселировать )
     
     
  • 2.17, Анон36363227 (?), 23:56, 16/02/2022 [^] [^^] [^^^] [ответить]  
  • +2 +/
    Тож об этом подумал. А вы не знаете, может что есть готовое в этом направлении? Сын хозяина собаки соседа начальника друга моей троюродной сестры интересуется.
     
     
  • 3.22, Kuromi (ok), 04:44, 17/02/2022 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Знаю есть какие-то аппаратные примочки у японцев, которые вроде как делают "слегка" четче. Но самое простое - это искать\ждать международный релиз в котором цензуры нет.
    А вообще Япония в смысле прона и цензуры самая странная страна, можно все - кроме показа гениталий, шиза какая-то.
     
     
  • 4.37, z (??), 09:20, 17/02/2022 [^] [^^] [^^^] [ответить]  
  • +/
    Сочувствую, соболезную, сопереживаю.
     
  • 4.48, Быдлоюзер (?), 19:32, 17/02/2022 [^] [^^] [^^^] [ответить]  
  • +/
    У них там есть "тематические бордели" где ты можешь затрахать проститутку в школьной форме в полном шатается вагоне метро  
     
  • 4.49, Аноним (49), 19:52, 17/02/2022 [^] [^^] [^^^] [ответить]  
  • +/
    Боже, как же мне прям сейчас хочется показать тебе свои гениталии!
     
  • 3.44, Аноним (44), 14:34, 17/02/2022 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Есть. https://github.com/liaoxiong3x/DeepCreamPy
     

  • 1.19, Аноним (19), 02:09, 17/02/2022 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Парни, есть масса класссных книг в херовом качестве, с тех времен, когда  жипег в 200kb было много.  
    Чем вот такое обрабатывать кто-нить знает?
     
     
  • 2.31, penetrator (?), 07:56, 17/02/2022 [^] [^^] [^^^] [ответить]  
  • –1 +/
    загнать всё в OCR
     
  • 2.39, Аноним (39), 11:16, 17/02/2022 [^] [^^] [^^^] [ответить]  
  • +/
    напрямую открыть Fr-ом
     
  • 2.51, Аноним (-), 10:55, 18/02/2022 [^] [^^] [^^^] [ответить]  
  • +/
    Книги хранятся в формате DJVU. Классные книги, тем более.
     

  • 1.23, Аноним (23), 05:32, 17/02/2022 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Посмотрите видос на сайте, там детально рассказывают как метод работает, никакой магии.
     
     
  • 2.25, Аноним (25), 06:40, 17/02/2022 [^] [^^] [^^^] [ответить]  
  • +/
    > Посмотрите видос на сайте, там детально рассказывают как метод работает, никакой магии.

    Я и без видоса, по этой новости понял, что если алгоритм не знает языка и шрифта оригинального послания, то ничего толкового не выйдет.

     
     
  • 3.30, Аноним (23), 07:52, 17/02/2022 [^] [^^] [^^^] [ответить]  
  • +/
    Ну так то да, и тренировать его на экзотический язык где символы не такие простые как Латиница,
    например Китайский, будет вряд ли возможно, т.к. там основная фишка в различии каждой буквы от других.
    Если их 26 и они разные, кроме некоторых (O0Q, RPF, VVW, BD) то это проще чем иероглифы
     

  • 1.32, nebularia (ok), 08:09, 17/02/2022 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Поэтому несколько раз прогоняю попеременно пикселизацию с большими пикселями и Гаусс. После этого удачи восстанавливать)
     
     
  • 2.36, Аноним (36), 08:53, 17/02/2022 [^] [^^] [^^^] [ответить]  
  • +1 +/
    > Поэтому несколько раз прогоняю попеременно пикселизацию с большими пикселями и Гаусс. После
    > этого удачи восстанавливать)

    И сколько у вас по времени занимют эти несколько прогонов относительно полного вырезания текста или закрытия сплошными чёрными прямоугольниками?!

    Я сомневаюсь, что ваш КПД выше.

    Разве что, у вас какое-то РАС или что-то подобное, и вы патологически не выносите вырезанные места и чёрные прямоугольники.

     
     
  • 3.38, nebularia (ok), 10:36, 17/02/2022 [^] [^^] [^^^] [ответить]  
  • +/
    > И сколько у вас по времени занимют эти несколько прогонов относительно полного
    > вырезания текста или закрытия сплошными чёрными прямоугольниками?!

    Секунд на 20 больше. Зато потом аккуратный документик, в котором

    > вырезанные места

    понятно, что на этом месте что-то было и

    > чёрные прямоугольники

    такие места не отвлекают на себя внимание.

     
     
  • 4.50, Аноним (49), 19:55, 17/02/2022 [^] [^^] [^^^] [ответить]  
  • +/
    >> чёрные прямоугольники
    >такие места не отвлекают на себя внимание

    не нравятся черные - рисуй белые прямоугольники! Или "вырезай" до "шашечек".

     
  • 2.41, kusb (?), 12:59, 17/02/2022 [^] [^^] [^^^] [ответить]  
  • +/
    Нужно научиться перебирать эти варианты и строить вероятностные ответы, в том числе с учётом того, что должно быть в запикселезованном.
     

     Добавить комментарий
    Имя:
    E-Mail:
    Текст:



    Партнёры:
    PostgresPro
    Inferno Solutions
    Hosting by Hoster.ru
    Хостинг:

    Закладки на сайте
    Проследить за страницей
    Created 1996-2024 by Maxim Chirkov
    Добавить, Поддержать, Вебмастеру