Дата | | Заголовок | pstotext - extract plain text from PostScript and PDF files |
Пояснение | Программа для преобразования PS или PDF файлов в текстовый формат (для поддержки русского нужно патчить).
Единственное нормальное средство для конвертации в текст из PDF или PS с кириллицей внутри, утилита pdftotex из комплекта xpdf: "pdftotext -enc KOI8-R test.pdf";
PreScript - утилита на Python для вытаскивания текста из PostScript файлов , возможен вывод в HTML формате;
ps2html - конвертирует PostScript в HTML с максимальным сохранением форматирования.
PsToEdit - ковертирует PostScript и PDF во всевозможные форматы, включая текст и HTML;
Из pdf можно сконвертировать в PS используя pdf2ps.
Используя ghostscript можно конвертировать так: gs -q -dNODISPLAY -dNOBIND -dWRITESYSTEMDICT -dSIMPLE -c save -f ps2ascii
.ps fite.ps -c quit |
Home URL | http://www.research.compaq.com/SRC/virtualpaper/pstotext.html |
Флаг | english |
Раздел | Преобразование из одного формата в другой
|
Ключи | postscript, pdf, text, (найти похожие документы) |
|
|