On-line: Andrey, гостей 0. Всего: 1 [подробнее..]
АвторСообщение





Пост N: 211
Зарегистрирован: 05.11.05
ссылка на сообщение  Отправлено: 03.02.20 16:41. Заголовок: Вытащить картинки из pdf


Пользуюсь программой PDFMate. Все бы ничего, но есть ограничение на порции файлов, порядка 600-800 pdf за один раз. А у нас, как обычно дикие объемы; я уже очумел эти картинки вынимать.
Может кто сталкивался с такой проблемой?
Есть еще какие программы для пакетной обработки?
Может где-то можно раздобыть кусок программного кода и прикрутить его или хотя бы понять, как он работает?
Или кто знает алгоритм, как эти рисунки вынимать?

Спасибо: 0 
ПрофильЦитата Ответить
Ответов - 5 [только новые]





Пост N: 6
Зарегистрирован: 26.03.19
ссылка на сообщение  Отправлено: 14.02.20 09:42. Заголовок: Уточни - что конкрет..


Уточни - что конкретно нужно
Извлекать внедренные в PDF-файл растровые изображения или
сохранить PDF-страницы как растровые файлы?

Если обрабатываются сотни pdf-файлов то куда складывать изображения и как потом с этой кучей работать?

Спасибо: 0 
ПрофильЦитата Ответить





Пост N: 224
Зарегистрирован: 05.11.05
ссылка на сообщение  Отправлено: 14.02.20 10:05. Заголовок: Нужно Извлекать внед..


Нужно

 цитата:
Извлекать внедренные в PDF-файл растровые изображения



SadStar2019 пишет:

 цитата:
Если обрабатываются сотни pdf-файлов то куда складывать изображения и как потом с этой кучей работать?



Куда извлекать не особенно важно. Важно им присвоить имя оригинального pdf файла. Можно не самому файлу, а папки с ним. Так mate делает. Можно имя чуть видоизменить на конце, но главное, чтобы файл можно было однозначно идентифицировать. У нас есть программа-сборщик, которая всё это обработает.

Спасибо: 0 
ПрофильЦитата Ответить



Пост N: 47
Зарегистрирован: 28.07.10
ссылка на сообщение  Отправлено: 16.02.20 09:58. Заголовок: http://www.xpdfreade..


http://www.xpdfreader.com/download.html

среди "the Xpdf command line tools" есть утилита pdfimages.exe которая извлекает картинки.

если написать в cmd-файл что-то типа
for %%pdf in (*.pdf) do pdfimages -j -list %%p ".\img" > %%p.rep
то можно получить внедренные картинки

Правда у меня pdfimages.exe не запускается. Может потому что у меня WinXP. Проверь. Отпишись. Pls.

Спасибо: 0 
ПрофильЦитата Ответить
администратор




Пост N: 7164
Зарегистрирован: 17.05.05
ссылка на сообщение  Отправлено: 16.02.20 11:41. Заголовок: SADSTAR33 xp..


SADSTAR33
xp

Спасибо: 0 
ПрофильЦитата Ответить





Пост N: 226
Зарегистрирован: 05.11.05
ссылка на сообщение  Отправлено: 16.02.20 14:14. Заголовок: Запуск pdfimages.ex..


Запуск
pdfimages.exe -j <имя файла pdf> <результирующий каталог>
выдает растровое изображение в формате .pbm

Вообще-то это, похоже, то что нужно. Используя дальше ImageMagick можно его преобразовать во что угодно. Нам скорее всего нужны .png

Спасибо!

Спасибо: 0 
ПрофильЦитата Ответить
Ответ:
1 2 3 4 5 6 7 8 9
большой шрифт малый шрифт надстрочный подстрочный заголовок большой заголовок видео с youtube.com картинка из интернета картинка с компьютера ссылка файл с компьютера русская клавиатура транслитератор  цитата  кавычки моноширинный шрифт моноширинный шрифт горизонтальная линия отступ точка LI бегущая строка оффтопик свернутый текст

показывать это сообщение только модераторам
не делать ссылки активными
Имя, пароль:      зарегистрироваться    
Тему читают:
- участник сейчас на форуме
- участник вне форума
Все даты в формате GMT  3 час. Хитов сегодня: 692
Права: смайлы да, картинки да, шрифты да, голосования нет
аватары да, автозамена ссылок вкл, премодерация откл, правка нет