Какую версию формата PDF/A лучше выбрать для отсканированных документов? : ECM
10.02.2016
26 января 2016 года на международном форуме (листе рассылки) специалистов по управлению документами RECMGMT-L прошёл интересный обмен мнениями по поводу использования формата PDF/A, см. https://lists.ufl.edu/cgi-bin/wa?A2=ind1601D&L=RECMGMT-L&P=R2000&D=0 . Поскольку наши специалисты тоже начали обращать внимание на этот формат и его разновидности, думаю, им это тоже будет интересно. Сообщения незначительно сокращены и в некоторых случаях объединены.
Специалист по управлению документами и информацией Джессика Фейрчайлд (Jessica Fairchild), работающая в региональном управлении аэропортов округа Сан-Диего (штат Калифорния, США), задала коллегам следующий вопрос:
«Есть ли у кого-нибудь опыт успешного преобразования отсканированного документа в PDF/A-1a? Большинство прочитанных мною материалов наводит на мысль о том, что отсканированные документы могут быть успешно преобразованы лишь в PDf/A-1b.
У нас нет требований, предписывающих использование именно версии 1а для отсканированных документов. Мне, однако, в литературе встретились высказывания о том, что это предпочтительный вариант, если его удастся реализовать. Для нашей группы я рекомендую использовать версию 1b для отсканированных документов и 1а для преобразования в PDF/A изначально-электронных документов.»
Первым Джессике ответил Крис Каплингер (Chris Caplinger), президент и основатель компании RecordLion, Inc.:
«Формат PDF/A-1a не очень хорошо подходит для отсканированных документов, поскольку предполагает форматированный документ. Версия 1а – это «тегированный PDF», рассчитанный на работу с текстом. Если Вы планируете использовать распознавание (OCR) для того, чтобы превратить PDF обратно в структурированный текст, то, думаю, Вы можете использовать версию 1а. В противном случае лучше применять версию 1b.»Несколько в иную плоскость разговор перевёл вице-президент по вопросам управления документами Корпорации по экономическому развитию города Нью-Йорка (New York City Economic Development Corporation) Фредерик Гревин (Frederic J.
Grevin):
«Джессика, для изначально-электронных документов Вы могли бы рекомендовать формат PDF/A-2u (специфицированный стандартом ISO 19005-2 2011) вместо PDF/A-1a. Подробности Вы можете найти в статье в Википедии, см. https://en.wikipedia.org/wiki/PDF/A .
А как Вы проверяете соответствие спецификациям результата преобразования в PDF/A?»Мой комментарий: Фред упоминает международный стандарт ISO 19005-2:2011 «Управление контентом – Электронный файловый формат для долговременной сохранности – Часть 2: Применение ISO 32000-1 (PDF/A-2)» (Document management — Electronic document file format for long-term preservation — Part 2: Use of ISO 32000-1 (PDF/A-2)), см.
На вопрос Фреда Гревина Джессика ответила следующее:
«Сейчас я использую инструмент Preflight, встроенный в Adobe Acrobat X Pro. Сталкивались ли Вы с проблемами с надежностью проверки? Для нас это первый опыт использования PDF/A, и мы сосредоточили внимание на создании внутренних стандартов для отсканированных электронных копий протоколов и резолюций нашего Совета директоров. В конечном итоге мы расширим эту практику и потребуем использования PDF/A для других документов, которые подлежат длительному хранению.
Мне, определенно, следует более детально изучить этот вопрос, и я благодарна за сведения о более новом варианте формата. Я обратила внимание на то, что существует ещё один стандарт PDF/А-3, поддерживающий одну дополнительную возможность — встроенные файлы. Есть ли серьёзные причины того, что Вы не используете эту версию?
Кроме того, я была бы очень признательна за ссылки на любые ресурсы, которые Вы или другие коллеги считаете полезными при принятии решений, касающихся выбора форматов для длительного хранения. »
Завершил (пока что) разговор ещё один ответ Фреда Гревина:
Джессика писала: «Сейчас я использую инструмент Preflight, встроенный в Adobe Acrobat X Pro. Сталкивались ли Вы с проблемами с надежностью проверки?»
Мы столкнулись с массой проблем при преобразовании с использованием Adobe Acrobat X Pro. Я настоятельно призываю Вас сделать одно из двух:
•Либо обновиться до текущей версии этого ПО (Adobe Acrobat Pro DC),
•Либо подумать о приобретении специализированного конвертора в PDF/A, например, такого, как pdfaPilot фирмы Callas Software, см. https://www.callassoftware.com/en/products/pdfapilot/?type=product&product=pdfapilotdesktop
Что касается проверки на соответствие спецификациям формата PDF/A, то существует такого рода программное обеспечение других разработчиков, которое можно использовать вместо (или вместе) с инструментом Preflight в Adobe Acrobat.
Список решений (несколько устаревший, составленный в 2011 году) есть на веб-сайте Ассоциации PDF ((PDF Association), см.
http://www.pdfa.org/2011/08/validating-pdfa/ .Фонд «открытая сохранность» (Open Preservation Foundation) разрабатывает решение veraPDF (в настоящее время текущей является версия 0.8), см. http://openpreservation.org/news/verapdf-0-8-now-available/ .
Ряд интересных материалов по проверке на соответствие спецификациям формата Вы найдёте на перечисленных ниже сайтах:
•Дафф Джонсон (Duff Johnson) «Зачем нужна проверка соответствия спецификациям?» (Why Validation?, видео), см. http://www.pdfa.org/video/duff-johnson-why-validation/
•Александра Эттлер (Alexandra Oettler) «Проверка: Это действительно PDF/A?» (Validation: Is it really PDF/A?), пост на сайте Ассоциации PDF от 7 февраля 2013 года, см. http://www.pdfa.org/2013/02/validation/
•«Баварский отчет о точности проверок на соответствие спецификациям PDF/A» (Bavaria Report on PDF/A Validation Accuracy), PDFlib, 2009 г., http://www.pdflib.com/fileadmin/pdflib/pdf/pdfa/2009-05-04-Bavaria-report-on-PDFA-validation-accuracy.
•Борис Дубров (Boris Doubrov) «Как veraPDF осуществляет проверку на соответствие спецификациям PDF/A» (How veraPDF does PDF/A validation), пост от 19 мая 2015 года, см. http://www.pdfa.org/2015/05/how-verapdf-does-pdfa-validation/
•Имеется также ряд сделанных на проведенной Ассоциацией PDF Технической конференции по PDF 2015 года видеозаписей докладов по валидации PDF-файлов, см. http://www.pdfa.org/2015/12/video-recordings-from-the-pdf-technical-conference-2015/ . См., в частности, доклады Бориса Дуброва «Автоматизация контроля качества при создании и проверке PDF-файлов» и «Авторитетная валидация PDF/A: Почему разработчикам следует обратить на это внимание? (совместно с Даффом Джонсоном).
Джессика также писала: «Я обратила внимание на то, что существует ещё один стандарт PDF/А-3, поддерживающий одну дополнительную возможность — встроенные файлы. Есть ли серьёзные причины того, что Вы не используете эту версию?»
Лично я избегал бы PDF/A-3, как чумы: это продукт, который по моему, не слишком скромному мнению, был разработан для целей, по сути дела не являющихся «архивными» (замечу, что люди из подготовившей его рабочей группы 171-го технического комитета ИСО со мной не согласны).
Полное раскрытие информации о себе: я являюсь членом американской делегации («Технической консультативной группы» — Technical Advisory Group, TAG), принимающей участие в работе технического комитета TC 171, отвечающего – в числе многих других проектов – за дальнейшее развитие системы форматов PDF (за исключением PDF/T , PDF/V и PDF/X, которыми занимаются другие организации). Источник: лист рассылки RECMGMT-L
https://lists.ufl.edu/cgi-bin/wa?A2=ind1601D&L=RECMGMT-L&P=R2000&D=0
https://lists.ufl.edu/cgi-bin/wa?S2=RECMGMT-L&D=0&q=PDF%2FA+-+Scanned+Documents&0=S&s=&f=&a=&b=
Автор: Наташа Храмцовская
http://rusrim.blogspot.ru/2016/02/pdfa.html
Опубликовал: Александр Абрамов ([email protected])
Тематики:
Ключевые слова:
ДайджестКЭДО для устойчивого развития: Циан перевела в онлайн кадровый документооборот от VK | Другие новостиЭОС рассказал о трансформации МЭДО и новых инструментах интеграции с СЭД На «Российской неделе высоких технологий-2023» представлены два полностью российских ПАК, созданные по инициативе ЭОС: «МФЦ Плюс» и «Архивное дело» КЭДО для устойчивого развития: Циан перевела в онлайн кадровый документооборот от VK Редкие книги и учетную документацию Бахрушинского музея оцифровывают на сканерах ЭЛАР «Девелоника» (ГК Softline) автоматизировала документооборот и наряд-задания для Высокогорского горно-обогатительного комбината |
Файлы, совместимые с PDF/X, PDF/A и PDF/E (Adobe Acrobat Pro)
Руководство пользователя Отмена
Поиск
Последнее обновление Sep 10, 2021 03:33:31 PM GMT | Также применяется к Adobe Acrobat 2017, Adobe Acrobat 2020
- Руководство пользователя Acrobat
- Введение в Acrobat
- Доступ к Acrobat с настольных компьютеров, мобильных устройств и интернета
- Новые возможности Acrobat
- Комбинации клавиш
- Системные требования
- Рабочее пространство
- Основные сведения о рабочем пространстве
- Открытие и просмотр файлов PDF
- Открытие документов PDF
- Навигация по страницам документа PDF
- Просмотр установок PDF
- Настройка режимов просмотра PDF
- Включение предварительного просмотра эскизов файлов PDF
- Отображать PDF в браузере
- Работа с учетными записями облачного хранилища в Интернете
- Доступ к файлам из Box
- Доступ к файлам из Dropbox
- Доступ к файлам из OneDrive
- Доступ к файлам из SharePoint
- Доступ к файлам из Google Диска
- Acrobat и macOS
- Уведомления Acrobat
- Сетки, направляющие и измерения в PDF
- Использование азиатского текста, кириллицы и текста слева направо в документах PDF
- Основные сведения о рабочем пространстве
- Создание документов PDF
- Обзор процедуры создания документов PDF
- Создание файлов PDF в Acrobat
- Создание документов PDF с помощью PDFMaker
- Использование принтера Adobe PDF
- Преобразование веб-страниц в PDF
- Создание файлов PDF с помощью Acrobat Distiller
- Настройки преобразования Adobe PDF
- Шрифты PDF
- Редактирование документов PDF
- Редактирование текста в документах PDF
- Редактирование изображений и объектов в документе PDF
- Поворот, перемещение, удаление и изменение нумерации страниц PDF
- Редактирование отсканированных документов PDF
- Улучшение фотографий документов, снятых на камеру мобильного устройства
- Оптимизация документов PDF
- Свойства документов PDF и метаданные
- Ссылки и вложенные файлы в PDF
- Слои документов PDF
- Миниатюры страниц и закладки в документах PDF
- Мастер операций (Acrobat Pro)
- Файлы PDF, преобразованные в веб-страницы
- Настройка документов PDF для использования в презентации
- Статьи PDF
- Геопространственные файлы PDF
- Применение операций и сценариев к файлам PDF
- Изменение шрифта по умолчанию для добавления текста
- Удаление страниц из документов PDF
- Сканирование и распознавание текста
- Сканирование документов в формат PDF
- Улучшение фотографий документов
- Устранение неполадок сканера при использовании Acrobat для сканирования
- Формы
- Основные положения для работы с формами PDF
- Создание форм с нуля в Acrobat
- Создание и рассылка форм PDF
- Заполнение форм PDF
- Свойства полей форм PDF
- Заполнение и подписание форм PDF
- Настройка кнопок для выполнения действий в формах PDF
- Публикация интерактивных веб-форм PDF
- Основные положения для работы с полями форм PDF
- Поля форм PDF для штрих-кода
- Сбор данных формы PDF и управление ими
- Инспектор форм
- Помощь с формами PDF
- Отправка форм PDF получателям с использованием эл. почты или внутреннего сервера
- Объединение файлов
- Объединение или слияние файлов в один файл PDF
- Поворот, перемещение, удаление и перенумерация страниц PDF
- Добавление верхних и нижних колонтитулов, а также нумерации Бейтса в документы PDF
- Обрезка страниц PDF
- Добавление водяных знаков в документы PDF
- Добавление фона в документы PDF
- Работа с файлами, входящими в портфолио PDF
- Публикация портфолио PDF и предоставление совместного доступа
- Обзор портфолио PDF
- Создание и настройка портфолио PDF
- Общий доступ, редактирование и комментирование
- Предоставление общего доступа к документам PDF и их отслеживание онлайн
- Пометка текста при редактировании
- Подготовка к редактированию документа PDF
- Запуск процесса редактирования файлов PDF
- Размещение совместных рецензий на сайтах SharePoint или Office 365
- Участие в редактировании документа PDF
- Добавление комментариев в документы PDF
- Добавление штампа в файл PDF
- Процессы утверждения
- Управление комментариями | просмотр, добавление ответа, печать
- Импорт и экспорт комментариев
- Отслеживание редактирования PDF и управление им
- Сохранение и экспорт документов PDF
- Сохранение PDF
- Преобразование файлов PDF в формат Word
- Преобразование документа PDF в файл JPG
- Преобразование и экспорт документов PDF в файлы других форматов
- Параметры форматирования файлов для экспорта в PDF
- Повторное использование содержимого PDF
- Защита
- Повышенный уровень защиты документов PDF
- Защита документов PDF с помощью паролей
- Управление цифровыми удостоверениями
- Защита документов PDF с помощью сертификатов
- Открытие защищенных документов PDF
- Удаление конфиденциальных данных из документов PDF
- Установка политик безопасности файлов PDF
- Выбор метода защиты для документов PDF
- Предупреждения безопасности при открытии документов PDF
- Защита файлов PDF с Adobe Experience Manager
- Функция защищенного просмотра PDF-документов
- Обзор функций защиты в программе Acrobat и файлах PDF
- Язык JavaScript в файлах PDF, представляющий угрозу безопасности
- Вложения как угроза безопасности
- Разрешить или заблокировать ссылки в PDF-файлах
- Электронные подписи
- Подписание документов PDF
- Съемка подписи на мобильное устройство и использование ее в любых приложениях
- Отправка документов на электронные подписи
- О подписях сертификатов
- Подписи на основе сертификата
- Подтверждение цифровых подписей
- Доверенный список, утвержденный Adobe
- Управление доверенными лицами
- Печать
- Основные задачи печати файлов PDF
- Печать брошюр и портфолио в формате PDF
- Дополнительные настройки печати PDF
- Печать в PDF
- Печать цветных документов PDF (Acrobat Pro)
- Печать файлов PDF с помощью заказных размеров
- Расширенный доступ, теги и перекомпоновка
- Создание и проверка средств расширенного доступа к документам PDF
- Возможности расширенного доступа в файлах PDF
- Инструмент «Порядок чтения» в PDF
- Чтение документов PDF при помощи возможностей расширенного доступа и перекомпоновки
- Редактирование структуры документа на панелях «Содержимое» и «Теги»
- Создание документов PDF с расширенным доступом
- Поиск и индексация
- Индексирование файлов PDF
- Поиск в документах PDF
- 3D-модели и мультимедиа
- Добавление аудио, видео и интерактивных объектов в файлы PDF
- Добавление 3D-моделей в файлы PDF (Acrobat Pro)
- Отображение 3D-моделей в файлах PDF
- Взаимодействие с 3D-моделями
- Измерение 3D-объектов в файлах PDF
- Настройка 3D-видов в файлах PDF
- Включение 3D-содержимого в документе PDF
- Добавление мультимедийного контента в документы PDF
- Добавление комментариев для 3D-макетов в файлах PDF
- Воспроизведение видео-, аудио- и мультимедийных форматов в файлах PDF
- Добавление комментариев в видеоролики
- Инструменты для допечатной подготовки (Acrobat Pro)
- Обзор инструментов для допечатной подготовки
- Типографские метки и тонкие линии
- Просмотр цветоделения
- Обработка прозрачности
- Преобразование цветов и управление красками
- Цветовой треппинг
- Предпечатная проверка (Acrobat Pro)
- Файлы, совместимые с PDF/X-, PDF/A- и PDF/E
- Профили предпечатной проверки
- Расширенная предпечатная проверка
- Отчеты предпечатной проверки
- Просмотр результатов предпечатной проверки, объектов и ресурсов
- Методы вывода в PDF
- Исправление проблемных областей с помощью инструмента «Предпечатная проверка»
- Автоматизация процедуры анализа документов с помощью дроплетов или операций предпечатной проверки
- Анализ документов с помощью инструмента «Предпечатная проверка»
- Дополнительная проверка с помощью инструмента «Предпечатная проверка»
- Библиотеки предпечатной проверки
- Предпечатные переменные
- Управление цветом
- Обеспечение согласованности цветов
- Настройки цветов
- Управление цветом документов
- Работа с цветовыми профилями
- Основы управления цветом
Преобразование файлов PDF в формат PDF/X, PDF/A или PDF/E
Содержимое документа PDF можно проверить на соответствие критериям PDF/X, PDF/A, PDF/VT или PDF/E. Копию файла PDF можно сохранить в формате PDF/X, PDF/A или PDF/E, при условии, что он соответствует указанным требованиям. Например, при определенных обстоятельствах ICC-профиль, который описывает устройство назначения, необходим для совместимости с форматами PDF/X-1a, PDF/X-3 и PDF/X-4. Если документ не располагает встроенным профилем вывода ICC, то можно встроить профиль перед сохранением документа.
Преобразование файла PDF в соответствующий стандарту файл PDF выполняется с помощью Мастера стандартов. В ходе выполнения операций в этом Мастере даются пояснения по отдельным форматам. Если вы знакомы с этими стандартами, то для преобразования файла PDF можно использовать встроенный профиль или профиль, созданный с помощью мастера.
Примечание.
Также можно создать файл, совместимый с PDF/X и PDF/A, с помощью программы Acrobat Distiller.
Преобразование в PDF/X, PDF/A или PDF/E с помощью профиля
Выберите Инструменты > Допечатная подготовка.
Набор инструментов допечатной подготовки отображается на панели справа.
Нажмите Выполнить предпечатную проверку.
Отобразится диалоговое окно «Предпечатная проверка».
В диалоговом окне «Предпечатная проверка» выберите Стандарты PDF из раскрывающегося списка Библиотеки.
Перейдите на вкладку Профили.
Разверните совместимый профиль и выберите необходимый профиль. Например, в пункте «Соответствие PDF/A» выберите пункт Преобразовать в PDF/A-1b.
Нажмите Анализировать и исправить.
Нажмите Сохранить для преобразования файла в соответствии с выбранным профилем.
Преобразование в формат PDF/X, PDF/A или PDF/E
Выберите Инструменты > Стандарты PDF.
Выберите на панели справа Сохранить как PDF/A, Сохранить как PDF/X или Сохранить как PDF/E.
Выберите местоположение для сохранения файла и нажмите Сохранить.
Проверка PDF-файла на соответствие критериям стандартов PDF/X, PDF/A, PDF/VT или PDF/E
Файлы PDF/X, PDF/A, PDF/VT и PDF/E могут быть созданы различными способами, например с использованием приложения Acrobat Distiller или команды «Файл» > Сохранить как «Другое»Если Вы открываете файл PDF, который соответствует одному из этих стандартов, то информацию о стандартах можно увидеть на панели «Навигация» (выберите Просмотр > Показать/Скрыть > Панели навигации, а затем нажмите Стандарты ). Меню и панель «Стандарты» доступны только в том случае, если файл PDF соответствует стандарту. Панель «Стандарты» присутствует во всех версиях (Acrobat Professional, Standard и даже Reader). Однако функция проверки подтверждения доступна только в Acrobat.
В сведениях о подтверждении указывается стандарт, использованный для создания файла, наименование стандарта ISO, а также отметка о том, был ли файл проверен на соответствие требованиям стандартов PDF/X, PDF/A, PDF/VT, PDF/UA или PDF/E. В информации о способах вывода указываются цветовые настройки, ассоциированные с данным файлом. Чтобы проверить файл на соответствие стандартам, нажмите на кнопку Проверить соответствие.
Вы можете удалить всю информацию о соответствии стандартам PDF/X, PDF/A или PDF/E, например условие вывода или ключ версии GTS_PDFX. Это полезно, если файл был изменен, если нужно начать заново или если ICC-профиль слишком увеличивает размер файла.
Выберите Инструменты > Допечатная подготовка.
Набор инструментов допечатной подготовки отображается на панели справа.
Нажмите Выполнить предпечатную проверку.
Отобразится диалоговое окно «Предпечатная проверка».
В диалоговом окне «Предпечатная проверка» выберите Стандарты PDF из раскрывающегося списка Библиотеки.
Перейдите на вкладку Исправления .
Раскройте группу Информация о документе и метаданные и выберите Удалить данные <название_стандарта>. Например, выберите «Удалить данные PDF/A».
Нажмите Исправить.
Выберите местоположение для сохранения файла и нажмите Сохранить.
Если действие выполнено успешно, в диалоговом окне «Предпечатная проверка», на вкладке «Результаты» отобразится зеленый флажок. Если действие завершится с ошибкой, в диалоговом окне «Предпечатная проверка», на вкладке «Результаты» отобразится красный крестик.
Связанные материалы
- Анализ документов с помощью инструмента «Предпечатная проверка» (Acrobat Pro)
- Настройки Adobe PDF
- О стандартах PDF/X, PDF/E и PDF/A
Вход в учетную запись
Войти
Управление учетной записью
Использование PDF/A в качестве формата сохранения
PDF/A (или Portable Document Format Archival) — это формат, разработанный как формат сохранения цифровых записей, особенно документов. Однако этот формат также можно использовать для отсканированных документов. Это международный стандарт и подмножество формата PDF. Одно из больших достоинств форматов PDF заключается в том, что они представляют собой открытые стандарты, широко используемые во всем мире и предназначенные для записи изображений и машиночитаемого текста в одном документе.
PDF/A можно использовать для хранения многих типов записей, но наиболее ценным он является как формат для долговременного хранения копий цифровых текстовых документов, таких как файлы Microsoft Word. Когда вы конвертируете такой файл в формат PDF/A, полученный файл сохраняет внешний вид исходного документа. Каждая страница исходного документа отображается как отдельная страница в файле сохранения, в обоих документах используются одни и те же шрифты, и вы можете выполнять поиск по тексту PDF/A так же, как и в оригинале. Если документ цветной, цвет сохраняется. По этим причинам PDF/A является хорошим форматом в тех случаях, когда внешний вид документа имеет значение для его интерпретации и понимания.
Другие цифровые файлы также могут быть преобразованы в PDF/A, включая обычные PDF-файлы, сообщения электронной почты, цифровые изображения и электронные таблицы. Вы даже можете преобразовать последовательность цифровых изображений в один файл PDF/A. Любой цифровой файл, который можно распечатать, можно преобразовать в PDF/A, хотя этот формат лучше подходит для одних документов, чем для других. Этот формат лучше всего подходит для статических файлов, которые не изменяются. Это не подходит для файлов, которые постоянно находятся в движении, таких как базы данных.
Бумажные документы также можно преобразовать в PDF/A во время сканирования, но при этом будет лучше, если вы также используете программное обеспечение для оптического распознавания символов (OCR) для преобразования изображений букв в документе в электронный текст. Однако всякий раз, когда вы распознаете документ, в преобразованном тексте будут ошибки данных. (См. Руководство по цифровым изображениям Государственного архива 2013 г. для получения рекомендаций по сканированию и распознаванию текстовых документов.)
PDF/A имеет много преимуществ как файловый формат для хранения записей с длительными или постоянными периодами хранения. Если вы рассматриваете другие форматы цифровых файлов в качестве вариантов для долгосрочного или постоянного хранения, сравните их преимущества с преимуществами PDF/A. Приведенные ниже преимущества PDF/A послужат контрольным списком функций, необходимых для любого формата сохранения. Обратите внимание, что вы найдете форматы файлов, которые имеют одно или даже несколько из этих преимуществ, но именно их совокупность делает PDF/A хорошим форматом для сохранения. Microsoft Word, например, вездесущ и долговечен, но в нем отсутствуют другие важные функции, которые сделали бы его кандидатом на долгосрочное хранение записей.
Не зависит от платформы
С момента своего создания формат PDF был доступен на всех вычислительных платформах, и формат PDF/A имеет такое же преимущество. Это означает, что PDF/A, созданный в среде Windows, будет отлично читаться и использоваться в среде Mac или наоборот.
Вездесущий
Вездесущий — это то, что можно найти повсюду, а форматы PDF и PDF/A ежедневно используются сотнями миллионов людей по всему миру. Ценность такого универсального использования PDF заключается в том, что это означает, что он вряд ли исчезнет как формат в ближайшее время. Кроме того, поскольку PDF/A является просто подмножеством PDF, любой программный продукт, который может читать PDF, может читать PDF/A. Adobe распространяет бесплатное программное обеспечение Adobe Reader для чтения PDF-файлов, позволяя каждому читать PDF/A без дополнительных затрат на компьютерное оборудование или оборудование. (Его можно загрузить по адресу http://get.adobe.com/reader/.)
Долгоживущий
Формат PDF существует с 1991 года, поэтому вряд ли этот формат скоро исчезнет. Опять же, пока существует PDF, PDF/As будет легко читать и использовать.
Вспомогательные метаданные
Чтобы понять цифровой файл, вам часто нужны хорошие метаданные, чтобы дать файлу контекст. Эти метаданные могут включать множество фрагментов информации, например имя автора и дату файла. Для цифровых файлов метаданные часто хранятся внутри самого файла, поэтому важно иметь возможность сохранять эти метаданные (и даже добавлять к ним) при преобразовании одного цифрового файла в другой. PDF/A специально разработан для поддержки расширенных метаданных.
Поддержка идеального преобразования
Целью любой программы преобразования, даже микрофильмирования и сканирования, является создание новой записи, максимально похожей на оригинал. PDF/A многое делает в этой области: он сохраняет внешний вид и возможность поиска исходного файла, а также требует, чтобы исходные шрифты, цвета и макет были сохранены в создаваемом вами PDF/A. Формат PDF/A делает это за счет того, что является автономным, то есть сохраняет в самом файле всю информацию, необходимую для отображения документа. (Сюда входят шрифты и определения цветов, которые не всегда сохраняются в файлах других форматов.)
Открытый
Открытый формат файла — это формат, в котором спецификации доступны всем и каждый может использовать эти спецификации для разработки программного продукта для создания и чтения формата файла. PDF/A всегда был стандартом сохранения с момента его первоначального выпуска в 2005 году, поэтому он явно соответствует этому критерию.
Поддерживает аутентичность
В цифровом мире, даже в большей степени, чем в аналоговом мире, важно гарантировать, что записи сохраняют эту аутентичность, чтобы они не изменялись после их создания, чтобы они не содержали информацию, отличную от той, что была в них. изначально держал. Ни один формат файла сам по себе не может гарантировать аутентичность, но PDF/A поддерживает аутентичность, поскольку его трудно (хотя и не невозможно) модифицировать, а также обеспечивает безопасность документа (например, цифровые подписи).
Расширяемый
Расширяемый означает, что читаемость цифрового файла будет расширяться в будущем, что файл не станет нечитаемым при изменении программного обеспечения. Стандарт PDF/A разработан таким образом, что самый ранний PDF/A всегда будет доступен для чтения в самой последней программе просмотра PDF. Это обеспечивается тем фактом, что каждая версия PDF/A всегда является подмножеством той, что следует за ней, а это означает, что стандарт PDF/A-3 всегда поддерживает все характеристики исходного PDF/A-1 — наряду с несколько дополнительных функций.
Хотя PDF/A имеет много преимуществ, у него есть и недостатки. Все цифровые файлы не могут быть преобразованы в PDF/A. Иногда это происходит из-за того, что в файлах есть функции, запрещенные в PDF/A, поскольку нет известного способа сохранить эти функции с течением времени. К таким файлам относятся документы с аудио- и видеоданными или Javascript. PDF/A также является сложным текстовым и графическим форматом, и его сложность может стать помехой в будущем. Наконец, некоторые цифровые файлы или записи просто не подходят для преобразования в формат PDF/A. Например, можно сохранить веб-сайт в формате PDF/A, но полученный файл будет громоздким и сложным в использовании. Поскольку PDF/As требуют встраивания любых шрифтов, используемых в файле, они также могут быть больше, чем обычные PDF-файлы. Несмотря на эти недостатки, в целом PDF/A является хорошим форматом для сохранения большинства цифровых документов.
Поскольку формат PDF/A расширяет свои возможности с течением времени, уже существует несколько различных версий PDF/A (PDF/A-1, -2 и -3). Помимо этого, каждое поколение формата имеет разные уровни соответствия, которые указывают, в какой степени каждый из них соответствует самым высоким целям PDF/A.
Все версии PDF/A объединены определенным подмножеством поддерживаемых функций, которые можно свести к одной идее: каждый файл PDF/A должен быть автономным, содержать в себе всю необходимую для него информацию читать как полный файл. Может показаться, что все цифровые файлы самодостаточны, что каждый из них несет в себе все необходимое, чтобы сделать его читаемым так, как он должен был быть прочитан, но это не так. Например, если вы работаете с файлом Microsoft Word на работе, а затем открываете его дома, он может выглядеть совсем по-другому: если у вас дома нет того же шрифта, что и на работе, то файл Word выберет самый близкий шрифт, который он может найти на вашем компьютере. Файл Word не должен хранить внутри себя используемые шрифты; вместо этого он хранит только информацию об используемом шрифте, а затем ищет этот шрифт в любой вычислительной среде, в которой он находится.0003
Однако PDF/A должен встраивать все свои шрифты в себя, чтобы ему никогда не приходилось искать шрифты, необходимые для полного раскрытия себя пользователю. Чтобы сэкономить место, в файле будет храниться только подмножество нужного шрифта, поэтому, если в файле нет заглавной буквы X, информация, показывающая этот символ, не сохраняется в файле. PDF/As также должны иметь неограниченное легальное использование любых встроенных шрифтов, потому что, если они этого не сделают, их нельзя будет точно просмотреть в будущем. Некоторые шрифты содержат метаданные, которые не позволяют использовать их в PDF-файлах или ограничивают временные рамки, в течение которых шрифт может использоваться на законных основаниях. Если такие шрифты есть в документе, который вы пытаетесь преобразовать в PDF/A, вы не сможете создать из него PDF/A.
Помимо встроенных шрифтов, PDF/A также нуждается в аппаратно-независимом цвете, что означает, что отображение цвета в файле не может зависеть от вычислительного устройства, которое вы использовали для его просмотра. PDF/A должен использовать один из двух видов цветового кодирования для обеспечения независимости от устройства. Эти две проблемы, встроенные шрифты и независимый от устройства цвет, являются частью более широкого правила, согласно которому файл PDF/A не может иметь никаких ссылок на внешнее содержимое.
Также важными для определения PDF/A являются требования к метаданным. Поскольку PDF/As являются архивными файлами, они должны включать метаданные, описывающие файл, и файл должен идентифицировать себя как PDF/A определенной версии. Поскольку расширение файла для PDF/A такое же, как и для любого типа PDF (все они .pdf), файл должен хранить метаданные внутри себя, которые точно идентифицируют версию PDF/A.
PDF/A-1 (2005)
Стандарт ISO 19005-1:2005
На основе PDF Reference 1.4 (Acrobat 5)
Самая ранняя версия PDF/A — это PDF/A-1, номер один обозначая, что это первый в серии. PDF/A-1 также исключает функции, которые, скорее всего, будут исключены из серии PDF/A навсегда или, по крайней мере, на долгое время. Поскольку средства сохранения определенного контента неизвестны, ни одна версия PDF/A не поддерживает аудио- или видеоконтент, JavaScript или исполняемые файлы или 3D-моделирование, которые являются сложными формами данных. Шифрование запрещено во всех версиях PDF/A, поскольку оно может стать постоянным препятствием для доступа к архивным записям.
PDF/A-1 также поддерживает наименьшее количество функций из всех версий PDF/A. Он не поддерживает прозрачность (это функция, которая поддерживает создание затенения текста, поскольку средства поддержки прозрачности в долгосрочной перспективе еще не были решены). Эта версия также не поддерживает сжатие JPEG2000 или встроенные файлы, которые поддерживаются во всех последующих версиях.
Уровень соответствия PDF/A-1a
Наивысшим уровнем соответствия любого PDF/A является уровень 1a, где «a» означает «доступный». Этот уровень обладает всеми общими функциями PDF/A, но при этом сохраняет логическую структуру документа. Это означает, что PDF/A-1a хранит информацию для сохранения текстового потока (или текстовых потоков) документа в порядке чтения. Например, если вы создаете информационный бюллетень в формате PDF/A-1a, файл будет знать, что направит вас от одной истории на первой странице прямо к тому месту, где она продолжается на пятой. Эта функция особенно важна для слабовидящих, чьи программы чтения с экрана будут понимать метаданные в PDF/A-1a и логически направлять их по файлу. PDF/A-1a также должен указывать внутри себя язык, на котором он написан, и он должен включать отображение Unicode. Юникод является расширением ASCII. В то время как ASCII кодирует весь латинский алфавит, Unicode кодирует все когда-либо существовавшие системы письма, что делает файл более точным представлением текста.
Уровень соответствия PDF/A-1b
Уровень соответствия PDF/A-1b является более низким по сравнению с 1a. («b» на этом уровне означает «базовый».) Этот уровень сохраняет визуальный формат файлов, как и все PDF/As, но не требует большого количества описательной информации, использования Unicode, сохранение порядка чтения текстового потока. Это делает PDF/A-1b менее доступным форматом (для слабовидящих), но по-прежнему создает удобный файл сохранения. Поскольку все PDF/As на уровне соответствия b проще сделать, они также имеют тенденцию быть более распространенными.0003
PDF/A-2 (2011)
Стандарт ISO 19005-2:2011
На основе PDF Reference 1. 7
PDF/A-2 расширяет формат, поддерживая ряд различных функций: встраивание шрифтов OpenType ( вместо только шрифтов PostScript), сжатие изображений JPEG2000, прозрачные объекты и слои (которые можно скрыть для поддержки просмотра многослойного документа). Эта версия также определяет использование цифровых подписей (таким образом, лучше поддерживает безопасность), устанавливает требования к созданию метаданных лицом, создающим PDF/A, и позволяет встраивать документы в PDF/A. В последнем случае в PDF/A можно встроить только PDF/As, но это позволяет пользователям создавать наборы документов в одном файле (например, серию электронных писем или связанных отчетов).
Уровень соответствия PDF/A-2a
Этот уровень аналогичен уровню PDF/A-1a, но с расширениями PDF/A-2.
Уровень соответствия PDF/A-2b
Этот уровень аналогичен уровню PDF/A-1b, но с расширениями PDF/A-2.
Уровень соответствия PDF/A-2u
Уровень PDF/A-2u идентичен PDF/A-2b, за исключением одного: он требует использования «Unicode». (U означает Unicode.) Как и версия 2b, версия 2u не представляет логическую структуру документа, но она немного лучше, чем 2b, поскольку лучше представляет текст в различных системах письма.
PDF/A-3 (2012)
Стандарт ISO 19005-3:2012
На основе PDF Reference 1.7
В настоящее время PDF/A-3 является последней версией формата, но новые версии PDF/A ожидаемы и неизбежны. Эта новейшая версия включает только одно изменение по сравнению с версией PDF/A-2: она позволяет встраивать файлы любого типа в PDF/A. Ценность этого изменения заключается в том, что оно поддерживает практику сохранения исходного файла вместе с созданным из него PDF/A. Это позволяет вам хранить обе версии как часть одного файла, упрощая тем самым методы сохранения, если вы следуете рекомендуемой практике сохранения цифровых файлов, всегда сохраняя исходные цифровые файлы вместе с их сохраненными копиями.
Уровень соответствия PDF/A-3a
Этот уровень аналогичен уровню PDF/A-2a, но с расширением PDF/A-3.
Уровень соответствия PDF/A-3b
Этот уровень аналогичен уровню PDF/A-2b, но с расширением PDF/A-3.
Уровень соответствия PDF/A-3u
Этот уровень аналогичен уровню PDF/A-2u, но с расширением PDF/A-3.
Выбор версии PDF/A для использования
При принятии решения о том, какую версию PDF/A использовать, необходимо учитывать ряд соображений, но до некоторой степени подойдет любая версия. Если у вас есть только программное обеспечение, которое создаст PDF/A-1b и которое поддерживает все необходимые вам функции, то это хороший выбор, причем постоянный. Помните, что, учитывая расширяемость серии PDF/A, первая версия PDF/A совместима со всеми более поздними версиями, и нет необходимости преобразовывать PDF/A в более новую версию формата PDF/A.
Есть несколько основных правил, которым вы можете следовать при выборе. Во-первых, наилучшим уровнем соответствия всегда является уровень a, который всегда будет создавать наиболее доступный файл. За исключением этого, вы должны выбрать уровень u для его кодировки Unicode, но имейте в виду, что базового уровня (b) почти всегда будет достаточно для ваших нужд. Также имеет смысл использовать последнюю версию серии, которую вы можете создать, потому что это позволит вам поддерживать наибольшее количество функций.
Что может быть более важным, так это кодировка цвета. Если вам нужно распечатать высококачественные копии документа, вам следует выбрать кодировку CMYK (что означает голубой, пурпурный, желтый и черный). Но если вы планируете читать файлы только на экране компьютера, то лучшим выбором будет RGB Color (для красного, зеленого и синего).
Для создания PDF/A требуется продукт, который может создавать PDF/As. Одним из наиболее часто используемых продуктов является Adobe Acrobat Professional версии 8 и выше. Имейте в виду, однако, что есть много других программных продуктов, которые вы можете использовать, и некоторые из них имеют различные функции, которые могут оказаться полезными. (Список некоторых из этих продуктов см. в «Приложении A: Инструменты PDF/A».) Кроме того, ряд продуктов общего назначения, таких как пакет Microsoft Office, теперь включают в себя инструменты для создания PDF/As, так что вы можете вообще не нужно покупать какое-либо новое программное обеспечение, в зависимости от ваших потребностей. Однако, если вам нужно создать сразу несколько PDF/As, вам необходимо приобрести продукт, ориентированный на создание PDF/As, поскольку они поддерживают пакетную обработку, которая позволяет конвертировать несколько документов одновременно.
Практика преобразования
Процесс преобразования цифрового файла в файл сохранения технически называется нормализацией. В этом процессе целевой формат (в данном случае PDF/A) должен соответствовать требованиям формата сохранения, то есть это должен быть формат, который, как ожидается, не исчезнет или не станет непригодным для использования в ближайшем будущем. .
Перед преобразованием любых файлов необходимо убедиться, что на компьютере, который вы используете для нормализации, установлены необходимые шрифты. Без необходимых шрифтов вы не сможете создать файл PDF/A. Конечно, это не проблема при преобразовании отсканированного изображения в PDF/A.
Когда создавать PDF/A
Фактически у вас есть выбор, когда создавать PDF/A, и вы можете выбрать создание PDF/As в разные моменты жизненного цикла записей в зависимости от ваших бизнес-процессов для разных записей .
В момент создания
Иногда вы можете создать PDF/A в качестве исходного документа, полностью избегая проблемы преобразования. Это позволит вам начать жизнь документа в том формате, который, как вы знаете, прослужит долго. Если вы это сделаете, вам придется делать это только с документами, которые вам не придется изменять с течением времени. Обычно PDF/As создаются при создании только как вывод из больших баз данных.
В момент записи
Запись — это процесс превращения документа в запись. Например, вы можете создать несколько версий отчета, но записью будет только последняя версия. Поэтому, когда вы завершили написание и редактирование этого отчета, вы можете сохранить файл в формате PDF/A, что заморозит файл, что затруднит его изменение. Другое преимущество этого метода заключается в том, что он позволяет легко отличить промежуточные черновики от окончательной версии, поскольку PDF/A всегда будет окончательным.
В момент архивирования
Большинство людей по-прежнему конвертируют документы, бумажные и электронные, в формат PDF/As в момент архивирования, в тот момент, когда они решают сохранить запись как архивную, создав резервную копию это.
Сканирование с бумаги
При сканировании с бумаги необходимо настроить сканер на создание файла, совместимого с форматом PDF/A. Затем вы сканируете документ, сохраняя все страницы документа в одном PDF/A, и при необходимости запускаете распознавание текста OCR, чтобы преобразовать текст внутри документа в интеллектуальный цифровой текст.
Преобразование существующих отсканированных изображений
Если у вас есть цифровые изображения текстовых документов для преобразования в PDF/A, вы можете использовать программное обеспечение PDF для распознавания текста OCR и сохранения файла в выбранной вами версии PDF/A. При сканировании записей возможны только уровни соответствия b и u, причем уровень u является предпочтительным.
Использование механизма Distiller
Один из методов преобразования файла в формат PDF/A доступен только в Adobe Acrobat, и это механизм Distiller. Distiller работает отдельно от Adobe Acrobat, но также является частью этого программного обеспечения. Обычно он доступен на панели задач вашего компьютера. Чтобы создать файл PDF/A с помощью Distiller, выберите соответствующую настройку PDF, а затем сохраните или экспортируйте файл. Механизм Distiller иногда может быть немного удобнее, но других преимуществ у него нет, и он не может создать полностью доступный файл (имеется в виду такой, который соответствует уровню соответствия a).
Преобразование из проприетарных программных продуктов
Вы также можете создать PDF/A из многих программных продуктов, которые делают гораздо больше, чем просто создают PDF-файлы. К ним относятся программы для обработки текстов, электронных таблиц и верстки. Обычно вы можете создавать PDF/As, «распечатывая» или сохраняя файлы в PDF/A, но вы должны быть уверены, что изменили настройки PDF в соответствии со своими предпочтениями PDF/A. Вы также можете установить предпочтительные настройки программного обеспечения по умолчанию для удобства использования в дальнейшем.
Преобразование из обычных PDF-файлов
У многих людей есть магазины обычных PDF-файлов, которые они хотят преобразовать в PDF/As в целях сохранения. Для этого вам, возможно, придется сначала удалить все функции, запрещенные в PDF/A, или вы можете запустить преобразование и посмотреть, возникнут ли какие-либо ошибки во время преобразования. Если вы используете Adobe Acrobat, вам придется использовать его функцию Preflight для преобразования обычного PDF в PDF/A. Поскольку преобразования PDF в PDF/A, как известно, неудачны, вы можете приобрести продукт, предназначенный для таких преобразований. Продукт 3-Heights PDF to PDF/A более подробно анализирует файлы, чтобы повысить вероятность успешного преобразования. Тем не менее ни один продукт не всегда сможет создать PDF/A из обычных PDF-файлов.
Любая форма репрографии (например, микрофильмирование, создание изображений или фотокопирование для сохранения) должна включать этап контроля качества, чтобы гарантировать получение точной копии оригинала. То же самое относится и к процессу нормализации.
Существует два основных этапа контроля качества PDF/A. Сначала вы должны визуально осмотреть документ, чтобы убедиться, что новый файл выглядит точно так же, как старый файл. Если преобразование каким-то образом пошло не так, вы сможете увидеть это в файле, а затем повторить процессы преобразования после перепроверки настроек и методологии. Второй шаг в контроле качества — проверка соответствия созданных файлов используемой версии стандарта PDF/A. Для этого вам придется использовать любой из нескольких инструментов проверки, включая функцию Adobe Acrobat Preflight. Список таких продуктов см. в «Приложении B: Инструменты проверки PDF/A».
Сохранение записей включает в себя гораздо больше, чем просто создание PDF/As. Это требует большой работы в течение долгого времени и постоянной бдительности. Вы должны разработать четкие процедуры конверсии, за которыми следует надлежащая практика контроля качества. Вам придется создавать и поддерживать метаданные файлов, чтобы сделать их доступными и удобными для использования. Вам нужно будет убедиться, что ваши средства контроля окружающей среды подходят для хранения электронных файлов и что ваши средства управления данными (особенно процедуры резервного копирования) разумны и последовательны. И вам нужно будет убедиться еще в одном факте: выбранный вами формат файла для хранения остается допустимым форматом сохранения. В настоящее время PDF/A является хорошим форматом для долгосрочного хранения документов, особенно цифровых текстовых документов, но это может измениться через десять лет.
Adobe Acrobat
www.adobe.com
Apago
www.apagoinc.com
Callas
www. callassoftware.com
Compart
www.compart.net
6 PDFlib
PDFlib 9000 002 Инструменты PDF AG
www.pdf-tools.com
Luratech
www.luratech.com
Adobe Acrobat Preflight Function
adobe.com
Callas Software’s pdfaPilot
callassoftware.com
PDF-AG 0 пдф -tools.com
Вопросы?
Электронная почта [email protected].
Выдан 08.08.2013
История PDF | Эволюция формата файлов и Acrobat
На этой странице представлен обзор эволюции PDF, Portable Document Format и соответствующего программного обеспечения Adobe Acrobat. На отдельной странице дается более общий обзор истории допечатной подготовки.
Введение
Безбумажный офис. Помните это модное слово, которое, кажется, никогда не исчезнет полностью, хотя история доказала, что использование компьютеров до сих пор приводило только к увеличению использования бумаги?
PDF начался с мечты о безбумажном офисе, как любимый проект одного из основателей Adobe, Джона Уорнока. Изначально это был внутренний проект Adobe по созданию формата файлов, чтобы документы можно было распространять по всей компании и отображать на любом компьютере с любой операционной системой. В своей статье, которая привела к разработке PDF, Джон Уорнок написал: «Представьте себе возможность отправлять полные текстовые и графические документы (газеты, журнальные статьи, технические руководства и т. д.) по сетям электронной почты. Эти документы можно было просматривать на любом компьютере, а любой выбранный документ можно было распечатать локально. Эта возможность действительно изменит способ управления информацией».
У Adobe уже есть две более-менее подходящие технологии: PostScript как независимая от устройства и платформы технология для описания документов и Adobe Illustrator как пример приложения, работающего на нескольких платформах (ладно, на двух: Windows и Mac, но это 99 процентов всех компьютеров) и мог открывать и визуализировать довольно простые файлы PostScript, даже если они были созданы с помощью других приложений. Инженеры Adobe улучшили эти две технологии и создали как новый формат файлов (PDF, который на самом деле является разновидностью оптимизированного PostScript), так и набор приложений для создания и визуализации этих файлов.
PDF 1.0
Впервые Adobe заговорила об этой технологии на конференции Seybold в Сан-Хосе в 1991 г. В то время она называлась «IPS», что расшифровывалось как «Interchange PostScript». была анонсирована на выставке Comdex Fall в 1992 году, где технология получила награду «Лучшее из Comdex». Инструмент для создания и просмотра PDF-файлов, Acrobat, был выпущен 15 июня 1993 года. Эта первая версия не пригодилась сообществу допечатной подготовки. В нем уже были внутренние ссылки, закладки и шрифты, но поддерживалось только RGB.
Первоначальное кодовое название того, что позже стало программным обеспечением Acrobat, было «Камелот», позже переименованное в «Карусель». Вот почему тип файла PDF на Macintosh был «CARO».
Adobe запросила высокую цену за инструменты для создания PDF-файлов.