PDF/A, cканирование в PDF, TIFF в PDF, создание PDF, запись в PDF
Скорее всего, вы уже используете PDF-файлы на работе или дома и понимаете, насколько удобен этот универсальный формат. Но знаете ли вы, что формат можно адаптировать, с тем, чтобы использовать файлы еще более эффективно? Перед вами список наиболее важных стандартов PDF, которые могут качественно улучшить возможности печати, хранения и распространения PDF документов.
PDF/A-решения от Solid Documents
- Solid PDF Tools — настольные программы для создания, преобразования и валидации PDF/A документов
- Solid Framework — для разработчиков программного обеспечения в области создания, преобразования и валидации PDF/A документов
PDF/A – Формат долгосрочного хранения PDF файлов
Что такое PDF/A?
In September 2005 the International Organization for Standardization (ISO) approved the new PDF/A standard for archiving electronic documents. According to the standard ISO 19005-1, PDF/A is a derivative of PDF that «provides a mechanism for representing electronic documents in a manner that preserves their visual appearance over time, independent of the tools and systems used for creating, storing or rendering the files.
« This means of preservation allows PDFs to be self-sustainable. PDF/A achieves this self-sustainability by embedding the information (content, color, font, images, text, etc.) needed for displaying the document within the document itself. In other words, PDF/A does not require any additional outside information to display properly. However, for this format to achieve self-sustainability, it must exclude certain features allowed in standard PDF files such as movies, sound, and transparency.
The PDF/A classification is divided into two parts, PDF/A-1 and PDF/A-2. The first classification, PDF/A-1, is further subdivided into two more categories, PDF/A-1a, and PDF/A-1b. The primary difference between PDF/A-1a and PDF/A-1b is the way in which each handles the extraction of text:
- PDF/A-1a: Уровень Соответствия A; полностью совместим со стандартом ISO 19005-1. Включает в себя тэги, поэтому текст может быть воспроизведен на множестве различных устройств, включая портативные компьютеры.
- PDF/A-1b: Уровень Соответствия B; считается минимально допустимым уровнем соответствия стандарту PDF/A. Гарантирует, что документ может быть открыт и воспроизведен на мониторе компьютера, однако качество текста не гарантируется.
- PDF/A-2: PDF/A-2 is based on the ISO standard 32000-1 and takes advantage of features that came after the Adobe PDF 1.4 specification. This includes
- support for JPEG2000 compression (benefits for scanned color documents)
- embedded PDF/A files via collections/portfolios
- transparency, optional content (layers): useful for mapping or engineering drawings or documents with multiple languages (implement different content on different layers)
- unicode support (PDF/A-2U)
- object level XMP metadata (new requirements for custom metadata)
- comments and annotations (defined list of acceptable and prohibited annotation and comment types for PDF/A-2)
- digital signature rules defined
- PDF/A-3: PDF/A-3 is based on the ISO standard 32000-1 and offers support for embedded files.
Что это значит для вашего бизнеса…
PDF/A является новым революционным способом хранения важных документов, издаваемых государственными и частными организациями. В настоящее время большинство документов хранится на бумаге. Другим популярным способом хранения являются микрофильмы и микрофиши. PDF/A создан специально для того, чтобы заменить все традиционные способы хранения документов единым стандартизированным электронным форматом, при использовании которого документы можно легко разыскать, просмотреть, обновить, который является удобным для организации и транспортировки документов и сохраняет документы в неизменном виде. Электронный формат хранения документов является дешевым и сберегающим пространство способом. Кроме того, он позволяет создавать копии документов, что является защитой от их физического уничтожения.
PDF/X – PDF Формат для печати
Что такое PDF/X?
PDF/X, как и PDF/A, является подмножеством формата PDF. Целью формата PDF/X является возможность создания файла, который можно было бы распечатать единообразно любыми средствами (для использования дизайнерами, художниками, инженерами). PDF/X формат подразумевает абсолютную совместимость, даже если речь идет о разнообразном использовании PDF документов на различном оборудовании. Этот формат является идеальным для внутрикорпоративного обмена документами. Кроме гарантии неизменного вида распечатанного документа PDF/X предусматривает такие премущества, как стандартную программу просмотра файла, хороший уровень сжатия (меньший размер файла), поддержку цветовой гаммы, распознавание метода печати, заданного для данного документа. Однако, как и в PDF/A, преимущества PDF/X компенсируются некоторыми компромиссами. Такие свойства как прозрачность, шифрование и JBIG2 компрессия запрещены стандартом PDF/X.
The PDF/X стандарт делится на три категории:
- PDF/X-1a: Стандарт для обмена страницами, который гарантирует необходимый результат при печати. Этот формат ограничивает все содержимое которое не служит непосредственно для обеспечения высокого качества печати и удовлетворяет наиболее распространенным требованиям.
- PDF/X-3: Наиболее существенным различием между PDF/X-3 и PDF/X-1a является то, что файл формата PDF/X-3 файл содержит данные управления цветом. Это означает, что если приложение читает файл стандарта PDF/X-3, то файл формата PDF/X-1a тоже будет прочитан.
- PDF/X2: В отличие от первых двух форматов, созданных для обмена документами между мало контактирующими сторонами, PDF/X2 разработан для обмена файлами в случае существования более тесной связи между отправителем и получателем. Это надстройка PDF/X-3 формата, который в свою очередь является надстройкой формата PDF/X-1a.
Что это значит для вашего бизнеса…
The PDF/X standard is designed to be applicable across many sectors and businesses within the print industry. If you’re on the receiving end of print-ready files, make sure you are clear on exactly what types of files you can accept (PDF/X-1a, PDF/X-3, or PDF/X2). Also, it’s safe to upgrade to newer versions of PDF/X tools as they are made available, because they’ll be able to read older files. Most products that support baseline PDF will also support PDF/X files. Make sure you pre-flight any incoming print files to determine that they comply with the proper version of PDF/X. Also, if you are a printer or a publisher, make certain that your entire workflow is PDF/X compliant. If you are sending print-ready data to a publisher or printer, consider carefully your options with regards to the subsets of PDF/X to determine which is best for your business. Ultimately, the goal of PDF/X is to provide a means to send full-bodied digital files with the confidence of knowing that they will get through the prepress process without any errors or rework.
А также… PDF/E и PDF/UA
PDF/E
PDF/E — это развивающийся стандарт для промышленных отраслей. Этот стандарт относится к новой функциональности PDF файлов (в частности, к возможности визуализации трехмерных изображений и задании метаданных для свойств объектов), которая используется в основном пользователями с инженерными профессиями.
PDF/UA
“UA” — это аббревиатура Universal Accessibility (Универсальная Доступность). Этот стандарт находится в процессе разработки и направлен на обеспечение возможности доступа к PDF документам в соответствии с разделом 508. PDF/UA имеет целью предоставить возможность работы с PDF документами любым категорииям лиц с ограниченными возможностями.
Дополнительно про Международную Организацию Стандартизации можно прочитать здесь http://www.iso.org/iso/en/ISOOnline.frontpage
PDF/A становится официальным форматом межведомственного документооборота
Интеграция ИТ в госсекторе, Текст: Владислав Мещеряков
Экспертный совет при Минкомсвязи предложил использовать для межведомственного документооборота и постоянного хранения электронных документов формат PDF/А, сообщили в Минкомсвязи.
По мнению экспертов, сейчас именно PDF/A — оптимальное решение для перехода с бумажного на электронный документооборот. Наряду с PDF/A они предлагают в межведомственном документообороте использовать XML-файл с реквизитами электронного документа.
Как сообщает министерство, PDF/A был опробован в пилотных проектах на документобороте между аппаратом Правительства РФ, Минэкономразвития, Минкомсвязи, Минюстом, Минфином, Минпромторгом, Минспортом, Минкультуры, Минсельхозом и правительствами Татарстана, Московской и Ростовской областей, Хабаровского и Приморского края.
Минкомсвязи сообщило, что сейчас совместно с ФСО разрабатывает ведомственный приказ с основными техническими требованиями к порядку обмена электронными документами. Требования будут включать формат PDF/A, описание XML-файла с метаданными, использование усиленной квалифицированной подписи «и ряд других». Согласно решению правительственной комиссии, органы государственной власти должны привести свои системы электронного документооборота в соответствие требованиям до 27 апреля 2015 г.
Особенности формата PDF/A, отличающие его от других форматов семейства PDF — это запрет на вставку в документ аудио- и видеоконтента, запрет на шифрование, запрет на вставку кода JavaScript, а также внедрение в документ всех использованных в нем шрифтов, что позволяет воспроизводить документ независимо от ОС, в которой он открывается.
Экспертный совет по документообороту в госорганах — молодой орган, его первое заседание состоялось летом 2013 г. По данным сайта Минкомсвязи, совет заседает под председательством замглавы министерства Олега Пака и состоит из 22 специалистов по электронному документообороту.
Первое заседание экспертного совета 15 июля 2013 г.
Идея использовать формат PDF/A в совокупности с XML в качестве базового формата файла воспроизведения электронных документов при взаимодействии органов государственной власти прозвучала еще на первом заседании совета 15 июля 2013 г.
Ведущий эксперт по управлению документацией компании «Электронные офисные системы» и член экспертного совета при Минкомсвязи Наталья Храмцовская замечает, что совет — это совещательный орган, «который сам ничего не определяет и не решает». Его задача — донести до руководства отрасли точку зрения и аргументированную позицию профессионального экспертного сообщества, в то время, как окончательные решения принимает министерство, которое и несет за них ответственность.
В данном случае, как рассказала Наталья Храмцовская, на экспертном совете обсуждался вопрос о том, какой формат из очень узкого списка «кандидатов» подходит для использования в межведомственной системе документооборота: PDF/A или XML.
Сама Храмцовская говорит, что PDF/A – хороший выбор для хранения, особенного длительного, готовых типовых офисных документов. Однако для оперативной коллективной работы над документами удобнее использовать обычные офисные форматы. Кроме того ряд электронных объектов, например, работоспособные электронные таблицы и презентации с динамическими элементами, не может быть адекватно представлен в формате PDF/A.
CIO и СTO: как меняется влияние ИТ-руководителей в компаниях?
Новое в СХДХрамцовская считает, что принимая решение о PDF/A в качестве типового формата для межведомственного документооборота, нужно ответить на вопросы о ПО, которое будет использоваться для создания файлов в формате PDF/A, а также о том, кто оплатит его покупку.
Второй важный вопрос — будет ли поступающая в госорганы документация проверяться на соответствие спецификациям формата PDF/A, какое ПО будет для этого использоваться, и каковы будут последствия несоответствия (если проверки на такое соответствие не будет, то непонятно, почему речь идет именно о PDF/A, а не о более общем формате PDF, который также открыт и стандартизован в ISO).
Наталья Храмцовская выразила сожаление, что Минкомсвязи не проявило интереса к зарубежному опыту регламентации форматов электронных документов в деятельности государственных органов. Как ей известно, ни одна страна мира не пошла по пути использования одного-единственного формата.
За рубежом, как правило, регуляторы составляют списки рекомендованных, допускаемых и нежелательных форматов, понимая, что ситуация меняется: некоторые старые форматы выходят из употребления, а новые виды электронных документов, требующие использования новых форматов, появляются.
Иван Бегтин, известный активист использования открытых данных в органах власти и глава НКО «Информационная культура», признает, что не слышал о работе экспертного совета по документообороту. Тем не менее, говорит он, подход Минкомсвязи с отдельным XML-файлом не выглядит проработанным.
ZIP или другой контейнер всегда лучше множества разбросанных файлов, говорит он. Форматы OpenDocument, MusicXML, IPA, APK, JAR, как и многие другие, как раз основаны на ZIP-контейнерах, это уже стандарт де-факто. Практику разбивать связанные сущности на файлы, в то время, как их можно упаковать, эксперт назвал «дурацкой».
Одним из общепризнанных недостатков XML можно назвать избыточность его разметки. При небольших объемах значимого контента в XML-файла его основной объем начинает занимать разметка, что приводит к излишней трате как трафика при пересылке файла, так и вычислительного ресурса при его обработке.
Стоит заметить, что в июле 2014 г. стало известно о приостановке на неопределенный срок разработки национальной системы документооборота. Контракт Минкомсвязи с НИИ «Восход» на соответствующие работы был расторгнут, и возможность заключения нового договора пока не рассматривается. Министерство сосредоточилось на подготовке правил обмена электронными документами.
Что такое PDF файлы и почему мы все еще полагаемся на них?
- Подробности
- сентября 06, 2017
- Просмотров: 8689
Вы открывали PDF на этой неделе? Скорее всего, вы регулярно работаете с ними. Несмотря на то, что некоторые другие типы файлов исчезают в неизвестности, PDF-файлы по-прежнему остаются популярным выбором. Вы когда-нибудь задумывались, почему это так? Давайте рассмотрим, как работают PDF-файлы, почему они так важны и почему они по-прежнему пользуются такой популярностью.
История PDFPDF – расшифровывается как «Portable Document Format», что в переводе означает «Переносимый формат документов». Созданный Adobe, он впервые был запущен в начале 1990-х годов как способ полностью сохранить документ в одном файле. Поскольку интернет тогда был еще молод, они в основном использовались для публикации на рабочем столе документов для печати. Компании использовали PDF-файлы для сохранения плакатов, флаеров и других подобных файлов для физической печати.
Adobe Acrobat было нелегко заполучить, у PDF-файлов не было всех функций интеграции, которые они делают сегодня, и использование dial-up для загрузки большого PDF было очень медленным. Через несколько лет Adobe выпустила Adobe Reader бесплатно для всех, и в конечном итоге PDF выбил несколько конкурентов, чтобы стать файловым стандартом для фиксированных документов.
Интересно, что PDF был первоначально проприетарным форматом, что означает, что Adobe контролирует PDF-файлы и как они функционируют. В 2008 году они отказались от этого права собственности, и PDF стал открытым стандартом. Теперь PDF-файлы по-прежнему имеют базовый набор свойств, но они не зависят от Adobe. В самом деле, вы можете найти десятки других бесплатных PDF-читателей.
Как работают PDF-файлы
Чтобы понять, почему PDF был такой революцией, когда он только появился, мы должны понять, что такое этот стандарт в то время. В начале 90-х профессиональное программное обеспечение, используемое для создания графики и документов, приводило к невыносимо большим файлам, особенно когда в них были встроены изображения, шрифты и другие графические элементы. Помните, что машины в это время имели крошечную часть вычислительной мощности компьютера, который вы используете сегодня, что означает, что каждый бит эффективности был жизненно важен.
Чтобы исправить это, разработчики программного обеспечения начали использовать ссылки на другие ресурсы на компьютере. Предположим, вы использовали специальный шрифт в своем документе. Вместо того, чтобы сохранять все данные для этого шрифта внутри вашего документа, он вытащил необходимую информацию из установочной папки шрифта на вашем компьютере. Это уменьшило нагрузку на файл документа, сделав его более легким.
Это будет работать нормально, если вы не перемещаете шрифт на свой компьютер. Однако, если вы принесли файл на другой компьютер, у которого не было вашего конкретного шрифта, это выглядело бы неправильно. Вы можете представить себе сколько времени вы потратили на создание важного документа, а затем он стал выглядеть просто ужасно, потому что вы не сохранили ссылки на графические элементы.
PDF изменил это. Adobe нашла способ собрать все части файла и превратить его в более мелкие. Очевидно, что это намного эффективнее, чем обходные решения, которые разработчики использовали перед тем, как был представлен PDF.
И поэтому PDF стали стандартом.
Почему они так важны
Портативный формат PDF имеет большое значение: PDF-файлы выглядят одинаково независимо от того, на каком устройстве они просматриваются. Независимо от того, используете ли вы Windows 10, Mac, Chrome OS, Android, Windows Phone, iPad или Windows XP — на любом программном и аппаратном обеспечении, файлы PDF остаются неизменными. Информация, содержащаяся в PDF-файле, не зависит от устройства создателя или зрителя. Включение шрифтов, картинок, диаграмм и т. п. — это не борьба за PDF.
Сравните это с отправкой документа Microsoft Word. Что произойдет, если ваш получатель не имеет Microsoft Word на своем компьютере? Конечно, они могут открыть его в Документах Google, но документ при этом может сильно отличаться, поскольку Docs обрабатывает файлы по-разному. Если вы потратили много времени на создание таблиц, изображений и других элементов в правильном порядке, все это могло бы выйти из окна. И что, если они попытаются открыть документ Word на своем телефоне?
Как правило, PDF-файлы предназначены для просмотра. То, что вы видите, когда вы нажимаете «Сохранить», — это то, что получит кто-то другой, который просмотрит документ. И вам даже не нужно устанавливать программу — большинство современных браузеров открывают PDF-файлы без проблем. Хотя вы можете редактировать PDF-файлы, вы ограничены несколькими вариантами, если не заплатите за премиальное программное обеспечение, такое как Adobe Acrobat, Foxit PhantomPDF или Nitro.
Почему они все еще популярны
В дополнение к переносимости, описанной выше, PDF-файлы имеют несколько функций, которые способствовали их постоянной популярности.
Во-первых, PDF-файлы позволяют настраивать параметры безопасности. Когда вы создаете PDF-файл, вы можете отключить способность зрителей печатать документ, оставлять комментарии к нему или копировать его текст. Таким образом, когда правительства и предприятия размещают онлайн-формы, они могут в значительной степени ограничить их для предотвращения злоупотреблений. Для большей безопасности вы также можете защитить PDF паролем.
Вы, вероятно, заметили, что PDF-файлы также работают с полями заполнения. Создатель PDF может размещать выделенные блоки в любом месте документа, чтобы показать, где они хотели бы, чтобы читатель добавлял информацию. Даже если они ограничивают редактирование, зритель все равно может набрать свое имя, адрес и другую соответствующую информацию в эти поля. Подпишитесь на RSS, подпишитесь на электронную подпитку, чтобы вы могли добавить свое согласие на документ, не распечатывая его.
Незначительные функции, такие как добавление комментариев, выделение, штампы, гиперссылки и другой контент в прямом эфире, сохранили PDF-файлы в течение текущего десятилетия. Программное обеспечение оптического распознавания может захватывать документы и легко превратить их в PDF-файлы, а некоторые независимые издатели даже выпускают книги в формате PDF. Его простота использования, надежный набор функций и вездесущность закрепили PDF в повседневной вычислительной жизни.
Что вы узнали о формате PDF?
Я провел краткий обзор формата PDF, чтобы Вы узнали, как это началось, как он работает и что делает его настолько важным и популярным. В мире с различными операционными системами, размерами экрана, браузерами и аппаратными компонентами, PDF остается стойким и неизменным. Зная, что созданный вами документ не пройдет каких-либо странных изменений, прежде чем ваш зритель это увидит. Это то, что предоставляет PDF, и, таким образом, он является стандартом уже более двух десятилетий.
Теперь, когда вы знаете все о PDF-файлах, ответьте на следующие вопросы:
Как часто вы используете PDF-файлы? Есть ли у вас другая причина использовать их, кроме перечисленных здесь? Дайте нам знать, что вы думаете об этом формате файла в комментариях!
Читайте также
Почему PDF — самый важный в мире формат хранения документов.
И при чем здесь Пол Манафорт11 Марта, 2018, 13:00
12673
Издание Motherboard изучило историю формата PDF, а также его важность для сохранения человеческого наследия. Разработка Adobe, рыночному продвижению которой помогла процедура подачи налоговых деклараций, стала универсальным способом хранения документов. Теперь ей необходимо пройти испытание временем на прочность. Зато она уже помогла следствию в обвинениях против руководителя избирательной кампании Дональда Трампа. Редакция AIN.UA приводит сокращенный перевод материала.
История PDF не наполнена сюжетными твистами. Появлению формата предшествовало эссе сооснователя Adobe Криса Уорнока, написанное в 1990 году. В нем бизнесмен заявлял, что миру нужен открытый и удобный способ хранить и печатать документы. На тот момент в активе Adobe были конкурентные разработки: языки PostScript и Display PostScript. Но многие компьютеры не справлялись с их обработкой для отображения файлов. В перспективе они были хороши, писал Уорнок, но сейчас оставались фрагментарным решением.
Тем временем Налоговое управление США (IRS) переживало самый тяжелый период в году. Ведомству требовалось отправить 110 млн налоговых деклараций. Это было логистическим и операционным кошмаром, поскольку бумажная волокита сильно тормозила обработку форм. Специализированный софт для PC и Mac уже существовал, но был не так популярен среди рядовых американцев. Зато распечатать нужные бумаги они были вполне способны.
Тут и пригодилась новая разработка Adobe — представленный в 1992 году формат под брендом Acrobat. Он в точности воспроизводил печатную страницу в электронном виде. Решение выглядело спасением как для IRS, так и для всей корпоративной Америки. Хотя в 2010 году Уорнок и посетовал, что на момент релиза немногие осознавали, как важно будет отправлять друг другу документы в электронном виде.
IRS начала отправлять первые PDF-формы для подачи деклараций в 1994 году. Не хватало только интернета. К 1996 появилось и это недостающее звено: налоговики обзавелись собственным сервером и разместили на сайте более 600 разнообразных форм для загрузки. ПО для работы с документами до 2001 года получили более 100 000 работников ведомства. Новый формат быстро показал свои преимущества для чиновников и корпораций, избавляя от полок с бумагами и позволяя удобно хранить информацию.
Вскоре в PDF появилась поддержка поиска и редактуры. IRS даже сделала специальные версии форм, доступные для легкого заполнения: граждане могли легко внести туда числа, а следом и подписи. Файлы уступали по весу текстовым документам, а по гибкости — HTML-формам. Но были удобнее для рядовых пользователей. Статус нового стандарта закрепило и то, что еще в 1993 году Adobe опубликовала полные спецификации PDF. Так другие компании и организации могли свободно его использовать.
В 2007 году Adobe закрепила это сотрудничеством с Международной организацией по стандартизации. Она закрепила использование PDF международным стандартом. Иными словами, будущие поколения точно будут знать, как открыть и использовать такие файлы. Аналогичную сертификацию прошел формат PDF-A, созданный в 2005 году. Главная его фича — в возможности максимально воспроизвести вид отсканированного/сохраненного документа, включая изображения, шрифты, цветовые профили. Кроме того, туда можно вставлять файлы с таблицами и HTML-вложения. Разработку с воодушевлением оценили организации вроде Internet Archive и Библиотеки Конгресса — им нужно, чтобы данные легко открывались и через 30 лет.
Но многие в архивном сообществе выступают против PDF. Главная причина – его громоздкость. Часть экспертов называют формат отличным решением для печати, да и только. Поднимают вопрос и о том, насколько PDF-A хорош в качестве «контейнера» для исследовательской информации, вроде текста и данных, которые могут потребоваться в будущем.
Однако издание все таки заключает, что историю нашего поколения и эфемерную природу сети, скорее всего, запечатлят именно в PDF. Даже несмотря на все его слабости. Всего этого могло и не случиться — Уорнок рассказывал, что правление компании едва не убило формат. На фоне повсеместного распространения разработки Adobe пришла к лучшему решению. Производитель ПО начал бесплатно распространять клиент для чтения PDF — Acrobat Reader. Программа с возможностью редактирования Acrobat осталась платной.
Motherboard также вспоминают, как PDF оказался замешан в историю Пола Манафорта, руководителя избирательной кампании кандидата в президенты США Дональда Трампа. Опальный лоббист сейчас находится под следствием федеральных агентств. Обвинений много: и неправомерные сделки во время сотрудничества с бывшим президентом Украины Виктором Януковичем, и пособничество РФ во вмешательстве в президентские выборы.
Во время последнего обвинительного заключения, оглашенного Манафорту, прокурор Роберт Мюллер указал необычные доказательства в деле об отмывании денег. Манафорт и его коллега конвертировали PDF-документы в формат Word, внесли нужные изменения, подделав сведения о доходах, и провели обратную конвертацию. Обе версии они отправляли друг другу по почте. В результате образовался так называемый «цифровой след», по которому было легко обнаружить редактирование. Возможно, чтобы не предстать перед федеральным судом, Манафорту и его подельнику стоило просто скачать Adobe Acrobat.
Подготовка к печати.
PDF/X — PDF, который вам нуженФормат и его подмножества
Формат PDF известен практически всем, чья работа связана с обменом электронной документацией. Не мудрено, ведь для этого и был разработан Portable Document Format. Особенно он был оценен корпоративным рынком, который использует массу всевозможных офисных и специализированных программ подготовки документации на различных платформах, и совместимость всего этого разнообразия не могла не вызвать проблем. Создание фирмой Adobe Systems формата PDF в начале 90-х гг прошлого столетия и было попыткой внести свой вклад в решение проблемы. И попыткой довольно успешной.
Обратите внимание, изначально PDF был совершенно не предназначен для использования в полиграфии. Его нельзя было гарантированно обработать на RIP`е. Он мог содержать элементы, нераспознаваемые или распознаваемые некорректно растровыми процессорами, да и просто совершенно лишние для такой работы — аннотации, закладки, ключевые слова для поиска и индексации файла, звук, видео, активные формы, гипертекстовые ссылки, изображения в RGB или с низким разрешением, не внедренные в файл шрифты.
И тем не менее, PDF начинал проникать в область допечатных процессов. В начале его использовали в основном для вывода изданий, не требующих особо высокого качества, например, черно-белых газет, но удобство формата (его переносимость, кроссплатформенность) и скромные объемы файлов вызывали острое желание расширить сферу применения.
В итоге была разработана новая спецификация формата — PDF/X *, предназначенная для допечатной подготовки **.
Строго говоря, PDF/X сегодня — это подмножество формата, основанного на адобовской спецификации PDF. Существует сегодня в виде нескольких стандартов: PDF/X-1, PDF/X-2, PDF/X-3. Первый из них пережил три редакции (версии):
* версия PDF/X-1:1999 — созданная на основе PDF 1.2 — запрещала использование RGB, аннотаций, форм, комментариев и не поддерживала duotone.
* версия PDF/X-1:2001 была принята для соответствия новому формату PDF 1.3, но в остальном не отличалась от предыдущей.
* наконец, версия PDF/X-1a:2003 — на основе PDF 1. 4 *** — исключила использование OPI и шифрование документов.
PDF/X-1a принят в издательской области в качестве стандарта. Если файл сертифицирован как PDF/X-1a, это означает, в частности, что
o все шрифты внедрены в файл,
o все цвета определены как CMYK или спот,
o файл четко идентифицируется как либо содержащий треппинг, либо не содержащий треппинг.
Необходимо уточнить, что PDF/X-1a запрещает использование прозрачности. Прозрачность может быть использована при создании контента/дизайна, но должна быть «слита» (flattened) для конвертации файла в PDF данного стандарта. Кроме того, не поддерживаются: управление цветом (сolor management), передаточные кривые (transfer functions) и задание линиатуры (halftone screen frequencies).
Как выяснилось позднее, слишком жесткие ограничения PDF/X-1a не всегда удобны. Например, использование только CMYK-изображений не позволяет гибко подходить к цветоделению файлов, когда приходится готовить печать с учетом типа бумаги, красок, растискивания и др. Возникла потребность несколько ослабить требования спецификации. Для этого была начата разработка стандарта PDF/X-2. PDF/X-2:2003 поддерживает Lab, управление цветоделением через ICC-профили, снова разрешает использование OPI, даже допускает отсутствие внедренных шрифтов (например, в случае, когда внедрение шрифта запрещено по условиям лицензирования). Одним словом, эта спецификация явно рассчитана на более профессионального пользователя, но, вместе с тем, увеличивает вероятность ошибки для массового пользователя ****.
Чтобы разрешить конфликт, был создан «компромиссный» вариант — PDF/X-3. PDF/X-3:2003 учитывает спецификацию PDF 1.4. По требованию к файлам он ближе к PDF/X-1, но поддерживает не только CMYK и spot-цвета, но и Lab с профилями, — иными словами, рассчитан на рабочий поток, использующий управление цветом. По-прежнему не включена поддержка transfer functions; поддержка halftone screen frequencies ограничена.
Создание и соответствие спецификации
Развитие PDF чрезвычайно перспективно. Файлы, прошедшие проверку на соответствие спецификации, могут быть приняты типографиями без дополнительной, зачастую отнимающей немало времени и сил проверки и даже переработки.
И тут возникает закономерный вопрос: а как, собственно, убедиться в том, что созданный вами PDF соответствует той или иной спецификации. Ведь если это очень сложная процедура, то выходит, что типография просто переложила на вас всю ответственность за правильность файла!
Самый очевидный способ получить документ, соответствующий одной из спецификаций PDF/X — это использовать для его создания Adobe Acrobat 6.0 Professional. Нужная версия — PDF/X-1а или PDF/X-3 — просто выбирается из предустановок Acrobat Distiller. В процессе обработки PostScript-файла программа проверяет его — и либо создает PDF, в котором прописывает информацию о соответствии файла требованиям, либо останавливает работу и создает файл-отчет (текстовый log-файл), в котором указывает обнаруженные проблемы. Просмотреть «сертификат» PDF-файла можно в Acrobat 6. 0 по команде меню Document > Preflight > Validate. (При использовании утилиты PitStop от Enfocus в Acrobat v.5 та же информация обнаруживается в меню Certified PDF.)
Другой способ получить PDF/X — это прямое сохранение из Adobe InDesign CS, где также присутствуют уже знакомый по Acrobat выбор между PDF/X-1а и PDF/X-3.
Если вы создали PDF другой программой и не уверены в его корректности, то в Acrobat 6.0 Pro можно произвести его проверку. Выберите требуемый профиль в меню Document > Preflight и просмотрите результаты проверки. Проблемные элементы обозначены красным символом. По двойному клику на этих элементах вы можете перейти на содержащую их страницу, где они будут обведены красной пунктирной линией. Если проблемы не обнаружены, вы сможете сохранить файл в версии PDF/X, а затем сертифицировать его, чтобы в типографии могли просмотреть результат вашей проверки и соответствие выбранному профилю.
Примечания:
* «Х» в названии подразумевает англ. «blind eXchange», т.е. «слепой обмен» — надежда разработчиков на то, что файлы, чье соответствие данному стандарту установлено, могут не подвергаться дополнительной проверке перед печатью, когда они переданы в сервисное бюро или типографию.
** Разработка Комитета по стандартизации графических технологий (CGATS) при Американском институте национальных стандартов (ANSI).
*** PDF/X-1:2001 основывался на PDF 1.3.
**** По одним данным, PDF/X-2 до сих пор находится в процессе разработки и пока официально не утвержден в качестве стандарта. Однако на сайте www.iso.org присутствует стандарт ISO 15930-5:2003 со следующим описанием:
Graphic technology — Prepress digital data exchange using PDF — Part 5: Partial exchange of printing data using PDF 1.4 (PDF/X-2).ISO 15930-5:2003 specifies the use of the Portable Document Format (PDF) Version 1.4 for the dissemination of digital data, where all elements necessary for final print reproduction are either included or provision is made for unique identification. Colour-managed, CMYK, and spot colour data are supported in any combination.
Источник
PDF Complete Corporate Edition — лицензия, русская версия, цена
PDF Complete – это набор инструментов, который предназначен для работы с PDF-файлами. PDF Complete поможет сделать разметку PDF-файла, конвертировать в PDF многие другие форматы, разрезать файлы и соединять их. Можно добавлять комментарии с применением указателей места заполнения. PDF Complete отлично подходит как для работы с одной страницей, так и для одновременной обработки группы файлов.
Сколько стоит купить лицензию, варианты поставки
- Артикул: PDFC19026519
- НДС: 20 % (включен в стоимость)
- Тип поставки: Электронная (e-mail)
- Язык (версия): Английский
- Срок поставки лицензионной программы или ключа активации: 3-14 рабочих дней
- Платформа: Windows/Windows Server
- Тип лицензии: Постоянная
- Тип покупателя: Коммерческая
- Доступна оплата картой
- Артикул: PDFC19026520
- НДС: 20 % (включен в стоимость)
- Тип поставки: Электронная (e-mail)
- Язык (версия): Английский
- Срок поставки лицензионной программы или ключа активации: 3-14 рабочих дней
- Платформа: Windows/Windows Server
- Минимальная закупка: 5 шт.
- Тип лицензии: Постоянная
- Тип покупателя: Коммерческая
- Оплата картой недоступна
- Только для юр. лиц и ИП
- Артикул: PDFC139999
- НДС: 20 % (включен в стоимость)
- Тип поставки: Электронная (e-mail)
- Язык (версия): Английский
- Срок поставки лицензионной программы или ключа активации: 3-14 рабочих дней
- Платформа: Windows/Windows Server
- Минимальная закупка: 100 шт.
- Тип лицензии: Постоянная
- Тип покупателя: Коммерческая
- Оплата картой недоступна
- Только для юр. лиц и ИП
Импорт данных из PDF в Excel через Power Query
youtube.com/embed/Y6evpN9nGU0″ frameborder=»0″ allow=»autoplay; encrypted-media» allowfullscreen=»»/>
Задача переноса данных из таблицы в PDF-файле на лист Microsoft Excel — это всегда «весело». Особенно если у вас нет дорогих программ распознавания типа FineReader или чего-то подобного. Прямое копирование обычно ни к чему хорошему не приводит, т.к. после вставки скопированных данных на лист, они, скорее всего, «слипнутся» в один столбец. Так что их потом придется кропотливо разделять с помощью инструмента Текст по столбцам с вкладки Данные (Data — Text to Columns).
И само-собой, копирование возможно только для тех PDF-файлов, где есть текстовый слой, т.е. с только что отсканированным с бумаги в PDF документом это не сработает в принципе.
Но все не так грустно, на самом деле :)
Если у вас Office 2013 или 2016, то за пару минут без дополнительных программ вполне можно реализовать перенос данных из PDF в Microsoft Excel. А помогут нам в этом Word и Power Query.
Для примера, давайте возьмем вот такой PDF-отчет с кучей текста, формул и таблиц с сайта Европейской Экономической Комиссии:
… и попробуем вытащить из него в Excel, скажем первую таблицу:
Поехали!
Шаг 1. Открываем PDF в Word
Почему-то мало кто знает, но начиная с 2013 года Microsoft Word научился открывать и распознавать PDF файлы (даже отсканированные, т.е. без текстового слоя!). Делается это совершенно стандартным образом: открываем Word, жмем Файл — Открыть (File — Open) и уточняем PDF-формат в выпадающем списке в правом нижнем углу окна.
Затем выбираем нужный нам PDF-файл и жмем Открыть (Open). Word сообщает нам, что собирается запустить распознавание этого документа в текст:
Соглашаемся и через несколько секунд увидим наш PDF открытым для редактирования уже в Word:
Само-собой, у документа частично слетит дизайн, стили, шрифты, колонтитулы и т. п., но для нас это не важно — нам нужны только данные из таблиц. В принципе, на этом этапе уже возникает соблазн дальше просто скопировать таблицу из распознанного документа в Word и просто вставить ее в Excel. Иногда это срабатывает, но чаще приводит ко всевозможным искажениям данных — например числа могут превратиться в даты или остаться текстом, как в нашем случае, т.к. в PDF используется не российские разделители:
Так что давайте не будем срезать углы, а сделаем все чуть сложнее, но правильно.
Этап 2. Сохраняем документ как веб-страницу
Чтобы потом загрузить полученные данные в Excel (через Power Query), наш документ в Word нужно сохранить в формате веб-страницы — этот формат является, в данном случае, неким общим знаменателем между Word’ом и Excel’ем.
Для этого идем в меню Файл — Сохранить как (File — Save As) или жмем клавишу F12 на клавиатуре и в открывшемся окне выбираем тип файла Веб-страница в одном файле (Webpage — Single file):
После сохранения должен получиться файл с расширением mhtml (если у вас в Проводнике видны расширения файлов).
Этап 3. Загружаем файл в Excel через Power Query
Можно открыть созданный MHTML-файл в Excel напрямую, но тогда мы получим, во-первых сразу все содержимое PDF вместе текстом и кучей ненужных таблиц, а, во-вторых, опять потеряем данные из-за неправильных разделителей. Поэтому импорт в Excel мы будем делать через надстройку Power Query. Это совершенно бесплатная надстройка, с помощью которой можно загружать в Excel данные практически из любых источников (файлов, папок, баз данных, ERP-систем) и всячески затем полученные данные трансформировать, придавая им нужную форму.
Если у вас Excel 2010-2013, то скачать Power Query можно с официального сайта Microsoft — после установки у вас появится вкладка Power Query. Если у вас Excel 2016 или новее, то качать ничего не нужно — весь функционал уже встроен в Excel по-умолчанию и находится на вкладке Данные (Data) в группе Загрузить и преобразовать (Get & Transform).
Так что идем либо на вкладку Данные, либо на вкладку Power Query и выбираем команду Получить данные или Создать запрос — Из файла — Из XML. Чтобы были видны не только XML-файлы — меняем в выпадающем списке в правом нижнем углу окна фильтры на Все файлы (All files) и указываем наш MHTML-файл:
Обратите внимание, что импорт успешно не завершится, т.к. Power Query ждет от нас XML, а у нас, на самом деле, HTML-формат. Поэтому в следующем появившемся окне нужно будет щелкнуть правой кнопкой мыши по непонятному для Power Query файлу и уточнить его формат:
После этого файл будет корректно распознан и мы увидим список всех таблиц, которые в нем есть:
Посмотреть содержимое таблиц можно, если щелкать левой кнопкой мыши в белый фон (не в слово Table!) ячеек в столбце Data.
Когда нужная таблица определена, щелкните по зеленому слову Table — и вы «провалитесь» в её содержимое:
Останется проделать несколько простых действий, чтобы «причесать» ее содержимое, а именно:
- удалить ненужные столбцы (правой кнопкой мыши по заголовку столбца — Удалить)
- заменить точки на запятые (выделить столбцы, щелкнуть правой — Замена значений)
- удалить знаки равно в шапке (выделить столбцы, щелкнуть правой — Замена значений)
- удалить верхнюю строку (Главная — Удалить строки — Удаление верхних строк)
- удалить пустые строки (Главная — Удалить строки — Удаление пустых строк)
- поднять первую строку в шапку таблицы (Главная — Использовать первую строку в качестве заголовков)
- отфильтровать лишние данные с помощью фильтра
Когда таблица будет приведена в нормальный вид, ее можно выгрузить на лист командой Закрыть и загрузить (Close & Load) на Главной вкладке. И мы получим вот такую красоту, с которой уже можно работать:
Ссылки по теме
Понимание соответствия стандартам PDF | Блог Foxit PDF
Некоторое время PDF был проприетарным форматом, контролируемым одной компанией-разработчиком программного обеспечения, до его выпуска в качестве открытого стандарта в 2008 году Международной организацией по стандартизации (ISO) в соответствии с IDO 32000-1: 2008. Таким образом, документы, созданные с помощью программного обеспечения PDF, требуют соответствия определенным стандартам, чтобы другие имели возможность открывать и просматривать эти файлы. Это особенно верно, когда PDF используется для специальных приложений, таких как профессиональная печать или технические документы, или даже когда он используется для долгосрочного архивирования.
Как подмножества стандартов ISO, PDF / X, PDF / A и PDF / E все определяют соответствие стандартам. Но что именно это означает? Читайте и узнайте.
Стандарт PDF / X
, известные как PDF for Exchange, эти семь стандартов диктуют обмен графикой для стандартизации использования PDF для передачи файлов графического содержимого между сайтами, издателями и принтерами.
PDF / X-1a требует, чтобы все используемые шрифты были встроены в документ и чтобы все используемые изображения соответствовали CMYK или плашечным цветам.Этот стандарт не допускает прозрачности.
PDF / X-3 обеспечивает немного большую гибкость, позволяя использовать RGB, но слои и прозрачность по-прежнему не разрешены.
Стандарт соответствия PDF / X-4 поддерживает CMYK, серый, RGB или плашечный цвет и предоставляет возможность включать прозрачность и слои, в то время как X-4p помогает объединить большое количество файлов для создания документа.
Следующий стандарт, PDF / X-5g, основан на своих предшественниках и позволяет создателям документов сохранять графические элементы во внешнем файле, а не в самом основном документе.
Два последующих стандарта, X-5pg и X-5n, объединяют расширения в X-4p и X-5g и допускают дополнительные цветовые пространства, такие как Hexachrome.
Стандарт PDF / A
Для большинства документов PDF — это все, что вам нужно для повседневного чтения и совместного использования. Однако, если вам необходимо обеспечить возможность чтения этих документов в течение длительного времени, вы должны выбрать PDF / A в своем программном обеспечении PDF.
Документы, созданные с помощью программного обеспечения PDF для архивирования, должны соответствовать стандарту PDF / A, чтобы пользователи могли воспроизводить документ таким же образом, используя программное обеспечение PDF в будущем.
Ключ к совместимости с PDF / A — это 100% автономность документов; документ не может содержать внешнего содержимого, изображений, информации о цвете или шрифтах. Дополнительно документ может содержать номер:
- Аудио или видео
- JavaScript
- Запускает исполняемый файл
- Шифрование
- Архитектура XML-форм
- Прозрачные объекты слоев
Стандарт PDF / E
Этот стандарт соответствия разработан для документов, используемых в геопространственных, строительных и производственных рабочих процессах, чтобы обеспечить простой и последовательный обмен инженерно-технической документацией.Целью этого стандарта соответствия было снижение затрат, связанных с хранением и обменом бумажной документации.
Как и другие стандарты, PDF / E определяет, как авторы создают документы, однако этот стандарт соответствия допускает безопасность и шифрование, цифровые права, цифровые подписи и интерактивные носители. Документы, соответствующие этому стандарту, могут не включать:
- Ссылки на внешний контент
- JavaScript, не связанный с 3D
- Динамические формы
Программное обеспечение Enterprise PDF, такое как PhantomPDF Business, упрощает создание документов, соответствующих этим стандартам.Благодаря встроенным функциям, которые позволяют создавать PDF / A, E и X, вам никогда не придется беспокоиться о том, будет ли файл, созданный вами в каком-либо другом типе приложения и экспортированный как PDF, соответствовать требуемым стандартам.
Что такое PDF / E — Основная информация в PDF / E
Что такое PDF / E?
PDF / E (PDF / Engineering) — это один из подмножеств PDF, который разработан как открытый и нейтральный формат обмена инженерно-технической документацией.Он утвержден Международной организацией по стандартизации как стандарт ISO 24517-1: 2008. Он разрабатывается и поддерживается AIIM (Ассоциация управления информацией и изображениями).
Почему PDF / E?
Формат PDF / E широко используется при создании и обмене инженерно-технической документацией. PDF / E возник из необходимости открытого нейтрального формата обмена инженерно-технической документацией.Хотя существует несколько проприетарных форматов, у каждого из них есть свои собственные средства просмотра, что затрудняет перепрофилирование трехмерных и технических данных для последующего использования. Стоимость распространения и хранения бумаги приводит к высокой стоимости управления распределением и изменениями на протяжении всего проекта для групп разработки продуктов, а также для расширенных цепочек поставок.
Как и PDF, PDF / E представляет собой цифровой контейнер, который поддерживает широкий спектр содержимого и может быть просмотрен и помечен с помощью бесплатного и широко доступного программного обеспечения Adobe Reader®.PDF / E может помочь обеспечить безопасное распространение конфиденциальной информации и снизить сложность и затраты, связанные с распространением и хранением бумаги.
Хотя PDF / E является открытым стандартом, разработанным и поддерживаемым рабочей группой ISO, он также использует U3D, еще один открытый стандарт, для представления трехмерного содержимого. PDF / E основан на PDF V1.6. Однако он лишен некоторых возможностей, которые не используются при создании технической документации.
История формата PDF / E
PDF / E преимущества
Стандарт PDF / E определяет, как формат переносимого документа (PDF) должен использоваться для создания документов в рабочих процессах проектирования.
Как создать PDF
Для большинства людей Adobe Acrobat Pro слишком дорого, у них недостаточно бюджета для покупки этого профессионального инструмента PDF; поэтому они предпочитают конвертировать файлы других форматов в PDF с помощью доступного альтернативного средства создания Adobe Acrobat, которое также поддерживает эффективное преобразование Office в PDF и изображений в PDF.
Как конвертировать PDF
Как мы знаем, вносить изменения в PDF непросто, поэтому многие люди хотели бы использовать программное обеспечение для преобразования PDF, чтобы преобразовать PDF в другие редактируемые форматы файлов, такие как Office Word и PowerPoint, для повторного использования содержимого PDF.
О PDF / E | 3D PDF |
[ведущий] Управление документами, формат инженерной документации с использованием PDF. Часть 2: Использование ISO 32000-2, включая поддержку долгосрочного хранения (PDF / E-2) [/ lead]
PDF / E — сокращение от стандарта PDF для технических документов, это международный стандарт, обозначенный как ISO 24517 и определяет формат файла, известный как PDF / E, который обеспечивает механизм для обмена и архивирования технической документации на основе широко распространенного и хорошо известного формата PDF для различных сообществ, работающих с технической документацией.
Сильной характеристикой PDF / E является включение данных инженерной 3D-модели, поскольку многие 3D-данные так или иначе связаны с рабочими процессами проектирования.
Несколько версий
В настоящее время существует два различных уровня версий PDF / E. Первой была исходная спецификация, в первую очередь нацеленная на варианты использования двухмерных инженерных чертежей, она обозначена и опубликована как PDF / E-1 . В последнее время, когда 3D PDF становится все более распространенным, исходная спецификация пересматривается, чтобы приспособиться к меняющимся условиям, а также отразить основную новую версию PDF 2.0. Новые изменения еще не полностью внесены или опубликованы, но в настоящее время известны как PDF / E-2 .
Несколько типов
Файлы PDF / E сохраняют визуальное представление инженерных данных с течением времени, независимо от инструментов и систем, используемых для создания, хранения или визуализации файлов. В этом отношении он разделяет некоторые общие цели с PDF / A для архива документов.
Вместо одного типа он имеет вариации, позволяющие удовлетворить будущие требования рабочего процесса.Важной целью является улучшение обмена документами, совместной работы и точности печати в рабочих процессах проектирования как внутри компаний, так и с расширенными предприятиями партнеров, поставщиков, клиентов, государственных организаций и частных лиц.
Как используется PDF / E
PDF / E позволяет организациям оптимизировать рабочие процессы проектирования, объединяя различные наборы сложных документов, что приводит к повышению производительности, совместной работы и возможности более быстрого вывода на рынок более качественных продуктов.
Помимо базового стандарта PDF, он определяет функции PDF, которые требуются, рекомендуются, ограничиваются или запрещаются при создании, просмотре, разметке, печати, анализе, распространении и архивировании технических документов.
Он учитывает различные потребности как интерактивных, так и неинтерактивных читателей. ISO 24517 определяет правильное использование PDF для отображения на экране и печати технической документации. Печатная техническая документация представляет собой сборку страницы (или страниц), созданную различными организациями, которые могут быть межведомственными или внутрифирменными.Он также определяет структуру для представления логической структуры и другой семантической информации технических документов в соответствующих файлах.
ISO 24517 предназначен для предоставления формата для разработки различных приложений, таких как продукты для чтения, визуализации, записи, печати и проверки соответствия документов PDF. Различные продукты будут включать в себя различные возможности для подготовки, интерпретации и обработки соответствующих объектов. Однако инклюзивный, многофункциональный характер формата требует наложения дополнительных ограничений на его использование, чтобы сделать его пригодным для документов рабочего процесса проектирования.
PDF / E позволяет инженерам надежно создавать, обмениваться и просматривать техническую документацию, включая документы большого формата. PDF / E позволяет организациям работать более эффективно при создании или обмене технической документацией.
С 3D-типами U3D или PRC
Нет прямого требования, чтобы PDF / E содержал 3D-контент, на самом деле основной вариант использования — это 2D-чертежи, заменяющие бумажные чертежи. Однако с появлением 3D-технологий и формата 3D PDF PDF / E стал естественным домом для обсуждения 3D PDF для инженерных рабочих процессов.Если документ PDF / E содержит 3D, то по спецификации стандартов он содержит область данных модели U3D или PRC.
3D PDF Без PDF / E
Создание документа 3D PDF без ссылки на PDF / E является совершенно законным. Дополнение PDF / E — это более конкретное подмножество, направленное на более строгий архив и модель долгосрочного использования. Для повседневных и краткосрочных обычных PDF-документов 3D может быть включен и совместно использован с использованием типов кодирования U3D и PRC. Некоторые сообщества используют «PDF / E» как синоним 3D PDF, но на самом деле они разные.
Ключевые различия между 3D PDF-файлами с обычными ограничениями или PDF / E (предварительными)
Основные отличия, которые PDF / E-2 привносит при применении к 3D PDF:
- PRC 3D-потоки предпочтительнее в аннотациях RichMedia, а не в 3D.
- Метаданные документа должны включать в себя автора, дату создания и изменения, а также все остальные свойства документа в XMP .
- Избегайте использования шрифтов Type-3, все шрифты должны быть встроены в PDF.
- Избегайте flash, используйте стиль Acroform для интерактивных элементов.
- Должно быть указано намерение вывода.
- Подтипы должны быть указаны явно:
- PDF / E-2s с защитой, шифрование должно быть включено
- PDF / E-2r без защиты и с ограниченными встроенными типами файлов
- PDF-документ должен быть помечено в PDF 2.0 (не 1.7)
- Цветовая схема Должна быть указана цель.
- Безопасность должна быть отключена, если только не используется режим PDF / E-2s.
- Весь JavaScript с неявным поведением запрещен, JS разрешен только там, где он запускается явными наблюдаемыми событиями действия пользователя.
Ожидается, что более подробная информация будет доступна после того, как PDF / E-2 получит международное одобрение и будет опубликован.
8 типов стандартов PDF — каждый служит уникальной цели
PDF, переносимый формат документов, является отраслевым стандартом для обмена и печати документов. Каждый документ, преобразованный в PDF или сохраненный в формате PDF, может быть сохранен как определенный стандарт; в зависимости от того, какой стандарт вы сохраняете файл, будет зависеть цель, для которой он был создан. Если вы сохраните неправильный стандарт, у вас могут возникнуть проблемы при попытке распечатать, поделиться или архивировать файлы сейчас или в будущем.
Понимание стандартов PDF
Всего существует восемь стандартов PDF; шесть стандартов ISO и два от других организаций.
Шесть типов стандартов PDF из ISO
ISO — это Международная организация по стандартизации, которая выдает сертификаты для продуктов, соответствующих их стандартам во многих отраслях промышленности, включая документы в формате PDF. Они устанавливают стандарты, основанные на строгом процессе сертификации, чтобы гарантировать качество, надежность и универсальность.Каждый стандарт PDF от ISO имеет гарантированное качество, основанное на определенных обстоятельствах. Итак, какой стандарт вы будете использовать, будет определяться набором обстоятельств документа — как ваш PDF-файл будет храниться, просматриваться, совместно использоваться, распечатываться и т. Д.
- PDF — этого общего стандарта PDF достаточно для использования в офисе, совместного использования и просмотра в Интернете, а также для документов стандартного качества.
- PDF / A — этот стандарт был разработан для долговременного хранения файлов, обычно используется архивистами, менеджерами по документации и менеджерами по соблюдению нормативных требований.Он имеет ограниченный набор функций, включая JavaScript, аудио и видео контент и шифрование, потому что они могут запретить пользователям открывать и просматривать точно в будущем.
- PDF / E — Архитекторы, инженеры, специалисты по строительству и производственные группы будут использовать этот стандарт чаще всего. Согласно Planet PDF, «этот стандарт был предназначен для решения ключевых проблем в областях широкоформатных чертежей, мультимедиа, полей форм и управления правами — и это лишь некоторые из них, — которые могут помешать инженерному сообществу использовать PDF в своих рабочих процессах.”
- PDF / X — этот стандарт лучше всего подходит профессионалам печати, графическим дизайнерам и творческим профессионалам. При использовании этого стандарта можно ожидать документов высокого качества профессионального уровня. Этот стандарт PDF обеспечивает готовность документов к печати за счет правильного встраивания шрифтов, изображений, цветовых профилей и прочего.
- PDF / UA — Этот стандарт повышает удобство чтения для людей с ограниченными возможностями, ИТ-менеджеров в государственных или коммерческих предприятиях и менеджеров по соблюдению нормативных требований. UA означает универсальный доступ; этот стандарт будет работать со вспомогательными технологиями, которые помогают пользователям в чтении и навигации.
- PDF / VT — профессионалы печати также будут использовать этот стандарт для документов. Этот стандарт основан на компонентах стандарта PDF / X, что позволяет поддерживать некоторые функции, такие как цветовые профили, слои и прозрачность. Самым большим дополнением является возможность настраивать данные в этих файлах, такие как банковские выписки, бизнес-счета или персонализированные маркетинговые материалы.
Два типа стандартов PDF от других организаций
Дополнительные организации приняли стандарты для своих конкретных требований к документам.
- PAdES — Стандартизация безопасных безбумажных транзакций, соответствующих европейскому законодательству. Этот стандарт был установлен для цифровых подписей PDF в ЕС.
- PDF Healthcare — согласно Acrobat, этот стандарт «предоставляет передовой опыт и рекомендации по внедрению для облегчения сбора, обмена, сохранения и защиты медицинской информации. Следование этим рекомендациям обеспечивает более безопасный электронный контейнер, который может хранить и передавать медицинскую информацию, включая личные документы, XML-данные, изображения и данные DICOM, клинические заметки, лабораторные отчеты, электронные формы, сканированные изображения, фотографии, цифровые рентгеновские снимки и ЭКГ.”
Знание ваших параметров PDF позволит оптимизировать качество вашего документа, если у вас есть определенные цели просмотра, совместного использования, печати или архивирования документа. Если вам нужна дополнительная информация о печати высококачественных PDF-файлов (PDF / X), загляните в нашу статью о предварительных настройках PDF в ближайшее время.
Источники:
http://acroeng.adobe.com/wp/?page_id=303
https://www.eldos.com/security/articles/6963.php
http://www.planetpdf.com/enterprise/article. asp? ContentID = PDF_Standards
http: // www.pdflib.com/knowledge-base/pdfvt/
http://www.businessknowledgesource.com/manufacturing/what_are_iso_standards_027120.html
Раскрытие | Открытый международный стандарт, опубликованный ISO в 2008 году. Поддерживается рабочей группой (WG7) в рамках ISO / TC 171 SC2, подкомитета по приложениям управления документами, вопросам приложений. С 2002 по 2016 год AIIM (Ассоциация по управлению информацией и изображениями) выполняла функции секретариата, а U.S. Техническая консультативная группа (TAG) в ISO / TC 171 SC 2 (см. AIIM | US TAG в ISO / TC 171 с 2015 г.). В 2017 году Консорциум 3D PDF был одобрен Американским национальным институтом стандартов (ANSI) в качестве разработчика стандартов и взял на себя роль секретариата и администратора TAG США для ISO / TC 171 SC 2 (см. Консорциум 3D PDF, одобренный ANSI как США. TAG Administrator для стандартов PDF ISO). | Принятие | Составители этого ресурса нашли мало информации о степени, в которой формальный стандарт PDF / E-1 был использован на практике, за исключением заявления в стандартизованных ISO подмножествах PDF: экскурсия, слайд-шоу в мае 2018 года из PDF Association, что PDF / E-1 практически не используется.Комментарии приветствуются. Существуют обстоятельства, указывающие на то, что усыновление не получило широкого распространения. PDF / E-1 поддерживает U3D только для 3D-содержимого. Поддержка другой 3D-кодировки, Product Presentation Compact (PRC), была представлена Adobe в Acrobat 8.1 в 2007 году, до того, как PDF / E-1 был опубликован как ISO 24517-1: 2008 или PDF 1.7 был опубликован как ISO 32000-1: 2008 г. PRC имеет преимущества перед U3D, особенно в поддержке очень эффективного специализированного механизма сжатия. До PDF 1.7 был одобрен ISO, Adobe задокументировала расширение PDF 1.7, PDF_1_7_ext03, которое поддерживает 3D-контент с использованием PRC и стандартизированный способ представления геопространственных местоположений, что является еще одной важной особенностью в некоторых инженерных контекстах. По этим причинам рабочие процессы проектирования, вероятно, лучше обслуживались тем, что часто называют «3D PDF», чем формальным стандартом PDF / E-1. В октябре 2018 года министерство обороны США выпустило обновление своего стандарта MIL-STD-31000, который определяет пакеты технических данных (TDP), которые требуются в связи с контрактами.Цель TDP — «предоставить авторитетное техническое описание предмета, которое является ясным, полным и точным, а также в форме и формате, соответствующих его предполагаемому использованию». В этом обновлении представлена концепция TDP для просмотра 3Di (3-мерный интеллектуальный) PDF. Определение технических данных 3Di: «Трехмерное видимое представление объекта, представленное в широко доступном программном формате (например, в формате переносимого документа ISO 32000-1 (PDF)). Это представление содержит полное техническое описание требуемой проектной конфигурации. для включения, помимо прочего, геометрии, топологии, взаимосвязей, допусков, атрибутов, метаданных и других функций, необходимых для определения компонента или сборки.«Составителям этого ресурса кажется вероятным, что этот стандарт повлияет на развитие рынка инструментов для создания и визуализации технической документации в формате PDF. Комментарии приветствуются. Черновик PDF / E-2 был разослан для комментариев как ISO 24517-2, чтобы быть на основе на PDF версия 2.0 (в виде определенный в ISO 32000-2) скорее чем в PDF версия 1.6. Но процесс остановился. Будущие стандарты ISO на основе PDF 2.0 из PDFlib заявляет: «PDF / A-4e нацелен на инженерное сообщество. Он планируется как преемник существующего стандарта PDF / E-1 ISO 24517-1, который основан на PDF 1.6. Предыдущий план по определению новой разновидности PDF / E-2 как ISO 24517-2 был отменен. Вместо этого PDF / A-4e добавляет аннотации RichMedia для 3D-контента в формате U3D или PRC к базовому формату PDF / A-4 ». Комментарии приветствуются. Между тем, кажется, нет причин для использования PDF / E-1, поскольку PDF-файлы на основе PDF 2.0 (ISO 32000-2) могут включать 3D в форматы U3D и PRC, а также использовать преимущества других функций, представленных в PDF 2. .0, которые полезны в инженерных рабочих процессах, таких как встраивание связанных файлов. |
---|
PDF / A, сканирование в PDF, PDF с возможностью поиска
К настоящему моменту вы, скорее всего, использовали PDF-файлы в своем бизнесе или личной жизни и пришли к пониманию преимуществ, которые может предложить этот универсальный формат. Но знаете ли вы, что вы можете настроить свой формат PDF еще больше, чтобы он лучше отвечал потребностям вашего бизнеса? Вот некоторые очень важные стандарты PDF, которые могут кардинально изменить способ печати, архивирования и обмена документами.
Решения PDF / A из Solid Documents
- Solid PDF Tools — настольные решения для проверки, создания и преобразования PDF / A
- Solid Framework — решения для разработки программного обеспечения для проверки, создания и преобразования PDF / A
PDF / A — Стандарт PDF для долгосрочного архивирования
Что такое PDF / A?
В сентябре 2005 года Международная организация по стандартизации (ISO) утвердила новый стандарт PDF / A для архивирования электронных документов.Согласно стандарту ISO 19005-1, PDF / A является производным от PDF, который «обеспечивает механизм для представления электронных документов таким образом, который сохраняет их внешний вид с течением времени, независимо от инструментов и систем, используемых для создания, хранения или визуализации. файлы.»
Этот способ сохранения позволяет PDF-файлам быть самодостаточными. PDF / A достигает этой самодостаточности за счет встраивания информации (содержимого, цвета, шрифта, изображений, текста и т. Д.), Необходимой для отображения документа, в самом документе.Другими словами, PDF / A не требует никакой дополнительной внешней информации для правильного отображения. Однако, чтобы этот формат достиг самодостаточности, он должен исключать определенные функции, разрешенные в стандартных файлах PDF, такие как фильмы, звук и прозрачность.
Классификация PDF / A разделена на две части: PDF / A-1 и PDF / A-2. Первая классификация, PDF / A-1, далее подразделяется на еще две категории: PDF / A-1a и PDF / A-1b. Основное различие между PDF / A-1a и PDF / A-1b заключается в способе извлечения текста каждым из них:
- PDF / A-1a: Этот уровень, также называемый уровнем соответствия A, полностью соответствует стандарту ISO 19005-1.Эта версия включает теги, так что текст можно извлекать и просматривать на нескольких устройствах, включая портативные.
- PDF / A-1b: Эта категория, называемая уровнем соответствия B, считается минимальным уровнем соответствия для PDF / A. Этот уровень гарантирует, что документ может быть отображен и прочитан на мониторе компьютера, но читаемость текста не гарантируется.
- PDF / A-2: PDF / A-2 основан на стандарте ISO 32000-1 и использует преимущества функций, появившихся после Adobe PDF 1.4 спецификация. Сюда входит поддержка
- сжатия JPEG2000 (преимущества для отсканированных цветных документов)
- встроенных файлов PDF / A через коллекции / портфолио
- прозрачность, дополнительное содержимое (слои): полезно для сопоставления или инженерных чертежей или документов на нескольких языках (реализовать различное содержимое на разных уровнях)
- поддержка Unicode (PDF / A-2U)
- метаданные XMP на уровне объекта (новые требования к настраиваемым метаданным)
- комментарии и аннотации (определенный список допустимых и запрещенных типов аннотаций и комментариев для PDF / A -2)
- Определены правила цифровой подписи
- PDF / A-3: PDF / A-3 основан на стандарте ISO 32000-1 и предлагает поддержку встроенных файлов.
Что это значит для вашего бизнеса …
PDF / A — это новый стандарт, который коренным образом изменит способ архивирования важных документов и записей предприятиями и государственными учреждениями. В настоящее время многие предприятия архивируют свои документы, храня бумажные копии. Другой современный метод архивирования — использование микрофильмов и микрофиш. PDF / A разработан, чтобы заменить все это единым стандартизированным форматом, который легко обновлять, доступен для поиска, легко организовывать, эффективный, переносимый и, прежде всего, устойчивый.Для вашего бизнеса это означает дешевую и малотиражную альтернативу хранению стопок бумаг и папок в вашем архиве. Кроме того, поскольку это электронный формат, вы можете легко хранить свои архивные документы в нескольких местах, что делает их гораздо менее уязвимыми для пожаров, наводнений или любых других стихийных бедствий.
PDF / X — Стандарт PDF для допечатной подготовки данных
Что такое PDF / X?
PDF / X, как и PDF / A, является подмножеством PDF. Цель PDF / X — предоставить дизайнерам, иллюстраторам, инженерам и художникам-графикам электронный формат файла, который может быть правильно распечатан любым поставщиком услуг.PDF / X обеспечивает полную согласованность, даже когда файлы обрабатываются в нескольких местах людьми, использующими разное оборудование. Этот формат идеально подходит для большинства межфирменных переводов, готовых к печати, когда отправитель готовой к печати информации и получатель не имеют прочной аффилированности. Помимо обеспечения надежного формата доставки для заданий на печать, PDF / X также предоставляет другие преимущества, включая просмотрщик файлов, лучшее сжатие (меньший размер файла), поддержку плашечных цветов, средства определения условий печати, для которых был подготовлен файл. , и больше.Однако, как и PDF / A, преимущества PDF / X компенсируются компромиссами. Такие функции, как прозрачность, шифрование и сжатие JBIG2, запрещены в PDF / X.
Стандарт PDF / X подразделяется на три категории:
- PDF / X-1a: Этот стандарт идеально подходит для отправителей файлов, которые хотят сохранить максимальный контроль над заданием на печать. Он поддерживает слепой обмен и соответствует общим требованиям во многих частях мира.
- PDF / X-3: Наиболее важное различие между PDF / X-3 и PDF / X-1a заключается в том, что файл PDF / X-3 содержит данные с управляемым цветом.Это означает, что любые инструменты, которые могут читать PDF / X-3, также должны иметь возможность читать PDF / X-1a файл.
- PDF / X2: В отличие от первых двух форматов, упомянутых выше, которые предназначены для слепого обмена, PDF / X2 ориентирован на обмены, в которых существует больше диалога между отправителем и получателем. Это расширенный набор формата PDF / X-3, который является расширенным набором формата PDF / X-1a.
Что это значит для вашего бизнеса …
Стандарт PDF / X разработан для применения во многих секторах и предприятиях полиграфической промышленности.Если вы получаете готовые к печати файлы, убедитесь, что вы точно знаете, какие типы файлов вы можете принимать (PDF / X-1a, PDF / X-3 или PDF / X2). Кроме того, безопасно обновляться до более новых версий инструментов PDF / X по мере их появления, поскольку они смогут читать старые файлы. Большинство продуктов, поддерживающих базовый PDF, также будут поддерживать файлы PDF / X. Убедитесь, что вы предварительно проверяете все входящие файлы для печати, чтобы убедиться, что они соответствуют правильной версии PDF / X. Кроме того, если вы печатник или издатель, убедитесь, что весь ваш рабочий процесс совместим с PDF / X.Если вы отправляете готовые к печати данные издателю или типографии, внимательно рассмотрите свои варианты в отношении подмножеств PDF / X, чтобы определить, какой из них лучше всего подходит для вашего бизнеса. В конечном итоге цель PDF / X — предоставить средства для отправки полнофункциональных цифровых файлов с уверенностью в том, что они пройдут допечатную подготовку без каких-либо ошибок или переделок.
PDF / E и PDF / UA
PDF / E
ISO 24517-1: 2008 — стандарт ISO, опубликованный в 2008 году.Этот стандарт определяет формат для создания документов, используемых в рабочих процессах проектирования, и основан на справочнике PDF версии 1.6 от Adobe Systems. PDF / E — это подмножество PDF, разработанное как открытый и нейтральный формат обмена инженерно-технической документацией.
PDF / UA
UA означает универсальный доступ. PDF / UA предоставляет технический стандарт для разработчиков программного обеспечения, реализующих программное обеспечение для записи и обработки PDF. Соответствие PDF / UA обеспечивает доступность для людей с ограниченными возможностями, которые используют такие технологии, как программы чтения с экрана, экранные лупы, джойстики и другие технологии для навигации и чтения электронного контента.PDF / UA — это не отдельный формат файла, а просто способ использования PDF.
Для получения дополнительной информации о Международной организации по стандартизации посетите http://www.iso.org/iso/en/ISOOnline.frontpage
Какие существуют версии PDF / A?
Организации предпочитают PDF / A из-за его признания в отрасли и преимуществ перед другими форматами архивирования с точки зрения его способности сохранять текст, векторную графику, растровые изображения и связанные метаданные. Тем не менее, с различными стандартами PDF / A и уровнями соответствия (а в настоящее время — с восемью возможными комбинациями) легко заблудиться.
Если вы хотите освежить в памяти свою таксономию PDF / A, читайте дальше. В этой статье мы рассмотрим различные стандарты PDF / A и уровни соответствия, а также их значение.
ссылка Каковы различные версии PDF / A и уровни соответствия?PDF / A поставляется во многих различных возможных вариантах, созданных путем смешивания различных стандартов PDF / A и уровней соответствия. Каждый стандарт PDF / A определяет набор доступных функций и технологий сжатия изображений, которые помогают сохранить содержимое файла.В свою очередь, каждый стандарт PDF / A поддерживает разные уровни соответствия (a и b для PDF / A-1; и a, b и u для PDF / A-2 и -3). Эти уровни соответствия контролируют требования «доступности» к файлу, которые влияют на способность машин и людей понимать контент.
ссылка Подробно: различные стандарты PDF / A PDF / A-1: (ISO 19005-1: 2005)
PDF / A-1 — исходный стандарт PDF / A, наиболее часто используемый сегодня и самый строгий.Поскольку он основан на более старом стандарте PDF, PDF 1.4, опубликованном Adobe Systems в 2001 году, PDF / A-1 не поддерживает JPEG 2000, слои или вложения. Кроме того, несмотря на поддержку в PDF 1.4, прозрачность считалась «слишком новой» во время создания PDF / A-1 и поэтому не включалась.
Отсутствующие функции: JPEG2000, прозрачность, слои и вложения
Уровни соответствия: a & b
На основе PDF 1.4
PDF / A-2: (ISO 19005-2: 2011)
На основе в PDF 1.7 (ISO 32000-1: 2008) PDF / A-2 представляет несколько функций, недоступных в PDF 1.4, а также прозрачность. Дополнения включают слои, улучшенное сжатие изображений (JPEG 2000 и JBIG2) и вложения — при условии, что эти вложения находятся в формате PDF / A.
PDF / A-2 не делает файлы PDF / A-1 устаревшими. Скорее, стандарт предназначен для обеспечения прямой совместимости: например, действительный файл PDF / A-1b должен пройти проверку в программном обеспечении, установленном для проверки для PDF / A-2b или PDF / A-3b.
Наконец, уровень соответствия u (как в Unicode ) также был введен с PDF / A-2.Уровень u позволяет организациям гарантировать, что текст документа может быть надежно найден и скопирован — при этом файл не должен соответствовать другим требованиям уровня a.
Новые и разрешенные функции: JPEG 2000, прозрачность, слои и вложения (только другие файлы PDF / A)
Уровни соответствия: a, b & u
На основе PDF 1.7 (ISO 32000-1: 2008 )
PDF / A-3 (ISO 19005-3: 2012)
PDF / A-3 практически идентичен PDF / A-2.(Они даже оставили нетронутыми опечатки.) Единственное отличие состоит в том, что PDF / A-3 допускает любой тип файла в качестве вложения.
Однако программа просмотра PDF / A не требует дополнительных действий с этими прикрепленными файлами, кроме обеспечения их правильного извлечения. Следовательно, стандарт не может гарантировать, сможете ли вы читать или иным образом использовать эти файлы в будущем. побуждает архивистов озвучивать опасения, что PDF / A-3 может позволить обойти архивные ограничения на разрешенные форматы.
В ответ на вышеуказанное беспокойство было отмечено, что тщательно разработанный рабочий процесс, построенный с учетом архивных соображений, может учитывать и использовать возможности PDF / A-3. Действительно, PDF / A-3 был во многом вдохновлен желанием иметь доступный машиночитаемый компонент, такой как проприетарные двоичные данные или XML, используемый в ситуациях, когда можно было бы тщательно прописать встроенные форматы. Примером этого является гибридный стандарт электронного выставления счетов ZUGFeRD, опубликованный через два года после внедрения PDF / A-3, одобренный правительством Германии и одобренный многими организациями и предприятиями Европейского Союза.
Новые и разрешенные функции: Вложения (файлы любого типа)
Уровни соответствия: a, b & u
На основе PDF 1.7 (ISO 32000-1: 2008)
PDF / A-4 (ISO 19005-4: 2019)
PDF / A-4, который иногда называют PDF / A-NEXT, является следующей версией стандарта PDF / A, который планируется опубликовать в 2019 году. PDF / A-4 будет основан на PDF 2.0 , самая последняя версия стандарта PDF, и вводит два новых уровня соответствия, e и f.
Новые функции: TBD
Уровни соответствия: TBD
На основе PDF 2.0 (ISO 32000-2: 2017)
Уровень b (базовый)
PDF / A-1b, PDF / A-2b, PDF / A-3b
Соответствие уровня B требует только того, чтобы документы соответствовали рекомендациям для надежного просмотра и, следовательно, это самый простой уровень для достижения.
Из спецификации ISO:
Уровень соответствия B
уровень соответствия, охватывающий требования данной части ISO 19005 в отношении внешнего вида электронных документов, но не их структурные или семантические свойства, а также требование, чтобы весь текст имел эквиваленты Unicode .
Уровень a (доступный)
PDF / A-1a, PDF / A-2a, PDF / A-3a
«Доступное» соответствие — это надмножество соответствия b-уровня. Он добавляет требования к информации, предназначенной для сохранения логической структуры документа, семантического содержания и естественного порядка чтения.
Другими словами, соответствие на уровне a не только гарантирует, что документы будут выглядеть так же в будущем; он также помогает машинам и людям лучше понимать и перенаправлять его содержание.Допустимый PDF / A-документ уровня A будет иметь текст, который можно надежно искать и копировать, а также контент, более доступный для таких технологий, как программы чтения с экрана для слепых.
Список требований A-уровня выглядит следующим образом:
- Содержимое должно быть с тегами с иерархической структурой , дерево , то есть такие элементы, как порядок чтения, рисунки и таблицы, явно идентифицируются через метаданные.
- Необходимо указать естественный язык документа.
- Изображения и символы должны иметь альтернативный описательный текст.
- Файл должен включать отображение символов в Unicode для надежного поиска и копирования.
Примечание: ни одно из этих требований не изменит внешний вид документа.
Уровень u (Unicode)
PDF / A-2u, PDF / A-3u
Как и «уровень a», соответствие u-уровню требует преобразования символов в Unicode . Однако он снижает требования к уровню, включая встроенную логическую структуру (т.е., теги и структурное дерево), как указано в разделе 6.7 ISO 19005-2 (PDF 1.7). Следовательно, PDF / A, отвечающий требованиям u-уровня, будет иметь текст, который можно надежно искать и копировать, но порядок чтения не будет гарантирован.
ссылка Подробнее о решениях PDF / A и PDFTron для PDF / AТаким образом, знание ваших параметров PDF / A поможет вам повысить ценность ваших документов для конкретных целей просмотра, совместного использования, печати или архивирования. Если вам нужна дополнительная информация в формате PDF / A, ознакомьтесь с нашей страницей, посвященной PDF / A.
Если вы заинтересованы в преобразовании в конкретный вариант PDF / A, попробуйте бесплатный онлайн-инструмент PDF / A конвертера PDFTron, способный преобразовать более 20 форматов файлов в любую версию PDF / A; или прочтите нашу статью о том, как конвертировать в PDF / A с помощью PDF SDK PDFTron или инструмента командной строки.
Если у вас есть какие-либо вопросы о PDF SDK PDFTron, свяжитесь с нами!
.