Что значит формат пдф: Обзор формата Adobe PDF

Содержание

Что такое формат PDF? | Конвертер PDF в Word

Что такое формат PDF?

Если файл имеет расширение .pdf, скорее всего это файл формата Portable Document Format (PDF), разработанный Adobe Systems, Inc. PDF файл позволяет просматривать и печатать документ под различными платформами, включая Windows, UNIX и Mac.

Просмотр PDF файлов

Для просмотра PDF файлов необходимо скачать программу Adobe® Acrobat® Reader, которая является бесплатной и служит для просмотра и печати файлов формата Adobe Portable Document Format (PDF) в наиболее распространенных операционных системах и платформах.

PDF Navigation Features

Certain features built into the PDF specification allow authors to expand the usefulness of a document. For example, you can add bookmarks, thumbnails of each page, internal and external links, form fields, article threads, buttons for navigation, notes to annotate information, and views to magnify or reduce a page to fit within the user’s computer screen.

PDF allows users to magnify up to 800% on screen with no loss of clarity.

PDF Size and Performance

For the Web, smaller files are better since download time depends on file size. PDF files can be optimized to reduce file sizes and can create files up to 80% smaller than their HTML counterparts.

PDF files can be «linearized» to allow the user to start viewing the document before it is fully downloaded, similar to the process used to deliver streaming video over the internet.

PDF can be interwoven seamlessly into most Web sites. This combination of HTML and PDF formats enables authors to serve content in its most appropriate format based on the demands of content versus technology. Also, on most popular Web servers there is no compression, translation, or filtering penalty for serving PDF files.

PDF Security

PDF has a well-established security feature set. Authors of PDF files can prevent users from editing, printing, and/or copying content (text and graphics). Software developers can create their own software to read, create, or modify PDF files without special permission or licensing. The only condition that Adobe insists on is that the document author’s PDF security settings be respected.

Что такое PDF файлы и почему мы все еще полагаемся на них?

Подробности
сентября 06, 2017
Просмотров: 9015

Вы открывали PDF на этой неделе? Скорее всего, вы регулярно работаете с ними. Несмотря на то, что некоторые другие типы файлов исчезают в неизвестности, PDF-файлы по-прежнему остаются популярным выбором. Вы когда-нибудь задумывались, почему это так? Давайте рассмотрим, как работают PDF-файлы, почему они так важны и почему они по-прежнему пользуются такой популярностью.

История PDF

PDF – расшифровывается как «Portable Document Format», что в переводе означает «Переносимый формат документов». Созданный Adobe, он впервые был запущен в начале 1990-х годов как способ полностью сохранить документ в одном файле. Поскольку интернет тогда был еще молод, они в основном использовались для публикации на рабочем столе документов для печати. Компании использовали PDF-файлы для сохранения плакатов, флаеров и других подобных файлов для физической печати.

Adobe Acrobat было нелегко заполучить, у PDF-файлов не было всех функций интеграции, которые они делают сегодня, и использование dial-up для загрузки большого PDF было очень медленным. Через несколько лет Adobe выпустила Adobe Reader бесплатно для всех, и в конечном итоге PDF выбил несколько конкурентов, чтобы стать файловым стандартом для фиксированных документов.

Интересно, что PDF был первоначально проприетарным форматом, что означает, что Adobe контролирует PDF-файлы и как они функционируют. В 2008 году они отказались от этого права собственности, и PDF стал открытым стандартом. Теперь PDF-файлы по-прежнему имеют базовый набор свойств, но они не зависят от Adobe. В самом деле, вы можете найти десятки других бесплатных PDF-читателей.

 

Как работают PDF-файлы

Чтобы понять, почему PDF был такой революцией, когда он только появился, мы должны понять, что такое этот стандарт в то время. В начале 90-х профессиональное программное обеспечение, используемое для создания графики и документов, приводило к невыносимо большим файлам, особенно когда в них были встроены изображения, шрифты и другие графические элементы. Помните, что машины в это время имели крошечную часть вычислительной мощности компьютера, который вы используете сегодня, что означает, что каждый бит эффективности был жизненно важен.

Чтобы исправить это, разработчики программного обеспечения начали использовать ссылки на другие ресурсы на компьютере. Предположим, вы использовали специальный шрифт в своем документе. Вместо того, чтобы сохранять все данные для этого шрифта внутри вашего документа, он вытащил необходимую информацию из установочной папки шрифта на вашем компьютере. Это уменьшило нагрузку на файл документа, сделав его более легким.

Это будет работать нормально, если вы не перемещаете шрифт на свой компьютер. Однако, если вы принесли файл на другой компьютер, у которого не было вашего конкретного шрифта, это выглядело бы неправильно. Вы можете представить себе сколько времени вы потратили на создание важного документа, а затем он стал выглядеть просто ужасно, потому что вы не сохранили ссылки на графические элементы.

PDF изменил это. Adobe нашла способ собрать все части файла и превратить его в более мелкие. Очевидно, что это намного эффективнее, чем обходные решения, которые разработчики использовали перед тем, как был представлен PDF.

И поэтому PDF стали стандартом.

 

Почему они так важны

Портативный формат PDF имеет большое значение: PDF-файлы выглядят одинаково независимо от того, на каком устройстве они просматриваются. Независимо от того, используете ли вы Windows 10, Mac, Chrome OS, Android, Windows Phone, iPad или Windows XP — на любом программном и аппаратном обеспечении, файлы PDF остаются неизменными. Информация, содержащаяся в PDF-файле, не зависит от устройства создателя или зрителя. Включение шрифтов, картинок, диаграмм и т. п. — это не борьба за PDF.

Сравните это с отправкой документа Microsoft Word. Что произойдет, если ваш получатель не имеет Microsoft Word на своем компьютере? Конечно, они могут открыть его в Документах Google, но документ при этом может сильно отличаться, поскольку Docs обрабатывает файлы по-разному. Если вы потратили много времени на создание таблиц, изображений и других элементов в правильном порядке, все это могло бы выйти из окна. И что, если они попытаются открыть документ Word на своем телефоне?

Как правило, PDF-файлы предназначены для просмотра. То, что вы видите, когда вы нажимаете «Сохранить», — это то, что получит кто-то другой, который просмотрит документ. И вам даже не нужно устанавливать программу — большинство современных браузеров открывают PDF-файлы без проблем. Хотя вы можете редактировать PDF-файлы, вы ограничены несколькими вариантами, если не заплатите за премиальное программное обеспечение, такое как Adobe Acrobat, Foxit PhantomPDF или Nitro.

 

Почему они все еще популярны

В дополнение к переносимости, описанной выше, PDF-файлы имеют несколько функций, которые способствовали их постоянной популярности.

Во-первых, PDF-файлы позволяют настраивать параметры безопасности. Когда вы создаете PDF-файл, вы можете отключить способность зрителей печатать документ, оставлять комментарии к нему или копировать его текст. Таким образом, когда правительства и предприятия размещают онлайн-формы, они могут в значительной степени ограничить их для предотвращения злоупотреблений. Для большей безопасности вы также можете защитить PDF паролем.

Вы, вероятно, заметили, что PDF-файлы также работают с полями заполнения. Создатель PDF может размещать выделенные блоки в любом месте документа, чтобы показать, где они хотели бы, чтобы читатель добавлял информацию. Даже если они ограничивают редактирование, зритель все равно может набрать свое имя, адрес и другую соответствующую информацию в эти поля.

Подпишитесь на RSS, подпишитесь на электронную подпитку, чтобы вы могли добавить свое согласие на документ, не распечатывая его.

Незначительные функции, такие как добавление комментариев, выделение, штампы, гиперссылки и другой контент в прямом эфире, сохранили PDF-файлы в течение текущего десятилетия. Программное обеспечение оптического распознавания может захватывать документы и легко превратить их в PDF-файлы, а некоторые независимые издатели даже выпускают книги в формате PDF. Его простота использования, надежный набор функций и вездесущность закрепили PDF в повседневной вычислительной жизни.

 

Что вы узнали о формате PDF?

Я провел краткий обзор формата PDF, чтобы Вы узнали, как это началось, как он работает и что делает его настолько важным и популярным. В мире с различными операционными системами, размерами экрана, браузерами и аппаратными компонентами, PDF остается стойким и неизменным. Зная, что созданный вами документ не пройдет каких-либо странных изменений, прежде чем ваш зритель это увидит.

Это то, что предоставляет PDF, и, таким образом, он является стандартом уже более двух десятилетий.

Теперь, когда вы знаете все о PDF-файлах, ответьте на следующие вопросы:

Как часто вы используете PDF-файлы? Есть ли у вас другая причина использовать их, кроме перечисленных здесь? Дайте нам знать, что вы думаете об этом формате файла в комментариях!


Читайте также

 

 

 

 

Чем отличается формат PDF от PDF/A, и какой формат лучше использовать для сохранения отсканированных образов документов?

Сохранение скана в формате PDF

PDF (“portable document format”) — это универсальный формат электронных документов. Он создан по инициативе компании Adobe, и его исходное предназначение — электронное представление печатных материалов. Отсюда следуют задачи данного формата — хранение информации о цветовой схеме и расположении элементов, а также обеспечение идентичного вывода на разных мониторах и принтерах.

За время своего существования формат PDF значительно прибавил в возможностях. Eщё в первой редакции формата появилась возможность вставлять гиперсылки в текст, шифровать документ с паролем и тем самым защищать его от модификации.

В версии PDF 1.4 поверх изображения можно наносить текстовый слой, в том числе невидимый. То есть пользователь, видя «картинку», тем не менее может копировать с неё текст. Кроме того, в этой же версии появилась возможность вставлять метаданные в виде пар «ключ-значение», каждая из которых может быть связана с какой-то частью документа (например, отдельным изображением) или со всем документом целиком. Это важные нововведения, с точки зрения архивного хранения, и они поддерживаются форматом по сей день.

Сохранение в PDF/A. Когда нужен этот формат?

PDF/A — это подмножество формата PDF, содержащее ограниченный набор возможностей представления данных. Данный формат является стандартом ISO и предназначен для долгосрочного хранения электронных документов.

Обеспечение длительного срока хранения достигается посредством внедрения в содержимое электронного документа в формате PDF/A всей информации, необходимой для его отображения. К ней, в частности, относятся шрифты — те из них, которые использованы в документе, включены в него. К слову, это влияет на его размер: документ в формате PDF/A не меньше, а вероятно даже больше по размеру, чем документ с аналогичным содержимым, сохранённый в формате PDF.

Считается, что документ, хранимый в формате PDF/A, из-за полного отсутствия связи с такими изменчивыми вещами как гиперссылки и мультимедийный контент, можно будет открыть в любой операционной системе через какое угодно время с помощью приложения, поддерживающего соответствующий формат. Поскольку PDF/A обеспечен статусом международного стандарта, его поддержка со стороны разработчиков ПО в долгосрочной перспективе оправдана, а использование целесообразно по сравнению с другими доступными форматами хранения, которые могут измениться в любой момент времени.

При этом целостность и неизменность неподписанного документа в формате PDF/A не может быть гарантирована и не заявляется как особенность формата. Другими словами, несмотря на то, что данный формат позиционируется как обеспечивающий долгосрочное хранение, изменение содержимого документа возможно и не является отклонением от нормы, если оно не зашифровано. Однако есть ещё один нюанс: для каждого конкретного документа, формат которого заявлен как PDF/A, невозможно заведомо утверждать, что это действительно так. Необходима верификация на соответствие требованиям формата для каждого конкретного документа. И если на этапе размещения в архиве или после очередного изменения она не будет проведена, можно считать миссию обеспечения долгосрочного хранения потенциально проваленной (с некоторыми оговорками, но всё же).

Исходя из описанных выше различий между форматами PDF и его потомком PDF/A, вполне можно предположить, что первый больше пригоден для оперативного обмена и краткосрочного хранения электронных документов, тогда как PDF/A, несмотря на потенциально большой размер единичного документа (в него внедрены все использованные шрифты, а это для краткосрочного использования избыточный и ощутимый балласт), имея статус международного стандарта, гарантирует, что даже через продолжительное время, вне зависимости от окружения и операционной системы, любой пользователь сможет открыть документ в данном формате, располагая приложением-просмотрщиком. Этот факт укладывается в концепцию архива электронных документов и должен учитываться при сохранении каждого документа в нём.

Хранение документов в формате PDF/A, подписанных электронной подписью, возможно и на длительный срок – от 5 лет. Чтобы обеспечить их целостность и юридическую значимость, достаточно воспользоваться системами долговременного хранения.

Сканированный образ документа. Что это такое?

Теперь необходимо определиться с тем, что такое отсканированный образ документов. В подавляющем большинстве случаев это растровое изображение. Предполагается, что текста поверх него нет, то есть в документе хранится исключительно отсканированный растр — изображение, текст на котором непонятен компьютеру, а понятен только человеку. В исключительных случаях поверх растрового изображения может быть расположен текстовый слой, частично или целиком наполненный. Причём делается это либо вручную человеком, либо с помощью системы распознавания текста. Можно предположить, что документ содержит метаданные, так или иначе связанные с видом документа и его содержимым (например, если это счёт-фактура, метаданные могут содержать информацию о поставщике, дате выставления, сумме и т.д.).

Очевидно, что отсканированный образ документа допускает, но не подразумевает долгосрочного хранения. Но всё-таки в большинстве случаев образ должен храниться не меньше бумажного оригинала, а зачастую значительно дольше, поскольку значимость и важность его в контексте организации-владельца всегда есть. Кроме того, образ снят с бумажного документа, а это значит, что его изменение не подразумевается, хотя и возможно.

На основании перечисленных особенностей, которыми обладает отсканированный образ документа, можно смело заявлять, что одинаково пригодны оба формата. Хотя PDF/A допускает и метаданные, и текстовый слой поверх изображения, и даже подписание документа с целью защитить его от модификации.

Формат PDF: особенности, преимущества и недостатки.

Vasyl Holiney Обновлено Loading…
  1. Преимущества и недостатки.
  2. Где используется?

PDF(Portable Document Format), не просто всем известный и удобный формат, а и единственный, который является стандартом с 2008 года. Он был разработан командой компании Adobe Systems. Разработчики формата поставили перед собой задачу создать такой формат отображения документа, чтобы на любом устройстве документ открывался и выглядел одинаково.

Вкратце PDF мы уже рассматривали в статье «Форматы графических файлов — JPG, PNG, SVG, PDF», сегодня попробуем выявить достоинства и недостатки этого векторного формата.

Часто этот формат ассоциируется с «безбумажным офисом», а в случае с дизайном — с подготовкой к печати и с передачей графических макетов в типографию.

Преимущества и недостатки.

Плюсы:
— стандартизованность и популярность: открывается на любых устройствах с любыми операционными системами ровно в том виде, в котором был создан;
—  средство просмотра формата, Adobe Acrobat Reader, часто предустановлено на компьютер, если устройство поставлялось с операционной системой. Если же нет – он доступен для скачивания с сайта разработчика Adobe Systems и это совершенно бесплатно;
— занимает мало места на жестком диске, потому что поддерживает множество алгоритмов компрессии;
— безопасность: пользователь может настроить параметры безопасности для своего файла, например, запрет печати, запрет редактирования, использование электронной подписи для определения подлинности документа и т.д.

Минусы:
— редактор PDF файлов – платный;
— редактировать pdf файлы в специализированных программах, сложнее, чем любые другие графические файлы;
— сложно работать с текстом, он воспринимается как картинка.

Где используется?

PDF формат используется для хранения и передачи текстовой и графической информации в сети, например для передачи фирменного бланка в полиграфию или размещение анкеты на сайте. Отлично подходит для демонстрации наработок: показать легко, отредактировать – сложно. Это усложняет воровство интеллектуальной собственности. Ну и идеи «безбумажного офиса» воспринимаются на ура всеми, кто задумывается об экологии на планете.

Руководитель отдела маркетинга и главный генератор идей компании Logaster. Автор книги «Как создать фирменный стиль и не разориться». Ценит экспертный подход, но в то же время использует простой язык для объяснения сложных идей.

PDF/X: подарок, которого ждали

Всё чаще в публикациях, посвящённых допечатной подготовке, стала появляться доселе незнакомая аббревиатура PDF/X.
И хотя в ней угадывается родство с PDF, это не снимает закономерный вопрос: зачем издательской индустрии понадобился ещё один формат?

Чтобы разобраться, давайте вспомним историю. Как известно, изначальное предназначение Portable Document Format (PDF) — быть межплатформенным средством для обмена документацией. Именно эту цель преследовал исполнительный директор Adobe Systems Джон Ворнок, когда в 1991 г. осознал необходимость разработки универсального формата для документов (тем, кто хочет ознакомиться с аргументами мэтра, рекомендую познавательную статью по адресу http://www.planetpdf.com/ mainpage.asp?webpageid=1851). У компании уже была интересная разработка — язык описания страниц PostScript, под управлением которого вполне успешно работали лазерные принтеры и ФНА, эксплуатировавшиеся на всех существовавших платформах. Этот язык и был взят за основу нового формата.

Следовательно, PDF был нацелен, в первую очередь, на корпоративный рынок, больше всего страдавший от проблем с открытием документов, созданных в различных программах. Разработка была быстро взята на вооружение, и время, которое армия клерков ранее тратила на эту примитивную операцию, стало расходоваться более эффективно.

Итак, PDF был совершенно не предназначен для использования в полиграфии. Позже Adobe адаптировала его под нужды печатающей братии, и ныне формат всё чаще выступает как альтернатива традиционным способам. Оценивая сегодняшнее положение PDF, можно констатировать, что он состоялся именно как межплатформенное средство обмена цифровой информацией. «Сваяв» своё творение в любом пакете, каждый через PDF может сохранить его для всемирной истории, сделав доступным для просмотра, архивации, поиска из любой среды, в т. ч. и поисковыми машинами Интернета. Замечательно!

Несколько иная картина вырисовывается, если отдать это творение для печати. Как правило, люди малознакомые с полиграфией не могут создать PDF так, чтобы в итоге получилось именно то, что они хотели. Налицо конфликтная ситуация.

PDF стал неотъемлемой частью процесса допечатной подготовки благодаря предсказуемости результатов. Корректно созданные файлы невелики по размеру и быстро выводятся на печать. Однако PDF может содержать чуждые для препресса элементы (аннотации, комментарии, изображения в модели RGB), бывает, отсутствуют шрифты. Приведённый пример показывает: то, что файл имеет расширение PDF, ещё ни о чём не говорит, — кто знает, как его делали? Разумеется, в таком случае ничего хорошего на печати ожидать не приходится.

Во избежание подобных недоразумений и была введена отдельная спецификация формата — PDF/Х, описывающая требования исключительно для допечатной подготовки. Предполагается, что его использование позволит ввести в обиход издательского сообщества понятие blind exchange («слепой обмен», или «без входного контроля»).

Разновидности PDF/X

PDF/Х разработан Комитетом по стандартизации графических технологий (CGATS) при Американском институте национальных стандартов (ANSI) и основывается на спецификации Adobe формата PDF. Фактически, это не один стандарт, а целых три: PDF/Х-1, PDF/Х-2, PDF/Х-3. Первоначальная редакция PDF/Х-1 (PDF/Х-1:1999, основана на спецификации PDF 1.2) исключала использование цветов RGB, аннотаций, полей электронных форм и комментариев. Это упростило процедуру приёма PDF и сократило время запуска их в работу, гарантировав надлежащее качество.

Паспорт документа: к печати годен!

Редакция PDF/Х-1:2001 появилась после выхода Acrobat 4 и стала поддерживать возможности новой спецификации PDF 1.3. Самая поздняя из семейства PDF/Х-1 — редакция PDF/Х-1а, в ней запрещено использование OPI (Open Prepress Interface) и шифрование (encryption). Таким образом, PDF/Х-1 является базовым форматом, принятым издательской индустрией в качестве стандарта.

Настройки параметров PDF/X-1а в Enfocus PitStop

Но жизнь вносит свои коррективы… Дело в том, что поддержка исключительно CMYK и Duotone накладывает определённые ограничения на применение PDF/Х-1а. Многие, особенно крупные издательства, предпочитают изображения в модели sRGB. Тогда, в отличие от CMYK (строго привязанного к определённому типу бумаги, растискиванию растровой точки и прочим меняющимся параметрам), при помощи ICC-профилей можно учитывать особенности допечатных и печатных процессов, следовательно, при любых условиях получать оттиски наилучшего качества.

Эти поправки и составили основу стандарта PDF/Х-2, который отличается от предшественника гораздо меньшей «дисциплинированностью». Он поддерживает цветовую модель LAB, управление цветом с помощью профилей ICC, разрешает применение OPI и даже допускает отсутствие внедрённых шрифтов. Базируясь на спецификации PDF 1.4, позволяет использовать полупрозрачные объекты.

В общем, получился довольно гибкий формат, ориентированный исключительно на профессионалов. Однако «техника в руках дикаря — груда металла». Представив, сколько проблем возникнет, когда он попадёт к не самым компетентным людям, учёные мужи разработали промежуточный вариант между PDF/Х-2 и PDF/Х-1а (ближе к последнему). Кроме возможностей, поддерживаемых PDF/Х-1 (и, конечно же, прозрачности), по стандарту PDF/Х-3 позволено использовать палитру LAB с цветокорректирующими профилями. Поскольку утверждён совсем недавно, он только начинает распространяться.

Создание PDF/X

Самый удобный способ создать PDF/X-совместимый документ — использовать Acrobat 6.0 Professional. Acrobat Distiller может создавать файлы по стандартам PDF/X1-a и PDF/X-3 (необходимый тип выбирается из предустановок программы Adobe PDF Settings). В процессе создания файлов Distiller проверяет полученный PostScript на соответствие принятым нормам. При полном их соблюдении в документ дописывается соответствующая информация. Если PDF, удовлетворяющий выбранному стандарту, из PostScript создать невозможно, Distiller прекращает работу и в отчёте (log file) перечисляет все обнаруженные проблемы.

Кроме Adobe, продукты, создающие PDF/X-совместимые документы, выпустили все известные игроки рынка: Agfa (Apogee Series 3), Apago, Callas, CGS, Creo, Dalim, Fujidilm, Global Graphics и Heidelberg.

Удостовериться, что перед вами действительно PDF, получивший «добро» на печать, можно в Acrobat. Например, при использовании его пятой версии и Enfocus PitStop достаточно зайти в меню Certified PDF/Show Status. У Acrobat 6.0 Professional соответствующая информация находится в Document/Preflight/Validate.

Несмотря на то, что формирование PDF согласно новым спецификациям гарантирует корректное цветоделение, от некачественного результата PDF/X не убережёт (низкое разрешение, ошибки с overprint и т. п.). Поэтому анализ файлов средствами предварительной проверки — такая же неотъемлемая процедура, как и для любых других, подготовленных к выводу.

В Acrobat 6.0 Professional проверка выполняется из меню Document/Preflight. Сначала выбирается определённый профиль, а после завершения инспекции появляется окно с её результатами. Объект, вызвавший проблему (пометки красными символами), можно просмотреть, дважды щёлкнув на её описании. При этом Acrobat перейдёт на необходимую страницу и вокруг некорректного элемента появится красная прерывистая рамка. Если проблем не обнаружено, тут же из исходного файла можно сделать PDF/X-совместимый (Save as PDF/X). Затем желательно готовый файл снабдить сертификатом подлинности (Validate) — это избавит персонал сервисного бюро от траты времени на его очередную инспекцию. В файл дописывается информация о результатах проверки, выбранном профиле и дате проверки.

Выводы

PDF/X, являясь подмножеством PDF, обезопасит всех участников технологической цепочки допечатной подготовки от гипотетической головной боли. Он должен придти на смену существующему способу генерации PDF, когда сервисные бюро сохраняют требуемые настройки Distiller (Job options) в виде файла (*.joboptions) и затем распространяют их всем клиентам, ориентирующимся на использование этого формата. О широких перспективах PDF/X свидетельствует тот факт, что в недавно вышедшем Adobe InDesign CS уже присутствуют опции для создания публикаций по обеим спецификациям (PDF/Х-1а и PDF/Х-3).

Электронный документооборот: Word DOC или PDF?

Использование электронных документов в работе любой компании – прекрасная возможность не только снизить затраты на канцелярские товары и расходные материалы для принтеров, но и существенно ускорить обмен информацией с филиалами и партнерами путем пересылки файлов через Интернет. Однако процесс реализации электронного документооборота и безбумажного офиса связан со многими трудностями. Так, например, большую сложность представляет собой выбор подходящего формата, который ляжет в основу реализуемой системы. Дело в том, что сегодня существует множество различных текстовых форматов и их модификаций, и у каждого есть свои достоинства и недостатки.

Word Document и PDF – старые соперники

Наиболее часто для работы с документами используется формат Word Document (файлы с расширением .doc). Это стандартный формат файлов, создаваемых с помощью программы Microsoft Word. Его популярность полностью обусловлена популярностью данного текстового процессора. История формата Word Document началась вместе с программой Microsoft Word, в то время обычного редактора для создания текстов. С тех пор каждая новая версия Microsoft Word приносила с собой новую версию формата, которая не очень сильно, но все-таки отличалась от предыдущей. Причем компания Microsoft не заботилась об обратной совместимости. Это значит, что файл, созданный и отформатированный в последней версии редактора Word, во всех предыдущих может выглядеть иначе.

Еще одной особенностью формата Word Document является его закрытость. Разрабатывала его компания Microsoft специально для использования в своем текстовом процессоре, а поэтому он является ее собственностью. Спецификации формата Word Document не разглашаются. Доступ к ним имеют лишь официальные партнеры корпорации Microsoft, а также правительства некоторых государств. Исключением является спецификация формата документов Microsoft Word 97, которая в 1998 году была опубликована в составе Microsoft Office Development Office 97 Documentation. Из-за этой закрытости очень сложно следить за развитием формата Word Document. Известно лишь то, что долгое время никаких принципиальных изменений в нем не происходило. И только в Microsoft Office 2007 появился новый формат Word Document, основанный на технологии XML.

Другим распространенным форматом для хранения электронных документов является формат PDF (Portable Document Format). Он был разработан компанией Adobe Systems. Главной его целью было представление в электронном виде любой полиграфической продукции. Впервые он был представлен общественности в 1991 году, а уже в 1992 на выставке Comdex Fall получил звание “best of Comdex”. С тех пор формат PDF довольно сильно изменился. В 1994, 1996, 1999 и 2001 годах выходили его новые версии, в каждой из которых вводилась поддержка новых функций, таких как внешние линки, потоки статей, машинонезависимые цвета, цветовое пространство CMYK, растрирование и оверпринт, ICC-цвета, 2-байтные CID-шрифты и многое, многое другое.

Главное отличие формата PDF – машино- и платформонезависимость. Это значит, что любой документ данного формата может быть открыт на компьютере, работающем под управлением любой операционной системы (с помощью соответствующего программного обеспечения), и при этом будет выглядеть точно так же, как и на том ПК, на котором он создавался. Это – главное преимущество формата PDF. Благодаря нему документы такого типа гораздо более практичны как для создания электронного архива для внутреннего использования компании, так и для обмена информацией с партнерами и удаленными филиалами.

Электронный документооборот: Word Document или PDF?

Весь процесс работы с электронными документами можно разделить на три основных этапа – создание, пересылка (передача ответственным лицам, публикация и т.п.) и хранение. На первом из них формат Word Document имеет явное преимущество, т.к. редактирование PDF документов затруднительно. Текстовый процессор Microsoft Word – явный лидер в области программного обеспечения, использующегося для создания документов, который установлен практически на каждом офисном компьютере. Он прост в использовании, обладает широкими функциональными возможностями и давно уже превратился в стандарт “де-факто”. В то же время полноценных редакторов для создания PDF-файлов просто-напросто не существует. Даже профессиональные версии ПО Adobe Acrobat позволяют вносить лишь минимальные изменения в уже существующий документ (например, заполнить анкету, добавить комментарий и т.п.). То есть для того, чтобы создать PDF файл необходимо сначала создать его в любом другом формате, а потом уже конвертировать его в PDF с помощью какого-либо программного обеспечения. Естественно, для конечного пользователя это не очень удобно.

А вот на следующем этапе все преимущества, наоборот, оказываются на стороне формата PDF. Давайте рассмотрим их подробнее.

Во-первых, это, конечно же, платформонезависимость. Не важно, какие компьютеры стоят в офисах ваших партнеров и под управлением каких операционных систем они работают. Не важно, какое у них установлено программное обеспечение для чтения PDF-файлов. В любом случае они смогут увидеть и при необходимости распечатать документы именно в том виде, в каком нужно. В то время как при использовании формата Word Document очень желательно, чтобы обе стороны обмена использовали одну и ту же версию ПО. Говоря откровенно, проблема с версиями программ для чтения файлов актуальна и для формата PDF. Однако нужно учитывать, что это ПО бесплатно. А поэтому новую версию в случае необходимости всегда можно загрузить из Интернета.

Вторым преимуществом формата PDF является бесплатность программ для просмотра файлов, сохраненных в нем. Любой человек или любая компания может совершенно свободно скачать из Интернета программу Acrobat Reader и использовать ее для работы с электронными документами. Особенно это хорошо в том случае, когда необходим односторонний обмен информацией.

Третьим преимуществом формата PDF при передаче файлов партнерам или клиентам компании является безопасность. Дело в том, что документы, созданные в Microsoft Word, часто становятся переносчиками различных вирусов. Кроме того, иногда в электронных документах необходимо использовать встроенную защиту от несанкционированного доступа. И в этом плане формат PDF имеет некоторое преимущество, поскольку его спецификация была исследована многими независимыми разработчиками ПО и экспертами в области информационной безопасности, которые подтвердили отсутствие уязвимостей и специально оставленных “дыр”.

Есть у формата PDF еще одно, четвертое преимущество. Дело в том, что он стандартизован ISO (International Organization for Standardization) для архивного хранения электронных документов и для обмена компаниями информацией друг с другом. Кроме того, представители Adobe заявили, что собираются передать спецификацию последней версии своего формата общественной организации Association for Information and Image Management (AIIM), которая намерена продвинуть ее в качестве общего международного стандарта для реализации электронного документооборота. В том случае, если это осуществиться (а вероятность такого развития событий велика), использование технологии PDF для электронного документооборота, будет регламентировано по всему миру.

Все эти преимущества формата PDF актуальны и для третьего этапа документооборота, а именно, для хранения электронных документов. Таким образом, налицо весьма интересная ситуация. С одной стороны, создавать документы придется в формате Word Document, т.к. создать PDF-документ сразу невозможно. Но передавать и хранить документы удобнее в формате PDF. Можно, конечно, выбрать какую-то одну технологию и смириться с ее недостатками. Но лучше все-таки использовать комбинированный документооборот: создавать файлы в формате Word Document, а перед их отправкой или передачей в архив, конвертировать в PDF. Такой подход позволяет использовать все плюсы обеих технологий и избежать их минусов. А поэтому перед компаниями часто возникает задача по конвертированию файлов из формата DOC в формат PDF.

Конвертирование Word Document в PDF? Запросто!

Решая задачу конвертирования документов из формата Word Document в формат PDF на корпоративном уровне, в первую очередь необходимо думать об удобстве конечных пользователей. Этот процесс должен быть максимально автоматизированным, чтобы сотрудник мог осуществлять его буквально нажатием на одну кнопку. Наглядным примером такого решения является продукт Universal Document Converter. По сути, он представляет собой виртуальный принтер. Это значит, что после установки данного программного обеспечения в операционной системе появляется ещё одно “печатающее устройство”. Оно доступно из любых приложений, в том числе, и из Microsoft Word. Отправляя документ на этот виртуальный принтер, пользователь инициирует процесс конвертирования. Такой подход позволяет минимизировать временные затраты сотрудников компании, а, значит, и финансовые затраты самой компании, на преобразование файлов из формата Word Document в формат PDF.

Иногда в компаниях возникает необходимость массового конвертирования документов из формата Word Document в формат PDF. Для решения такой задачи можно последовательно открывать файлы один за другим и распечатывать их на виртуальном принтере. Однако это очень неудобно и отнимает много времени. Поэтому для существенного ускорения процесса массового конвертирования можно воспользоваться любой утилитой пакетной печати, например, программой PrintConductor. Принцип ее работы очень прост. Пользователю необходимо только задать список документов, которые нужно распечатать, и устройство, на котором это необходимо сделать. Естественно, если в качестве принтера будет указан виртуальный принтер Universal Document Converter, то в результате мы получим пакетное конвертирование файлов из формата Word Document в формат PDF.

Таким образом, благодаря недорогому (а утилита PrintConductor вообще бесплатна) и максимально простому в использовании программному обеспечению любая компания может использовать все преимущества форматов Word Document и PDF и отказаться от их недостатков.

Что такое PDF файл? Преимущества и недостатки PDF

Загружая документ из Интернета, вы можете заметить, что он имеет формат .PDF. Возможно, вы также заметили, что его трудно (если вообще возможно) редактировать. Чтобы открыть файл .PDF формата нужно иметь специальную программу, например Adobe Acrobat Reader. Иногда пользователи путаются, какой формат выбрать. Почему люди используют PDF файлы? Разве не проще пользоваться .DOC или .DOCX форматами?

На самом деле, формат .PDF широко распространен для передачи различного рода документов и электронных книг. Почему так произошло? Давайте разберемся, что такое PDF файл, и узнаем его плюсы и минусы.

Преимущества PDF файлов

Давайте вернемся к вопросу “Что лучше, PDF или DOCX?”. DOCX — отличный формат для пользователей, которые используют Microsoft Office на своих устройствах. DOCX это стандартный формат документов Microsoft Word. Но если кто-то открывает ваш файл, на его компьютере должен быть установлен текстовый редактор от MS, или другая программа, которая умеет работать с этим форматом. Хотя и большинство альтернатив MS Office могут конвертировать .DOC в нужный формат, этот процесс иногда изменяет оригинальное форматирование и создает лишние хлопоты.

К счастью, большинство операционных систем полностью поддерживают PDF файлы. Это значит, что вам не нужно создавать документ специально для пользователей Windows, MacOS, Linux, IOS, или Android. Просто выберите PDF и будьте уверены, что он откроется на любом устройства.

Когда стоит использовать .PDF формат?

В ситуациях, когда вы не знаете, на какой операционной системе будет открываться файл, используйте PDF. Скажем, вы решили выложить на сайт книгу, журнал, брошюру, или какой-либо важный документ. На сайт могут заходить люди с компьютеров под управлением Windows, Linux или владельцы смартфонов на IOS или Android. Лучшим вариантом в данном случае будет использование .PDF формата. Каждое устройство сможет его открыть и отобразить содержимое.

Еще лучше, если после загрузки документа, он автоматически открывается через браузер. Популярные браузеры, такие как Google Chrome (это одна из малоизвестных функций Chrome) или Mozilla Firefox имеют встроенные PDF-просмотрщики, потому люди могут просмотреть документ просто и быстро.

Отдавайте преимущество PDF файлам при отправке по Email. Представим, что вы отправляете резюме. Хорошо, если получатель проверяет почту с компьютера, и может открыть .DOCX файл. А если нет? Со смартфона или планшета проще открыть .PDF ежели .DOC.

Недостатки .PDF формата

Получив файл, вы можете захотеть изменить его, но тут кроется одна из основных проблем PDF файлов — их сложно редактировать. Если DOC файл это оригинальный текстовый документ, который можно легко изменять, то PDF больше напоминает изображение. Редактирование возможно, но для этого нужен просмотрщик со встроенной функцией редактирования, или соответствующая программа.

Когда не нужно использовать PDF

Не используйте формат .PDF, когда вы хотите иметь “живой документ”, который может быть отредактирован другими пользователями. Вы можете добавить редактируемые поля в PDF документ, но полное редактирование требует немалых усилий. Если вы работаете с другими пользователями, желательно узнать, какие операционные системы они используют и договориться о типе файлов, который подходит всем.

По крайней мере, каждый может использовать облачную службу документов, например Google Docs. Для режима “только чтение” хорошо подойдет PDF, а для редактирования — его использовать не стоит.

Итог

Теперь вы знаете, что такое PDF файл, в каких случаях его стоит использовать, а которых лучше подойдет .DOC. Прежде чем создавать документ, подумайте о тех, кто будет им пользоваться. Желаю удачи.

Источник: www.maketecheasier.com

Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter.

Что такое файл PDF?

Урок 8: Что такое файл PDF?

/ ru / базовые-компьютерные-навыки / ПО с открытым исходным кодом и с закрытым исходным кодом / контент /

Что такое файл PDF?

Adobe PDF файлов — сокращенно для формата переносимых документов . файлов — сегодня являются одним из наиболее часто используемых типов файлов. Если вы когда-либо загружали форму или документ для печати из Интернета, например налоговую форму IRS, велика вероятность, что это был файл PDF. Каждый раз, когда вы видите файл, заканчивающийся на .pdf , это означает, что это файл PDF.

Зачем нужны файлы PDF?

Допустим, вы создаете информационный бюллетень в Microsoft Word и публикуете его в виде файла .docx , который является форматом файлов по умолчанию для документов Word. Если на компьютерах всех не установлен Microsoft Word, нет гарантии, что они смогут открывать и просматривать информационный бюллетень. А поскольку документы Word предназначены для редактирования, есть вероятность, что некоторые форматирование и текст в вашем документе могут быть смещены.

Напротив, файлы PDF в первую очередь предназначены для просмотра , а не для редактирования . Одна из причин их популярности заключается в том, что PDF-файлы могут сохранять форматирование документа , что делает их более доступными для совместного использования и помогает им выглядеть одинаково на любом устройстве. Распространение информационного бюллетеня в виде файла PDF поможет гарантировать, что каждый сможет просматривать его так, как вы хотели.

Открытие файлов PDF

Открыть и просмотреть файл PDF довольно просто. Большинство современных веб-браузеров открывают файлы PDF прямо в окне вашего браузера , а не загружают их на ваш компьютер.Если ваш браузер не может этого сделать, он должен предложить вам загрузить файл. Попробуйте щелкнуть эту ссылку, чтобы увидеть, как она работает на вашем компьютере.

Если вам нужно просмотреть файл PDF только один раз, обычно проще всего открыть его в веб-браузере. Если вам понадобится доступ к PDF-файлу позже, вы захотите сохранить копию на свой компьютер. Этот процесс будет зависеть от вашего веб-браузера, но в приведенном ниже примере кнопка Сохранить PDF находится в правом верхнем углу.

Если файл PDF уже находится на вашем компьютере, вы можете просто дважды щелкнуть , чтобы открыть его. с помощью приложения PDF по умолчанию.

Если на вашем компьютере используется Windows 7 или более ранняя версия, вам может потребоваться загрузить бесплатную программу просмотра PDF (например, Adobe Reader), прежде чем вы сможете просматривать файлы PDF.

Редактирование файлов PDF

Как мы упоминали ранее, PDF-файлы в первую очередь предназначены для просмотра, а не редактирования. Однако могут быть случаи, когда вы сталкиваетесь с PDF-файлом, который позволяет вам ввести определенную информацию, например имя и адрес. В этих PDF-файлах используется специальная функция, называемая полей формы , которая позволяет вам вводить новую информацию в документ и сохранять изменения.Например, этот PDF-файл содержит несколько полей формы для ввода вашего имени, адреса и другой информации.

Эта функция поддерживается не всеми веб-браузерами, поэтому вам может потребоваться загрузить PDF-файл, прежде чем вы сможете использовать поля формы для добавления информации.

Также могут быть случаи, когда вы хотите сделать маленьких правок в файлы PDF, например, добавление комментария или выделение текста. Чтобы узнать больше о редактировании PDF-файлов, ознакомьтесь с нашим уроком о том, как редактировать и объединять PDF-файлы.

Создание файлов PDF

Существует несколько способов создания файлов PDF, но метод во многом зависит от используемого вами устройства. Например, если вы используете Windows 10, вы можете перейти в диалоговое окно «Печать» , затем выбрать PDF из списка принтеров наверху . Это позволяет вам создавать PDF-файлы из всего, что вы обычно можете распечатать, включая документы, электронные письма и веб-страницы.

Если вы работаете на Mac, в диалоговом окне «Печать» есть меню PDF, которое позволяет сохранить файл в формате PDF.

Если на вашем компьютере установлена ​​Windows 8 или более ранняя версия, у вас есть несколько вариантов. Самый простой способ — использовать программное обеспечение, которое поддерживает экспорт PDF , например Microsoft Office или Google Chrome.

Другой вариант — использовать конвертер PDF , например Smallpdf, бесплатное приложение, которое запускается в вашем веб-браузере. Smallpdf может преобразовывать различные типы файлов , например, документы Microsoft Office , в формат PDF.

Хорошо, это основы файлов PDF!

/ ru / basic-computer-skills / how-to-set-up-a-wifi-network / content /

Что такое файл PDF (и как его открыть)?

Файл с расширением.pdf — это файл в формате Portable Document Format (PDF). PDF-файлы обычно используются для распространения документов только для чтения, сохраняющих макет страницы. Они обычно используются для таких документов, как руководства пользователя, электронные книги, формы приложений и отсканированные документы, и это лишь некоторые из них.

Что такое файл PDF?

PDF был создан Adobe в 1990-х годах для достижения двух целей. Во-первых, люди должны иметь возможность открывать документы на любом оборудовании или в любой операционной системе, без необходимости использовать приложение для их создания — все, что вам нужно, это программа для чтения PDF-файлов, и в наши дни большинство веб-браузеров отвечают всем требованиям.Во-вторых, где бы вы ни открывали PDF-файл, макет документа должен выглядеть одинаково.

PDF-файлы

могут содержать текст, изображения, встроенные шрифты, гиперссылки, видео, интерактивные кнопки, формы и многое другое.

Как просмотреть файл PDF

Поскольку PDF-файлы являются стандартизированным форматом, существует значительное количество приложений, которые могут открывать PDF-файлы. Веб-браузеры, официальный Adobe Acrobat Reader, сторонние приложения и даже текстовые редакторы.

Самый простой способ просмотра PDF-файлов: используйте веб-браузер

Скорее всего, если вы читаете эту статью, используемый вами веб-браузер поддерживает просмотр PDF-файлов, и это в основном то же самое в macOS и Windows.

Если у вас нет другого приложения, которое может читать PDF-файлы, скорее всего, ваш браузер уже является приложением по умолчанию, и вы можете просто дважды щелкнуть файл, чтобы открыть его.

Если нет, щелкните файл правой кнопкой мыши, выберите меню «Открыть с помощью» и щелкните свой любимый браузер.

Результаты аналогичны результатам любой другой программы.

Для большего контроля и лучшей поддержки функций: используйте настольное устройство чтения

Adobe Acrobat Reader — это официальный инструмент для чтения PDF-файлов.Это бесплатно и доступно для Windows, macOS, iOS и Android.

После установки Acrobat Reader все, что вам нужно сделать, это дважды щелкнуть любой PDF-файл, который вы хотите открыть.

И, как видите, у него гораздо больше функций для управления просмотром, а также возможность экспортировать PDF-файлы в редактируемый формат, такой как документ Microsoft Office.

Конечно, существуют также сторонние приложения для просмотра файлов PDF, некоторые из которых работают быстрее и менее объемны, чем Adobe Reader.

СВЯЗАННЫЙ: Лучшие программы для чтения PDF-файлов для Windows

Как редактировать PDF

Если вам нужно отредактировать PDF-файл, но оставить его в формате PDF, ваши возможности ограничены. Золотым стандартом здесь является собственный Acrobat DC от Adobe. К сожалению, это довольно дорого. Стандартная версия стоит 12,99 долларов в месяц и требует ежегодных обязательств. Он также доступен только для Windows. Профессиональная версия стоит 14,99 долларов в месяц, а также требует ежегодных обязательств.Этот доступен как для Windows, так и для macOS.

Для версии Pro доступен семидневный бесплатный пробный период, поэтому, если вам нужно отредактировать только один или два документа, это может сработать для вас.

Есть также несколько бесплатных утилит. Наш фаворит — PDF-XChange Editor, который позволяет вам делать базовые правки и аннотации.

Как создать PDF

Есть несколько способов создать PDF-файл практически из чего угодно — документов Word, веб-страниц и так далее.

Начнем с того, что и Windows, и macOS позволяют «печатать» в файл PDF. Итак, почти все, что вы можете распечатать, вы можете сохранить в формате PDF.

СВЯЗАННЫЙ: Как создать файл PDF в Windows

СВЯЗАННЫЙ: Как создать файл PDF на Mac

Некоторые приложения, например Chrome, также имеют собственные встроенные принтеры PDF.

Если вам нужно больше контроля над тем, как будут выглядеть ваши PDF-файлы (например, если вы готовите что-то для профессиональной печати), вам придется обратиться к Adobe Acrobat DC.

Как преобразовать PDF в нечто редактируемое

Вы также можете преобразовать PDF в какой-либо другой формат файла, который вам будет легче редактировать.

Как правило, вам нужно преобразовать PDF-файл во что-то, с чем может справиться ваш текстовый редактор. У нас уже есть отличные статьи о преобразовании PDF-файлов в Microsoft Word или Google Docs, так что прочтите их, если это то, что вам нужно. Даже если вы используете другой текстовый процессор, он должен уметь обрабатывать любой из этих форматов после преобразования.

Единственная проблема с преобразованием документов с помощью встроенных инструментов Word или Google заключается в том, что иногда у них могут возникнуть трудности с поддержанием сложного форматирования и разметки. Если у вас есть PDF-файл, соответствующий этим требованиям, вы можете попробовать Adobe Acrobat Reader DC. Хотя приложение бесплатное, вам нужно платить 1,99 доллара в месяц, если вы хотите, чтобы оно могло конвертировать PDF-файлы в другие форматы, такие как Word. Если это то, что вам нужно делать регулярно, эта плата, вероятно, того стоит, потому что использование Acrobat — самый надежный способ преобразовать ваши PDF-файлы в документы Word, поскольку он имеет тенденцию довольно хорошо поддерживать форматирование.И, конечно же, полная версия Acrobat DC также может выполнять эту работу, но это не стоит дополнительных затрат, если все, что вам нужно сделать, это преобразовать документы.

Есть также некоторые инструменты онлайн-преобразования, которые вы можете использовать, если ни один из них не соответствует вашим потребностям. Поскольку эти решения являются облачными и позволяют конвертировать любой PDF-файл без необходимости устанавливать программное обеспечение на свой компьютер. Однако важно помнить, что в процессе вы должны загрузить свой документ на их серверы, поэтому, если ваш документ содержит конфиденциальную информацию, вы можете пропустить этот шаг.

Zamzar — один из самых популярных сайтов для конвертации файлов в Интернете, и он хорошо нам зарекомендовал себя. Их бесплатный сервис позволяет конвертировать любой файл размером до 100 МБ. После загрузки и выбора формата, в который вы хотите его преобразовать, документ будет отправлен вам по электронной почте со ссылкой для загрузки.

Еще одним преимуществом использования Zamzar является то, что он поддерживает огромное количество форматов, в которые вы можете конвертировать, включая различные форматы документов, изображений и даже электронных книг.

PDF (формат переносимого документа) Определение

означает «Формат переносимого документа».«PDF — это формат файлов, предназначенный для единообразного представления документов на различных устройствах и платформах. Он был разработан Adobe в 1992 году и с тех пор стал одним из наиболее широко используемых форматов для сохранения и обмена документами.

Файл PDF может хранить широкий спектр данных, включая форматированный текст, векторную графику и растровые изображения. Он также содержит информацию о макете страницы, которая определяет расположение каждого элемента на странице, а также размер и форму страниц в документе.Вся эта информация сохраняется в стандартном формате, поэтому документ выглядит одинаково, независимо от того, какое устройство или программа используется для его открытия. Например, если вы сохраните PDF-файл на Mac, он будет выглядеть так же в Windows, Android и iOS.

Формат PDF также поддерживает метаданные, такие как название документа, автор, тема и ключевые слова. Он может хранить встроенные шрифты, поэтому вам не нужно устанавливать соответствующие шрифты для правильного просмотра документа. PDF-документы также могут быть зашифрованы, поэтому только авторизованные пользователи могут их открывать.

Создание и просмотр PDF-файлов

PDF-файлов редко создаются с нуля. Вместо этого они обычно создаются из существующего документа. Например, вы можете сохранить документ Word в формате PDF или отсканировать бумажную копию и сохранить ее в формате PDF. Хотя формат PDF изначально был проприетарным, Adobe открыла его другим разработчикам, поэтому многие программы теперь включают опцию «Сохранить как PDF» или «Экспорт в PDF». macOS предоставляет функцию «Сохранить как PDF» в стандартном диалоговом окне «Печать», поэтому вы можете сохранить любой документ для печати в формате PDF.

Для просмотра PDF-файлов можно использовать Adobe Reader или любую программу или дополнительный модуль, поддерживающий формат PDF. Вы можете редактировать PDF-файлы с помощью Adobe Acrobat или стороннего редактора PDF. Например, многие редакторы включают функцию «Заполнить и подписать», которая позволяет заполнять поля и подписывать документ. Программы, поддерживающие OCR, позволяют сканировать документ в цифровом виде на наличие текста, а затем редактировать или удалять его. Вы также можете добавлять изображения и блоки текста в PDF. Большинство редакторов PDF также позволяют объединить несколько PDF-файлов в один документ.

ПРИМЕЧАНИЕ: Поскольку формат Portable Document Format предназначен для обмена, возможности редактирования PDF ограничены по сравнению с другими форматами. Поэтому при разработке документа лучше всего создать его с помощью редактора, такого как Microsoft Word, CorelDRAW или Adobe InDesign, а затем сохранить документ как PDF.

Обновлено: 5 апреля 2018 г.

TechTerms — Компьютерный словарь технических терминов

Эта страница содержит техническое определение PDF. Он объясняет в компьютерной терминологии, что означает PDF, и является одним из многих терминов о форматах файлов в словаре TechTerms.

Все определения на веб-сайте TechTerms составлены так, чтобы быть технически точными, но также простыми для понимания. Если вы сочтете это определение PDF полезным, вы можете сослаться на него, используя приведенные выше ссылки для цитирования. Если вы считаете, что термин следует обновить или добавить в словарь TechTerms, отправьте электронное письмо в TechTerms!

Подпишитесь на информационный бюллетень TechTerms, чтобы получать избранные термины и тесты прямо в свой почтовый ящик. Вы можете получать электронную почту ежедневно или еженедельно.

Подписаться

Что такое файл PDF (и как его открыть)

В этой статье объясняется, что такое PDF-файлы, как их открывать, а также все способы их преобразования в другой формат, например изображение или редактируемый файл, который вы можете использовать в Word или Excel, а также как защитить паролем один или удалить пароль.

Что такое файл PDF?

Файл с расширением .PDF, разработанный Adobe, является файлом Portable Document Format.

Файлы PDF могут содержать не только изображения и текст, но также интерактивные кнопки, гиперссылки, встроенные шрифты, видео и многое другое.

Вы часто увидите руководства по продуктам, электронные книги, листовки, заявления о приеме на работу, отсканированные документы, брошюры и всевозможные другие документы, доступные в формате PDF. Веб-страницы можно даже сохранять в PDF-файлах в их полном форматировании для дальнейшего использования.

Поскольку PDF-файлы не зависят от программного обеспечения, которое их создало, ни от какой-либо конкретной операционной системы или оборудования, они выглядят одинаково независимо от того, на каком устройстве они открыты.

Как открыть файл PDF

Большинство людей сразу обращаются к Adobe Acrobat Reader, когда им нужно открыть PDF-файл. Adobe создала стандарт PDF, и его программа, безусловно, является самой популярной бесплатной программой для чтения PDF-файлов. Это совершенно нормально для использования, но мы считаем, что это несколько раздутая программа с множеством функций, которые вам, возможно, никогда не понадобятся или которые вы не захотите использовать.

Большинство веб-браузеров, например Chrome и Firefox, могут сами открывать PDF-файлы. Для этого вам может потребоваться надстройка или расширение, а может и не потребоваться, но очень удобно, чтобы они открывались автоматически, когда вы щелкаете ссылку PDF в Интернете.

Мы настоятельно рекомендуем SumatraPDF, Slim PDF Reader или MuPDF, если вам нужно что-то с немного большим количеством функций; все трое бесплатны. Смотрите наш список лучших бесплатных программ для чтения PDF-файлов, чтобы узнать о дополнительных возможностях.

Как редактировать файл PDF

Adobe Acrobat — самый популярный редактор PDF, но Microsoft Word тоже сделает это.Существуют и другие редакторы PDF, например PhantomPDF и Nitro Pro.

PDFescape, DocHub и PDF Buddy — это несколько бесплатных онлайн-редакторов PDF, которые позволяют очень легко заполнять формы, подобные тем, которые вы иногда видите в заявлении о приеме на работу или в налоговой форме. Просто загрузите свой PDF-файл на веб-сайт, чтобы делать такие вещи, как вставка изображений, текста, подписей, ссылок и т. Д., А затем загрузите его обратно на свой компьютер в виде PDF-файла.

Аналогичный онлайн-редактор PDF под названием Fill отлично подходит, если вам просто нужно добавить подпись к PDF.Он также поддерживает флажки, даты и обычный текст, но вы не можете редактировать существующий текст с его помощью или легко заполнять формы.

См. Наш список лучших бесплатных редакторов PDF, где вы найдете регулярно обновляемую коллекцию редакторов PDF, если вам нужно нечто большее, чем просто заполнение форм, например добавление или удаление текста или изображений из PDF-файла.

Сейда PDF редактор.

Если вы хотите извлечь часть файла PDF как собственный или разделить PDF-файл на несколько отдельных документов, есть несколько способов сделать это.Ознакомьтесь с нашими лучшими инструментами и методами для разделения PDF-файлов, чтобы получить всю необходимую помощь.

Как преобразовать файл PDF

Большинство людей, желающих преобразовать PDF-файл в какой-либо другой формат, заинтересованы в этом, чтобы они могли редактировать содержимое PDF-файла. Преобразование PDF означает, что он больше не будет .PDF и вместо этого откроется в программе, отличной от PDF-ридера.

Например, преобразование PDF-файла в файл Microsoft Word (DOC и DOCX) позволяет открывать файл не только в Word, но и в других программах для редактирования документов, таких как OpenOffice и LibreOffice.Использование этих типов программ для редактирования преобразованного PDF-файла, вероятно, является гораздо более удобным занятием по сравнению с незнакомым редактором PDF.

Если вместо этого вы хотите, чтобы файл, отличный от PDF, был файлом .PDF, вы можете использовать средство создания PDF . Эти типы инструментов могут принимать такие вещи, как изображения, электронные книги и документы Microsoft Word, и экспортировать их в формате PDF, что позволяет открывать их в PDF-формате или в программе для чтения электронных книг.

Сохранение или экспорт из какого-либо формата в PDF можно выполнить с помощью бесплатного средства создания PDF. Некоторые даже служат в качестве PDF-принтера, что позволяет практически «распечатать» практически любой файл в формате .PDF. На самом деле, это простой способ конвертировать в PDF что угодно. См. Раздел «Как печатать в PDF», чтобы полностью изучить эти параметры.

Печать веб-страницы в PDF в Chrome.

Некоторые программы по ссылкам выше можно использовать обоими способами, то есть вы можете использовать их для преобразования PDF-файлов в различные форматы, а также для создания PDF-файлов. Caliber — еще один пример бесплатной программы, которая поддерживает преобразование в формат электронных книг и обратно.

Кроме того, многие из упомянутых программ также могут объединять несколько PDF-файлов в один, извлекать определенные PDF-страницы и сохранять только изображения из PDF-файла.

EasePDF — это один из примеров онлайн-конвертера PDF в Word, который может сохранять файл в DOCX.

См. Как конвертировать файлы PDF в JPG, если вы хотите, чтобы ваш PDF-файл был просто изображением, что может быть удобно, если вы не уверены, есть ли у человека, которому вы отправляете PDF-файл, или он хочет его установить. читатель.

EasyPDF.com — еще один онлайн-конвертер PDF, который поддерживает сохранение PDF в различных форматах, чтобы он был совместим с Word, PowerPoint, Excel или AutoCAD. Вы также можете преобразовать страницы PDF в файлы GIF или в отдельный текстовый файл. PDF-файлы можно загружать из Dropbox, Google Диска или с вашего компьютера. CleverPDF — аналогичная альтернатива.

Еще одно преобразование, которое вы можете сделать, — это PDF в PPTX. Если вы используете PDFConverter.com для преобразования документа, каждая страница PDF-файла будет разделена на отдельные слайды, которые вы можете использовать в PowerPoint или любом другом программном обеспечении для презентаций, которое поддерживает файлы PPTX.

См. Эти бесплатные программы преобразования файлов и онлайн-службы, чтобы узнать о других способах преобразования файла PDF в другие форматы файлов, включая форматы изображений, HTML, SWF, MOBI, PDB, EPUB, TXT и другие.

Как защитить PDF-файл

Защита PDF-файла может включать требование пароля для его открытия, а также запрет на печать PDF-файла, копирование его текста, добавление комментариев, вставку страниц и многое другое.

Некоторые из создателей и конвертеров PDF, на которые есть ссылки сверху, а также другие, такие как PDFMate PDF Converter Free, PrimoPDF, FreePDF Creator, Soda PDF и FoxyUtils, являются одними из многих бесплатных приложений, которые могут изменять эти типы параметров безопасности.

Спасибо, что сообщили нам!

Расскажите, почему!

Другой Недостаточно подробностей Сложно понять

Формат файла PDF: базовая структура [обновлено в 2020 г.]

Все мы знаем, что существует ряд атак, при которых злоумышленник включает некоторый шелл-код в документ PDF. Этот шелл-код использует некоторую уязвимость в том, как документ PDF анализируется и представляется пользователю для выполнения вредоносного кода в целевой системе.

На следующем изображении показано количество уязвимостей, обнаруженных в популярной программе чтения PDF-файлов Adobe Acrobat Reader DC, выпущенной в 2015 году и ставшей единственной поддерживаемой версией Acrobat Reader после прекращения поддержки Acrobat XI в октябре 2017 года.Количество уязвимостей растет с годами. Наиболее важные уязвимости — это уязвимости выполнения кода, которые злоумышленник может использовать для выполнения произвольного кода в целевой системе (если Acrobat Reader еще не исправлен).

Рисунок 1: Уязвимости Adobe Acrobat Reader DC

Это важный показатель того, что мы должны регулярно обновлять нашу программу чтения PDF-файлов, поскольку количество недавно обнаруженных уязвимостей весьма устрашающе.

Структура файла PDF

Каждый раз, когда мы хотим обнаружить новые уязвимости в программном обеспечении, мы должны сначала понять протокол или формат файла, в котором мы пытаемся обнаружить новые уязвимости. В нашем случае мы должны сначала подробно разобраться в формате файла PDF. В этой статье мы рассмотрим формат файла PDF и его внутреннее устройство.

PDF — это переносимый формат документов, который можно использовать для представления документов, содержащих текст, изображения, мультимедийные элементы, ссылки на веб-страницы и многое другое.Он имеет широкий спектр функций. Спецификация формата файла PDF общедоступна здесь и может использоваться всеми, кто интересуется форматом файла PDF. Документация только по формату PDF составляет почти 800 страниц, так что читать ее — это не то, что нужно делать по прихоти.

PDF имеет больше функций, чем просто текст: он может включать изображения и другие мультимедийные элементы, быть защищенным паролем, выполнять JavaScript и так далее. Базовая структура файла PDF представлена ​​на рисунке ниже:

Рисунок 2: Структура PDF

Каждый PDF-документ содержит следующие элементы:

Заголовок

Это первая строка файла PDF, в которой указывается номер версии используемой спецификации PDF, которая используется в документе.Если мы хотим это выяснить, мы можем использовать шестнадцатеричный редактор или просто использовать команду xxd , как показано ниже:

[простой]
# xxd temp.pdf | head -n 1
0000000: 2550 4446 2d31 2e33 0a25 c4e5 f2e5 eba7% PDF-1.3.% ……
[/ plain]

В PDF-документе temp.pdf используется спецификация PDF 1.3. Символ «%» является комментарием в PDF, поэтому в приведенном выше примере первая и вторая строки фактически представляют собой комментарии, что верно для всех PDF-документов. Следующие байты взяты из вывода ниже: 2550 4446 2d31 2e33 0a25 c4e5 и соответствуют тексту ASCII «% PDF-1.3.% ». Ниже приведены некоторые символы ASCII, в которых используются непечатаемые символы (обратите внимание на точки ‘.’), Которые обычно используются, чтобы сообщить некоторым программным продуктам, что файл содержит двоичные данные и не должен рассматриваться как 7-битный ASCII. текст. В настоящее время номера версий имеют вид 1.N, где N находится в диапазоне 0-7.

Кузов

В теле документа PDF есть объекты, которые обычно включают в себя текстовые потоки, изображения, другие мультимедийные элементы и т. Д. Раздел «Тело» используется для хранения всех данных документа, показываемых пользователю.

таблица внешних ссылок

Это таблица перекрестных ссылок, которая содержит ссылки на все объекты в документе. Назначение таблицы перекрестных ссылок состоит в том, что она обеспечивает произвольный доступ к объектам в файле, поэтому нам не нужно читать весь документ PDF, чтобы найти конкретный объект. Каждый объект представлен одной записью в таблице перекрестных ссылок, которая всегда имеет длину 20 байт. Покажем пример:

[простой]
xref
0 1
0000000023 65535 f
3 1
0000025324 00000 n
21 4
0000025518 00002 n
0000025632 00000 n
0000000024 00001 f
0000000000 00001 f
36 1
0000026900 00000 n
[/ простой ]

Мы можем отобразить таблицу перекрестных ссылок документа PDF, просто открыв PDF-файл в текстовом редакторе и прокрутив его до конца документа.В приведенном выше примере мы видим, что у нас есть четыре подраздела (обратите внимание на четыре строки, содержащие только два числа). Первое число в этих строках соответствует номеру объекта, а вторая строка указывает количество объектов в текущем подразделе. Каждый объект представлен одной записью длиной 20 байт (включая CRLF).

Первые 10 байтов — это смещение объекта от начала документа PDF до начала этого объекта. Далее следует разделитель пробелом с другим числом, указывающим номер поколения объекта.После этого идет еще один разделитель пробела, за которым следует буква «f» или «n», чтобы указать, свободен ли объект или используется.

Первый объект имеет идентификатор 0 и всегда содержит одну запись с номером поколения 65535, которая находится в начале списка свободных объектов (обратите внимание на букву «f», которая означает «свободный»). Последний объект в таблице перекрестных ссылок использует номер поколения 0.

Второй подраздел имеет идентификатор объекта 3 и содержит один элемент, объект 3, который начинается со смещения 25324 байта от начала документа.Третий подраздел состоит из четырех объектов, первый из которых имеет идентификатор 21 и начинается со смещения 25518 от начала файла. Остальные объекты имеют следующие номера 22, 23 и 24.

Все объекты отмечены флажком «f» или «n». Флаг «f» означает, что объект все еще может присутствовать в файле, но помечен как свободный, поэтому его не следует использовать. Эти объекты содержат ссылку на следующий свободный объект и номер поколения, который будет использоваться, если объект снова станет действительным. Флаг «n» используется для представления действительных и используемых объектов, которые содержат смещение от начала файла и номер поколения объекта.

Обратите внимание, что нулевой объект указывает на следующий свободный объект в таблице, объект 23. Поскольку объект 23 также свободен, он сам указывает на следующий свободный объект в таблице, объект 24. Но объект 24 является последним свободным объектом в таблице. файл, так что он указывает обратно на нулевой объект. Если представить приведенную выше таблицу перекрестных ссылок с каждым номером объекта, она будет выглядеть следующим образом:

[простой]
xref
0 1
0000000023 65535 f
3 1
0000025324 00000 n
21 1
0000025518 00002 n
22 1
0000025632 00000 n
23 1
0000000024 00001 f
24 1
0000000000 00001 f
36 1
0000026900 00000 n
[/ простой]

Номер поколения объекта увеличивается, когда объект освобождается, поэтому, если объект снова становится действительным (изменяет флаг с «f» на «n»), номер поколения все еще действителен без необходимости его увеличения.Номер поколения объекта 23 равен 1, поэтому, если он снова станет действительным, номер поколения по-прежнему будет 1, но если он снова будет удален, номер поколения увеличится до 2.

Множественные подразделы обычно присутствуют в документах PDF, которые были постепенно обновлены, в противном случае должен присутствовать только один подраздел, начинающийся с нуля.

Прицеп

Трейлер PDF определяет, как приложение, читающее документ PDF, должно найти таблицу перекрестных ссылок и другие специальные объекты.Все программы чтения PDF-файлов должны начинать чтение PDF-файла с конца файла. Пример трейлера представлен ниже:
трейлер
& amp; lt; & amp; lt;
/ Размер 22
/ Корень 2 0 R
/ Информация 1 0 R
& amp; gt; & amp; gt;
startxref
24212
%% EOF
Последняя строка документа PDF содержит конец строки файла «%% EOF». Перед концом тега файла находится строка со строкой startxref , которая указывает смещение от начала файла до таблицы перекрестных ссылок.В нашем случае таблица перекрестных ссылок начинается со смещения 24212 байт. Перед этим находится строка трейлера , которая определяет начало раздела трейлера. Содержимое разделов трейлера заключено в символы << и >> (это словарь, который принимает пары ключ-значение).

Мы видим, что секция трейлера определяет несколько клавиш, каждая из которых предназначена для определенного действия. В разделе трейлера можно указать следующие ключи:

  • / Размер [целое число]: указывает количество записей в таблице перекрестных ссылок (включая также количество объектов в обновленных разделах).Используемый номер не должен быть косвенной ссылкой.
  • / Prev [целое число]: указывает смещение от начала файла до предыдущего раздела перекрестной ссылки, которое используется, если имеется несколько разделов перекрестных ссылок. Номер должен быть перекрестной ссылкой.
  • / Root [словарь]: указывает объект ссылки для объекта каталога документов, который представляет собой специальный объект, содержащий различные указатели на различные типы других специальных объектов (подробнее об этом позже).
  • / Encrypt [dictionary]: Задает словарь шифрования документа.
  • / Info [dictionary]: Определяет объект ссылки для информационного словаря документа.
  • / ID [массив]: Задает массив двухбайтовых незашифрованных строк, образующих идентификатор файла.
  • / XrefStm [integer]: указывает смещение от начала файла до потока перекрестных ссылок в декодированном потоке. Это присутствует только в файлах гибридных ссылок, которые указываются, если мы также хотим открывать документы, даже если приложения не поддерживают сжатые потоки ссылок.

Мы должны помнить, что первоначальная структура может быть изменена, если мы обновим документ PDF позже. Обновление обычно добавляет дополнительные элементы в конец файла.

Дополнительные обновления

PDF-файл был разработан с учетом инкрементальных обновлений, поскольку мы можем добавлять некоторые объекты в конец PDF-файла, не перезаписывая весь файл. Благодаря этому изменения в PDF-документе можно быстро сохранить. Новую структуру PDF-документа можно увидеть на картинке ниже:

Рисунок 3: Структура PDF

Мы видим, что документ PDF по-прежнему содержит исходный заголовок, тело, таблицу перекрестных ссылок и трейлер.Кроме того, в PDF-документ были добавлены другие разделы основного текста, перекрестных ссылок и трейлера. Дополнительные разделы перекрестных ссылок будут содержать только записи для объектов, которые были изменены, заменены или удалены. Удаленные объекты останутся в файле, но будут отмечены флажком «f». Каждый трейлер должен заканчиваться тегом «%% EOF» и содержать запись / Prev, которая указывает на предыдущий раздел перекрестных ссылок.

В PDF версиях 1.4 и выше мы можем указать запись версии в словаре каталога документа, чтобы заменить версию по умолчанию из заголовка PDF.

Пример

Давайте представим простой пример PDF и проанализируем его. Давайте загрузим отсюда образец PDF-документа и проанализируем его. При открытии этого PDF-документа он выглядит, как показано ниже:

Рисунок 4: PDF-документ, образец

Перекрестные ссылки и концевые разделы представлены на картинке ниже:

Рисунок 5: Перекрестная ссылка и разделы прицепа

Раздел с перекрестными ссылками был уменьшен для ясности.Раздел перекрестных ссылок содержит один подраздел, который содержит 223 объекта. Раздел трейлера начинается со смещения байта 50291, включает 223 объекта, где корневой элемент указывает на объект 221, а информационный элемент указывает на объект 222.

В следующем разделе мы рассмотрим основные типы данных структуры PDF.

Типы данных PDF

PDF-документ содержит восемь основных типов объектов, описанных ниже. Эти типы: логические, числа, строки, имена, массивы, словари, потоки и нулевой объект.Объекты могут быть помечены, чтобы на них могли ссылаться другие объекты. Помеченный объект также называется косвенным объектом.

Логические

Есть два ключевых слова: истина, и ложь, , которые представляют логические значения.

Номера

В документе PDF есть два типа чисел: целые и действительные. Целое число состоит из одной или нескольких цифр, которым может предшествовать знак плюс или минус. Пример целочисленных объектов можно увидеть ниже:

Действительное значение может быть представлено одной или несколькими цифрами, с дополнительным знаком и ведущей, конечной или встроенной десятичной точкой (точкой).Пример действительных чисел можно увидеть ниже:

  • 123,0 -123,0 +123,0 123. -,123

Имена

Имена в документах PDF представлены последовательностью символов ASCII в диапазоне 0x21 — 0x7E. Исключение составляют символы:%, (,), <,>, [,], {,}, / и #, которым должна предшествовать косая черта. Альтернативное представление символов — их шестнадцатеричный эквивалент, которому предшествует символ «#». Существует ограничение на длину элемента имени, которая может составлять всего 127 байт.

При написании имени необходимо использовать косую черту для обозначения имени; косая черта не является частью имени, а является префиксом, указывающим, что далее следует последовательность символов, представляющих имя. Если мы хотим использовать пробел или любой другой специальный символ как часть имени, он должен быть закодирован в двузначной шестнадцатеричной системе счисления.

Примеры имен можно увидеть в таблице ниже:

Рисунок 6: Имена PDF-файлов (источник)

Струны

Строки в документе PDF представлены как последовательность байтов, заключенных в круглые или угловые скобки, но могут иметь длину не более 65535 байтов.Любой символ может быть представлен в виде ASCII, а также в восьмеричном или шестнадцатеричном представлении. Восьмеричное представление требует, чтобы символ был записан в форме ддд, где ддд — восьмеричное число. Шестнадцатеричное представление требует, чтобы символ был записан в форме

, где dd — шестнадцатеричное число.

Пример представления строки, заключенной в круглые скобки, можно увидеть ниже:

Пример представления строки, заключенной в угловые скобки, можно увидеть ниже (шестнадцатеричное представление ниже такое же, как и выше, и читается как «mystring»):

Мы также можем использовать специальные хорошо известные символы при представлении строки.Это: n для новой строки, r для возврата каретки, t для горизонтального табулятора, b для возврата, f для подачи формы, (для левой скобки) для правой скобки и для обратной косой черты.

Массивы

Массивы в документах PDF представлены как последовательность объектов PDF, которые могут быть разных типов и заключены в квадратные скобки. Вот почему массив в документе PDF может содержать любые типы объектов, такие как числа, строки, словари и даже другие массивы. В массиве также могут быть нулевые элементы.Массив обозначается квадратной скобкой. Пример массива представлен ниже:

  • 123 123.0 true (mystring) / myname]

Словари

Словари в PDF-документе представлены в виде таблицы пар ключ / значение. Ключ должен быть объектом имени, тогда как значением может быть любой объект, включая другой словарь. Максимальное количество статей в словаре — 4096 статей. Словарь может быть представлен статьями, заключенными в двойные угловые скобки << и >>.Пример словаря представлен ниже:
& lt; & lt; / mykey1 123

/ mykey2 0,123

/ mykey3 & lt; & lt; / mykey4 правда

/ mykey5 (mystring)

& gt; & gt;

& gt; & gt;

Потоки

Объект потока представлен последовательностью байтов и может быть неограниченной по длине, поэтому изображения и другие блоки больших данных обычно представляются как потоки.Объект потока представлен объектом словаря, за которым следует поток ключевых слов, за которым следует новая строка и конечный поток.

Пример объекта потока можно увидеть ниже:
& lt; & lt;

/ Тип / Страница

/ Длина 23 0 R

/ Фильтр / LZWDecode

& gt; & gt;

поток

endstream
Все объекты потока должны быть косвенными объектами, а словарь потока должен быть прямым объектом. Словарь потока указывает точное количество байтов потока.После данных должна быть новая строка и ключевое слово endstream.

Общие ключевые слова, используемые во всех словарях потоков, следующие (обратите внимание, что запись Length является обязательной):

  • Длина: сколько байтов файла PDF используется для данных потока. Если поток содержит запись фильтра, длина должна указывать количество байтов закодированных данных.
  • Тип: Тип объекта PDF, описываемого в словаре.
  • Фильтр: имя фильтра, который будет применяться при обработке данных потока.Можно указать несколько фильтров в порядке их применения.
  • DecodeParms: словарь или массив словарей, используемых фильтрами, указанными в Filter. Это значение определяет параметры, которые необходимо передать фильтрам при их применении. В этом нет необходимости, если фильтры используют значения по умолчанию.
  • F: указывает файл, содержащий данные потока.
  • FFilter: имя фильтра, который будет применяться при обработке данных, обнаруженных во внешнем файле потока.
  • FDecodeParms: словарь или массив словарей, используемых фильтрами, заданными FFilter.
  • DL: указывает количество байтов в декодируемом потоке. Это можно использовать, если на диске достаточно места для записи потока в файл.
  • N: количество косвенных объектов, хранящихся в потоке.
  • Первый: смещение в декодированном потоке первого сжатого объекта.
  • Extends: указывает ссылку на другие потоки объектов, которые образуют дерево наследования.

Данные потока в потоке объектов будут содержать N пар целых чисел, где первое целое число представляет номер объекта, а второе целое число представляет смещение в декодированном потоке этого объекта. Объекты в потоках объектов являются последовательными, и их не нужно сохранять в порядке возрастания относительно номера объекта. Первая запись в словаре идентифицирует первый объект в потоке объектов.

Нельзя хранить в потоке объектов следующую информацию:

  • Потоковые объекты
  • Объекты с номером поколения, отличным от нуля
  • Словарь шифрования документа
  • Косвенный объект записи Length в словаре потока объектов
  • Каталог документов, словарь линеаризации, объекты страниц

В PDF 1.5, информация о перекрестных ссылках может храниться в потоке перекрестных ссылок вместо таблицы перекрестных ссылок. Каждый поток перекрестных ссылок содержит информацию, эквивалентную таблице перекрестных ссылок и трейлеру.

Нулевой объект

Нулевой объект представлен ключевым словом «null».

Косвенные объекты

Прежде всего, мы должны знать, что любой объект в документе PDF может быть помечен как косвенный объект. Это дает объекту уникальный идентификатор объекта, который другие объекты могут использовать для ссылки на косвенный объект.Косвенный объект — это пронумерованный объект, представленный ключевыми словами «obj» и «endobj». Endobj должен присутствовать в отдельной строке, но obj должен находиться в конце строки идентификатора объекта, которая является первой строкой косвенного объекта. Строка идентификатора объекта состоит из номера объекта, номера поколения и ключевого слова «obj». Пример косвенного объекта выглядит следующим образом:
2 1 obj

12345

endobj
В приведенном выше примере мы создаем новый косвенный объект, который содержит объект с номером 12345.Объявляя объект косвенным объектом, мы можем использовать его в таблице перекрестных ссылок документа PDF и повторно использовать его на любой странице, в словаре и т. Д. В документе. Поскольку каждый косвенный объект имеет свою собственную запись в таблице перекрестных ссылок, к косвенным объектам можно получить доступ очень быстро.

Идентификатор косвенного объекта состоит из двух частей; первая часть — это номер текущего косвенного объекта. Непрямые объекты не нужно нумеровать последовательно в документе PDF.Вторая часть — это номер поколения, который устанавливается равным нулю для всех объектов во вновь созданном файле. Это число позже увеличивается при обновлении объектов.

Мы можем ссылаться на косвенные объекты с помощью косвенной ссылки, которая состоит из номера объекта, номера поколения и ключевого слова R. Чтобы ссылаться на вышеупомянутый косвенный объект, мы должны написать что-то вроде ниже:

Если мы пытаемся сослаться на неопределенный объект, на самом деле мы имеем в виду нулевой объект.

Структура документа

Документ PDF состоит из объектов, содержащихся в основной части файла PDF. Большинство объектов в документе PDF — это словари. Каждая страница документа представлена ​​объектом страницы, который представляет собой словарь, включающий ссылки на содержимое страницы. Объекты страниц связаны между собой и образуют дерево страниц, которое объявляется с косвенной ссылкой в ​​каталоге документов.

Вся структура документа PDF может быть представлена ​​на картинке ниже [1]:

Рисунок 7: Структура документа PDF (источник)

На рисунке выше мы видим, что каталог документов содержит ссылки на дерево страниц, иерархию структуры, цепочки статей, именованные места назначения и интерактивную форму.Мы не будем вдаваться в подробности того, что делает каждый из этих разделов, но представим только самый важный раздел — дерево страниц.

Каталог документов

Из рисунка выше мы видим, что Каталог документов является корнем объектов в документе PDF. Мы уже говорили, что это элемент / Root в разделе Trailer PDF, который определяет каталог документов. Каталог документов содержит ссылки на другие объекты, которые определяют содержание документа. Он также содержит информацию о том, как документ будет отображаться на экране.Записи в каталоге документов следующие:

  • / Тип: Тип объекта PDF, описываемого каталогом (в нашем случае это Каталог, поскольку это объект каталога документов).
  • / Версия: Версия спецификации PDF, на основе которой был создан документ.
  • / Extensions: Информация о расширениях для разработчиков в этом документе.
  • / Pages: косвенная ссылка на объект, являющийся корнем дерева страниц документа.
  • / Dests: косвенная ссылка на объект, который является корнем указанного объекта назначения.
  • / Outlines: косвенная ссылка на объект каталога структуры, который является корнем иерархии структуры документа.
  • / Threads: косвенная ссылка на массив словарей потоков, которые представляют цепочки статей документа.
  • / Метаданные: косвенная ссылка на поток метаданных, который содержит метаданные для документа.

Есть много других записей, которые мы видим как часть каталога документов, но не будем описывать их здесь.Подробности читатель может почитать в наших источниках. Пример каталога документов представлен ниже:
1 0 obj

& lt; & lt; / Тип / Каталог

/ Страницы 2 0 R

/ PageMode / UseOutlines

/ Наброски 3 0 R

& gt; & gt;

эндобдж

Дерево страниц

Доступ к страницам документа осуществляется через дерево страниц, которое определяет все страницы в документе PDF. Дерево содержит узлы, которые представляют страницы документа PDF, которые могут быть двух типов: промежуточные и листовые узлы.Промежуточные узлы также называются узлами дерева страниц, а конечные узлы — объектами страницы.

Простейшая древовидная структура страницы может состоять из одного узла дерева страниц, который напрямую ссылается на все объекты страницы (так что все объекты страницы являются листами).

Каждый узел в дереве страниц должен иметь следующие записи:

  • / Type: Тип объекта PDF, описываемого этим объектом (в нашем случае это Pages , поскольку мы говорим об узлах дерева страниц).
  • / Родитель: должен присутствовать во всех узлах дерева страниц, кроме корневого, где эта запись не должна присутствовать. Эта запись указывает своего родителя.
  • / Kids: Должен присутствовать во всех узлах дерева страниц, кроме листьев, и указывает все дочерние элементы, непосредственно доступные из текущего узла.
  • / Count: указывает количество конечных узлов, которые являются потомками этого узла в последующем дереве страниц.

Мы должны помнить, что дерево страниц не имеет отношения ни к чему в документе PDF, например к страницам или главам.

Базовый пример дерева страниц можно увидеть ниже:
2 0 obj

& lt; & lt; / Тип / Страницы

/ Дети [4 0 R

10 0 Р

24 0 R

]

/ Количество 3

& gt; & gt;

эндобдж

4 0 объект

& lt; & lt; / Тип / Страница

& gt; & gt;

эндобдж

10 0 obj

& lt; & lt; / Тип / Страница

& gt; & gt;

эндобдж

24 0 obj

& lt; & lt; / Тип / Страница

& gt; & gt;

endobj
В дереве страниц выше определяется объект Root с идентификатором 2, у которого есть три дочерних объекта: объекты 4, 10 и 20.Мы также можем видеть, что листья дерева страниц — это словари, определяющие атрибуты отдельной страницы документа. Есть несколько атрибутов, которые мы можем использовать при их определении для каждой страницы документа.

Мы рассмотрели базовую структуру документа PDF и типы данных. Если мы хотим начать поиск уязвимостей в программах для чтения PDF-файлов, нам необходимо изменить PDF-документ таким образом, чтобы программа для чтения PDF-файлов не могла с этим справиться и вылетела из строя. Обычно, если нам удается вызвать сбой программы чтения PDF-файлов, мы обнаруживаем уязвимость системы безопасности, которую можем использовать для выполнения произвольного кода на целевой машине.

Пример

В этой статье мы рассмотрим очень простой пример документа PDF. Сначала нам нужно создать PDF-документ, чтобы затем мы попытались его проанализировать. Чтобы создать документ PDF, давайте сначала создадим очень простой документ .tex, содержащий то, что показано на рисунке ниже:

Рисунок 8: Простой документ

Мы видим, что документ .tex действительно не содержит много. Сначала мы определяем документ как статью, а затем включаем содержимое статьи в начальный и конечный документ.Мы добавляем новый раздел с заголовком (Введение) и статическим текстом «Hello World!».

Мы можем скомпилировать документ .tex в документ PDF с помощью команды pdflatex и указав имя файла .tex в качестве аргумента. Полученный PDF-файл будет выглядеть так, как показано на рисунке ниже:

Рисунок 9: Результат

Мы видим, что документ PDF на самом деле не содержит очень много, только текст, который мы фактически включили, и никаких изображений, JavaScript или других элементов.

Пример 1

Давайте посмотрим на структуру документа PDF, которая представлена ​​в выводе ниже:
% PDF-1.5

% ÐÔÅØ

3 0 объект & lt; & lt;

/ Длина 138

/ Фильтр / FlateDecode

& gt; & gt;

поток

конечный поток

эндобдж

10 0 объект & lt; & lt;

/ Длина2 1526

/ Длина3 7193

/ Длина4 0

/ длина 8194

/ Фильтр / FlateDecode

& gt; & gt;

поток

конечный поток

эндобдж

12 0 объект & lt; & lt;

/ Длина2 1509

/ Длина3 9410

/ Длина4 0

/ Длина 10422

/ Фильтр / FlateDecode

& gt; & gt;

поток

конечный поток

эндобдж

15 0 объект & lt; & lt;

/ Производитель (pdfTeX-1.40,12)

/ Создатель (TeX)

/ CreationDate (D: 20121012175007 + 02’00 ’)

/ ModDate (D: 20121012175007 + 02’00 ’)

/ В ловушке / Ложь

/PTEX.Fullbanner (Это pdfTeX, версия 3.1415926-2.3-1.40.12 (TeX Live 2011) kpathsea версия 6.0.1)

& gt; & gt; эндобдж

6 0 объект & lt; & lt;

/ Тип / ObjStm

/ № 10

/ Первые 65

/ Длина 761

/ Фильтр / FlateDecode

& gt; & gt;

поток

конечный поток

эндобдж

16 0 объект & lt; & lt;

/ Тип / XRef

/ Индекс [0 17]

/ Размер 17

/ Вт [1 2 1]

/ Корень 14 0 R

/ Инфо 15 0 R

/ ID [& lt; 1DC2E3E09458C9B4BEC8B67F56B57B63 & gt; & lt; 1DC2E3E09458C9B4BEC8B67F56B57B63 & gt;]

/ Длина 60

/ Фильтр / FlateDecode

& gt; & gt;

поток

конечный поток

эндобдж

startxref

20215

%% EOF
Для создания такого простого документа PDF достаточно много элементов, поэтому мы можем представить, как будет выглядеть действительно сложный документ PDF.Мы также должны помнить, что все потоки закодированных данных были удалены и заменены тремя точками для ясности и краткости.

Давайте представим каждый из разделов PDF. Заголовок можно увидеть на картинке ниже:

Рисунок 10: Заголовок PDF

Корпус можно увидеть на картинке ниже:

Рисунок 11: Корпус PDF

Раздел xref можно увидеть на картинке ниже:

Рисунок 11: PDF xref

И, наконец, раздел Trailer представлен ниже:

Рисунок 12: Прицеп PDF

Мы представили все разделы PDF-документа, но нам еще предстоит их проанализировать.Заголовок PDF-документа стандартный, и нам не нужно об этом говорить, поэтому оставим текст на потом.

Вот почему мы должны сначала взглянуть на раздел xref. Мы видим, что смещение от начала файла до таблицы внешних ссылок составляет 20215 байт, что в шестнадцатеричной форме равно 0x4ef7. Если мы посмотрим на шестнадцатеричное представление файла, которое мы можем получить с помощью инструмента xxd, мы увидим то, что представлено на рисунке ниже:

Рисунок 13: Шестнадцатеричное представление файла

Выделенные байты лежат точно в начале смещения 20125 байтов от начала файла.Предыдущие байты 0x0a — это новая строка, а текущие байты 0x31 представляют собой число 1, которое в точности является началом таблицы внешних ссылок. Вот почему таблица xref представлена ​​косвенным объектом с идентификатором 16 и номером поколения 0. (Это должно быть так для всех объектов, поскольку мы только что создали документ PDF и ни один из объектов еще не был изменен. Если мы посмотрите на весь PDF-документ, и мы увидим, что это действительно так; все объекты имеют нулевой номер поколения.)

/ Тип косвенного объекта классифицирует его как таблицу внешних ссылок.Массив / Index содержит пару целых чисел для каждого подраздела этого раздела. Первое целое число указывает номер первого объекта в подразделе, а второе целое число указывает количество записей в подразделе. В нашем примере номер объекта равен нулю, и в этом подразделе 17 записей. Это также указывается в директиве / Size. Обратите внимание, что это число на единицу больше наибольшего числа любого номера объекта в подразделе. Атрибут / W определяет массив целых чисел, представляющих размер полей в записи перекрестной ссылки, что означает, что поля являются одним байтом, двумя байтами и одним байтом.

После этого идет элемент / Root, который указывает каталог каталога для документа PDF как объект номер 14. / Info — это каталог информации документа PDF, который содержится в объекте номер 15. Массив / ID требуется, потому что Зашифрованная запись присутствует и содержит две строки, составляющие идентификатор файла. Эти две строки используются в качестве входных данных для алгоритма шифрования.

Параметр / Length указывает длину ключа шифрования в битах; значение должно быть кратным 8 в диапазоне от 40 до 128 (значение по умолчанию — 40).В нашем случае длина ключа шифрования составляет 60 бит. / Filter указывает имя обработчика безопасности для этого документа; это также обработчик безопасности, который использовался для шифрования документа. В нашем случае это FlateDecode, который кодирует данные с помощью метода сжатия zlib / deflate.

Мы видим, что другая часть таблицы внешних ссылок сжата, поэтому мы не можем ее прочитать. Конечно, мы могли бы применить какой-нибудь алгоритм распаковки zlib к сжатым данным, но есть вариант получше.Зачем нам писать программу для этого, если инструмент уже существует? С помощью pdftk мы можем восстановить поврежденную таблицу внешних ссылок PDF-файла с помощью следующей команды:

  • # pdftk in.pdf output out.pdf

После этого файл out.pdf содержит следующие разделы внешних ссылок и трейлеров:

Рисунок 14: xref и трейлер

Ясно, что номера объектов / Root и / Info изменились, а также другие вещи, но мы получили ключевые слова трейлера и xref, которые определяют таблицу xref.Мы видим, что в таблице внешних ссылок 14 объектов.

Мы могли бы продолжить и попытаться расшифровать и другие разделы, но это выходит за рамки данной статьи. Затем мы проверим документ, который не закодирован.

Пример 2

Давайте взглянем на образец документа PDF, доступный здесь. Некоторые объекты потока зашифрованы, но сейчас они не так важны. Поскольку мы уже знаем, как работать с PDF-документами, мы не потеряем слишком много слов в простых вещах.

Давайте откроем этот PDF-файл в текстовом редакторе, таком как gvim, и посмотрим на раздел трейлера.К настоящему моменту мы должны знать, что все документы PDF следует читать от конца до начала. Прицеп представлен на картинке ниже:

Рисунок 15: PDF-трейлер

Давайте также представим Xref всего с несколькими объектами (остальные были отброшены для ясности):

Рисунок 16: PDF xref

Мы видим, что корневой каталог / документа PDF содержится в объекте с ID 221, а в объекте 222 есть дополнительная информация.Объект 221 — самый важный объект во всем документе, поэтому давайте представим его:

Рисунок 17: Объект 221

Мы видим, что объект действительно является Каталогом документов. Объект Page Tree — 212, объект Outlines — 213, объект Names — 220, а объект OpenAction — 58. Мы не говорили ни о каких других типах, кроме объекта Page Tree, поэтому продолжим разговор о Page Tree. Только.

Объект Page Tree с ID 212 представлен на рисунке ниже:

Рисунок 18: Объект дерева страниц

Итак, объект 212 содержит фактические страницы документа PDF.Он содержит 10 страниц, что совершенно верно (мы можем проверить это, если откроем PDF-файл с помощью любого PDF-ридера и проверим количество страниц).

Мы знаем, что атрибут Kids определяет все дочерние элементы, напрямую доступные из текущего узла. В нашем случае есть два прямых дочерних узла с идентификаторами объектов 66 и 135. Объект 66 представлен ниже:

Рисунок 19: Объект 66

Объект 66 содержит другие дочерние элементы с ID 57, 69, 75, 97, 108 и 120.

Рисунок 20: Объект 135

Объект 135 дополнительно определяет объекты 129, 138, 133 и 158.

Если мы посчитаем все элементы, мы увидим, что есть ровно 10 элементов, что означает 10 страниц из 10 страниц. Это также подразумевает, что все представленные объекты на самом деле являются фактическими страницами документа PDF и не содержат дополнительных дочерних узлов.

Все представленные объекты объявлены одинаково, поэтому мы не будем рассматривать каждый из них по очереди.Вместо этого мы просто взглянем на один объект, а именно на объект 57. Объект 57 содержит, объявлен следующим образом:

Рисунок 21: Объект 57

Мы видим, что тип объекта — / Page, что напрямую подразумевает, что это листовой узел, представляющий одну из страниц документа PDF. Содержимое этой страницы PDF можно найти в объекте 62:

.

Рисунок 22: Объект 62

Мы видим, что фактическое содержимое страницы PDF кодируется с помощью FlateDecode, который представляет собой простой алгоритм кодирования zlib.

Заключение

Мы видели два примера создания PDF-документов. Обладая полученными знаниями, мы можем начать создавать неправильные документы PDF и передавать их различным программам чтения PDF. Если при чтении определенного PDF-документа происходит сбой определенного PDF-ридера, этот документ содержит что-то, что программа PDF-ридера не может обработать. Это подразумевает возможность уязвимости, которую необходимо изучить дополнительно.

В конце, если обнаружится, что уязвимость присутствует, мы даже можем написать PDF-документ, содержащий вредоносный код, который запускается, когда жертва открывает PDF-документ с помощью уязвимого PDF-ридера на своей целевой машине.В таких случаях вся машина может быть скомпрометирована, поскольку произвольный вредоносный код может быть запущен, просто открыв вредоносный документ PDF.

Источники

Статистика уязвимостей

, сведения о CVE

Политики поддержки Adobe: поддерживаемые версии продуктов, Adobe

Управление документами — Формат переносимых документов — Часть 1: PDF 1.7, Adobe (Archive.org)

Артикул:

[1]: формат файла PDF, доступный по адресу: http: //wwwimages.adobe.com / www.adobe.com / content / dam / Adobe / en / devnet / pdf / pdfs / PDF32000_2008.pdf.

Что такое файл PDF и почему мы все еще полагаемся на него?

Вы открывали PDF-файл на этой неделе? Скорее всего, вы регулярно с ними работаете. Несмотря на то, что некоторые другие типы файлов становятся безвестными, PDF-файлы по-прежнему остаются популярным выбором (несмотря на то, что Adobe Reader становится ненужным).

Вы когда-нибудь задумывались, почему это так? Давайте разберемся, как работают PDF-файлы, почему они важны и почему они по-прежнему так популярны.

История PDF

PDF означает Portable Document Format .Созданный Adobe, он впервые был запущен в начале 1990-х годов как способ полностью сохранить документ в одном файле. Поскольку Интернет был молод, когда PDF развивался, они в основном использовались для настольной публикации документов для печати. Компании использовали PDF-файлы для сохранения плакатов, листовок и других подобных типов файлов для физической печати.

PDF-файлы начали работать не сразу.Получить Adobe Acrobat было непросто, PDF-файлы не обладали всеми функциями интеграции, которые есть сегодня, а использование удаленного доступа для загрузки большого PDF-файла было мучительно медленным. Через несколько лет Adobe выпустила Adobe Reader бесплатно для всех, и PDF в конечном итоге обошел нескольких конкурентов и стал стандартом файлов для фиксированных документов.

Интересно, что PDF изначально был проприетарным форматом, а это означало, что Adobe контролировала файлы PDF и то, как они функционировали.В 2008 году они отказались от этого права собственности, и PDF стал открытым стандартом. Теперь PDF-файлы по-прежнему имеют базовый набор свойств, но они не зависят от Adobe. Действительно, вы можете найти десятки других бесплатных программ для чтения PDF-файлов.

Как работают файлы PDF

Чтобы понять, почему PDF-файл произвел такую ​​революцию, когда он появился, мы должны понять, каким был стандарт в то время.В начале 90-х профессиональное программное обеспечение, используемое для создания графики и документов, приводило к невыносимо большим файлам, особенно когда в них были встроены изображения, шрифты и другие графические элементы. Помните, что в то время машины имели крошечную долю вычислительной мощности компьютера, который вы используете, а это значит, что каждый бит эффективности был жизненно важен.

Пытаясь исправить это, разработчики программного обеспечения начали использовать ссылки на другие ресурсы на компьютере.Допустим, вы использовали в документе специальный шрифт. Вместо того, чтобы сохранять все данные для этого шрифта внутри вашего документа, он будет извлекать необходимую информацию из папки установки шрифта на вашем компьютере. Это уменьшило нагрузку на файл документа, сделав его легче.

Это будет работать нормально, если вы не переместили шрифт на свой компьютер.Однако, если вы перенесли файл на другой компьютер, на котором не был установлен ваш конкретный шрифт, он выглядел бы неправильно. Вы можете себе представить, как больно тратить все это время на создание важного документа, а затем на то, чтобы он выглядел ужасно, потому что вы не сохранили ссылки на графические элементы.

PDF изменил это.Adobe нашла способ собрать все части файла в меньшее целое. Очевидно, это гораздо более эффективный способ, чем обходные пути, которые разработчики использовали до появления PDF.

Вот почему PDF-файлы стали стандартом.

Почему они важны

Portable в формате PDF важен: PDF-файлов выглядят одинаково независимо от того, на каком устройстве они просматриваются на .Независимо от того, используете ли вы Windows 10, Mac, Chrome OS, Android, Windows Phone, iPad или Windows XP — на любом программном и аппаратном обеспечении PDF-файлы остаются неизменными. Информация, содержащаяся в PDF-файле, не зависит от устройства создателя или читателя. Включение шрифтов, изображений, диаграмм и тому подобного — не проблема для PDF.

Сравните это с отправкой кому-то документа Microsoft Word.Что произойдет, если у получателя нет Microsoft Word на компьютере? Конечно, они могут открыть его в Google Docs, но он может выглядеть совсем иначе, поскольку Docs по-другому отображает файлы. Если вы потратили много времени на правильное получение таблиц, изображений и других элементов, все может исчезнуть. А что, если они попытаются открыть документ Word на своем телефоне?

Как правило, PDF-файлов предназначены для просмотра .Когда вы нажимаете Сохранить , вы видите то, что получит любой, кто просматривает документ. И вам даже не нужно устанавливать ридер — большинство современных браузеров без проблем открывают PDF-файлы. Хотя вы можете редактировать PDF-файлы, вы ограничены несколькими бесплатными вариантами, если вы не заплатите за программное обеспечение премиум-класса, такое как Adobe Acrobat, Foxit PhantomPDF или Nitro.

Почему они все еще популярны

В дополнение к описанной выше переносимости PDF-файлы обладают рядом функций, которые способствовали их неизменной популярности.

Во-первых, PDF-файлы позволяют точно настроить параметры безопасности.Создавая PDF-файл, вы можете запретить пользователям распечатывать документ, оставлять комментарии или копировать его текст. Таким образом, когда правительства и предприятия размещают формы в Интернете, они могут серьезно ограничить их, чтобы предотвратить злоупотребления. Для большей безопасности вы также можете защитить паролем PDF-файл.

Вы, наверное, заметили, что PDF-файлы также работают с заполняемыми полями.Создатель PDF-файла может размещать выделенные блоки в любом месте документа, чтобы показать, куда подписывающая сторона должна добавить информацию. Даже если они ограничили редактирование, зритель все равно может ввести свое имя, адрес и другую соответствующую информацию в эти поля. PDF-файлы поддерживают электронную подпись, поэтому вы можете добавить свое согласие к документу, не распечатывая его.

Незначительные функции, такие как добавление комментариев, выделение, штампы, а также гиперссылки и другое живое содержимое, сохраняют актуальность PDF-файлов в текущем десятилетии.Программное обеспечение для оптического распознавания может захватывать документы и легко преобразовывать их в PDF-файлы, а некоторые независимые издатели даже выпускают книги в формате PDF. Благодаря простоте использования, солидному набору функций и повсеместному распространению PDF-файл стал неотъемлемой частью повседневной компьютерной жизни.

Что вы узнали о файлах PDF?

Мы провели краткий обзор PDF-файла, чтобы узнать, как он появился, как работает и что делает его таким важным и популярным.В мире различных операционных систем, размеров экранов, браузеров и аппаратных компонентов PDF остается неизменным. Знание того, что созданный вами документ не претерпит каких-либо странных изменений до того, как ваш зритель увидит это, утешает. Это то, что предоставляет PDF-файл, и поэтому он является стандартом более двух десятилетий.

Теперь, когда вы знаете все о PDF-файлах, узнайте, как лучше всего поделиться ими в Интернете!

Как часто вы используете PDF-файлы? Есть ли у вас еще одна причина для их использования, кроме перечисленных здесь? Дайте нам знать, что вы думаете об этом формате файла в комментариях!

Билл Гейтс пытается сделать вам прививку от COVID-19?

Слышал слух о вакцине COVID-19, включающей микрочип, контролируемый Биллом Гейтсом? Ага, об этом…

Читать далее

Об авторе Бен Стегнер (Опубликовано 1707 статей)

Бен — заместитель редактора и менеджер по адаптации в MakeUseOf.Он оставил свою работу в сфере ИТ, чтобы писать полный рабочий день в 2016 году, и никогда не оглядывался назад. В качестве профессионального писателя он освещал технические руководства, рекомендации по видеоиграм и многое другое уже более семи лет.

Более От Бена Стегнера
Подпишитесь на нашу рассылку новостей

Подпишитесь на нашу рассылку, чтобы получать технические советы, обзоры, бесплатные электронные книги и эксклюзивные предложения!

Еще один шаг…!

Пожалуйста, подтвердите свой адрес электронной почты в электронном письме, которое мы вам только что отправили.

Основы PDF | формат файла и его использование в допечатной подготовке

Формат переносимых документов изначально был создан Adobe как формат файлов для надежного представления документов и обмена ими. Adobe по-прежнему остается одним из основных разработчиков программного обеспечения, позволяющего создавать, редактировать и визуализировать файлы PDF. Поскольку спецификации формата файла общедоступны и тем временем даже стали официальным стандартом ISO, многие другие компании также разрабатывают программное обеспечение, связанное с PDF.В допечатной подготовке PDF обычно используется в качестве формата для обмена данными, будь то полные страницы, которые необходимо распечатать, или рекламные объявления, которые необходимо включить в публикацию. Формат файла также популярен для мягкой проверки и просмотра содержимого, поскольку есть приложения, позволяющие делать примечания на страницах PDF.

Что можно делать с PDF?

PDF можно использовать для:

  • создание электронных документов — PDF максимально приближен к «безбумажному офису».
  • обмен данными — Все больше и больше приложений могут читать файлы PDF. Рекламными объявлениями часто обмениваются в виде файлов PDF. PDF / X — это специальная версия PDF, оптимизированная для этого типа приложений.
  • архивирование данных — на рынке есть инструменты, которые позволяют индексировать файлы PDF, чтобы вы могли создавать и выполнять поиск в электронной библиотеке файлов PDF. Существует даже специальная версия PDF, называемая PDF / A, которая оптимизирована для длительного хранения электронных документов.
  • интерактивных документов — PDF можно использовать для электронных форм, в которых заполненные данные могут храниться в базе данных.

Для получения дополнительной информации посетите следующие страницы:

Формат файла PDF

Файлы

PDF имеют расширение .PDF. Их значок выглядит так:

Как на Mac, так и на ПК, вы не увидите этот значок, если не установлено приложение, которое может обрабатывать файлы PDF. В настоящее время многие системы поставляются с предустановленным необходимым приложением Adobe Viewer. Система Apple OS X имеет встроенную поддержку PDF.

Для получения дополнительной информации посетите следующие страницы:

Особые ароматы PDF

  • PDF / X-1a — Популярный стандарт для обмена данными в допечатной подготовке и печати
  • PDF / X-3 — альтернатива PDF / X-1a с управлением цветом
  • PDF / X-4 — Новый стандарт использования PDF для допечатной подготовки и печати
  • PDF / X-5 — Непонятная альтернатива PDF / X-4
  • PDF / VT — Использование PDF для печати переменных данных и транзакций
  • PDF / A — Использование PDF для архивирования электронных документов
  • Сертифицированный PDF-файл — подтверждение того, что PDF-файл был предварительно проверен

PDF Association предлагает бесплатное 17-страничное руководство по формату файлов PDF / X, которое в двух словах называется PDF / X.

Каковы преимущества PDF?

PDF имеет уникальный ряд преимуществ:

  • Это кроссплатформенный стандарт. Это означает, что кто-то может создать файл PDF на рабочей станции Unix, а вы можете открыть его на Mac или ПК и по-прежнему видеть документ так, как он был предназначен для просмотра.
  • PDF-файлы
  • могут быть независимыми от устройства: их можно распечатать на дешевом струйном принтере, а также на дорогом фотонаборном устройстве. Это не обязательно означает, что вывод будет оптимизирован для каждого устройства.Многое зависит от способа создания документа.
  • PDF-файлы компактны. PDF поддерживает ряд сложных алгоритмов сжатия, а также продуманную файловую структуру, позволяющую свести размер файлов PDF к абсолютному минимуму.
  • Файлы
  • PDF могут содержать мультимедийные элементы, такие как фильмы или звук, а также элементы гипертекста, такие как закладки, ссылки на адреса электронной почты или веб-страницы, а также эскизы страниц.
  • PDF поддерживает безопасность. Создатель файла PDF может устанавливать различные параметры безопасности.Можно заблокировать PDF-файл, чтобы его можно было открыть только с паролем. Также можно запретить изменение содержимого PDF-файла или отключить возможность печати PDF-файла.

Недостатки PDF

Конечно, у использования PDF есть и недостатки.

  • Вопреки своему названию Portable Document Format не так удобен. Примерно каждые два года Adobe выпускает новую версию PDF, каждый раз добавляя новые функции или расширяя объем существующих.Последние версии Adobe Reader и Acrobat игнорируют функции PDF, которых не было на момент выпуска программного обеспечения. Хотя это элегантный обходной путь, тот факт, что существует так много разных версий PDF, не очень практичен и не удобен для пользователя.
  • Некоторые организации всегда возражали против использования PDF, потому что это был частный формат файла, принадлежащий Adobe. Так было до января 2007 года, когда Adobe выпустила спецификации PDF 1.7 для сертификации ISO. Некоторые разновидности PDF, такие как PDF / X-1 и PDF / A, уже несколько лет назад прошли сертификацию ISO.
  • PDF пытается быть всем для всех, а это означает, что он может быть не таким эффективным для конкретной задачи, как инструмент, оптимизированный для этой задачи. Вы можете использовать PDF в Интернете, но в большинстве случаев документ HTML может быть более эффективным. Вы можете использовать PDF для обмена небольшими графическими элементами, такими как реклама, рисунки или изображения, но большее количество приложений допечатной подготовки может работать с форматом файлов EPS. Вы можете использовать PDF для архивирования данных, но иногда обширные функции макета, такие как кернинг, могут помешать вам найти определенное слово в PDF-документе.
  • PDF предназначен для визуализации документов. Используя метаданные, можно сохранить логическую структуру документа. К сожалению, не так много приложений, которые создают такие файлы PDF с тегами.
  • PDF-файлы не предназначены для редактирования.
Оставить комментарий

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *