Pdf описание формата: Официальная документация на формат PDF — Документация Исчерпывающее руководство по формату PDF 0.1

Содержание

Официальная документация на формат PDF — Документация Исчерпывающее руководство по формату PDF 0.1

На этой странице собраны сведения по состоянию на 01.03.2015.

Основные справочные документы

Основная страница со справочной информацией http://www.adobe.com/devnet/pdf/pdf_reference.html

Архив со старыми версиями документации http://www.adobe.com/devnet/pdf/pdf_reference_archive.html

Стандарт ISO 32000-1

Копия стандарта ISO 32000-1, размещённая на сайте Adobe, PDF, 756 стр., eng, 8.6Мб. (Jul 2008)

Расширения Adobe к стандарту ISO 32000, ExtensionLevel 3, PDF, 140 стр., eng, 1.3Мб. Расширения реализованы в ПО Adobe Acrobat 9.0 and LiveCycle ES 8.2. (Jun 2008)

Расширения Adobe к стандарту ISO 32000, ExtensionLevel 5, PDF, 8 стр., eng, 316.4Кб. Расширения реализованы в ПО Adobe Acrobat 9.1 и Adobe Reader 9.1. (Jun 2009)

Дальнейшие расширения к ISO: Extension Level 6 и Extension Level 8 определяют расширения касающиеся XML Forms Architecture. http://partners.adobe.com/public/developer/xml/index_arch.html

Версия формата 1.7

Эта версия была стандартизирована как стандарт ISO 32000-1.

Описание формата PDF версия 1.7 (6-я редакция), PDF, 1310 стр., eng, 31.0Мб.

Исправления к описанию версии 1.7, PDF, 18 стр., eng, 163.5Кб. (Updated Oct. 23, 2007)

Дополнения от редации к описанию версии 1.7, PDF, 4 стр., eng, 105Кб. (Nov 2006)

Расширения Adobe версии 1.7, PDF, 11 стр., eng, 170.1 Кб. Расширения реализованы в ПО Adobe Acrobat 8.1 and LiveCycle ES 8.2.

Версия формата 1.6

Описание формата PDF версия 1.6 (5-я редакция), PDF, 1236 стр., eng, 8.7Мб. (Nov 2004)

Исправления к описанию версии 1.6, PDF, 3 стр., eng, 105Кб. (Updated Oct. 4, 2006)

Дополнительное описание режимов смешивания при использовании прозрачности, PDF, 6 стр., eng, 89Кб. (Jan. 23, 2006)

Версия формата 1.5

Описание формата PDF версия 1.5, рев. 5 (4-я редакция), PDF, 1172 стр., eng, 13.5Мб. (Aug 2003)

Описание формата PDF версия 1. 5, рев. 6 (4-я редакция), PDF, 1172 стр., eng, 8.8Мб. (Aug 2003)

Исправления к описанию версии 1.5, TXT, eng, 7.1Кб. (Revised Oct. 29, 2004)

Версия формата 1.4

Описание формата PDF версия 1.4 (3-я редакция), PDF, 978 стр., eng, 8.9Мб. (Nov 2001)

Исправления к описанию версии 1.5, TXT, eng, 7.1Кб. (Revised Jun 2003)

Изменения в версии 1.4 относительно версии 1.3, PDF, 236 стр., eng, 849.3Кб.

Версия формата 1.3

Описание формата PDF версия 1.3 (2-я редакция), PDF, 696 стр., eng, 4.9Мб. (Jul 3, 2000)

Исправления к описанию версии 1.3, TXT, eng, 7.1Кб. (Final revision Jan 09, 2002)

Версия формата 1.2

Описание формата PDF версия 1.2, PDF, 394 стр., eng, 1.4Мб. (November 27, 1996)

Данный документ доступен для скачивания по прямой ссылке.

Версия формата 1.1

Описание формата PDF версия 1.1, PDF, 302 стр., eng, 1.0Мб. (January 23, 1996)

Данный документ доступен для скачивания по прямой ссылке.

Версия формата 1.

0

Описание формата PDF версия 1.0, PDF, 230 стр., eng, 1.5Мб. (June 1993)

Данный документ доступен для скачивания по прямой ссылке.

Дополнительные документы

Описание разметки для выделения найденных элементов через плагин браузера, PDF, 8 стр., eng, 251.7Кб. (Jul 2003)

Данный документ относится к версии формата 1.3.

Файл PDF – чем открыть, описание формата

Чем открыть, описание – 1 формат файла

Документ PDF

Portable Document Format File

Тип файла: Размеченные документы

Тип данных: Двоичный файл

Mime-type: application/pdf

Разработчик: Adobe Systems

Заголовок и ключевые строки

HEX: 25 50 44 46 2D

ASCII: %PDF-

Подробное описание

Файл .PDF — документ, созданный с помощью программы Adobe Acrobat, соответствующего плагина для web-браузера, либо стороннего софта. Формат PDF на сегодняшний день приобрел огромную популярность благодаря тому, что он поддерживается практически всеми устройствами и операционными системами. Поэтому документы этого формата отлично подходят для обмена данными между пользователями.

PDF-документы могут быть открыты с помощью бесплатной версии Adobe Reader или web-плагина, который доступен для большинства интернет-браузеров. В некоторых браузерах, в частности, в Google Chrome обеспечена поддержка этого формата даже без установленного плагина. Редактировать файлы PDF можно с помощью платной версии Adobe Reader. Также, существует огромное количество программ как для открытия и работы с данным форматом, так и для конвертации других документов из/в этот формат.

Файлы PDF могут содержать текст, изображения, формы, аннотации и другие данные. Примечательно то, что отображение документа не зависит от платформы — что в Windows, что, к примеру, в Mac OS, документы будут выглядеть одинаково, также, как и при печати.

Как, чем открыть файл .pdf?

WindowsОнлайнAndroidiOSMac OSLinux

  • Inkscape

  • LibreOffice

  • Adobe Acrobat Reader DC

  • Nitro Pro 12

  • Icecream PDF Converter

  • IMSI TurboPDF

  • PDF-XChange Editor

  • Adobe Acrobat DC

  • Microsoft Word 2019

  • Corel WordPerfect X9

  • Nuance Power PDF Standard

  • Foxit Reader

  • Small PDF

  • Sejda PDF Editor

  • PDF Escape

  • Microsoft OneDrive

  • Google Диск

  • iLovePDF

  • Kingsoft WPS Office for Android

  • Google Диск

  • Adobe Reader

  • Google Play Books

  • Apple Pages

  • Infraware Polaris Office

  • Google Диск

  • Apple Books

  • Adobe Acrobat Reader

  • MobiSystems OfficeSuite Pro

  • Good. iWare GoodReader

  • Apple Pages

  • Apple Просмотр

  • LibreOffice

  • Adobe Acrobat Reader DC

  • Adobe Acrobat DC

  • Microsoft Word 2019

  • Smile PDFpenPro

  • Solid PDF to Word

  • LibreOffice

  • KDE Okular

  • Evince

  • KPDF

  • PDFedit

Инструкция — как выбрать программу из списка, скачать и использовать ее для открытия файла

Для более точного определения формата и программ для открытия файла используйте функцию определения формата файла по расширению и по данным (заголовку) файла.

PDF, версия 1.7 (ISO 32000-1:2008)

Формат Описание Категории >> Просмотреть алфавитный список

>> Назад

Содержание

  • Идентификация и описание
  • Местное использование
  • Факторы устойчивости
  • Факторы качества и функциональности
  • Признаки типа файла
  • Примечания
  • Характеристики формата
  • Полезные ссылки

Формат Описание Свойства

  • Идентификатор: fdd000277
  • Краткое имя: PDF_1_7
  • Категории контента: текст, неподвижное изображение
  • Категория формата: формат файла
  • Другие грани: унитарный, бинарный, структурированный
  • Последнее значительное обновление FDD: 2019-03-01
  • Статус черновика: Полный

Идентификация и описание

«>
Полное наименование PDF (Portable Document Format), версия 1.7, базовый уровень (ISO 32000-1:2008)
Описание

PDF (Portable Document Format), разработанный Adobe Systems Incorporated, описан Adobe как общий язык представления документов. PDF представляет собой отформатированные постраничные документы. Эти документы могут быть структурированными или простыми. Они могут содержать текст, изображения, графику и другой мультимедийный контент, например видео и аудио. Есть поддержка аннотаций, метаданных, гипертекстовых ссылок и закладок.

Исходная версия 1.7 формата PDF была выпущена в ноябре 2006 г. и связана с Acrobat и Adobe Reader 8.0. Версия 1.7 была опубликована как ISO 32000-1 в июле 2008 г.

Помимо других новых функций, в этой версии PDF представлен механизм расширения, основанный на словаре расширений w3.org/2001/XMLSchema-instance»> . Этот механизм использовался Adobe для введения новых функций, но он также доступен для использования другими поставщиками или разработчиками для создания опубликованных расширений. Adobe заявила, что будет поддерживать общедоступный реестр поставщиков, который будет использоваться для идентификации расширений в

http://adobe.com/go/ISO32000Реестр . По состоянию на начало 2019 года URL-адрес содержал только регистрационную форму; по состоянию на октябрь 2020 года URL-адрес является неработающей ссылкой. Список имен PDF теперь доступен по адресу https://github.com/adobe/pdf-names-list.

Фаза производства В общем, формат конечного состояния для доставки конечным пользователям.
Связь с другими форматами
Подтип PDF_семейство, Портативный формат документов
Имеет более раннюю версию ПДФ_1_6, PDF, версия 1. 6
Имеет расширение PDF_1_7_ext03, PDF, версия 1.7, ExtensionLevel 3

Местное использование

Опыт LC или существующие владения См. PDF_семейство.
LC предпочтения См. PDF_семейство.

Факторы устойчивости

Раскрытие информации Утвержден в качестве международного стандарта ISO 32000-1:2008.
    Документация

ИСО 32000-1:2008. Управление документами. Формат переносимых документов. Часть 1: PDF 1.7. Подтверждено в 2018 году.

Adobe предоставляет утвержденную ISO копию стандарта по адресу https://opensource.adobe.com/dc-acrobat-sdk-docs/standards/pdfstandards/pdf/PDF32000_2008.pdf.

Принятие Широко распространен. Однако в 2019 году многие инструменты для создания PDF по-прежнему создают файлы, которые идентифицируют себя как соответствующие более ранним версиям PDF.
    Лицензирование и патенты

Из текста стандарта ISO 32000-1:2008: «Международная организация по стандартизации обращает внимание на то, что утверждается, что соблюдение этого документа может включать использование патентов, касающихся создания, модификации, отображения и обработки файлов PDF. которые принадлежат следующим сторонам: Adobe Systems Incorporated, 345 Park Avenue, Сан-Хосе, Калифорния, 95110-2704, США. ISO не занимает никакой позиции в отношении доказательств, действительности и объема этих патентных прав. Владельцы этих патентных прав заверили ИСО в том, что они готовы вести переговоры о выдаче лицензий на разумных и недискриминационных условиях с заявителями по всему миру. В этом отношении заявления владельцев этих патентных прав зарегистрированы в ISO. Информация может быть получена от лиц, перечисленных выше».

В связи с принятием PDF версии 1.7 в качестве стандарта ISO (ISO 32000-1:2008) компания Adobe выпустила публичную патентную лицензию, предоставляющую «каждому лицу и организации в мире бесплатное право на Заявления о том, что Adobe владеет, производит, использует, продает, импортирует и распространяет Соответствует Реализации.»

См. PDF_family для получения дополнительной информации от Adobe о бесплатном использовании патентов Adobe.

Прозрачность См. PDF_семейство.
Самостоятельная документация Версия 1.4 и более поздние версии PDF могут включать пакеты метаданных XMP. XMP — это платформа Adobe для включения произвольных блоков метаданных с использованием представления в RDF.
Внешние зависимости

См. PDF_семейство.

Начиная с версии 1.7 файлы документов PDF могут использовать расширения, разработанные другими организациями, помимо Adobe. Документы, в которых используются эти расширения базовой спецификации, могут быть не полностью функциональными в общедоступных программах просмотра PDF, таких как Adobe Reader. См. список имен PDF на github; четырехсимвольные имена в реестре могут использоваться для идентификации проприетарных расширений или в качестве префиксов, связанных с цифровыми подписями. Adobe использует префикс «ADBE».

Вопросы технической защиты См. PDF.

Факторы качества и функциональности

Текст
Обычный рендеринг См. PDF_семейство.
Целостность структуры документа См. PDF_семейство.
Целостность компоновки и отображения См. PDF_семейство.
Поддержка математики, формул и т. д. См. PDF_семейство.
Функциональность, выходящая за рамки обычного отображения См. PDF_семейство.

Обозначения типов файлов и идентификаторы форматов

Тег Значение Примечание
Расширение имени файла pdf
См. PDF_семейство.
Тип Интернет-СМИ приложение/pdf
Тип носителя, зарегистрированный в IANA. См. также PDF_семейство.
Магические числа Hex: 25 50 44 46 2D 31 2E 37
ASCII: %PDF-1.7
Из ПРОНОМ. Однако значение магического числа в заголовке (%PDF-1. 7), указывающее версию PDF, которой соответствует файл, может быть переопределено в другом месте файла. См. примечание ниже для получения более подробной информации об определении хронологической версии документа PDF, о соответствии которой он заявляет.
Номер PUID футов/276
См. https://www.nationalarchives.gov.uk/PRONOM/fmt/276 для PDF 1.7.
Идентификатор заголовка Викиданных Q26085317
См. https://www.wikidata.org/wiki/Q26085317 для PDF 1.7.

Примечания

Общий

w3.org/2001/XMLSchema-instance»> Идентификация хронологических версий PDF может быть указан в двух местах в файле PDF. Все файлы PDF должны иметь версию, указанную в заголовке с помощью 5 символов %PDF– , за которыми следует номер версии. Для файлов PDF, соответствующих спецификациям ISO 32000-1:2008 или более ранним версиям (т. е. до ISO 32000-2:2017), номер версии имеет форму 1.N, где N — цифра от 0 до 7. Например, PDF 1.7 идентифицируется как %PDF–1.7 . Однако, начиная с PDF 1.4, создатель PDF, соответствующий требованиям, может использовать запись «Версия» в Каталоге документов, чтобы переопределить версию, указанную в заголовке. Расположение Каталога в файле указано в корневой записи трейлера/нижнего колонтитула файла. Эта функция переопределения была введена для облегчения поэтапного обновления PDF путем простого добавления в конец файла. В результате необходимо найти каталог в файле, чтобы получить правильный номер версии. Если PDF-файл не «линеаризован», в этом случае каталог находится впереди, для этого потребуется прочитать трейлер, а затем использовать ссылку для поиска каталога, который обычно будет сжат. Это имеет практическое значение, поскольку инструменты идентификации формата, включая DROID, обычно ищут определенные символы в начале файла (т. е. в заголовке), чтобы обеспечить идентификацию с минимальными усилиями. DROID может искать символы в конце файла, но не может следовать косвенной ссылке или распаковывать содержимое файла. Если номер версии не совпадает в заголовке и в Каталоге, возможны ошибки идентификации формата.

Модуль JHOVE PDF действительно учитывает ситуацию, заявляя, что для PDF 1.0 — 1.6 «Версия PDF определяется данными, указанными в заголовке PDF, и ключом версии словаря каталога документов. В случае, если эти два значения не совпадают, в качестве авторитетного значения принимается ключ версии. »

Механизм расширения для формата PDF : PDF 1.7 представил механизм расширения, основанный на словаре расширений. Adobe использовала этот механизм для указания функций, представленных в Acrobat 9..0 (июнь 2008 г.) и 9.1 (июнь 2009 г.). См. PDF_1_7_ext03 и PDF_1_7_ext05. Ожидалось, что поставщики, разрабатывающие расширения, выберут 4-значные идентификаторы и будут перечислены в реестре. Adobe использует идентификатор ADBE . По состоянию на начало 2019 года http://adobe.com/go/ISO32000Registry (предлагаемое место в реестре) вел не к реестру, а к PDF-файлу с формой для подачи заявок; по состоянию на октябрь 2020 года URL-адрес был неработающим. Между тем список имен в формате PDF доступен в виде электронной таблицы на github по адресу https://github. com/adobe/pdf-names-list. План реестра был одним из небольшого набора функциональных различий между исходной спецификацией Adobe для PDF 1.7 и окончательным вариантом ISO 32000-1:2008. Дополнительные сведения о механизме расширения стандарта PDF см. в разделе 7.12.2 Словарь расширений для разработчиков и в приложении E стандарта ISO 32000-1:2018.

Рекомендуемая практика для облегчения распознавания PDF-документа как двоичного файла : И Adobe PDF Reference для версии 1.7, и ISO 32000-1:2008 рекомендуют следующее: «Если PDF-файл содержит двоичные данные, что рекомендуется, чтобы за строкой заголовка сразу же следовала строка комментария, содержащая как минимум четыре двоичных символа, то есть символы с кодом 128 или выше.Это обеспечивает правильное поведение приложений для передачи файлов, которые проверяют данные в начале файла, чтобы определить, обрабатывать содержимое файла как текст или как двоичный файл». Эта практика требуется в документах PDF, соответствующих любой версии PDF/A.

История

PDF 1.7 был выпущен в ноябре 2006 г. вместе с версией 8 Acrobat и Adobe Reader. В январе 2007 года Adobe объявила о намерении продолжить стандартизацию через TC 171/SC 2 ISO. Этот процесс привел к публикации ISO 32000-1 в июле 2008 г. Существуют существенные редакционные различия между двумя документами спецификаций, особенно в порядке следования материалов. Небольшие функциональные различия могут отражать асинхронность между циклом разработки продукта Adobe и процессом стандартизации ISO, но Adobe описывает спецификации как «совпадающие».

Цитата из ISO 32000-1:2008: «Первая версия PDF была обозначена как PDF 1.0 и была указана Adobe Systems Incorporated в документе PDF Reference 1.0, опубликованном Adobe и Addison Wesley. С тех пор PDF претерпел семь изменений. обозначены как: PDF 1.1, PDF 1.2, PDF 1.3, PDF 1.4, PDF 1. 5, PDF 1.6 и PDF 1.7. Все нерекомендуемые функции, определенные в предыдущей версии PDF, также были включены в последующую версию PDF. Поскольку ISO 32000-1 версия PDF, соответствующая PDF 1.7, она также подходит для интерпретации файлов, созданных в соответствии с любой из спецификаций PDF от 1.0 до 1.7. На протяжении всей этой спецификации, чтобы указать, в какой момент в последовательности версий была введена функция, примечание с номером версии PDF в скобках (например, (PDF 1.3)). Таким образом, если функция помечена (PDF 1.3), это означает, что PDF 1.0, PDF 1.1 и PDF 1.2 не были указаны для поддержки этой функции, тогда как все версии PDF 1.3 и выше были де оштрафован за поддержку».


Характеристики формата

  • Adobe Systems Incorporated предоставляет доступ как к своему исходному справочнику в формате PDF 1.7, так и к варианту документа, который был утвержден как ISO 32000-1:2008. Последний был реорганизован и переформатирован в соответствии с рекомендациями ISO. Предполагается, что количество функциональных различий невелико, поскольку Adobe описывает спецификации как «совпадающие».
    • Управление документами. Формат переносимых документов. Часть 1: PDF 1.7 (https://opensource.adobe.com/dc-acrobat-sdk-docs/standards/pdfstandards/pdf/PDF32000_2008.pdf). Распространяется Adobe после принятия стандарта ISO 32000-1:2008 с разрешения ISO.
  • Архив спецификаций Adobe в формате PDF (http://www.adobe.com/devnet/pdf/pdf_reference_archive.html).
  • ИСО 32000-1:2008. Управление документами. Формат переносимых документов. Часть 1: PDF 1.7. Доступно для покупки в ISO

Полезные ссылки

URL-адреса

  • Статья в Википедии для PDF (https://en.wikipedia.org/wiki/PDF).
  • Запись в Википедии об истории формата переносимых документов (https://en.wikipedia.org/wiki/History_of_the_Portable_Document_Format_(PDF)).
  • Список имен PDF на github (https://github. com/adobe/pdf-names-list). Электронная таблица содержит все префиксы разработчиков, зарегистрированные с 2008 года. По юридическим причинам Adobe ведет список регистраций, имевших место до публикации ISO 32000-1:2008.
  • Документы Adobe со ссылкой на ISO 32000-2:2017 (https://reference.pdfa.org/iso/32000/). Многие из представленных здесь документов также являются нормативными ссылками на ISO 32000-1.
  • Запись PRONOM для fmt/276 (http://www.nationalarchives.gov.uk/PRONOM/fmt/276). Информация в PRONOM на PDF 1.7 (ISO 32000-1). PUID: fmt/276.
  • Запись Викиданных для Q26085317 (https://www.wikidata.org/wiki/Q26085317). Информация в WikiData о PDF 1.7 (ISO 32000-1). Идентификатор названия WikiData: Q26085317
  • См. также PDF_family.

Последнее обновление: 14.03.2022


4. Структура документа — объяснение PDF [книга]

Глава 4. Структура документа

В этой главе мы оставляем позади биты и байты файла PDF , и рассмотрим логическую структуру. Мы рассматриваем трейлер словарь , каталог документов и дерево страниц . Перечислим необходимые записи в каждом объект. Затем мы рассмотрим две общие структуры в файлах PDF: текст строки и даты .

На рис. 4-1 показана логическая структура типового документа.

Рис. 4-1. Типичная структура двухстраничного PDF-документа

Trailer Dictionary

Этот словарь, находящийся в трейлере файла, а не в основном тело файла, является одной из первых вещей, которые должны быть обработаны, когда программа хочет прочитать документ PDF. Он содержит записи, позволяющие таблицу перекрестных ссылок — и, следовательно, объекты файла — для чтения. Его важные записи сведены в Таблицу 4-1.

Таблица 4-1. Entries in a trailer dictionary (*denotes required entry)

Key Value type Value
/Size * Integer Total number of entries in таблица перекрестных ссылок файла (обычно равно количеству объектов в файле плюс один).
/Root * Косвенная ссылка на словарь Каталог документов .
/Информация Косвенная ссылка на словарь Информация о документе словарь .
/ ID Массив из двух строк Уникально идентифицирует файл в рабочем процессе. Первый строка определяется, когда файл сначала создается, второй изменены системами рабочего процесса, когда они изменяют файл.

Вот пример словаря трейлера:

 <<
   /Размер 421
   /Корень 377 0 Р
   /Информация 375 0 Р
   /ID [<75ff22189ceac848dfa2afec93deee03> <057928614d9711db835e000d937095a2>]
>> 

После обработки словаря трейлера мы можем перейти к чтению информационный словарь документа и каталог документов .

Информационный словарь документов

информационный словарь документов содержит даты создания и изменения файла, а также некоторые простые метаданные (не путать с более полными метаданными XMP). обсуждается в метаданных XML).

Записи словаря информации о документе описаны в таблице 4-2. Типичный словарь информации о документе приведено в Примере 4-1.

Таблица 4-2. Записи в словаре информации о документе. Типы «текст строка» и «строка даты» объясняются далее в этой главе.

Ключ Тип значения Значение
/Название текстовая строка Название документа. Обратите внимание, что это не имеет ничего общего с любой заголовок, отображаемый на первой странице.
/Тема текстовая строка Тема документа. Опять же, это просто метаданные без особых правил о содержании.
/Ключевые слова текстовая строка Ключевые слова, связанные с этим документом. Советов не дают как их структурировать.
/Автор текстовая строка Имя автора документа.
/ Дата создания строка даты Дата создания документа.
/ModDate строка даты Дата последнего изменения документа.
/Создатель текстовая строка Имя программы, которая первоначально создала это документ, если он начинался как другой формат (например, «Microsoft Word»).
/Производитель текстовая строка Имя программы, конвертировавшей этот файл в PDF, если он начинался как другой формат (например, формат слова процессор).

Пример 4-1. Типовой информационный словарь документов

 <<
   /ModDate (D:20060926213913+02'00')
   /CreationDate (D:20060926213913+02'00')
   /Название (catalogueproduit-UK.qxd)
   /Creator (QuarkXPress: фильтр pictwpstops 1.0)
   /Producer (Acrobat Distiller 6.0 для Macintosh)
   /Автор (Джеймс Смит)
>> 

Формат строки даты (для /CreationDate и /ModDate ) обсуждается в разделе Даты. Формат текстовой строки (который описывает, как различные кодировки могут использоваться в строковом типе) описано в текстовых строках.

Каталог документов

Каталог документов является корневым объектом основной граф объектов, из которого все другие объекты могут быть достигнуты через косвенные ссылки. В Таблице 4-3 мы перечисляем словарные статьи каталога документов, которые требуются, и некоторые из много необязательных, чтобы представить краткие темы PDF, которые мы не охватываем в другом месте на этих страницах.

Таблица 4-3. The document catalog (*denotes required entry)

Key Value type Value
/Type * name Must be /Catalog .
/страниц * косвенная ссылка на словарь Корневой узел дерева страниц. Деревья страниц обсуждаются в Страницы и деревья страниц.
/PageLabels Числовое дерево Числовое дерево, задающее метки страниц для этого документа. Этот механизм позволяет страницам в документе иметь больше сложная нумерация, чем просто 1,2,3…. Например, предисловие книги могут быть пронумерованы i,ii,iii…, в то время как основное содержание начинается снова с 1,2,3… Эти метки страниц отображаются в PDF зрители — они не имеют ничего общего с печатной продукцией.
/ Имена словарь Словарь имен. Это содержит различные имена деревья , которые сопоставляют имена объектам, чтобы предотвратить использовать номера объектов для прямой ссылки на них.
/Назначения словарь Словарь, сопоставляющий имена адресатам. Пункт назначения представляет собой описание места в документе PDF, к которому гиперссылка отправляет пользователя.
/ViewerPreferences словарь словарь предпочтений зрителя , который позволяет флагам определять поведение средства просмотра PDF, когда документ просматривается на экране, например страница, на которой он открыт, начальный масштаб просмотра и так далее.
/PageLayout имя Задает макет страницы, используемый средствами просмотра PDF. Ценности /SinglePage , /OneColumn , /TwoColumnLeft , /TwoColumnRight , /TwoPageLeft , /TwoPageRight . (По умолчанию: /Одностраничный ). Подробности в таблице 28 ИСО 32000-1:2008.
/Пейджмоде имя Задает режим страницы, используемый средствами просмотра PDF. Ценности /UseNone , /UseOutlines , /UseThumbs , /полноэкранный , /UseOC , /Использование вложений . (По умолчанию: /UseNone ). Подробности в Таблице 28 ИСО 32000-1:2008.
/Контуры косвенная ссылка на словарь Структурный словарь является корнем схема документа , широко известная как закладки.
/ Метаданные косвенная ссылка на stream Метаданные XMP документа — см. Метаданные XML.

Страницы и деревья страниц

Дерево страниц , построенное из словарей , приносит вместе инструкции по рисованию графического и текстового контента (который мы рассмотрим в главе 5 и главе 6) с ресурсами (шрифты, изображения и другие внешние данные), которые используются этими инструкциями. Он также включает в себя размер страницы вместе с рядом других коробки определение кадрирования и так далее.

Записи в словаре страниц сведены в Таблицу 4-4.

Таблица 4-4. Entries in a page dictionary (*denotes required entry)

Key Value type Value
/Type * name Must be /Page .
/ Родительский * косвенная ссылка на словарь Родительский узел данного узла в дереве страниц.
/Ресурсы словарь Ресурсы страницы (шрифты, изображения и т. д.). Если это запись полностью опущена, ресурсы наследуются от родительский узел в дереве страниц. Если ресурсов действительно нет, включите эту запись, но используйте пустой словарь.
/Содержание косвенная ссылка на поток или массив таких references Графическое содержимое страницы в одном или нескольких разделах. Если эта запись отсутствует, страница пуста.
/Повернуть целое число Поворот страницы в градусах по часовой стрелке от к северу. Значение должно быть кратно 90. Значение по умолчанию: 0. Это относится как к просмотру, так и к печати. Если эта запись отсутствует, его значение наследуется от его родительского узла на странице дерево.
/MediaBox * прямоугольник Медиабокс страницы (размер ее носитель, например, бумага). Для большинства целей размер страницы. Если это запись отсутствует, она унаследована от своего родительского узла на странице дерево.
/CropBox прямоугольник Поле обрезки страницы. Это определяет область страницы отображается по умолчанию при отображении или печати страницы. Если отсутствует, его значение определено таким же, как поле мультимедиа.

Структура данных прямоугольник для медиа-блок и другие блоки представляют собой массив из четырех числа. Они определяют диагонально противоположные углы прямоугольника. первые два элемента массива x и y координаты одного угла, двух последних элементов быть таковыми другого. Обычно левый нижний и правый верхний углы даны. Так, например:

 /MediaBox [0 0 500 800]
/CropBox [100 100 400 700] 

определяет страницу размером 500 на 800 точек с полем обрезки, удаляющим 100 точек с каждой стороны страницы.

Страницы связаны друг с другом с помощью страницы дерево , а не простой массив. Такая древовидная структура делает его быстрее найти нужную страницу в документе с сотнями или тысячами страницы. Хорошие приложения PDF строят сбалансированное дерево (один с минимальной высотой по количеству узлов). Это гарантирует, что конкретная страница может быть найдена быстро. Узлы без потомков сами страницы. Показан пример структуры дерева страниц для семи страниц. на Рисунке 4-2.

Это будет записано в объектах PDF, как показано в примере 4-2. Записи в промежуточном или корневом узел дерева страниц (т. е. не сама страница) сведены в Табл. 4-5.

Рис. 4-2. Дерево страниц на семь страниц. Точная форма дерева осталась в отдельное приложение PDF. Показан код PDF для этого дерева в примере 4-2.

Пример 4-2. Объекты PDF, используемые для построения дерева страниц, показанного на рисунке 4-2

 1 0 obj  Корневой узел 
<< /Тип /Страницы /Детские [2 0 R 3 0 R 4 0 R] /Количество 7 >>
эндообъект
2 0 obj  Промежуточный узел 
<< /Тип /Страницы /Дети [5 0 R 6 0 R 7 0 R] /Родитель 1 0 R /Количество 3 >>
эндообъект
3 0 obj  Промежуточный узел 
<< /Тип /Страницы /Дети [8 0 R 9 0 R 10 0 R] /Родитель 1 0 R /Количество 3 >>
эндообъект
4 0 обж  Страница 7 
<< /Type /Page /Parent 1 0 R /MediaBox [0 0 500 500] /Resources << >> >>
эндообъект
5 0 объект  Страница 1 
<< /Type /Page /Parent 2 0 R /MediaBox [0 0 500 500] /Resources << >> >>
эндообъект
6 0 объект  Страница 2 
<< /Type /Page /Parent 2 0 R /MediaBox [0 0 500 500] /Resources << >> >>
эндообъект
7 0 обж  Страница 3 
<< /Type /Page /Parent 2 0 R /MediaBox [0 0 500 500] /Resources << >> >>
эндообъект
8 0 обж  Страница 4 
<< /Type /Page /Parent 3 0 R /MediaBox [0 0 500 500] /Resources << >> >>
эндообъект
9 0 обж  Страница 5 
<< /Type /Page /Parent 3 0 R /MediaBox [0 0 500 500] /Resources << >> >>
эндообъект
10 0 объект  Страница 6 
<< /Type /Page /Parent 3 0 R /MediaBox [0 0 500 500] /Resources << >> >>
endobj 

Таблица 4-5. Записи в промежуточном или корневом узле дерева страниц (* обозначает required entry)

Key Value type Value
/Type * name Must be /Pages .
/Дети * массив косвенных ссылок Непосредственные дочерние узлы дерева страниц данного узла.
/Count * целое число Количество узлов страницы (не других узлов дерева страниц), которые являются возможными дочерними элементами этого узла.
/Родительский косвенная ссылка на узел дерева страниц Ссылка на родителя этого узла (узел которого это ребенок). Должен присутствовать, если не является корневым узлом страницы дерево.

В этом дереве на любую страницу можно найти не более двух косвенных ссылок вдали от корневого узла.

Текстовые строки

Строки вне фактического текстового содержимого страницы (например, названия закладок, информация о документе и т. д.) известны как текст . строки . Они кодируются с использованием либо PDFDocEncoding или (в более поздних документах) Юникод. PDFDocEncoding основан на кодировке ISO Latin-1. это полностью задокументировано в Приложении D стандарта ISO 32000-1:2008.

Текстовые строки, закодированные как Unicode, отличаются глядя на первые два байта: это будет 254, за которым следует 255. Это маркер порядка байтов Unicode U+FEFF, который указывает UTF16BE кодирование. Это означает, что строка PDFDocEncoding не может начинаться с þ (254). следует ÿ (255), но это вряд ли произойдет в любом разумном случае. обстоятельство.

Даты создания и изменения /CreationDate и /ModDate в словаре информации о документе являются примерами формата даты PDF, который кодирует дату в строке, включая информацию о часовом поясе.

Строка даты имеет формат:

 (ГГГГММДДЧЧммССОНЧ'мм') 

, где скобки, как обычно, обозначают строку. Другие части даты приведены в Таблице 4-6.

Таблица 4-6. Составляющие формата даты PDF

Часть Значение
ГГГГ Год, состоящий из четырех цифр, например, 2008 .
ММ Месяц двумя цифрами от 01 до 12 .
ДД День, двумя цифрами от 01 до 31 .
ЧЧ Час, двумя цифрами от 00 до 23 .
мм Минуты, две цифры от 00 до 59 .
нержавеющая сталь Второй, двумя цифрами от 00 до 59 .
О Отношение местного времени к универсальному времени, либо + , - или Z . + означает, что местное время позже, чем UT, - раньше, а Z равно всемирному времени.
НН' Абсолютное значение смещения от универсального времени в часов, двумя цифрами от 00 до 23 .
мм' Абсолютное значение смещения от универсального времени в минуты, двумя цифрами от 00 до 59 .

Все части даты после года являются необязательными. Например, (D:1999) вполне допустимо. Очевидно, хотя, если вы опустите одну часть, вы должны опустить и все последующее, иначе результат был бы неоднозначным. Значения по умолчанию для DD и MM равен 01, для всех остальных частей по умолчанию используются нули.

Например:

 (D:20060926213913+02'00') 

означает 26 сентября 2006 г., 21:39:13, во втором часовом поясе. часов опережает всемирное время.

Собираем вместе

Это текст, созданный вручную, который необходимо преобразовать в действительный PDF-файл. файл по pdftk с помощью метода представлена ​​в главе 2. Это трехстраничный документ, со словарем информации о документе и деревом страниц. На рис. 4-3 показан этот документ, отображаемый в Acrobat. Читатель. Рисунок 4-4 – соответствующий объект график.

Пример 4–3. Трехстраничный документ с информацией о документе словарь

 %PDF-1.1  Заголовок  1 0 obj  Верхний уровень дерева страниц: имеет двух дочерних элементов — первую страницу и промежуточный узел дерева страниц  << /Дети [2 0 R 3 0 R] /Тип /Страницы /Количество 3 >>
эндообъект
4 0 obj  Поток содержимого первой страницы  << >>
ручей
1. 0.000000 0.000000 1. 50. 770. см BT /F0 36. Tf (Page One) Tj ET
конечный поток
эндообъект
2 0 obj  Первая страница  <<
 /Повернуть 0
 /Родитель 1 0 Р
 /Ресурсы
 << /Font << /F0 << /BaseFont /Times-Italic /Subtype /Type1 /Type /Font >> >> >>
 /MediaBox [0,000000 0,000000 595,2755 841,88976378]
 /Тип /Страница
 /Содержание [4 0 Р]
>>
эндообъект
5 0 obj  Каталог документов  << /PageLayout /TwoColumnLeft /Pages 1 0 R /Type /Catalog >>
эндообъект
6 0 obj  Третья страница  <<
 /Повернуть 0
 /Родитель 3 0 Р
 /Ресурсы
 << /Font << /F0 << /BaseFont /Times-Italic /Subtype /Type1 /Type /Font >> >> >>
 /MediaBox [0,000000 0,000000 595,2755 841,88976378]
 /Тип /Страница
 /Содержание [7 0 Р]
>>
эндообъект
3 0 объект  Промежуточный узел дерева страниц, ссылающийся на вторую и третью страницы  << /Родитель 1 0 R /Дети [8 0 R 6 0 R] /Количество 2 /Тип /Страницы >>
эндообъект
8 0 obj  Вторая страница  <<
 /Повернуть на 270
 /Родитель 3 0 Р
 /Ресурсы
 << /Font << /F0 << /BaseFont /Times-Italic /Subtype /Type1 /Type /Font >> >> >>
 /MediaBox [0,000000 0,000000 595,2755 841,88976378]
 /Тип /Страница
 /Содержание [9 0 Р]
>>
эндообъект
9 0 obj  Поток контента для второй страницы  << >>
ручей
q 1.
Оставить комментарий

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *