Электронные книги

 

Введение

Электронная книга (Electronic book, e-book, eBook) – это текстовый файл (e-books), предназначенный для прочтения, с помощью программы-читалки, звуковой (audio) файл, для прослушивания, с помощью специальных программ-плееров и видеофайл (videos), для прослушивания и просмотра страниц, с помощью видео-плеера.
Также, электронной книгой называли (и называют до настоящего времени), специальное цифровое устройство, типа планшета, предназначенное только для хранения в своей памяти, текстовых файлов специального формата, и программу для чтения книги на экране устройства. Назовём, для ясности, подобные электронные устройства книжными гаджетами.

Xerox Sigma V
Компьютер Xerox Sigma V

Первая электронная книга – “Декларация независимости США,” была создана в 1971 году, Майклом Хартом, на компьютере Xerox Sigma V, установленном в университете штата Иллинойс. Майкл Харт, просто впечатал (пальчиками на клавишах) текст Декларации в компьютер.

 

 

Майкл Стерн Харт (Michael Stern Hart)
Майкл Стерн Харт (Michael Stern Hart)

Майкл Стерн Харт ( Michael Stern Hart) — американский писатель, изобретатель электронных книг и основатель проекта “Гутенберг”, целью которого было создание электронных копий большего количества книг, к которым имелся свободный доступ через Интернет. Большинство первых материалов, Майкл Харт напечатал и разместил лично.

 

 

 

 



Книжные гаджеты

Электронная книга Amazon Kindle paperwhite 2018 8GB
Электронная книга Amazon Kindle paperwhite 2018 8GB

Эти устройства становятся всё менее популярными в силу своей узкой специальзации: лишь хранение тестовых, книжных файлов и программ для их прочтения. Эти функции заложены в современных компьютерах – ноутбуках (Notebook), планшетах (Planchette PC), таблетках (Tablet PC), смартфонах (Smartphone) в полном объёме, как одно из дополнений их многочисленных  возможностей. В современных устройствах (книжных гаджетах), функции, доступные пользователю, постепенно расширяются и, кроме чтения книг, программное обеспечение позволяет: просматривать фотоальбомы, прослушивать музыку и даже играть в простейшие компьютерные игры. То есть, по своим функциям, книжные гаджеты превращаются в привычные всем планшеты или таблетки и теряются, как отдельный класс электронных устройств.
Далее по тексту, под “Электронной книгой” мы будем подразумевать, если не оговаривается особо, текстовый файл в одном их многочисленных форматов и разнообразные программы-читалки (ридеры) для просмотра текстовых файлов.

К началу страницы

Форматы файлов, используемых в электронных книгах

Электронные книги хранятся на компьютерах и, поэтому, электронные книги – это компьютерные файлы различных форматов. Этих форматов огромное множество. На странице нашего Учебного веб-сайта “Форматы файлов, хранящих электронные книги,” можно окинуть взором далеко не полное множество текстовых форматов для хранения электронных книг и их прочтения. На этой же странице, мы перечислим и кратко рассмотрим (с указанием расширений имён файлов) лишь некоторые, наиболее популярные из этих форматов. Файлы современных электронных книг, помимо текста, могут содержать несколько каналов восприятия: звуково-музыкальный, изобразительно-динамический (фотографии и галереи) и интерактивно-ментальный.

TXT – файлы

Простой (Plain text / Raw text file) текстовый файл (TXT): .txt.
(Plain text – Простой текст, Raw text file – Необработанный текстовый файл)
TXT – это текстовый файл, формат которого структурирует набор строк текста. Окончание таких файлов указывается с помощью маркеров окончания файла, которые следуют после последней строки текста. Файл содержит обычный текст. Файлы TXT, выполняют роль блоков по хранению информации, используемых с целью недопущения конфликтов с другими форматами файлов. Поврежденные файлы TXT восстановить проще, чем текстовые файлы более сложных форматов. TXT – файлы содержат очень мало элементов форматирования. Они универсальны по своей природе, т.к. открываются в любом текстовом редакторе. TXT файлы могут применять кодировку Unicode, которая позволяет облегчить пользователям, пишущим на разных языках, использовать данные файлов этого формата. Файлы TXT, использующие текст только в кодировке ASCII, можно переносить на разные компьютеры и устройства на ОС Unix, Mac и Windows. 

HTML файлы

Гипертекстовый формат (Hyper Text Markup Language): .html, .htm.
HTML –  это стандартизированный язык разметки документов, для просмотра веб-страниц в браузере.
(Hyper Text Markup Language – язык описания гипертекстовых документов)
HTML  – это стандартный язык для создания веб-страниц. Идея его создания была предложена в 1989 году, физиком Тимом Бернерс-Ли (Timothy John Berners-Lee).

Тим Бернерс-Ли (Timothy John Berners-Lee)
Тим Бернерс-Ли (Timothy John Berners-Lee)

Бернерс-Ли, Тимоти Джон (Berners-Lee Timothy John) – британский ученый, создатель Интернета. Ввел в 1991 году понятие World Wide Web. С 1994 года, является главой “Консорциума Всемирной паутины” (World Wide Web Consortium, W3C).  Возглавляет фонд World Wide Web Foundation.
Интересно! Создатель современного интернета, задумал создать новую сеть, которая должна заменить его детище.  Изобретатель представил новую структуру Inrupt, в которой пользователи сами смогут выбирать, где хранить данные, не предоставляя их крупным IT-компаниям. Создатель интернета заявил, что сеть в ее нынешнем состоянии “достигла критического переломного момента, … превратилась в двигатель несправедливости и разделения; она управляется мощными силами, которые используют ее для своих собственных целей”.

Веб-браузеры могут “читать” тексты на этом языке и превращать написанное в различные тексты, цвета и изображения (заголовки, параграфы, цитаты и т.п.), гиперссылки. Кроме того, браузеры в состоянии вставлять изображения или аудио, с помощью механизма внедрения URL-адреса. Язык HTML, позволяет добиться определенной интерактивности, благодаря своим свойствам и возможностям, однако, при этом, пользователь может видеть только конечный продукт, а не код. По желанию, пользователь может получить доступ к коду  в браузере. Некоторые почтовые клиенты, позволяют использовать HTML для форматирования текста писем. HTML и XHTML – родственные, но разные продукты.
Теги HTML заключаются в скобки “<>”. Большинство из них, снабжены командами начала и окончания, например: <title>Заголовок  веб-страницы</title>. При этом, некоторые теги не имеют команд начала или конца, т.е. являются независимыми (например, тег ). Несмотря на то, что HTML 4-ой версии отображается большинством современных браузеров, были разработаны новые языки – XHTML и HTML 5.  HTML 5 значительно богаче по своей функциональности.

К началу страницы

Открытые форматы электронных книг

Форматов и, соответственно файлов, разработанных в соответствии с этими форматами, с каждым годом становится всё больше и больше. Загляните на страничку нашего учебного веб-сайта “Форматы Аудиофайлов“, чтобы представить себе, сколько уже сделано в этой области информационных технологий.

EPUB файлы

Electronic Publication: .epub.
EPUB – это открытый формат электронных книг (с расширением .epub), разработан в 2007 году, Международным форумом по цифровым публикациям (International Digital Publishing Forum, IDPF). Файлы EPUB, используют различные версии языков HTML и XML. В электронных книгах этого формата, отсутствует достаточное количество ссылок и нет возможности вносить комментарии. По принципу работы EPUB, файлы похожи на архивные ZIP файлы. Файлы EPUB используются большинством устройств для чтения электронных книг, включая Nook, Kindle и другие устройства, которые конкурируют с Kindle. Основная цель создания формата EPUB – использование таких файлов для личного пользования, а также, для продажи текста (т.е. электронных книг).
За счёт методов переформатирования содержимого EPUB  файла, электронная книга может быть подогнана под любые размеры экрана цифровых устройств. Файлы EPUB могут содержать встроенные растровые и векторные изображения, а также, средства защиты авторских прав DRM (Digital rights management).

DRM (Digital rights management) – это технические средства защиты авторских прав, то  есть,  цифровое управление ограничениями или управление цифровыми ограничениями. Иначе – набор программных средств, предназначенных для ограничения и затруднения различных действий с данными, в электронной форме (копирование, модификацию, просмотр и т. п.) и отслеживания подобных действий. Средства DRM используется многими компаниями, в том числе, такими гигантами, как Amazon, Apple Inc., Microsoft, Sony и т. д. В 1998 году, в США был принят Закон об авторском праве в цифровую эпоху, который предполагает уголовную ответственность за распространение технологий для обхода DRM

Последние версии EPUB формата имеют 4 спецификации, указывающие семантику и требования к конфигурации документа. В зависимости от содержания книги, определяются варианты использования технологий XHTML, SVG и CSS. А формат открытого контейнера (Open Container Format), определяет формат файлов и метод обработки, при помещении ресурсов файла EPUB, в архив ZIP .

OPF файлы

Open Packaging Format (OPF FlipBook): .opf.
(Page-flip effect – эффект перелистывания страницы)
OPF (файлы в формате Open Packaging Format) – это стандартный тип файлов, который является частью процесса обработки электронных книг EPUB. Файл OPF, содержит информацию о конкретной электронной книге, в том числе: ID книги, язык написания книги, автор книги, название книги. OPF файлы сохраняются в XML формате и являются частью архива электронной книги EPUB. Для того, чтобы файл OPF работал, ему необходим отдельный файл NCX XML. Этот отдельный файл содержит оглавление электронной книги. Каждый OPF файл включает в себя четыре различных элемента: руководство (guide), структура (spine), метаданные (metadata) и список (manifest). Список указывает все отдельные файлы, которые являются частью более крупного пакета. Структура отвечает за поддержание линейного порядка чтения. Руководство не является обязательным и включает в себя структурные компоненты электронной книги.

К началу страницы

ODT файлы

OpenDocument Text Document: .odt.
ODT – это файлы, используемые для создания и управления электронными таблицами, диаграммами, презентациями и текстовыми документами. В качестве основы, ODT файлы используют стандарт XML. Назначение ODT файлов – обеспечить открытую (бесплатную) работу с документами и являются частью программы Open Office, созданной компанией Sun Microsystems. Она используется в качестве альтернативы Microsoft Office.
Загрузка программы бесплатна, безо всяких лицензионных поборов. При правильном сохранении, файлы в Open Office можно открыть и в Microsoft Word. Их также легко преобразовать в форматы DOC и DOCX. Open Office может открывать документы Microsoft Office. Open Office является бесплатным приложением, которое может работать на различных операционных системах.
Формат текстового файла OpenDocumen, используется при работе, как с бесплатными, так и платными программами оффлайн и онлайн (с использованием веб-интерфейса). Этот формат был разработан в рамках промышленного консорциума “Организации по улучшению стандартов структурированной информации” (Organization for the Advancement of Structured Information Standards, OASIS). Файлы ODT используют различные компоненты, в том числе масштабируемую векторную графику и синхронизированный язык интеграции мультимедиа.

К началу страницы

FB2 файлы

Fiction Book: .fb2;
FictionBook (FeedBook) – это формат представления электронных версий книг в виде XML-документов, где каждый элемент книги описывается своими тегами. Стандарт призван обеспечить совместимость с любыми устройствами и форматами.

Тег – это метка, размечающая и обозначающая информацию для облегчения процесса поиска, 
то есть, теги – это ключевые слова, по которым можно легко найти нужный материал. Эти слова кратко описывают, о чем этот материал.
Мета-тег – это специальный элемент кода, через который браузер и поисковые машины считывают информацию о веб-странице, то есть, мета-теги описывают веб-страницу с помощью заголовка, дескриптора, ключевых фраз. Мета-теги не видны пользователям.

Файл FB2 был разработан Дмитрем Грибовым. Формат бесплатен (пользователи могут обмениваться такими файлами бесплатно), а исходный код – открытый.

Дмитрий Грибов, автор формата fb2
Дмитрий Грибов, автор формата fb2

Дмитрий Грибов, технический директор компании ЛитРес, родился в 1975 году. В 1992 году окончил училище со специальностью “реставратор произведений из дерева и памятников деревянного зодчества”. В 1999 году окончил Российский государственный социальный университет, факультет общей и социальной психологии. С 1999 года работает в IT сфере.Разработчик формата fb2. Одним из первых в России начал развивать направление электронных книг. 
Любимая цитата: “Расплоди тараканов, … и у тараканов появятся права. Права, очевидные для всех. Набегут певцы, которые будут воспевать их. Они придут к тебе и будут петь о великой скорби тараканов, обреченных на гибель”.

FB2 файлы можно использовать для хранения электронных книг любого типа. Файлы FB2 могут содержать сноски, изображения, форматированный текст, Unicode и таблицы, которые могут поддерживаться или не поддерживаться некоторыми считывателями FB2 – ридерами (читалками). Любые изображения, используемые в электронной книге, такие как: PNG или JPG, преобразуются в  двоичный код (Base64), и сохраняются в теле самого файла книги.  Ограничений по типу текста, который может быть помещен в файл FB2, нет. Файлы FB2 содержат только один файл XML. При этом, изображения конвертируются в Base64 и превращаются в тег. Такие файлы очень часто копируются в виде архивов ZIP для того, чтобы облегчить их использование на различных компьютерах.
FB2 файлы могут содержать эпиграфы, стихи, цитаты и другие элементы, содержащиеся в книге. FB2 файлы содержат информацию об авторе, названии произведения и издателе. Файлы FB2 используют простую семантику, поддерживают Unicode, а также, внутреннее форматирование (включая полужирный шрифт, курсив, подчеркивание, зачеркивание, верхний и нижний индексы). Файлы FB2 часто содержат таблицы стилей, описание и основной текст (тело), в самом тексте файла. Структура файла позволяет определить параграфы, разделы, подразделы по всему тексту. В то время, как простой текст находится в начале файла FB2, крупные бинарные изображения располагаются в конце файла. В отличие от других файлов электронных книг, таких как EPUB, формат FB2 – это всего лишь один XML-файл.

К началу страницы

TeX файлы

TeX Document: .tex;
TEX – файлы (с расширением имени файла .tex) – это текстовые документы, созданные с помощью программы LaTex.

LaTex – это программа для набора текста, которая позволяет пользователю создавать высококачественные документы с различными таблицами, диаграммами и чертежами.

В отличие от программ обработки текста, таких как, Microsoft Word или Apple Pages, документы TEX, в основном используются научным сообществом. Они применяются для простых документов, статей, для создания книг и других технических публикаций. В систему компьютерной вёрстки TeX, входят средства для секционирования документов, для работы с перекрёстными ссылками. Документы TEX используются в компьютерной сфере, в сфере техники, физики, экспериментальной лингвистики, а также, в некоторых других областях, из-за высокого качества производимых документов и способности файлов TEX, содержать не просто обычный текст. Документы TEX, поддерживают включение сложных математических выражений, графиков и других отраслевых символов. Программа LaTeX, разработанная в 1985 году, в настоящий момент поддерживается, обновляется и развивается, как часть проекта LaTeX3.

PDF файлы

Portable Document Format
Portable Document Format

Portable Document Format (PDF): .pdf;
PDF – это межплатформенный, открытый формат электронных документов, разработанный фирмой Adobe Systems, с использованием ряда возможностей языка PostScript. PDF формат предназначен для представления полиграфической продукции в электронном виде. PDF-файлы трансформируют документ в фиксированный макет, похожий на изображение, который сохраняет свой формат во всех программах, на всех устройствах и операционных системах. Это позволяет пользователю интегрировать в единый документ различные изображения, шрифты и текстовые форматы (иногда содержащие гиперссылки). Документ готов к печати и доступен для обмена с любого устройства.
Большинство программ для чтения PDF являются бесплатными, что облегчает доступ и использование таких файлов. Такие файлы могут быть защищены паролем, зашифрованы и отредактированы. Кроме того, в них можно помещать 3D-изображения (с 2004 года). Можно объединять, поворачивать или редактировать PDF файлы  в Интернете, с использованием бесплатного редактора PDF. Открыть файл PDF может любой компьютер с установленным Adobe Acrobat Reader.
PDF – файлы можно просматривать, отправлять и сохранять на мобильных устройства (телефон и планшеты) .
PDF – файлы  имеют два различных типа форматирования: линейный и нелинейный. Нелинейные файлы меньше по размеру, однако загружаются медленнее из-за того, что необходимые данные разбросаны по всему файлу. Линейные (оптимизированные) файлы очень часто можно просмотреть в браузере. Кроме того, необходимости в их полной загрузке нет, так как можно начать просмотр линейного PDF – файла, не дожидаясь окончания загрузки. Нелинейные файлы можно оптимизировать с помощью программы Adobe Acrobat. Файлы PDF не кодируют информацию, необходимую для работы программы, что означает, что такие файлы содержат только те данные, которые описывают сам документ. Файлы PDF можно превратить в интерактивные путем добавления комментариев, флеш-анимации, трехмерной и двухмерной векторной графики, приложений, а также различных средств защиты (шифра, цифровых подписей и т.п.). 

К началу страницы

CHM файлы

Microsoft Compiled HTML Help (HTMLHelp): .chm;
HTMLHelp – это формат файлов контекстной справки, разработанный корпорацией Microsoft и выпущенный вместе с ОС Windows 98 в качестве замены формата WinHelp. Содержит в себе набор HTML-страниц, может также включать в себя содержание со ссылками на страницы, предметный указатель, а также базу для полнотекстового поиска по содержимому страниц. Как оглавление, так и сами HTML страницы  этого формата, поддерживают 28 языков. Возможно сжатие документов, их слияние, а также, поиск по документам. Кроме того, на страницах HTML можно разместить теги, изображения, текст, гиперссылки и др., что позволяет повысить качество файлов справки. Файлы CHM поддерживаются множеством различных программ для просмотра документов. Формат CHM используется и электронными книгами. Поддерживается большое количество кодировок (Unicode не поддерживается). CHM файлы совместимы с большинством веб-браузеров (независимо от ОС).
Сжатие осуществляется с использованием метода сжатия LZX. Распаковка осуществляется с помощью программ HTML Help Workshop и 7-Zip.

К началу страницы

EXE файлы

ExeBook (Самоисполняемая книга): .exe;
EXE – это формат самоисполняемых электронных книг. EXE файл состоит из двух частей:
1. Управляющая информация для загрузчика EXE книги, которая расположена в начале EXE файла и образует заголовок..
2. Тело загрузочного модуля, которое следует за заголовком. Тело загрузочного модуля электронной книги ExeBook, может содержать текст, рисунки, анимацию, навигационный гипертекст, поиск в  электронной книге, линки на веб-стороны, динамический клиентский код (Java Applets и JavaScripts). Большинство ExeBook в качестве исходных файлов, применяют HTML файлы, GIF и JPEG файлы, стандартные плагины. Имеется возможность применения парольной защиты всей е-книги, а также отдельных страниц, запрет на печать и копирование, что позволяет активно использовать этот формат, при коммерческом распространении . Книги ExeBook работают только на платформе WIN32. Простота изготовления макета книги, с помощью специально для этого предназначенных программ, позволяет изготовлять книги не только профессиональным издателям, но и любым желающим. Самоисполняемость файла обеспечивает работу, без дополнительного программного обеспечения. Внешний вид книги максимально приближен к печатной форме и потому создает привычные ощущения чтения обычной книги.

EXE немного о самом исполнительном файле

.EXE (сокр. англ. executable — исполнимый) — расширение исполняемых файлов, применяемое в операционных системах DOS, Windows, Symbian OS, OS/2 и в некоторых других, соответствующее ряду форматов. Кроме объектного кода, может содержать различные метаданные (ресурсы, цифровая подпись).

К началу страницы

MOBI файлы

Mobipocket: .mobi;
Расширение файлов MOBI, было создано в 2000 г. компанией Mobipocket. Компания производила приложения Mobipocket Reader, для устройств чтения электронных книг (для ОС Windows Mobile, Palm OS, Kindle, Blackberry и др.), КПК, компьютеров и смартфонов. Программное обеспечение бесплатно. Стоит отметить, что компанию Mobipockect, купила компания Amazon (в 2005 г.). Из-за прекращения поддержки файлов MOBI, на сегодняшний день, устройств для чтения книг, которые бы поддерживали этот формат, нет. В результате, в 2007 году, формат заменили форматом AZW. Возможность конвертирования файлов MOBI, особенно необходима тем пользователям, которые имеют новые устройства (в особенности те, что работают на ОС Android). В основе файлового формата MOBI, лежит открытый стандарт Open eBook XHTML. Его можно интегрировать с JavaScript. Пользователи могут добавлять страницы, комментарии, чертежи, выделять текст, а также, добавлять примечания к таким файлам для собственного пользования. Приложение Mobipocket Reader, обычно поставляется вместе со встроенным словарем. Ограничение на размер изображений в 64 кб, позволяет просматривать файлы даже на небольших устройствах (например, мобильных телефонах). При этом, увеличение размеров мобильных устройств и компьютеров превращает это преимущество в недостаток. Файлы MOBI идентичны формату AZW, от компании Amazon для устройств Kindle (при этом последний не интегрирован с Java). Файлы MOBI, были разработаны для оптимизации содержания файла с использованием в устройствах с узкополосным подключением к Интернету (например, 3G).

AZW файлы

AZW – формат электронной книги, разработанный компанией Amazon, для устройств Kindle (устройств для чтения электронных книг). Данный формат используется для тех книг, которые защищены средствами DRM. Этот формат похож на файл PRC Mobipocket, который средств защиты DRM не требует. Расширение файла AZW, в настоящий момент, используется для файлов электронных книг, которые как защищены средствами DRM, так и незащищены этими средствами. Формат AZW похож на формат MOBI, однако степень сжатия первого выше. Кроме того, данный формат использует собственные средства защиты DRM от компании Amazon. Такая защита не позволяет использовать файл, как на устройстве Kindle, так и на других устройствах, позволяющих читать такие книги. Защита DRM на устройстве Kindle, привязана к уникальному номеру устройства, которое связано с аккаунтом на сайте компании, где покупалось само устройство. Недостатком формата AZW является то, что он не позволяет добавлять к файлу серийные метаданные.

PRC файлы

Mobipocket eBook File: .prc.
PRC – это формат электронной книги, созданный компанией Mobipocket и используемый исключительно для устройств Palm, которые поддерживают форматы PRC. Файлы PRC также можно просмотреть на компьютере с помощью программы Mobipocket Reader Desktop. Незащищенные файлы PRC, можно просматривать на устройстве Kindle от компании Amazon. Формат электронных книг PRC, за свою основу взял язык XHTML, фреймы и JavaScript. Формат PRC, кроме того, поддерживает защиту средствами DRM, использование таблиц, изображений, добавление исправлений, примечаний, комментариев, закладок и др. Этот формат был разработан для оптимизации изображений и других элементов для мобильных устройств, с узкой полосой соединения с Интернетом.




К началу страницы

Графические растровые файлы

TIFF файлы

Tagged Image File Format (TIFF): .tiff.
TIFF – это формат хранения растровых графических изображений и векторных рисунков. Его  можно использовать для хранения штриховой графики и фотографий. Формат файлов TIFF был создан в ответ на возрастающую популярность приложений и оборудования для сканирования . TIFF формат поддерживает глубины цветов от 1 до 24 бита, а также, сжатие с потерями и без. Файл TIFF состоит из различных блоков. Каждый TIFF файл,  начинается с заголовка изображения, который указывает на папку файла изображения, в которой в свою очередь, находится вся информация об изображении.

JPEG файлы

 Joint Photographic Experts Group (JPEG): .jpg, .jpeg.
JPEG – это растровый, графический формат, применяемый для хранения фотографий и подобных им изображений. Файлы с расширением JPEG, удобны в случае необходимости отправки изображений по Интернету, благодаря тому, что они сжимают такие изображения с определенной потерей качества. Формат JPEG, предусматривает такой способ представления изображений, при котором сразу после загрузки части изображения, появляются размытые очертания всего файла (это отличает данный формат от форматов, которые предусматривают показ только загруженной части изображения). Степень сжатия можно регулировать, достигая при этом максимально выгодного соотношения размера файла и качества.
Метод сжатия JPEG используется несколькими форматами файлов. Наиболее известным из таких форматов является формат JPEG/Exif, который используется как цифровыми фотоаппаратами, так и другими устройствами для съемки. Обычно изображения в этом случае имеют расширение .JPG (.jpg).

DjVu файлы

Уже виденное (Déjà Vu, DjVu): .djvu.
DjVu – это графический, расторовый файл, сжатый по технологии сжатия изображений с потерями. Формат предназначен для хранения сканированных документов: книг, журналов, рукописей, содержащих большое количество графических элементов – формул, схем, рисунков и рукописных символов, цветных страниц. Наличие таких элементов в тексте, делает  трудоёмким их полноценное распознавание. DjVu формат  был разработан Яном Лекуном, Леоном Ботто, Патриком Хаффнером и Полем Ховардом, в лаборатории компании AT&T, в период между 1996 и 2001 годами. Формат DjVu во многих случаях бывает удобнее PDF формата,  благодаря меньшему размеру получаемых файлов и простоте при конвертировании больших объемов текста.
DjVu файлы хранят изображений в трёх слоях, которые получили название: фон, передний план и изображение-маска. У  изображения-маски разрешение выше. Фон и передний план сжимаются с использование алгоритма сжатия IW44. Изображение – маска сжимается с помощью алгоритма JB2. Такое раздельное сжатие, приводит к значительному уменьшению размера файлов. DjVu формат является конкурентом PDF формата с открытым исходным кодом. Кроме того, этот формат позволяет обмениваться изображениями с высоким разрешением через Интернет. Программы, просматривающие файлы DJVU, плагины к браузерам, кодеры и декодеры, доступны для ОС Windows и Mac.

К началу страницы

Мультимедиа книги

SWF файлы

Small Web Format, ранее Shockwave Flash: .swf.
SWF – это формат файла для так называемой флеш-анимации, видео, аудио и векторной графики  в Интернете. Изображение (графический файл), сохранённое в этом формате, масштабируется без видимых искажений, видеоролик имеет небольшой размер, происходит более быстрая загрузка видео файла и его воспроизведение.  Формат SWF файлов SWF, разработан компанией Macromedia, которая в настоящей момент куплена Adobe. Кроме векторной графики, файл такого формата, может также содержать текст. SWF файлы содержат анимированные элементы различной степени интерактивности и назначения. Их  можно просматривать (проигрывать) в веб-браузерах, в которых установлены соответствующий flash-плагины. Первоначально, SWF формат был разработан для плеера Shockwave (не поддерживается  после 31.12.2020 ). SWF файлы – это бинарные, 8-битные файлы. Самая последняя версия формата SWF10, поддерживает текст (в том числе двунаправленный), а также, сложные скрипты с новым тегом DefineFont4. Такая функциональность позволяет внедрять в файл изображения JPEG, которые имеют альфа-канал для непрозрачности и фильтр сглаживания.

Аудиокниги 

Аудиокнига (audio – слушать) –  это озвученное литературное произведение, записанное на любой звуковой носитель. Звуковыми носителями могут быть грампластинки, CD-диски, компакт-кассеты, жёсткие диски или аудиофайлы, хранящиеся на компьютере. Доступ к аудиокнигам возможен через плеер или браузер. Современные электронные аудиокниги – это мультимедийное средство информации. Различают два способа создания аудиокниг: чтение живым человеком и использование программ синтеза речи.

Мультимедиа (multimedia) – это данные, или содержание, которые представляется одновременно в разных формах: звук, анимированная компьютерная графика, видеоряд.

Форматов и, соответственно файлов, разработанных в соответствии с этими форматами, с каждым годом становится всё больше и больше. Загляните на страничку нашего учебного веб-сайта “Форматы Аудиофайлов“, чтобы представить себе, сколько уже сделано в этой областии информационных технологий.
Наиболее распространённый формат для звуковых книг – MP3. Этот формат и рассмотрим подробнее.

MP3 файлы

MPEG Layer 3 Audio: .mp3.

MP3 Logo
MP3 Logo

MP3 – это стандартные файлы MPEG-2 Audio Layer III, с расширением MP3, предназначенные для хранения аудиоданных. Большинство музыкальных плееров и смартфонов, воспроизводят музыку, хранящуюся в файлах типа MP3. Это сжатые файлы, с незначительным снижением качества звука по сравнению с оригиналом, т.е. несжатым аудиофайлом. Ведь в процессе сжатия (и немалого) удаляются лишь те частоты, которые человеческое ухо слышать и обрабатывать не способно. Уменьшенный после сжатия размер MP3 файла, позволяет экономно размещать его на компьютере и значительно уменьшить время загрузки и выгрузки аудиофайлов, независимо от скорости Интернет соединения. С помощью технологии сжатия с потерями, аудиофайлы сжимаются до размеров, которые подходят для отправки и хранения.
Предшественником формата MP3 был формат MPEG-1, который был заменен форматом MPEG-2 Audio Layer III. В отличие от файлов MPEG-1, файлы MP3 содержит только аудиоданные. Любые изображения, которые связаны с аудиоданными, которые можно увидеть на мобильных устройствах (смартфонах, планшетах, …) хранятся в отдельных файлах.  MP3 файлы с битрейтом в 128 кбит/с сжаты по сравнению с оригиналом в 11 раз. При этом, сжатая копия отличается от оригинала в тех участках спектра, которые человеческое ухо воспринимать не может, а важные данные остаются на месте. Если же размер MP3 файла уменьшить значительнее (что возможно), то качество звучания ухудшиться.

Цифровые говорящие книги. Формат DAISY.

Цифровая говорящая книга, предназначена для плохо видящих или совсем незрячих людей. В отличии от обычных аудиокниг, “говорящие” книги должны обеспечивать возможность удобной разметки и навигации по книге. Поэтому был разработан новый стандарт “говорящей” книги, формат которой получил название DAISY. Для работы над этим форматом, был создан международный консорциум DAISY,в который вошли представители организаций слепых, библиотек, разработчиков и издателей из разных стран мира.

DAISI Logo
DAISI Logo

DAISY (Digital Accessible Information System – цифровая система доступа к информации) – это стандарт цифрового формата для записи Цифровых говорящих книг (англ. digital talking books). DAISY формат сочетает различные способы представления материала: обычный текст, аудиоматериалы и иллюстрации. Многоуровневая навигация, обеспечивает переход к нужной книге, разделу, главе или странице. Формат предоставляет возможность выбора способа воспроизведения аудиоматериалов: прослушивание аудиокниг в дикторском исполнении, либо при помощи чтения текстового файла встроенным речевым синтезатором DAISY плеера или программного обеспечения, для прослушивания книг в формате DAISY.
Последняя версия DAISY стандарта, включает математическую нотацию на языке MathML, разработанном консорциумом World Wide Web, для представления математических символов в формате XML

Видеокниги

Видеокнига – это литературно-художественное или научно-популярное произведение, сделанное в виде фильма, хранимая в виде видеофайла и воспроизводимое с любого видеоносителя.
В отличие от кинофильма (включая и экранизации литературных произведений), видеокнига содержит только статичный видеоряд, то есть изображения читаемых и просматриваемых страниц книги. В видеокниге, возможно панорамное приближение каких-либо внутренних объектов кадра, подобно тому, когда мы рассматриваем иллюстрации в книге. В качестве видеоряда, в видеокниге могут выступать фотографии иллюстраций к тексту книги и страницы текста книги.
Аудиоряд видеокниги, подобен аудиокниге и включает в себя художественное произведение, прочитанное человеком (например, профессиональным актёром или группой актёров, либо автором и т. п.).
Видеокнига также включает музыкальный ряд, роль которого призвана выделить, подчеркнуть и оттенить самые наиболее важные моменты.
Видеокнига также отличается от аудиокниги типом требуемого носителя и тем, что предоставляет “читателю” возможность одновременного прослушивания текста и просмотра текста и иллюстраций, созданных специально для воспроизведения данной видеокниги.
Для создания видеоряда, в видеокниге могут быть использованы фотографии, картины, схемы, таблицы, простой текст или любой другой наглядный объект. Звуковой ряд мало чем отличается от аудиокниги. Единственное отличие – наличие видеоряда. 

Книги для смартфонов

Книги для смартфонов и других мобильный устройств,, с относительно небольшим размером экрана создаются в формате java-мидлетов. У устройств должна быть поддержка языка программирования Java (J2ME).

Мидлет (MIDlet, от MID – Mobile Information Device и let “что-то маленькое”) – это компактное приложение на языке программирования Java. Примером мидлетов, являются игры для мобильных телефонов, электронные книги. Приложения MIDP названы “мидлетами” по аналогии с терминами “апплет” и “сервлет”.

Java – это объектно-ориентированный язык программирования общего назначения, разработанный компанией Sun Microsystems. Права на торговую марку принадлежат корпорации Oracle.

J2ME (Java Platform Micro Edition, Java ME, ранее – Java 2 Micro Edition) – это подмножество платформы Java для устройств, ограниченных в ресурсах, например: сотовых телефонов, карманных персональных компьютеров, ресиверов цифрового телевидения, проигрывателей дисков Blu-ray. Java ME разработана под руководством Sun Microsystems.

КПК (Карманный персональный компьютер, Personal Digital Assistant, PDA) – это портативное вычислительное устройство, обладающее широкими функциональными возможностями.

К началу страницы

Справочный раздел

Стандартный обобщённый язык разметки (SGML)

Standard Generalized Markup Language: .sgml;
SGML – это стандартный обобщённый язык разметки, то есть метаязык, на котором можно определять язык разметки для документов.

Метаязык – это язык, предназначенный для описания другого языка.
Метаданные – это информация о другой информации, или данные, относящиеся к дополнительной информации о содержимом или объекте. Метаданные раскрывают сведения о признаках и свойствах, характеризующих какие-либо сущности, позволяющие автоматически искать и управлять ими в больших информационных потоках.

Стандарт описывает, как языки общей разметки (Makup Language, ML) должны хранить данные.
Основное использование: Файлы SGML хранят данные о структуре и атрибутах документов. Расширение было разработано для обеспечения стандартизированного средства обмена большими документами. Файлы SGML, хранятся в виде простого текстового файла и могут быть отредактированы с помощью текстовых редакторов.
Многие форматы разметки были получены из SGML, в том числе XML и HTML. Эти форматы похожи на файлы SGML, поскольку они являются декларативными, то есть описывают структуру и атрибуты документа, не указывая, как он должен быть обработан.

К началу страницы

Расширяемый язык разметки (XML файлы) 

eXtensible Markup Language (XML): .xml. 
XML – это расширяемый язык разметки. Файлы в XML формате представляет собой обычный текстовый документ, структура которого отображает описание документа и пользовательские теги. XML файл позволяет прочитать и понять содержащуюся информацию, не зная, в какой программе конкретный XML файл создавался. Язык разметки XML, предназначен для удобного кодирования и чтения информации программным и ручным способом. Структура файла и его параметры прописываются с помощью тегов, атрибутов и препроцессоров. По назначению и решаемым задачам, язык разметки XML, напоминает гипертекстовый язык разметки веб-страниц HTML. XML файлы открываются в текстовых редакторах.

XHTML файлы

Расширяемый Гипертекстовый формат (XHTML): .xhtml.
XHTML – это файлы, создаваемые на языке программирования XHTML. Язык XHTML (Extensible Hypertext Markup Language), который является расширенной версией языка HTML 4. Язык XHTML – это язык разметки гипертекста, основанный на технологии XML (eXtensible Markup Language – расширяемый язык разметки), максимально приближенный к текущим стандартам языка HTML. XHTML отличается от HTML строгостью написания кода. Если HTML позволял писать практически любые конструкции и браузер их корректно распознаёт, то с появлением XHTML,  требуется строгое соблюдение всех правил написания мета тегов. Строгие требования к оформлению XHTML-кода, позволяют избежать ошибок ещё на стадии написания и отладки кода веб-страницы. Любые браузеры, которые понимают HTML, будут работать и с XHTML. То есть, XHTML является аналогом HTML, но с более строгим синтаксисом. В настоящее время, многие современные веб-сайты состоят из кода, написанного на XHTML 1.0 или XHTML 1.1 (в отличие от обычного HTML ). Файлы, написанные на языке разметки XHTML, используют стандартные теги HTML. Тем не менее, к XHTML-коду применяются более строгие правила XML (в отличие от чистого HTML-кода). Благодаря этому, файлы XHTML довольно хорошо сформированы и могут быть легко проанализированы с использованием XML. Вариант XHTML 1.1 одобрен в качестве рекомендации Консорциума Всемирной паутины (W3C31 мая 2001 года.

К началу страницы

PS и EPS файлы

 PostScript (Постскрипт): .ps.
PS файлы используются специалистами и приложениями в издательском деле. PS файлы разработаны компанией Adobe Systems, в 1982 году. Программа PostScript, позволяет распечатать текст и изображения на одной странице. Файлы с расширением PS, обычно состоят из наборов инструкций, которые указывают принтеру то, что нужно напечатать, а также задают координаты печати на странице текста или объектов.  Формат PS (PostScript) в целом является как расширением файлов, так и языком программирования. Язык PostScript позволяет приложениям давать принтеру команды о размещении различных объектов на одной и той же странице.

PostScript  – это язык описания страниц, в основном используемый в настольных издательских системах.

Файлы формата PS, могут создаваться программами Quark Xpress и Adobe Acrobat. Открывать файлы PS формата способны многие программы и принтеры. 

EPS файлы

Encapsulated PostScript: .eps.
EPS – это стандартный формат для импорта и экспорта текста и изображений. EPS формат создан Adobe Systems, в 1992 году. Благодаря совместимости EPS-файлов со всеми операционными системами,, эти файлы используются в настольных издательских системах.
Файл EPS представляет из себя графический файл либо изображение, созданное при помощи  языка PostScript Adobe. Пользователь имеет возможность редактировать и просматривать EPS файлы, кроме того, файл формата EPS можно вставлять в документы, в качестве изображений. Открыть EPS файл, можно при помощи таких компьютерных программ, как Adobe PDF Reader, Adobe Illustrator, Adobe InDesign, Adobe Acrobat DC на компьютерах с операционными системами Windows или Mac OS. Чтобы просмотреть EPS файл в Microsoft Word, следует вставить этот файл в документ, в качестве изображения.
Редактировать EPS файл, можно с помощью приложений Adobe Photoshop или Illustrator или при помощи бесплатной альтернативы Photoshop – приложением GIMP (GNU Image Manipulation Program).
Изображениями предварительного просмотра, могут служить файлы TIFF или WMF (в случае если они начинаются с четырех байтов, которые содержат символы C5 D0 D3 C6 – именно этот набор символов приводит к появлению слова, похожего на слово Adobe). 

К началу страницы

Полезные ссылки по теме

Форматы Аудиофайлов URL: http://brooklynenvironmental.com/audio-file-formats
Форматы файлов, хранящих электронные книги URL: http://brooklynenvironmental.com/e-books-files-formats
Форматы видеофайлов URL: http://brooklynenvironmental.com/video-file-formats/
Электронная книга  URL: https://ru.wikipedia.org/wiki/Электронная_книга
Электронная книга (устройство)  URL: https://ru.wikipedia.org/wiki/Электронная_книга_(устройство)
Электронная книга URL: https://www.wikiwand.com/ru/Электронная_книга
Аудиокнига URL:  https://www.wikiwand.com/ru/Аудиокнига
Аудиокнига URL: https://ru.wikipedia.org/wiki/Аудиокнига
Онлайн Конвертор файлов  URL:  https://www.online-convert.com/ru/file-type
Редактор PDF URL: https://www.pdf2go.com/
Форматы электронных книг URL: https://hotuser.ru/ebooks/2418-2011-09-14-11-08-03
XHTML




К началу страницы