Сколько информации (в байтах) будет "весить" книга, содержащая 250 страниц с размером текста на странице 100 символов?
Ответы
Відповідь:
Adobe Photoshop (7.0 и выше) – графический редактор, Document Express Editor (6.0.1, DEE) – djvu-редактор, Abbyy FineReader (7.0 и выше) – программа распознавания изображений – коммерческие;
ScanKromsator (v. 5.92, СканКромсатор, СК) – программа обработки сканированных изображений (сканов), Djvu Small – djvu-кодер, DjvuOCR – редактор OCR-слоя в djvu-книгах, Djvu Bookmarker (1.0.15) – редактор оглавлений в djvu-книгах, IrfanView – графический просмотрщик с функциями редактирования изображений – бесплатные.
Материал: страницы с черно-белыми (ч/б), полутоновыми и/или цветными (далее – полутоновыми/цветными) иллюстрациями.
Описание. В данном руководстве сделана попытка проинструктировать весь процесс по созданию полноценной djvu-книги, начиная с обработки отсканированных изображений (сканов) страниц и заканчивая созданием электронного оглавления. Рассматриваются вопросы разделения текстовой и графической составляющих посредством программы ScanKromsator, обработки, djvu-кодирования и внедрения иллюстраций в готовый djvu-файл с текстами согласно разработанной методики вклейки иллюстраций (МВИ, метод разделенного кодирования). Данная методика позволяет добиться качественного сохранения иллюстративного материала и компактности djvu-книги за счет оптимального кодирования текстовой и графической составляющих обрабатываемых книг (журналов). Подробно ознакомиться с понятиями, методами djvu-кодирования, а также МВИ можно на сайте http://sourceforge.net [1].
В общих чертах суть создания качественного и компактного djvu-файла выражается в раздельном кодировании (сжатии) одноцветного текста, рисунков И растровых иллюстраций (полутоновых, цветных) соответствующими алгоритмами. При этом информация об одноцветном тексте и рисунках заносится в слои mask и foreground, а информация о растровых изображениях – в слой background. В каждом слое информация максимально сжата благодаря разработанным и усовершенствованным алгоритмам. На сегодняшний момент проблема корректного автоматизированного разделения текста и изображений и их кодирования в соответствующих слоях djvu-книги полностью не решена. Согласно МВИ предлагается использовать ручное разделение слоя текста и иллюстраций с последующей обработкой и вставкой иллюстраций в слой background. Одна из сопутствующих проблем – наличие растра в изображениях и выбор метода его удаления. Однозначного решения в выборе доступного и качественного метода удаления растра пока нет, существующие методы размытия растра требуют визуального контроля и смекалки в подборе оптимальных параметров и последовательности действий. Но об этом позже.
Приведу средние размеры получаемых по МВИ djvu-страниц в зависимости от типа содержания: текста, ч/б рисунков, полутоновых или цветных иллюстраций (см. табл.). В расчетах условно предполагается, что текст, рисунки и иллюстрации занимают равные части страницы, например 50% текста+50% ч/б рисунков=15-35 Кб. Отмечу, что размер кодированных иллюстраций во многом зависит как от характеристики цветовой палитры, так и параметров применяемого размывания.
Пояснення: