WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!

Pages:     | 1 |   ...   | 14 | 15 || 17 | 18 |

«Александр Александра Тайц CorelDRAW Graphics Suite ВСЕ о Содержание Введение 1 О чем эта книга 2 Строение книги 2 CorelDRAW 3 Corel PHOTO-PAINT 4 Другие программы 5 Новые возможности 6 ...»

-- [ Страница 16 ] --

Автоматически создаваемые наборы Во время установки Font Reserve автоматически создает набор System Fonts Folders, в который помещает пять вложенных наборов шрифтов, соответствующих пяти сис темным папкам шрифтов (рис. 24.29). Если Mac OS X установлена без поддержки "классического" режима, то создается на одну папку меньше.

.

Temp New Set Name Fonts ftQS Folder Network Fonts Folder User Fonts Moved From System Font Folders Of Fonts p Network Fonts Folder pi Fonts User Folder Рис. 24.29. Автоматически создаваемые наборы шрифтов Глава 24. Font Указанные наборы заполняются шрифтами, находившимися в этих папках. Если папка была пустая, то и соответствующий ей набор будет пуст. Постоянно активи зируются только шрифты, необходимые для работы системы. Остальные шрифты добавляются, но остаются неактивными.

Если вы решили, как рекомендуют разработчики, переместить шрифты из систем ных папок в хранилище Font Reserve, то структура папок сменится. Набор System Fonts Folders будет переименован в In System Fonts и в нем останутся только те шрифты, которые действительно будут содержаться в системных папках. Для пе ремещенных шрифтов будет создан отдельный набор Moved System Fonts Folders, в котором окажутся те же самые вложенные наборы. В них будут находиться шрифты, перенесенные из соответствующих папок.

Создание пустого набора шрифтов В Font Reserve вы можете создать неограниченное число наборов шрифтов и размес тить неограниченное число шрифтов в этих наборах. Чтобы создать набор, нажмите кнопку New Set (Новый набор) на панели управления браузера или выберите одно именную команду меню File (Файл). В верхнем списке в окне браузера появится набор Программа создаст набор который сразу предложит пере именовать. Имя набора станет строкой ввода, в которую следует ввести новое имя.

Закончите ввод нажатием клавиши или щелчком мыши вне строки ввода.

Размещение шрифтов в наборах После создания набора можно разместить в нем шрифты. Для этого достаточно пе ретащить значок шрифта из алфавитного списка к имени набора в списке наборов.

Если нужно добавить шрифт и одновременно разместить его в наборе, перетащите значок шрифта из окна Finder к значку набора в браузере Font Reserve.

Если вы перетаскиваете в браузер Font Reserve не отдельные шрифты, а целые пап ки со шрифтами, то программа автоматически создаст наборы с именами папок верхнего уровня. Например, клиент принес вам диск, на котором находится папка Project, в которую, кроме прочих, вложены папки Fonts 1 и Fonts 2, где и находятся шрифты. Если вы перетащите папку Project в окно списка наборов браузера Font Reserve, то в нем будет создан набор Project, содержащий шрифты из папок Fonts и Fonts 2.

Перемещение шрифтов между наборами Чтобы переместить шрифт из одного набора в другой, перетащите значок шрифта из одного набора к значку второго набора.

Вложенные наборы шрифтов Font Reserve допускает создание вложенных наборов шрифтов. С вложенными набо рами вы уже знакомы на примере автоматически созданного набора System Fonts Folders. Он содержит вложенные наборы, соответствующие системным шрифтовым 1014 III. Утилиты папкам. Чтобы создать набор, перетащите значок одного набора к значку другого. Первый набор окажется вложенным в последний. Если при этом удержи вать нажатой клавишу то вложенный набор будет копией одиночного набора.

Если требуется опять сделать из вложенного набора набор верхнего уровня, то пере тащите его значок к заголовку любого столбца списка наборов.

Удаление шрифтов и наборов Чтобы удалить шрифт из набора, выделите его в окне списка наборов и нажмите на панели управления кнопку Delete (Удалить). Обратите внимание, что при этом шрифт не только не удаляется физически, но даже не удаляется из базы Font Reserve. Вы всегда можете его снова найти в алфавитном списке шрифтов и активи зировать или поместить в другой набор.

Удаление целого набора шрифтов выполняется аналогично: выделите набор или несколько наборов в списке, а затем нажмите кнопку Delete (Удалить). Шрифты, составляющие набор, при этом также остаются в полной сохранности.

Если же вам все-таки надо не только удалить набор, но и все входящие в него шрифты, проделайте ту же саму операцию, удерживая нажатыми комбинацию кла виш Если шрифты находились в хранилище, то они будут физически удалены с жесткого диска. В противном случае они будут удалены только из базы Font Reserve.

Активация и деактивация наборов Именно в функциях активации и деактивации наборов заключается соль управления шрифтами Font Reserve. Благодаря им вы можете мгновенно активировать шрифты, использующиеся в одном проекте, и деактивировать те, которые были нужны в пре дыдущем. Чтобы активировать набор шрифтов, выделите его строку в списке набо ров и сделайте одно из следующих действий:

О нажмите кнопку Perm (Постоянно) или Temp (Временно) на панели инструмен тов для постоянной и временной активации соответственно;

щелкните на переключателе в форме кружка слева от имени шрифта в списке.

Тип активизации будет зависеть от установок активации в диалоговом окне Preferences;

выберите команду Activate Permanently (Активировать постоянно) или Activate Temporarily (Активировать временно) из меню Edit (Редактировать);

О нажмите комбинацию клавиш +<+> для временной активации или для постоянной;

а выберите команду Activate Permanently (Активировать постоянно) или Activate Temporarily (Активировать временно) из контекстного меню, открывающегося щелчком правой кнопкой мыши (или щелчком кнопкой мыши при нажатой кла више на кружке-переключателе.

Глава 24. Font слева от набора используется и как индикатор состояния активации. Если он белый, то шрифт не активирован. Синий цвет индикатора соот ветствует временной активации, а черный — постоянной. Если вместо одного кружка вы видите два или три, то это говорит о том, что часть шрифтов набора активирова ны постоянно, часть — временно, а часть Для деактивации набора его также следует выделить в списке, а затем деактивиро вать одним из следующих способов:

нажмите кнопку Deselect (Отменить выделение) на панели управления браузера Font Reserve;

О щелкните на кружке-переключателе слева от имени шрифта;

О нажмите клавишу или комбинацию клавиш выберите команду Inactive (Неактивен) из контекстного меню, открывающегося щелчком правой кнопкой мыши (или щелчком кнопкой мыши при нажатой кла више на кружке-переключателе.

Импорт и экспорт наборов Наборы шрифтов, созданные в Font Reserve, можно экспортировать в особый файл.

Шрифты, составляющие наборы, в файле не сохраняются. Туда попадает только информация о них. Таким образом, тот, кто воспользуется сохраненным набором, должен иметь те же самые шрифты и занести их в базу данных Font Reserve. Функ ция экспорта удобна для согласования списка шрифтов в рабочей группе и для ре зервного копирования.

Чтобы экспортировать набор шрифтов, выделите его в списке наборов и выберите команду Export Set (Экспортировать набор) меню File (Файл). Для импорта предва рительно сохраненного набора служит команда Import Set (Импортировать набор) того же меню. Обе команды открывают стандартные диалоговые окна сохранения и открытия файлов, в которых следует выбрать папку для сохранения набора или файл наборов для загрузки.

Резюме Программа Font Reserve предназначена для управления шрифтами в операцион ной системе Mac OS X в основном и "классическом" режимах.

П Для того чтобы взять на себя управление системными шрифтами, Font Reserve должен переместить их из системных папок Mac OS X.

П Font Reserve поддерживает собственную базу шрифтов, содержащую ссылки на физическое местонахождение их файлов, а также подробные описания.

О Font Reserve может автоматически перемещать или копировать добавляемые в его базу шрифты в специальную папку, называемую хранилищем. Хранилище организует файлы шрифтов в удобной иерархической структуре папок.

1016 Часть III. Утилиты Кроме информации, содержащейся в самих файлах шрифтов, Font Reserve запо минает введенную пользователем информацию о классе шрифта, его производи теле, владельце.

О Гибкая система фильтров позволяет быстро находить шрифты по заданным при знакам или выявлять источник конфликтов шрифтов.

D Font Reserve хранит в своей базе информацию обо всех ваших шрифтах. Чтобы сделать шрифт доступным другим приложениям, его следует активировать. Не активированные шрифты не занимают оперативной памяти и не потребляют сис темных ресурсов компьютера.

Благодаря Font Reserve распечатка шрифтовых каталогов с образцами становится простым делом.

О Шрифты в Font Reserve можно объединять в наборы. Активация и деактивация набора соответственно активирует или все содержащиеся в нем шрифты.

Глава ScanSoft OmniPage SE Как бы хорошо вы ни владели слепым набором текста на клавиатуре компьютера, вы наверняка не отнесете это занятие к вашим любимым. Если вам приходится много работать с бумажными документами, то часто случается и вносить в них правку, набирая вручную исходный документ. Программы распознавания текста (OCR, Optical Character Recognition) и сканер избавят вас от львиной доли этой ра боты. Зачем нужны программы OCR и почему недостаточно просто отсканировать документ? Дело в том, что сканер создает растровые изображения, а не текст. Точно так же глаз получает только изображение страницы, и лишь мозг в состоянии вы членить из нее текст и изображения. По существу OCR — это программа чтения текста. Прочтенный текст можно сохранить в формате вашего любимого текстового редактора и работать с ним, как с набранным вручную. В комплект CorelDRAW Graphics Suite входит одна из лучших программ распознавания текста OmniPage фирмы ScanSoft (http://www.scansoft.com). Кроме собственно чтения текста, програм ма способна сохранить его форматирование (размер, тип и начертание шрифта, отсту пы, поля и т. п.) и включить в получившийся макет сканированные изображения.

Программа OmniPage находится на втором диске Extras дистрибутива CorelDRAW Graphics Suite в папке ScanSoft. Она не устанавливается вместе с основным паке том программ и, если она вам нужна, установите ее с помощью собственной про граммы установки.

Этапы работы OCR-программ Любая программа распознавания текста, в том числе и OmniPage, разделяет работу на три этапа.

1. Получение оригинала. Оригиналом для распознавания служит растровое изобра жение, включающее текст и, возможно, иллюстрации. Изображения могут быть непосредственно получены со сканера или взяты из предварительно подготов ленных графических файлов. Последняя технологическая цепочка, включающая промежуточную стадию — графический файл, удобна, если сканированием и распознаванием заняты разные работники.

2. Распознавание текста. Это, в свою очередь, многоэтапный процесс, начинаю щийся с разбиения исходных изображений на фрагменты (зоны), содержащие различные типы текстового материала и графику. Наибольший успех будет дос тигнут, если программа будет точно знать, что содержит распознаваемый фрагмент:

сплошной текст, список, таблицу или изображение. Процесс разбиения изображе ния на зоны называется зонированием. Зонирование может осуществляться вручную, 1018 Часть III. Утилиты автоматически или полуавтоматически. Оптимальный вариант полностью зависит от макета оригинала. За распознаванием может последовать проверка его пра вильности. Программы OCR располагают встроенными словарями позволяющими автоматически идентифицировать неуверенно распознанные символы или подозрительные слова.

3. Экспорт текста. Финальная стадия распознавания, заключающаяся в сохране нии его результатов в файл или передаче другому приложению для обработки.

Автоматизация распознавания Распознавание текста может пригодиться для решения самых разнообразных задач.

Некоторые оригиналы очень просты и требуют минимального вмешательства поль зователя в работу программы. Допустим, ваш сканер оборудован автоматической подачей бумаги, и вы регулярно распознаете текст, напечатанный на стандартных листах в одну колонку. В таком случае желательно, чтобы программа вела себя "са мостоятельно", а вы только загружали бы стопки бумаги в лоток сканера и нажима ли кнопку "Пуск". Напротив, если вы эпизодически распознаете текст газетных ста тей для дайджеста, то вам не обойтись без ручного выделения фрагментов оригинала, которые требуется распознать и, возможно, без других настроек, связан ных с типом материала (списки, иллюстрации). И, наконец, может пона добиться совместить оба описанных крайних случая при распознавании форм и бланков. При этом потребуется однократная точная настройка программы на ма кет бланка, а затем поточное распознавание без диалога с программой.

Различным может быть и уровень пользователя программы. Возможно, что непо средственный работник не обязан вникать в нюансы настроек OmniPage. Тогда вы сможете создать для него несколько шаблонов настроек и только объяснить ему, для каких типов оригиналов предназначен каждый из них. Если задача не допускает стандартного решения, то пригодился бы мастер распознавания, который давал бы работнику пошаговые инструкции.

OmniPage учитывает многообразие задач и различные уровни пользователей. Наи большая автоматизация работы достигается при использовании автоматического режима программы. От пользователя требуется только поместить в сканер бумагу или выбрать графические файлы для распознавания. Все остальное делается в соот ветствии с заранее сделанными настройками.

Для пользователей, предпочитающих пошаговые инструкции, имеется мастер распо знавания. Каждое окно мастера обеспечивает установку одного режима программы.

По завершении работы, мастер запускает сканирование и распознавание в автомати ческом режиме.

Ручной режим дает контроль над каждым этапом распознавания от получения изо бражений до экспорта результатов. После выполнения каждого этапа программа останавливается и ожидает от пользователя установки режимов и запуска следующе го этапа. При ручном режиме все-таки возможна установка автоматического зони рования, ведь именно эта стадия занимает больше всего времени пользователя.

И даже при автоматическом зонировании ручной режим по-прежнему оставляет управление пользователю. По завершении зонирования можно скорректировать его результаты, настраивая форму зон, добавляя их, удаляя или меняя порядок следования.

Глава 25. ScanSoft OmniPage SE Интерфейс OmniPage на платформе Macintosh На рис. 25.1 изображено главное окно программы. По умолчанию сверху находится панель управления. Она обеспечивает доступ к большинству функций и настроек про граммы, избавляя вас от необходимости частого обращения к меню. Пять списков, располагающихся под кнопками, задают параметры каждого из описанных этапов.

OCR (US) ж.

OCR | eee Chapter AND erry of fav coming corridor.

I» or day II angry with Harry about malfunctioning, itself on and old green where it had struck. So He, l however, shaken 1 1, I*.

I I I'M Рис. 25.1. Интерфейс программы OmniPage для Mac OS X Окно документа разделено на две области. Левая содержит изображение, а правая распознанный текст. Обе части окна имеют полосы прокрутки, которые могут при годиться, если изображение или текст не помещаются в окне целиком. Фиксиро ванные масштабы просмотра задаются в списке, находящемся в левом нижнем углу окна. Масштаб просмотра настраивается для каждой его части независимо. Там же находится показывающий текущую страницу документа. По сторонам от индикатора располагаются стрелки перелистывания страниц. При перелистывании страниц обновляются обе части окна, чтобы одновременно были видны как исход ное изображение, так и распознанный текст. Между горизонтальными полосами прокрутки находится разделитель окон. Перемещая по горизонтали, вы измените соотношение размеров частей окна документа. Окно документа можно минимизи ровать и разворачивать.

По умолчанию слева от окна документа находится вертикальное окно миниатюр.

Оно показывает нумерованные миниатюры всех страниц оригинального документа.

1020 Часть III.

Значок под миниатюрой, изображающий очки, показывает, что эта страница распо знана. Щелчок на миниатюре открывает соответствующую страницу в окне доку мента. Вы можете импортировать графические файлы в документ простым перетас киванием из окон Finder в окно миниатюр. И наоборот, экспортировать отсканированные страницы оригинала перетаскиванием из окна миниатюр в окна Finder. У окна миниатюр есть полоса прокрутки и заголовок, захватив который можно переместить окно в другое положение.

Панель Tools (Инструменты) содержит инструменты, позволяющие поворачивать изображение оригинала, создавать, редактировать и удалять зоны распознавания, менять масштаб демонстрации оригинала в окне документа. Для изменения мас штаба демонстрации служит инструмент Zoom (Масштаб) с изображением увеличи тельного стекла. Щелчок этим инструментом на изображении в окне документа уве личивает масштаб, а при нажатой клавише

Панель Zone Info (Свойства зоны) полностью посвящена свойствам зон распознава ния: их типам и стилям. Мы еще обсудим ее подробнее.

Интерфейс OmniPage на платформе Windows Несколько иначе устроен интерфейс программы на платформе Windows (рис. 25.2).

Окно документа выглядит сходным образом, оно также разделено на две части, со держащие сканированный оригинал и распознанный текст. Чтобы изменить соот ношение этих частей, перетащите мышью разделяющую их рамку. В левом нижнем углу находятся индикатор текущей страницы и кнопки перелистывания страниц вперед и назад. Рядом находятся кнопки, удаляющие с экрана панель миниатюр, окно оригинала и окно текста. Крайнюю левую позицию занимает кнопка, разме щающая последние не по вертикали, а по горизонтали.

Слева от окна документа находится вертикальное окно миниатюр. Оно показывает нумерованные миниатюры всех страниц оригинального документа. Значок под ми ниатюрой, изображающий очки, показывает, что эта страница распознана. Щелчок на миниатюре открывает соответствующую страницу в окне документа. Вы можете импортировать графические файлы в документ простым перетаскиванием из окон Windows Explorer в окно миниатюр. И наоборот, экспортировать отсканированные страницы оригинала перетаскиванием из окна миниатюр в окна Windows Explorer.

У окна миниатюр есть полоса прокрутки, которая понадобится для многостранич ных документов. Снизу окна миниатюр есть две вкладки, переключающие режим показа оригиналов. В режиме Thumbnails (Миниатюры) показываются миниатюры.

В режиме Details (Подробно) вместо миниатюр приводятся детальные данные об оригинале и его текущем состоянии.

В левой части окна со сканированным оригиналом находится панель Image Toolbar (Панель "Изображение"). Панель содержит инструменты, позволяющие поворачи вать изображение оригинала, создавать, редактировать и удалять зоны распознава ния, менять масштаб демонстрации оригинала в окне документа. Для изменения масштаба демонстрации служит инструмент Zoom (Масштаб) с изображением уве личительно стекла. Щелчок этим инструментом на изображении в окне документа увеличивает масштаб, а при нажатой клавише — уменьшает.

Глава 25. ScanSoft OmniPage SE SE - OmniPage Tools Single Column, no Save as File New Roman itself i 4m tiny where I» visit I Рис. 25.2. Главное окно программы OmniPage для Windows Над окном с распознанным текстом располагается панель Formatting Toolbar (Па нель "Форматирование"), напоминающая панель управления WordPad. Здесь вы мо жете задать для текста и его фрагментов стиль, шрифт, кегль, начертание, режим выравнивания абзацев.

Непосредственно под строкой меню находится еще одна панель управления Standard (Стандартная). Она содержит кнопки создания, открытия и сохранения документов OmniPage, работы с буфером обмена, печати, проверки правописания, отмены и список масштабов отображения, работающий на обе части окна документа.

Доступ к большинству функций программы обеспечивает панель управления Toolbox (Панель инструментов). В ней находятся кнопки выбора режимов распознавания, списки с настройками каждого этапа кнопки запуска остановки и продолжения.

Установки сканирования Как и все программы распознавания, OmniPage позволяет получать изображения страниц оригинала непосредственно со сканера, подключенного к вашему компью теру. Прежде чем заниматься сканированием, необходимо сообщить программе марку вашего сканера и сконфигурировать его. Для этого служит вкладка Scanner (Сканер) диалогового окна Preferences (Установки) (рис. 25.3). Если ваш сканер имеет стандартный интерфейс TWAIN, то OmniPage может управлять им непосред ственно, минуя диалоговое окно модуля сканирования. При этом параметры Часть III. Утилиты сканирования устанавливаются в OmniPage. Если вы все-таки предпочитаете ис пользовать диалоговое окно сканера (например для того, чтобы сканировать страни цу не целиком), то это тоже возможно.

OmniPage Preferences -Scanner Se lected V V A IN I - Page — •' Letter OCR ABC — Resolution:

Miscellaneous Cancel a I Process j Layout | Test Editor Selected Layer OK Page Description Cancel Letter flrientation: | Portrait Lighten ADF Г, I High Low Flatbed scan pages Time between Sec.

Рис. 25.3. Раздел Scanner диалогового окна Preferences/Options в OmniPage:

a — для Mac OS X;

б — для Windows Имя текущего сканера отображается в информационном поле Selected Scanner (Вы бранный сканер).

На Macintosh, если вы запустили программу первый раз, вместо вашего сканера бу дет фигурировать имя "заглушки" Test (Тест). Нажмите кнопку Select (Выбрать), и OmniPage откроет диалоговое окно Select Scanner (Выбрать сканер) (рис. 25.4).

Глава 25. ScanSoft OmniPage SE Выберите в левой части окна интерфейс вашего сканера, а в правой — модель.

В области Driver (Драйвер) будет показано имя драйвера, управляющего сканером.

Затем нажмите кнопку Verify (Проверить), чтобы проверить работу сканера с OmniPage.

Если верификация прошла успешно (не появилось диалогового окна с сообщением об ошибке), то программа готова к сканированию. По умолчанию OmniPage предла гает использовать при сканировании интерфейс модуля TWAIN, прилагаемого к сканеру. Мы рекомендуем пользоваться возможностями самой OmniPage. Для это го сбросьте флажок Show TWAIN User Interface (Показывать пользовательский ин терфейс TWAIN). Закройте диалоговое окно Select Scanner (Выбрать сканер) кноп кой ОК, и вы вернетесь к диалоговому окну Preferences (Установки).

Select Scanner Scan Mode Manufacturer: Scanner:

UMAX TWAIN TWAIN TWAIN) [Photoshop (Test) Driver " VistaScan A IN Yes Verify j Рис, 25.4. Диалоговое окно Select Scanner для Mac OS X На платформе Windows для настройки сканера существует мастер, ко торый запускается отдельно или кнопкой Setup (Установки) из раздела Scanner (Сканер) диалогового окна Options (Параметры). Он позволяет не только выбрать сканер для работы с OmniPage, но и протестировать его работу. Мастер по шагам проведет вас через настройку всех параметров сканирования и несколько тестов. Мы не будем подробно описывать работу мастера, поскольку она сильно зависит от типа и интерфейса сканера. Кроме того, мастер сам предоставляет очень подробные объ яснения на каждом шаге работы. Заметим только, что в Windows мастер установки сканера также предоставляет выбор между использованием интерфейса OmniPage и штатным интерфейсом сканера.

Если вы отказались от использования штатного интерфейса сканера, то на Macin tosh станут доступны все настройки в разделе Scanner (Сканер) диалогового окна Options (Установки). В списках Size (Размер) и Orientation (Ориентация) установите размер и ориентацию оригинала в сканере. Если ваш ска нер оборудован автоматической подачей страниц (ADF), то установите флажок Scan until (Сканировать до конца). Это позволит вам запустить распознавание всей пачки в автоматическом режиме. Если оригинал двусторонний, то установите фла жок Double-sided Pages (Двусторонние страницы).

Часть III. Утилиты Продолжая настройку на Macintosh, в области Scanning (Сканирование) установите разрешение сканирования. Для большинства оригиналов оптимальное разрешение 300 dpi, но если оригинал плохого качества или набран мелким шрифтом, то увели чение разрешения вплоть до 600 dpi может улучшить качество распознавания. При сканировании очень важна правильная установка яркости и контраста. Неправиль ные настройки могут сделать текст на изображении нечитаемым даже для вас, не говоря уже о программе (рис. 25.5).

Рис. 25.5. Яркость сканирования: а — заниженная;

б — завышенная;

в — нормальная Часть описанных выше настроек может быть недоступна. Это означает, что про граммное обеспечение вашего сканера не поддерживает управления ими из других программ. Если вам все же необходимо изменить эти настройки, то придется дейст вовать через "штатный" интерфейс вашего сканера.

Выбор режима распознавания Выбор режима осуществляется кнопками на панели управления OmniPage (рис. 25.6). На Macintosh для этого надо нажать кнопку Start (Начать) с изображе нием треугольной стрелки и цифрами 1-2-3. В Windows следует нажать кнопку AutoOCR (Авто OCR), а затем кнопку Start с треугольной стрелкой в правой части панели. В обоих случаях автоматический режим требует предварительной настройки программы. На Macintosh все списки с возможными настройками находятся под кнопками панели управления. В Windows аналогичные списки находятся в цен тральной части панели под названиями этапов распознавания.

OCR Toolbar Ц English (US) ДО f Load [ Plain Format Perform OCR То File...

[ | Stan button: Click this to acquire and based on the OCR Toolbar settings.

2. OCR 3. Export Describe How?

Start Рис. 25.6. Панель управления OmniPage в режиме автоматического распознавания:

а — для Mac OS X;

б — для Windows Глава 25. OmniPage SE Для предварительной настройки распознавания вместо списков можно использовать мастер, запускающийся на Macintosh кнопкой Assistant (Помощник), размещенной на панели управления под кнопкой Start (Начать). На компьютерах PC мастер вы зывается кнопкой Wizard (Мастер), которая появляется на панели управления, если выбран соответствующий режим кнопкой OCR Wizard (Мастер OCR) (рис. 25.7).

Manual OCR Рис. 25.7. Панель управления OmniPage для Windows в режиме OCR Wizard Ручной режим распознавания на Macintosh предполагает последовательное нажатие кнопок Get Page (Получить страницу), OCR и Export (Экспорт), соответствующих эта пам распознавания. Настройки ручного распознавания выполняются все в тех же спи сках, находящихся под перечисленными кнопками и в середине панели. В Windows аналогичные кнопки Get Page (Получить страницу), Perform OCR (Распознать) и Export Results (Экспортировать результат) появляются на панели управления, если предварительно выбран режим Manual OCR (Ручное OCR) соответствующей кноп кой в левой части панели. Рядом с кнопками находятся маленькие треугольные стрелки, открывающие списки настроек каждого этапа (рис. 25.8). Текущий выбор в этих списках показан текстом под кнопками этапов.

Gel Page 2. 3. Export Manual OCR J в OCR J Рис. 25.8. Панель управления OmniPage для Windows в режиме Manual OCR Настройки распознавания Для начала познакомимся с настройками программы, как определяющими "техноло гическую цепочку" распознавания, так и влияющими на качество распознавания и форматирования распознанного текста.

Получение изображений В этом разделе приведены настройки первого этапа распознавания — получения исходных изображений с помощью сканера или загрузкой из файла. На платформе Macintosh они находятся в списке под кнопкой Get Page (Получить страницу).

В Windows они находятся в списке, принадлежащем кнопке Get Page (Получить страницу) в режиме ручного распознавания панели управления.

О Scan in B&W (Монохромное сканирование). Этот вариант задает монохромный ре жим сканирования оригинала. Выбирайте его, если оригинал содержит штриховые Часть III. Утилиты иллюстрации, которые вы бы хотели сохранить в распознанном документе, и для наилучших результатов распознавания для четких черно-белых оригиналов.

О Scan in Gray (Полутоновое сканирование). Черно-белое сканирование оригинала, дающее полутоновое изображение. Режим хорош для сканирования полутоновых оригиналов, если требуется сохранить имеющиеся в них изображения или для низкокачественных (низкоконтрастных) оригиналов.

О Scan in Color (Цветное сканирование). Цветное сканирование. Может пригодить ся для сканирования цветных оригиналов с иллюстрациями, если последние необходимо сохранить в макете. Сканирование в цвете занимает больше времени и требует больше памяти и ресурсов компьютера. В то же время оно не дает ни каких преимуществ в качестве распознавания по сравнению со сканированием полутоновых оригиналов.

Load Image (Загрузить изображение). Загрузка изображений для распознавания из файла. Если колонки текста в загруженных файлах не строго вертикальны, то программа автоматически слегка повернет изображения.

Описание оригинала Настройки этой группы говорят программе о том, к какому типу макетов относится оригинал. OmniPage способна автоматически определить те участки изображений, где находится текст и где размещены иллюстрации. Тем не менее, правильная уста новка типа макета сделает полученный документ более легко редактируемым и соот ветствующим оригиналу.

На платформе Macintosh настройки этой группы находятся в верхнем списке посе редине панели управления. В Windows это второй список в ручном режиме панели управления, находящийся под заголовком этапа Perform OCR (Распознать). Над ним также находится пояснение Describe Original (Описать оригинал).

Single Column. На платформе Windows этот же вариант называется Single Column, no Table (Одна колонка без таблиц). Выбирайте этот вариант, если текст ориги нала сверстан в одну колонку, независимо от положения иллюстраций. Практи чески всегда годится для книг, писем и т. п.

Single Column with Table (Одна колонка с таблицами). Этот вариант есть только на платформе Windows. Его название говорит само за себя: макет должен быть сверстан в одну колонку, но в нем могут быть таблицы.

О Multiple Column (Несколько колонок). На платформе Windows этот же вариант называется Multiple Columns, no Table (Несколько колонок без таблиц). Для ори гиналов, сверстанных в две и более колонок. Программа сама попытается найти эти колонки в процессе зонирования (разбиения оригинала на зоны). Характер ный тип макета для газет и О Spreadsheet (Таблица). Используйте этот вариант для распознавания табличных данных или таких оригиналов, которые можно трактовать как таблицу. Не уста навливайте его для оригиналов, включающих, кроме таблиц, еще и блоки обыч ного текста. Для таких оригиналов воспользуйтесь следующим вариантом.

Mixed Pages (Смешанный). На платформе Windows этот же вариант называется Automatic (Автоматически). Универсальная установка, дающая OmniPage полную Глава 25. ScanSoft OmniPage SE свободу в определении типа макета. Полезна для сложных макетов, включающих многоколоночный текст, графику и таблицы. Не устанавливайте этот тип, если макет попадает в один из типов, перечисленных ранее. Правильная установка типа улучшает качество макета распознанного текста.

Template (Шаблон). На платформе Windows в этом списке находится перечень пользовательских шаблонов зонирования. Если вам постоянно приходится рас познавать документы одного или нескольких фиксированных типов, то размеще ние зон можно сохранить как шаблон и загружать его по мере необходимости.

Фактически — это вариант ручного зонирования, дающего наилучшее соответст вие макета распознанного текста оригиналу. OmniPage SE для Macintosh не под держивает этой функции, и вы найдете в списке не меню Template (Шаблон), а только три примера шаблонов зонирования: Article (Статья), Contemporary Memo (Современная заметка) и Typewriter Memo (Заметка на пишущей машин ке). Создание шаблонов зонирования мы рассмотрим далее.

О Custom (Настраиваемый). На платформе Windows этот режим дает пользователю наибольший контроль за автоматическим зонированием. Он предполагает, что тип макета оригинала задан на вкладке Custom Layout (Настраиваемый макет) диалогового окна Options (Параметры) (рис. 25.9). С помощью переключателей в областях Flowing Text (Текст), Tables (Таблицы) и Graphics (Графика) вы може те задать любое сочетание текста, таблиц и графики в оригинальном макете.

I OCR | Direct OCR Text Editor | Г No Column | One Column Cancel Auto | One Table Settings... | I No Graphics Г One Graphic Auto Рис. 25.9. Диалоговое окно Options, вкладка Custom Layout на платформе Windows Стилевые листы Только в OmniPage для Macintosh можно задать стиль оформления распознанного текста отдельным зонам. Стили зон, характеризующие один тип документа, объеди няются в стилевые листы. Каждая распознаваемая страница может иметь толь ко один стилевой лист. Выбор стилевого форматирования влияет только на вновь III. Утилиты распознаваемые страницы. Программа поддерживает создание стилей и стилевых листов пользователем.

Чтобы было понятнее, приведем простой пример. Допустим, вам приходится часто распознавать статьи из журналов. Чтобы все распознанные документы были оформ лены одинаково, вы определите несколько стилей, соответствующих формату статей:

автор, заголовок, тема, дата публикации, текст статьи. Если в статьях часто встреча ется какое-то особое форматирование, например, для стихотворных фрагментов, то вам придется предусмотреть стили и для таких вставок. Полученный набор стилей можно оформить в виде стилевого листа Article (Статья). Далее, перед распознава нием очередной статьи, надо будет выбрать стилевой лист Article (Статья) и запус тить распознавание в ручном режиме. После того как программа сделает автомати ческое зонирование, найдите зону с именем автора и примените к ней стиль "Автор", к зоне с заголовком примените стиль "Заголовок" и т. д. В результате рас познавания вы сразу получите текст, отформатированный так, как вы хотели. Кста ти, Article (Статья) — один из предопределенных разработчиками стилей.

Вообще, разработчики предусмотрели четыре базовых стилевых листа и три пользо вательских, сделанных для примера. Пользовательские стилевые листы можно мо дифицировать и удалять. Базовые стилевые листы редактируются, но не удаляются.

Их перечень находится в нижнем списке посередине панели управления. Программа предлагает следующие базовые стилевые листы:

Plain Format (Сплошной текст). Выбирайте этот стиль, если вас не интересует сохранение макета, поскольку вы намерены сделать его самостоятельно. Весь распознанный текст помещается в единственную колонку, занимающую всю страницу целиком;

Similar Fonts (Близкие шрифты). Распознанный текст сохраняет форматирование оригинала. Анализируются и сохраняются тип шрифта, кегль и начертание;

О Similar Formats (Близкое форматирование). То же, что и Similar Fonts (Близкие шрифты), но дополнительно сохраняется ширина колонок. колоночные макеты при этом преобразуются в П Page (Точный макет). Максимально точное сохранение макета оригинала. Про грамма оставляет все текстовые блоки на местах, которые они занимали в оригинале.

Сохраняются типы, размеры и начертания шрифтов, отступы и поля страниц.

Остальные стили относятся к пользовательским и могут варьироваться. По умолча нию в списке находятся стили Article (Статья), Contemporary Memo (Современная заметка) и Typewriter Memo (Заметка на пишущей машинке). Рассмотрим процедуру создания и редактирования стилей и стилевых Команда Style Sets (Стилевые листы) меню Edit (Редактирование) открывает диало говое окно Style Sets (Стилевые листы), которое содержит перечень всех стилевых листов, как базовых, и пользовательских (рис. 25.10). Кнопки справа от списка стилевых листов выполняют следующие функции:

О кнопка New (Новый) создает новый стилевой лист;

О кнопка Delete (Удалить) удаляет выделенный в списке стилевой лист;

D кнопка Edit (Редактировать) открывает окно редактирования выделенного в спи ске стилевого листа;

О кнопка Done (Готово) просто закрывает диалоговое окно.

Глава 25. OmniPage SE Style Sets Plain Format New Similar Fonts Similar Formats Page Article Contemporary Memo Test Style Typewriter Memo Рис. 25.10. Диалоговое окно Style Sets Кнопки New (Новая) и Edit (Редактировать) открывают одно и то же диалоговое окно Edit Style Sets (Редактировать стилевые листы), изображенное на рис.

Отличие в том, что первая открывает его пустым, а вторая — заполненным стилями в текущем стилевом листе. Нажатие кнопки ОК закрывает диалоговое окно. Если оно было открыто командой New (Новый), то в списке стилей появится имя нового стиля, а если кнопкой Edit (Редактировать) — выделенный в диалоговом окне Style Sets (Стилевые листы) стилевой лист будет отредактирован.

Edit Style Set - Article f Style 3 f Font Date of f • Auto Auto (Tab) Auto Auto, |.. 2 с ' 3 ' ' ' 4 ' 5 • 6 • 7 I text. Sample Sample text. Sample underlined text.

text. Sample text. Sample text. Sample text. Sample text. Sample text. Sample text.

Sample text.

1st Row Entries 2nd Row Entries Row Entries Sample text. Sample text. Sample Sample text. Sample text. Sample text.

text. text. Sample text. Sample text. text. text.

Sample text.

Рис. Диалоговое окно Edit Style Sets В левом верхнем углу диалогового окна Edit Style Sets (Редактировать стилевые лис ты) находится список стилей в редактируемом стилевом листе. При создании нового стиля этот список содержит единственный стиль Auto Detect (Автоопределение), ответственный за автоматическое форматирование текста. Находящаяся справа Часть III. Утилиты кнопка New Style (Новый стиль) создает новый стиль, кнопка Delete Style (Удалить стиль) удаляет выделенный стиль из текущего стилевого листа, а кнопка Make Default (Установить по умолчанию) делает выделенный стиль принятым по умолча нию. Последнее означает, что именно этим стилем будут форматироваться те зоны, которым не назначен какой-либо специфический стиль.

OmniPage не распознает шрифты оригинального документа, но позволяет сохранить тип использованных в нем шрифтов: с засечками и рубленый, моноширинный или пропорциональный. Какие конкретно шрифты будут подставлены в документ, зада ется в диалоговом окне Font Mapping (Автоматическая замена шрифтов), изображенном на рис. 25.12. Оно открывается нажатием кнопки Font Mapping (За мена шрифтов) в диалоговом окне Edit Style Sets (Редактировать стилевые листы).

В нем перечислены распознаваемые типы шрифтов, а в списках можно выбрать подходящий по типу шрифт, установленный на вашем компьютере.

Automatic Font Mapping Font Proportional IB Sans Serif Monospaced Courier Monospaced Sans Рис. 25.12. Диалоговое окно Automatic Font Mapping Вернемся к диалоговому окну редактирования стилевых листов Edit Style Sets (Ре дактировать стилевые листы) (см. рис. В области Zone Style Details (Парамет ры стиля зоны) задаются параметры стиля, выделенного в списке стилей. Верхнюю часть области занимают элементы управления, а нижнюю — пример форматирова ния текущим стилем различных типов текста.

В списке Font (Шрифт) устанавливается шрифт, которым следует форматировать текст. Это может быть любой из установленных на компьютере шрифтов. В списке Size (Размер) выбирают кегль шрифта в пунктах. Кнопки Р, В, I, U устанавливают начертание шрифта: нормальное, полужирное, курсивное и подчеркнутое соответст венно. Кнопки, расположенные правее, отвечают за выравнивание абзацев (слева направо): по левому краю, по правому краю, по центру и по формату. В списке Tab Character (Символ табуляции) устанавливается символ, который будет использовать ся как табулятор. По умолчанию это и есть символ табуляции, но иногда, если вы, например, планируете обработку распознанных табличных данных, его удобно заме нить на запятую или другие символы из списка. В зависимости от выбора в списке Text Flow (Текст), программа будет ставить жесткий перевод строки в конце каждой строки Lines Return (Жесткие переводы или абзаца (Word Wrap (Заво рачивание В полях Start Text (Начало текста), End Text (Конец текста) и First Line Indent (Отступ первой строки) задаются соответственно левый, правый Глава 25. ScanSoft OmniPage SE и абзацный отступы в текущих единицах измерения. Значения отступов также можно установить, перемещая движки на линейке, размещающейся вдоль края области просмотра с образцом форматирования. Значения Auto (Авто) в полях и списках дают OmniPage свободу самостоятельно определять эти параметры, исходя из ори гинала.

Чтобы создать стиль, нажмите кнопку New (Новый) и введите имя стиля в открыв шемся диалоговом окне. Затем выберите его строку в списке стилей окна Edit Style Sets (Редактировать стилевые листы) и установите перечисленные выше параметры.

После этого можно переходить к созданию следующего стиля. Когда создание сти лей будет завершено, закройте диалоговое окно кнопкой ОК. В списке стилей диа логового окна Style Sets (Стилевые листы) и в списке на панели управления появит ся определенный вами стиль. О том, как применять стили к зонам, мы расскажем далее.

Запуск проверки орфографии OmniPage имеет встроенный модуль проверки орфографии, позволяющий сократить количество ошибок распознавания. Использование встроенной проверки удобнее, чем, например, последующая проверка в текстовом редакторе, потому что кроме текста у вас перед глазами всегда находится оригинал (сканированное изображение).

Благодаря этому проверка двигается гораздо быстрее, и вам не приходится постоян но переключаться между экраном и оригиналом, будь то лист бумаги или окно про граммы просмотра изображений.

Проверка орфографии может включаться автоматически, сразу вслед за распознава нием. Если же вы предпочитаете проверять текст в другой программе, то проверку орфографии можно отключить. На компьютерах Macintosh для этого предназначен список, находящийся под кнопкой OCR. Вариант OCR & Proof (Распознать и про верить) включает автоматический запуск проверки правописания, a Perform OCR (Распознать) отключает. На компьютерах Windows эта настройка перенесена в раз дел Proofing (Проверка) диалогового окна Options (Параметры). Установка флажка Automatically proofread results after OCR (Автоматически проверять результат после распознавания) включает проверку правописания. Детально с проверкой правописа ния мы вас познакомим далее.

Настройки экспорта Настройки экспорта на компьютерах Macintosh находятся в списке под кнопкой Export (Экспорт) панели управления. На платформе Windows этот список озаглавлен Export Results (Экспортировать результат). При этом возможны следующие вариан ты направления экспорта:

То File (В файл). Сохранение распознанного текста в файл выбранного формата.

Он устанавливается в открывающемся диалоговом окне Export;

То Clipboard (В буфер обмена). Копирование распознанного текста в буфер об мена. По завершении экспорта вы сможете вставить текст из буфера обмена в любое приложение;

1032 Часгь ///. Утилиты О То Application (В приложение). Есть только на платформе Mac OS. По существу, этот вариант списка нельзя выбрать непосредственно. Он активизируется, только если распознавание производится в режиме "прямого распознавания" (Direct OCR). На платформе Windows также возможно "прямое распознавание", но реа лизуется оно по несколько иному механизму;

О Send as (Послать по почте). Только на платформе Windows. Открывает поч товый клиент и помещает распознанный текст в новое почтовое сообщение.

Ручное распознавание Ручное распознавание предполагает максимальную интерактивность и, следователь но, максимальный контроль пользователя над процессом распознавания и наиболь шие затраты времени. Тем не менее, зачастую это единственный выход при распо знавании сложных макетов. Да и потери времени могут быть нечувствительны, если распознаванием вы занимаетесь эпизодически.

Получение страниц Ручное распознавание не требует предварительной настройки всех перечисленных выше опций — это можно делать поэтапно. Для запуска распознавания в ручном режиме на платформе Macintosh выберите источник изображений в списке под кнопкой Get Page (Получить страницу), как это описано в разд. "Получение изобра жений", и нажмите эту кнопку. На компьютерах Windows активизируйте ручной ре жим кнопкой Manual OCR (Ручное OCR), в списке рядом с кнопкой Get Page (По лучить страницу) (он открывается щелчком на черной треугольной стрелке справа от кнопки), установите источник изображений и также нажмите кнопку.

Если в качестве источника изображений выбран сканер, то немедленно после нажа тия кнопки Get Page (Получить страницу) программа начнет сканирование. Если же был указан файл, то вам будет предоставлено стандартное диалоговое окно открытия файлов (рис. 25.13). Допускается выбор нескольких файлов одновременно. Omni Page для Macintosh может работать с форматами TIFF, JPEG и PICT. Для много страничных оригиналов можно использовать многостраничную версию формата TIFF или сохранить все страницы оригинала в отдельных файлах. На платформе Windows выбор форматов шире. Они включает TIFF, PDF, BMP, JPEG, PNG, GIF, Кроме на платформе Windows диалоговое окно слегка модифици ровано. Нажатие кнопки Advanced (Дополнительно) открывает вторую часть диало гового окна, содержащую список выбранных файлов. Там же имеются кнопки до бавления и удаления файлов из списка. В строке Page Range (Диапазон страниц) можно задать диапазон импортируемых страниц для многостраничных файлов.

После того как вы закроете диалоговое окно кнопкой Open (Открыть), программа загрузит файлы изображений и разместит их миниатюры в окне миниатюр. В левой части окна документа вы увидите крупное изображение первой импортированной страницы.

Глава 25. OmniPage SE Load Images Show: All image files From: [ Pictures — * Library Mac Apps Volumes :, Movies !

Music Public tiff Sites Corbis Go to:

Add to Favorites ( Cancel a Load in:

Polter File Potter [ Cancel | TIFF Page range: j files:

All Рис. 25.13. Диалоговое окно загрузки изображений:

а — на платформе Macintosh;

б — на платформе Windows Зонирование и распознавание Второй этап распознавания состоит в разбиении страницы оригинала на зоны (рис. 25.14), собственно распознавании и проверке орфографии. Перед запуском распознавания проверьте установку автоматического запуска проверки орфографии.

Затем нажмите кнопку OCR на Macintosh или Perform OCR (Распознать) на PC.

Программа немедленно выполнит все действия, предполагаемые этим этапом.

Результат распознавания отобразится в правой части окна документа.

34 1034 Часть III. Утилиты т и х Ц S | Л lor of few days of saw a avoid was Colin to to bigger thrill to "All right, six a and Harry when said was with Ron's wand was on morning by out of in hitting liny Professor creat ing t it with оке another, Harry was quite to And to visit morning. Harry, however, awake several hours earlier Рис. 25.14. Автоматическое зонирование В левой части окна документа отобразится результат автоматического зонирования.

Прямоугольники, видимые поверх изображения, отмечают зоны. В левом верхнем углу каждого прямоугольника стоит цифра, обозначающая порядковый номер зоны.

Если в документе есть несколько текстовых зон, то номера покажут очередность следования фрагментов в распознанном тексте. Разумеется, программа не всегда может точно определить порядок чтения текстовых блоков в сложных макетах. Это еще одна причина обращения к ручному распознаванию. Правый верхний угол за нимает значок, показывающий тип зоны (одноколоночный текст, многоколоночный текст, графика или таблица).

Если вас не устраивает автоматическое зонирование, выполненное программой, вы можете скорректировать зоны или вообще не прибегать к автоматическому зониро ванию. Для ручного зонирования вам понадобятся инструменты из палитры Tools Глава 25. ScanSoft OmniPage SE (Инструменты) (Image Toolbar (Панель "Изображение") на платформе Windows) и настройки стилей зон из палитры Zone Info (Свойства зоны) (только на Macintosh).

Поворот изображения Если отсканированный оригинал имеет неправильную ориентацию, поверните его одной из кнопок палитры Tools (Инструменты), расположенных в нижнем ряду. Это кнопки (сле ва поворота на 90° против часовой стрелки, на 180° и на 90° по часовой стрелке. На платформе Windows вы найдете только одну кнопку Rotate Image (Повернуть изображение) на панели Image Toolbar (Панель "Изображение"). Каждое нажатие кнопки поворачивает изображение на 90° по часовой стрелке.

Tools sip С Рис. Палитры: а — Tools на платформе Mac OS X;

б — Image Toolbar на платформе Windows Палитра Tools (Инструменты) содержит следующие инструменты (рис. 25.15).

О Rectangular Zones (Прямоугольные зоны). Этим инструментом создаются прямо угольные зоны. Чтобы воспользоваться инструментом, поместите курсор в левый верхний угол фрагмента изображения, нажмите левую кнопку мыши и перетащи те курсор к правому нижнему углу. Когда вы отпустите кнопку мыши, на экране появится прямоугольник, ограничивающий фрагмент — прямоугольную зону.

Этот же инструмент годится для выделения, перемещения и масштабирования зон. Чтобы выделить зону, достаточно щелкнуть мышью в ее внутренней области (рис. 25.16, а). Чтобы переместить зону, перетащите ее на новое место мышью, захватив любую точку внутренней области (рис. 25.16, б). Для масштабирования зоны перетаскивайте угловые манипуляторы, появляющиеся у прямоугольного маркера зоны при выделении (рис. 25.16, в).

— — — — — — — — Ml Л С f V N С А Р к 1 t к J X P ч A Рис. 25.16. Выделение, перемещение и масштабирование зоны Часть III. Утилиты О Irregular Zones (Непрямоугольные зоны). Создает непрямоугольные зоны по сто роне за один прием. Поместите курсор в угол предполагаемой зоны и сделайте щелчок мышью. Затем переместите курсор к соседнему углу и снова сделайте щелчок. Продолжайте до тех пор, пока не построите контур зоны целиком. За вершите построение двойным щелчком.

Если построенная вами зона перекроет существующую, то программа автомати чески скорректирует новую зону так, чтобы они не накладывались, а только ка сались друг друга. Линии, образующие контур зоны, могут быть только строго вертикальными или горизонтальными.

Modify Zones (Редактирование зон). На платформе Windows вместо одного этого инструмента есть два: Add to Zone (Добавить к зоне) и Subtract from Zone (Вы честь из зоны), решающие ту же задачу: изменение формы зон, объединение и разделение зон. Чтобы дополнить зону прямоугольным фрагментом, нарисуйте этот фрагмент инструментом Modify Zones (Редактирование зон) или Add to Zone (Добавить к зоне) (рис. 25.17, а). Чтобы удалить фрагмент зоны, нарисуйте этот фрагмент инструментом Subtract from Zone (Вычесть из зоны) или Modify Zones (Редактирование зон) при нажатой клавише

AND AND Т a of days a lac of glad teach and another, glad and to ) on and on Sam ing. Harry, however, was hours ea Harry, however, was awake hours Г ' Т i • :

Рис. 25.17. Дополнение и удаление части зон Чтобы соединить зоны, нарисуйте инструментом Modify Zones (Редактирование зон) или Add to Zone (Добавить к зоне) небольшой прямоугольник, соединяю щий зоны (рис. 25.18, а). Для разделения зон нарисуйте между ними узкий и длинный прямоугольник инструментом Subtract from Zone (Вычесть из зоны) или Modify Zones (Редактирование зон) при нажатой кнопке (рис. 25.18, б).

Reorder Zones (Перенумеровать зоны). Изменяет порядковые номера зон, а сле довательно, очередность текстовых блоков в распознанном документе. Щелкните мышью внутри каждой зоны на странице в том порядке, в котором они должны следовать в итоговом документе. Проверьте новый порядок по номерам зон в ле вом верхнем углу их маркеров.

Глава 25. OmniPage SE S a arry a of he saw a corridor. to down to ( to Harry's to than or arry spcm out whenever he a corridor to Colin who seemed down corridor to was to to schedule. Nothing seemed to Colin а "All a than "АИ Рис. 25.18. Соединение и разбиение зон Особый тип зон представляют табличные зоны. Для создания и редактирования зон этого типа в палитре Tools (Панель инструментов) (Image Toolbar (Панель "Изобра жение") в Windows) есть целых пять инструментов:

Insert Rows (Вставить строки). Вставляет горизонтальные разделители в таблицу, добавляя новую строку. Щелкните мышью в пространстве между строками таб лицы (рис. 25.19, а);

Insert Columns (Вставить столбцы). Вставляет вертикальные разделители в табли цу, добавляя новую колонку. Щелкните мышью в пространстве между столбцами таблицы (рис. 25.19, б);

Day Mat Day I.

' $ 10 S с Art i Barker $65.00 10 a $40.00 10 Sun $40.00 Sun $ Barker [ Barker $ Chan Chan i $55.00 _ Sun шло $ с т с т Рис. 25.19. Вставка строк и столбцов в табличную зону Move Dividers (Переместить разделители). Перемещает границы столбцов и строк. Перетащите мышью разделитель строк или столбцов;

Remove Dividers (Удалить разделители). Удаляет разделители строк и столбцов.

Щелкните инструментом на лишнем разделителе;

Часть III. Утилиты Remove/Replace All (Удалить/Удалить все). Удаляет все разделители в табличной зоне и запускает автоматическое детектирование строк и столбцов. Щелкните мышью внутри табличной зоны, и все разделители будут удалены. Чтобы запус тить автоматическое разделение зоны на столбцы и строки, щелкните мышью еще раз.

Как мы уже говорили, зоны могут иметь тип, а на платформе Macintosh еще и стиль. Все эти параметры задаются в палитре Zone Info (Свойства зоны) на Macintosh (рис. 25.20, а) и в палитре Zone Properties (Свойства зоны) на платформе Windows (рис. 25.20, б). Последняя открывается нажатием кнопки Zone Properties (Свойства зоны) на панели Image Toolbar (Панель "Изображение"). В палитре Zone Info (Свойства зоны) каждому типу соответствует кнопка в верхней части палитры.

В OmniPage для Windows выбор осуществляется из списка Zone Type (Тип зоны).

Тип зоны можно задать перед рисованием зоны или после.

Zone Info Single Column Text Zone Properties j Settings Zone Zone content:

able | Style Set for Plain Format i Рис. 25.20. Палитры Zone Info на Macintosh (а) и Zone Properties в Windows В OmniPage имеются следующие типы зон:

О Single Column Text текст) — текст в одну колонку;

О Multiple Column Text (Многоколоночный текст) — многоколоночный текст;

Table (Таблица) — таблица. Этот тип зоны может быть только прямоугольным;

Graphic (Графика) — изображение;

Ignore Zone (Игнорировать зону) — эту зону не надо распознавать;

О Automatic (Автоматически) - на платформе Windows этот тип называется Auto-detect zone (Автоопределение зоны). Назначая зоне этот тип, вы доверяете программе определить точный тип зоны самостоятельно.

Чтобы задать зоне или зонам требуемый тип, выделите их одним из инструментов рисования зон и нажмите кнопку соответствующего типа в палитре Tools (Инстру менты). В OmniPage для Windows также следует выделить зоны и выбрать тип в спи ске Zone Type (Тип зоны).

Глава 25. OmniPage SE Кроме типа зоны программа предлагает описать ее содержимое. Если зона содержит только цифровые данные, то в списке Zone Content (Содержимое зоны) выберите вариант Numeric (Цифровые). Этот список находится на Macintosh в палитре Zone Info (Свойства зоны), а на PC — в палитре Zone Properties (Свойства зоны). Если зона содержит кроме цифр еще и текст, то выберите вариант Alphanumeric (Сим вольные).

В OmniPage для Macintosh зоне можно придать стиль. Для этого достаточно выде лить зону или несколько зон, а затем выбрать стиль в списке Zone Style (Стиль зо ны) палитры Zone Info (Свойства зоны). Учтите, что при этом в списке Style Set for Page (Стилевой лист для страницы) должен быть выбран стилевой лист, содер жащий этот стиль. Поэтому, если вы вообще используете возьмите себе за правило сразу устанавливать стилевой лист, соответствующий содержанию страни цы, а уже затем начинать зонирование.

Когда зонирование будет закончено и всем зонам будут присвоены типы и нажмите кнопку Perform OCR (Распознать). Программа распознает текст в соответ ствии с вашим зонированием. Если вы установили автоматический запуск проверки орфографии, то она запустится сразу после распознавания. Проверкой орфографии заканчивается второй этап ручного распознавания.

Экспорт Финальный этап распознавания — экспорт распознанного текста. OmniPage позво ляет экспортировать результат распознавания в файл, буфер обмена и прямо в ка кое-либо приложение. Последний вариант мы рассмотрим отдельно, в разделе, по священном "прямому распознаванию", а здесь ознакомимся с первыми двумя.

Смысл и результат копирования в буфер обмена очевиден: результат распознавания (текст вместе с таблицами и иллюстрациями) помещается в буфер обмена. После этого вы можете вставить его в любое приложение, например Microsoft Word, Ap pleWorks, Word Perfect и т. п. Копирование в буфер удобно только для эпизодиче ской работы с небольшими оригиналами, поскольку имеет свои ограничения и не допускает автоматизации. В остальных случаях удобнее поместить результат распо знавания в файл.

Чтобы выбрать направление экспорта, обратитесь к списку под кнопкой Export (Экспорт) (на Macintosh) или рядом с кнопкой Results (Экспортировать ре зультат) в Windows. Выберите в списке вариант То File (В файл) (на Macintosh) или Save as File (Сохранить как файл) (Windows) для экспорта в файл, То Clipboard (В буфер обмена) - для экспорта в буфер обмена. Нажатие кнопки Export (Экс порт) (Macintosh) или Export Results (Экспортировать результат) (Windows) запускает экспорт. Если в качестве направления выбран буфер обмена, то программа только откроет на несколько секунд окно с уведомлением, что документ скопирован. При экспорте в файл вам будет предоставлено диалоговое окно Export As (Сохранить как), изображенное на рис. 25.21.

Диалоговое окно Export (Экспорт) содержит стандартную часть, характерную для любого окна сохранения файла, и часть с дополнительными настройками.

На платформе Macintosh выберите папку и имя файла. Установите формат экспорта.

Часть III. Утилиты As:

.

• Library Mac I Mac Volumes • Music Public Л New С Favorites Save Format: ASCII Text © Create File for All Pages О Create File for Each Page О Create a New File at Each Page and Launch I Corel Save 97. and Advanced options: one file for all pages Retain line • Save as С Save by to tetoflotfja Рис. Диалоговое окно: а — Export для Mac OS, б — Save As для Windows Глава 25. ScanSoft OmniPage SE На этой платформе OmniPage поддерживает следующие форматы: RTF, MS Word, MS Excel, ASCII и HTML 3.2. Переключатели, расположенные в нижней части окна, позволяют выбрать режим сохранения для многостраничных файлов:

Create One for Pages (Все страницы в один файл) — все распознанные страницы сохраняются в одном файле;

Create One File Each Page (Страницы в отдельные файлы) — каждая страница сохраняется в отдельном файле;

О Create a New File at Each Blank Page (Новый файл с каждой пустой страницей) новый файл создается при появлении пустой страницы. Этот вариант полезен, если, например, вы сканируете книгу и хотите поместить каждую главу в отдель ный файл. Настройка сработает, если каждая глава имеет шмуцтитул.

Флажок Frames on Export (Удалить фреймы при экспорте) запрещает форма тирование с помощью фреймов. Устанавливайте его, если намерены форматировать (переверстывать) получившийся документ вручную. Флажок Save and Launch (Со хранить и запустить) автоматически открывает экспортированный файл в ассоции рованном с ним приложении.

На платформе PC выбор режима сохранения реализован не в виде переключателя, а в виде списка. Кроме перечисленных настроек, вы можете отказаться от экспорта графики (сбросив флажок Retain Graphics (Сохранять текстовых стилей (сбросив флажок Retain Styles (Сохранять таблиц (переведя переключатель Tables (Таблицы) в положение Save as columns separated by tabs (Сохранять как ко лонки, разделенные и колонтитулов (переключатель Headers/Footers (Колонтитулы) в положении Ignore Headers/Footers (Игнорировать Набор форматов для экспорта на платформе Windows несколько шире, чем на Mac intosh. Дополнительно поддерживаются форматы PDF, Harvard Graphics, MS Power Point, MS Publisher, PageMaker, Ventura Publisher и Word Perfect. Обратите внимание, что часть перечисленных типов файлов не поддерживает некоторых возможностей форматирования OmniPage. Например, вы не можете сохранить графику в формате ASCII.

На платформе Windows важную роль при экспорте играет переключатель видов рас познанного текста в окне документа. В файл попадает только то, что видно на экране.

Например, если в момент экспорта был установлен режим просмотра No Formatting View (Просмотр без форматирования), то в файле не окажется колонок или выделе ний курсивом.

Когда вы закроете диалоговое окно Export (Экспорт) (Save As (Сохранить как) в Windows) кнопкой Save (Сохранить), OmniPage сохранит результат распознавания в указанном файле.

Автоматическое распознавание Автоматическое распознавание также требует настройки программы, как и ручное.

По существу, различие заключается в том, что при ручном распознавании настройки делаются в процессе распознавания, а при автоматическом заблаговременно.

Часть III. Утилиты В OmniPage для Macintosh все настройки находятся в списках, расположенных на панели управления, и мы их уже рассмотрели ранее. На платформе Windows после выбора режима распознавания вид панели управления меняется в соответствии с режимом. Вид панели распознавания для автоматического режима сканирования был приведен на рис. 25.6. Настройки также выполняются в раскрывающихся спи сках посередине панели управления. Они уже описаны ранее, в разд. "Настройки распознавания Для начала распознавания нажмите кнопку Start (Начать). Если в качестве источни ка был установлен файл, то выберите файлы изображений. По окончании распозна вания выберите имя, папку и формат файла так, как это было описано в разд. "Экс порт" для ручного распознавания.

Процесс распознавания можно в любой момент прервать, нажав кнопку Stop (Стоп) (на Macintosh она появляется на месте кнопки Start В OmniPage для Windows кнопка Start (Начать) может менять свое название на Finish (Завершить) и Additional (Дополнительно). Кнопка Finish (Завершить) появляется, если распозна вание не завершено. Ее нажатие позволяет распознать оставшиеся страницы и экс портировать результат. Кнопка Additional появляется, когда все три этапа распознавания завершены. Она позволяет еще раз экспортировать документ, добавить к нему новые страницы или распознать имеющиеся еще раз. Последнее может понадобиться, если вы неправильно сделали какие-либо настройки перед распознаванием. На Macintosh после распознавания кнопка Additional (Дополни тельно) не появляется, но те же самые возможности предоставляются кнопкой Start (Начать). Ее нажатие открывает диалоговое окно OCR Instructions (Инструкции OCR), изображенное на рис. 25.22.

OCR instructions You have opened images. What would like to do?

Load and Process Additional Pages Process AH Pages 0 Reprocess All Pages Cancel Рис. 25.22. Диалоговое окно OCR Instructions В нем предоставляется выбор из следующих возможностей:

О Load and Process Additional Pages (Загрузить и распознать дополнительные стра ницы);

Process All Unrecognized Pages (Распознать оставшиеся страницы);

Reprocess All Pages (Распознать все страницы заново).

Сделайте свой выбор и нажмите ОК.

Глава 25. ScanSoft OmniPage SE Мастер распознавания Мастер помогает сделать все установки распознавания, сопровождая их пошаговыми инструкциями. Мастер предлагает шесть диалоговых окон.

На платформе Windows в первом окне можно выбрать источник получения файлов:

Paper document in my scanner (Бумажный документ в сканере) или Image on my computer изображений на компьютере). Если выбрано сканирование, то следует указать его тип: Scan in black and white (Монохромное сканирование), Scan in grayscale (Полутоновое сканирование), Scan in color (Цветное сканирование) (рис. 25.23). После нажатия кнопки Next (Дальше) откроется диалоговое окно за грузки файла, если в первом окне именно файл был указан источником изображе ний. В противном случае откроется второе окно мастера.

- Step 1 of documents do you want Paper document in my in black and For with you do not want to keep.

For pages with dark text on Г Scan in pages with photos you want to save in For text shady backgrounds.

For pages pictures text you want to keep in color.

Image on my computer Cancel Рис. 25.23. Первое окно мастера распознавания Во втором окне мастера находится единственный переключатель, устанавливающий тип макета оригинального документа (рис. 25.24).

В третьем окне мастера выберите языки оригинального документа. В списке языков допускается выбирать одновременно несколько что позволяет распознавать многоязычные документы (рис. 25.25). Русский язык поддерживается только на платформе Windows.

В четвертом окне мастера (рис. 25.26) выберите вариант форматирования готового документа. Хотя на платформе Windows программа форматирует текст с максималь но точным следованием оригиналу, данная установка определяет, что окажется в файле документа или буфере обмена. После завершения работы мастера вы всегда сможете пересохранить файл, изменив форматирование с помощью кнопок измене ния вида распознанного текста. На платформе Macintosh выберите один из базовых /044 Часть III. Утилиты стилевых листов для распознанного документа. Они описаны в разд. "Стиле вые Пятое окно мастера устанавливает автоматический запуск проверки орфографии после распознавания (рис. 25.27). Функция позволяющая программе обучаться распознаванию новых шрифтов и символов, включена только в профес сиональную версию OmniPage. По этой причине второй переключатель в этом окне мастера не работает.

- Step 2 does original document look like?

Let OmniPage SE decide memo, of book page column, no Magazine or newspaper (multiple no table) with tables (single column, one tables) table) < fiack Cancel Рис. 25.24. Второе окно мастера распознавания of Б What contain?

Romanian Ruanda Sardinian Serbian Shona OCR method • Г accurate Рис. 25.25. Третье окно мастера распознавания Глава 25. ScanSoft OmniPage SE How much of do you retain?

I only want plain ! want to retain font and want to and flowing (connected] to retain the document's appearance as as possible.

< [ Cancel Рис. 25.26. Четвертое окно мастера распознавания Wizard - Step 5 of you want to finished exporting X г MO Do want to apply Рис. 25.27. Пятое окно мастера распознавания Последнее, шестое окно мастера позволяет выбрать направление экспорта: Save to Disk (Сохранить на диске) или Copy to Clipboard (Скопировать в буфер обмена) (рис. 25.28). При сохранении результата распознавания в файл на Macintosh вы можете отказаться от сохранения иллюстраций, сбросив Retain Graphics if Possible (По возможности сохранять графику).

После завершения мастера программа будет работать в автоматическом режиме вплоть до этапа экспорта. На нем вам будет предоставлено соответствующее диалоговое окно (см. рис. 25.21), где надо выбрать для экспортируемого файла имя, папку и формат.

1046 III. Утилиты OCR - Step 6 G How do you to it as a on my computer be to specify a location, and other end of the process.

С itto the Clipboard Your document will copied at end the process. Paste it into the application of your OmniPage SE the you selected in and to your processing mode is (Auto, Manual Wizard].

Cancel < ' Рис. 25.28. Шестое окно мастера распознавания На платформе Macintosh мастер немного отличается от описанного для Windows:

различаются некоторые формулировки для положений переключателей и принят другой порядок появления окон, но функционально они абсолютно идентичны.

"Прямое распознавание" Как на платформе Macintosh, так и на платформе Windows, OmniPage предлагает режим передачи результата распознавания в другое приложение.

На Macintosh передача происходит через буфер обмена, и удобство заключается в том, что она автоматизируется и не требует перехода к целевому приложению и вставки содержимого буфера. Режим "прямого распознавания" запускается значком приложения OmniPage SE Direct OCR из докера или папки OmniPage. При этом должно быть активным приложение, способное получить макет распознанного тек ста через буфер обмена. В нем должен быть открыт документ, и курсор должен быть установлен в позицию, с которой должен начинаться распознанный фрагмент. Не медленно после этого OmniPage откроет диалоговое окно загрузки файлов изобра жений или приступит к сканированию. Когда все изображения будут загружены, вы можете сделать необходимые настройки и перейти к автоматическому или ручному распознаванию. Когда оно будет закончено, результат распознавания будет помещен в открытый документ приложения начиная с текущей позиции курсора.

На платформе Windows вы должны предварительно зарегистрировать приложение в OmniPage. Для этого откройте диалоговое окно Options (Параметры) на вкладке Direct OCR (Прямое OCR). В области Register Applications (Зарегистрировать приложе ние) находятся два списка: Unregistered (He зарегистрированы) и Registered (Зарегист рированы). Кнопка Add (Добавить) переносит выделенное в списке Unregistered (He зарегистрированы) приложение в список Registered (Зарегистрированы). Собственно, Глава 25. ScanSoft OmniPage SE в этом и заключается процедура регистрации. Если в списке незарегистрированных приложений нет нужного, нажмите кнопку Browse (Просмотр) и выберите испол няемый файл этого приложения в стандартном диалоговом окне открытия файла.

Затем установите флажок Direct OCR (Включить прямое OCR), чтобы акти визировать "прямое распознавание". Флажок Draw zones automatically (Автоматиче ское зонирование) включает автоматическое зонирование, а флажок Proofread OCR (Проверить OCR) — автоматический запуск проверки орфографии после окончания распознавания.

После того как приложение зарегистрировано, в его меню File (Файл) появляются две новых команды Acquire Text (Получить текст) и Acquire Text Settings (Установки получения текста). Последняя команда открывает диалоговое окно Options (Пара метры) OmniPage, где вы можете указать источник изображений, языки распозна вания, выбрать вариант макета оригинала (рис. 25.29).

OCR | Format | Direct OCR | Input OK С Auto Cancel column, no tables С Output Format - formatting and Retain flowing С Рис. Описание макета оригинала и распознанного текста при прямом распознавании Команда Acquire Text (Получить текст) запускает распознавание. В зависимости от сде ланных установок вам придется поместить в сканер оригинал или выбрать файлы с ис ходными изображениями страниц. Далее процесс распознавания пойдет автоматически, и распознанный текст будет вставлен в текущий документ, начиная с позиции курсора.

Редактирование текста После распознавания текста вы можете сразу отредактировать его в правой части окна документа. Она представляет собой, по существу, обычный текстовый редак тор. На платформе Macintosh он располагает базовым набором функций, позволяя задавать только гарнитуру, кегль и начертание шрифтов. Они выбираются соответст венно в меню Font (Шрифт), Type Style (Начертание) и Size (Размер), вложенных в меню Format (Формат).

Часть III. Утилиты На платформе Windows текстовый редактор OmniPage более развит. Кроме тех же атри бутов шрифта, вы можете даже управлять стилевым оформлением с помощью списка Style (Стиль) на панели управления Formatting Toolbar (Панель "Форматирование"). Ре дактор поддерживает выравнивание абзацев, списки и таблицы. При редактировании таблиц вы можете перетаскиванием мышью менять размеры строк и колонок.

Проверка орфографии Каким бы хорошим ни был оригинал, никогда нельзя ручаться за абсолютную точ ность распознавания. В оригинале, например, может повстречаться шрифт, который плохо распознается OmniPage, или грязь на изображении помешает правильно про честь то или иное слово. Поэтому мы призываем вас не отказываться от проверки тек ста даже в том случае, если на первый взгляд он выглядит абсолютно верным. Omni Page помогает вам оценить качество распознавания, выделяя цветом неуверенно распознанные и сомнительные слова. Красный цвет маркирует слова, в которых встречаются нераспознанные символы. Нераспознанные символы в тексте представле ны значком (тильда). Маркеры синего и зеленого цвета появляются, только если включен автоматический языковой анализ. При этом зеленым цветом помечаются слова, в которых один или несколько символов распознаны неуверенно, а синим цве том — сомнительные слова, т. е. отсутствующие в орфографическом словаре OmniPage.

На Macintosh настройки проверки орфографии находятся в разделе Spelling (Право писание) диалогового окна Preferences (Установки) (рис. 25.30). В области Spell Checking (Проверка правописания) флажок Use Language Analyst (Использовать язы ковой анализ) включает языковой анализ. Остальные флажки переключают проверку имен собственных, аббревиатур и акронимов. Мы рекомендуем всегда активизиро вать языковой анализ, поскольку он позволяет быстро обнаруживать ошибки распо знавания и при этом занимает очень мало времени. На платформе Windows языко вой анализ включен всегда.

OmniPage SE -Languages — Man None Dictionary:

ABC — Spell Checking — Spelling | Analyst j Ignore Proper Ignore Рис. 25.30. Раздел Spelling диалогового окна Preferences на Macintosh Глава 25. ScanSoft OmniPage SE Проверка орфографии запускается автоматически, в соответствии с настройками распознавания или вручную командой Proofread OCR (Проверить OCR) меню Edit (Редактировать) на Macintosh или меню Tools (Сервис) на PC. Команда открывает немодальное диалоговое окно Proofreader OCR (Проверить OCR), изображенное на рис. В левом верхнем углу окна приводится найденное сомнительное слово.

Ниже находится строка ввода Change to (Заменить на) с предложением по его заме не. Под строкой ввода расположен список предлагаемых слов, если возможны не сколько вариантов. Бывает, что список оказывается пуст, т. е. OmniPage не может "догадаться", какое слово было использовано в оригинале. В таком случае просто введите правильное написание этого слова в строку ввода.

. OCR found in to:

J [ I I sef dictionary;

J [none] Colin came ITT Рис. Диалоговое окно OCR Proofreader В правой верхней части окна находятся кнопки управления проверкой орфографии.

Когда будет найдено сомнительное слово, вам будут предоставлены следующие воз можности исправления:

D Ignore (Игнорировать) — игнорировать слово. Его стоит использовать, если вы уверены в правильности написания этого слова и оно встречается в тексте одно кратно;

О Ignore All (Игнорировать все) — игнорировать слово во всем тексте. Если незна комое OmniPage слово встречается в тексте несколько раз, то, нажав эту кнопку, вы больше не получите запросов относительно него;

О Change (Заменить) -- заменить слово на введенное в строку ввода или выбран ное в списке альтернатив;

Change All (Заменить все) • - заменить все появления слова в распознаваемом тексте;

Change and Add (Заменить и добавить), Add (Добавить) в Windows заменить слово и добавить его в пользовательский словарь. Добавляйте в словарь OmniPage слова, в орфографии которых вы абсолютно уверены. Если впоследствии в рас познавании этих слов возникнет ошибка, то программа "отловит" ее;

Часть III. Утилиты О Done (Готово), Close (Закрыть) в Windows закрывает диалоговое окно провер ки орфографии;

Prefs (Установки) (Только на Macintosh) — открывает раздел Spelling (Правопи сание) диалогового окна Preferences (Установки). Кнопка сделана для того, что бы по ходу проверки можно было включить пользовательский словарь, в кото рый добавляются новые слова. В Windows вместо этого в окне просто размещен список пользовательских словарей User Dictionary (Пользовательский словарь).

Главное удобство встроенной проверки орфографии состоит в том, что OmniPage показывает в нижней половине окна проверки орфографии фрагмент оригинала, содержащий неуверенно распознанное слово. В результате, вам не приходится от влекаться на поиск нужного места в бумажном оригинале или графическом файле.

По окончании проверки орфографии закройте диалоговое окно OCR Proofread (Проверить OCR) кнопкой Close (Закрыть) (Done (Готово) на Macintosh). Если необходимо, отредактируйте текст в текстовом редакторе.

Резюме Программа ScanSoft OmniPage SE, входящая в состав пакета CorelDRAW Graphics Suite предназначена для распознавания текста со сканированных оригиналов.

Оригинал может быть представлен в виде бумажной копии или графического файла. Для распознавания бумажного оригинала необходим сканер.

Программа разбивает исходное изображение на зоны, содержащие текст, табли цы и графику. Текст и таблицы распознаются, а графика переносится в распо знанный документ в исходном виде. Разбивка документа на зоны называется зо нирование.

Зонирование можно выполнить вручную.

Распознанный текст можно дополнительно отформатировать во встроенном тек стовом редакторе. OmniPage также имеет встроенную функцию орфографической проверки. Основываясь на ее словаре, программа может сделать заключение о качестве распознавания отдельных слов оригинального документа.

О Программа может работать в ручном и автоматическом режимах. В автоматиче ском режиме все установки программы делаются заранее, а затем программа не требует вмешательства пользователя. В ручном режиме часть операций требует работы пользователя.

ЧАСТЬ IV ТЕОРИЯ Глава 26. Атрибуты текста Глава 27. Описание цвета Глава 28. Управление цветом Глава 29. Точечные и векторные изображения Глава 30. Тоновая и цветовая коррекция Глава Растрирование и цветоделение Глава Атрибуты текста Данный раздел описывает важнейшие атрибуты текста безотносительно к работе в каком-либо приложении. Свойства текста делятся на две большие группы — атри буты символа, которые задаются для каждого символа текста по отдельности, и ат рибуты абзаца, которые имеют смысл для всего текста.

Различные приложения имеют разные способы работы с атрибутами. Может не сколько различаться как сама трактовка атрибута, так и методы работы с ним. Здесь мы обсудим определения атрибутов, характерные для пакета CorelDRAW.

Шрифт При передаче информации в письменном виде принято, чтобы все буквы были чем то похожи друг на друга, так как это облегчает восприятие текста. Если мы пишем послание от руки, то стиль начертания букв называется почерком. В случае печатно го слова характер изображения символов текста мы назовем шрифтом. Все элементы в качественном шрифте гармонично сочетаются, образуя настоящее произведение искусства, выполненное художником-графиком. Шрифтов очень много, и различия между ними могут быть более чем существенными. Однако можно выделить неко торые элементы, общие для большинства шрифтов (рис.

Основной штрих прописных Высота букв Ь Соединительный штрих Очко Наплыв выносной Рис. Элементы шрифта Гарнитура Группа шрифтов, имеющих одинаковый стиль и дизайн, объединяется термином "гарнитура". Многие из ныне используемых гарнитур созданы давно (например, "Академия", "Баскервиль", "Тайме", "Авангард"), другие придуманы недавно. Обычно гарнитура состоит из нескольких шрифтов. Эти шрифты имеют общие особенности Часть IV. Теория дизайна, отличающие их от другой гарнитуры. Однако сами они также различаются — по толщине штрихов, наклону, соотношению ширины и высоты.

Эти параметры определяются начертанием.

В компьютерной слово "шрифт" часто употребляется как синоним тер мина "гарнитура". Строго говоря, это не верно, хотя уже стало традицией.

Начертания Начертание — это параметр шрифта в гарнитуре. Оно однозначно определяет вид шрифта. Наиболее распространенные начертания — Bold (Полужирный) и Italic (Курсив). Основное начертание гарнитуры часто называют Normal (Обычный).

Названия начертаний не стандартизированы Компьютерные шрифты создаются самыми разными производителями, живущими в раз ных странах. Они могут и не придерживаться общего стандарта именования шрифтов.

Начертание включает в себя различные характеристики.

Насыщенность — относительная толщина штрихов символов. Чем более насыщен шрифт, тем темнее будет выглядеть текст, им набранный (рис. 26.2). Начертания могут быт светлыми, полужирными, жирными, обычными.

dolor ipsum dolor sit elit, sed sed diem nibh tincidunt ut lacreet magna lacreet erat Ut ad erat ad minim veniam, quis nostrud Ut ad nostrud ut exerci talon lobortis ex en commodo consequat. Duis te en Duis te per suscipit nisi ut «« lobortis ut aliquip ex en ex en per ipsum dolor ipsum dolor amet, consectetuer amet consectetuer adipiscing elit sed adipiscing sed diem nonammy nibh ipsum finddunt euismod ut em, sed Ut erat Ut wisis enim ad ut ad minim quis nostrud minim veniam, quis nostrud exerci suscipit lobortis lacreei aliguam suscipit ut aliquip It wisis enlm ad minim ex ea commodo consequat. Duis te ea commodo consequat. Duis te exerci Duis in Рис. 26.2. Насыщенность различных шрифтов Насыщенность — характеристика гарнитуры Если сравнить несколько шрифтов с одинаковыми параметрами насыщенности, но при надлежащих к разным гарнитурам, вы увидите, что некоторые из них темнее, а некото рые светлее. Поэтому можно говорить о насыщенности и как об общей характеристике гарнитуры.

Пропорциональность — отностельная ширина знаков шрифта. Гарнитура может включать обычное, широкое, узкое начертания (рис. 26.3). Встречается и более тонкое деление шрифтов по пропорциональности.

Наклон. Если шрифт не имеет наклона, он называется прямым. Наклонный шрифт образуется наклоном символов обычного начертания (рис. 26.4).

Глава 26. Атрибуты LOREM IPSUM Рис. 26.3. Пропорциональность Рис. 26.4. Прямой и наклонный шрифт Курсив — особое начертание, характерное для шрифтов с засечками. Буквы в курсивном начертании имеют сходство с прямыми по стилю, рисунок же их совсем другой и напоминает рукописный шрифт (рис. 26.5).

em em sum Рис. 26.5. Прямой шрифт и курсив Производители гарнитур могут включать в их любые, самые экзотиче ские начертания, например, инверсный, с различными деформациями, снабжен ный тенью, лишенный заливки и пр. Название начертания состоит из нескольких слов. Первое определяет насыщенность шрифта, второе степень наклона, третье — дополняет определение начертания. Например, Times Bold Italic Тайме Полужирный Курсив, или Bodoni Extra Bold Condensed — Бодони Жирный Суженный.

К начертанию можно условно отнести смену регистра символов (рис. 26.6). Так, в режиме "все прописные" (All Caps) строчные буквы текста также набираются прописными. Вид и объем текста при этом очень сильно меняются. Капитель это особое изменение регистра текста, при котором прописные буквы не меняют вид, а все строчные заменяются прописными уменьшенного кегля. Набор капите лью и прописными применяется для заголовков, колонтитулов и текстовых выде лений.

LOREM IPSUM LOREM IPSUM Рис. 26.6. Обычный регистр, прописные и капитель В эпоху докомпьютерного набора гарнитурой называли группу шрифтов разных на чертаний и кеглей (размеров). Термином "шрифт" обозначался набор символов (ли тер) данной гарнитуры, начертания и кегля. Поскольку теперь кегль шрифта можно легко и плавно менять, в понятие шрифта кегль не входит. Как мы уже отмечали, в настоящее время понятия гарнитуры и шрифта сближаются. Во многих случаях — это синонимы. Однако первое понятие все же шире.

1056 IV. Теория Классификации гарнитур и шрифтов Как и любые другие произведения искусства, гарнитуры и входящие в них шрифты невозможно строго классифицировать. Существует множество классификаций. Так, гарнитуры можно разделить по форме символов на рубленые, с засечками, рукопис ные, декоративные и символьные (рис. 26.7).

Рубленые С засечками Декоративные Символьные (Sans Serif) (Serif) (Symbol) I.

Times New Roman Nueva LITHOS Фит» Europe Acme б a в г Рис. 26.7. Примеры шрифтов (классификация по форме символов) Полезна, хотя очень условна, классификация по применению. Она делит именно шрифты — в состав гарнитуры могут входить и жирные, и наклонные шрифты, и шрифты с особыми начертаниями, а они по этой классификации попадают в раз ные группы.

Итак, шрифты условно делят на наборные, заголовочные и акцидентные. Первые применяются для набора больших объемов текста — книг, статей и др. Они имеют тонкие штрихи, простой рисунок и засечки. Засечки — это горизонталь ные штрихи, располагающиеся сверху и снизу основного штриха. Серифы оттеняют силуэт буквы, делая шрифт более читаемым. Страница, напечатанная таким шриф том, легко читается, даже если размер символов очень мал.

Заголовочные шрифты обычно имеют более толстые штрихи. Они могут иметь или не иметь засечек и хорошо смотрятся, если размер букв достаточно большой. Деко ративные шрифты имеют произвольный рисунок символов, применяются только для коротких заголовков, которые можно рассматривать скорее как элементы дизайна.

Кроме того, есть еще символьные шрифты. Они вместо букв содержат различные символы, рисунки и т. д. и применяются, разумеется, не для набора текста, а для создания графических объектов, формул, чертежей и т. п. Многие шрифты, в том числе и распространенные, нельзя отнести ни к одному из типов. Есть шрифты универсальные, такие как они применяются как в крупном кегле (за головки), так и в мелком (набор).

Существует множество классификаций шрифтов. Каждая из них делит шрифты на много классов и подклассов. Примеры классификаций — ГОСТ, Windows, PANOSE.

PANOSE — принципы классификации В программах пакета Corel при подборе шрифта для замены отсутствующего приме няется система замен PANOSE, причем ее установки можно в большой степени из менять и приспосабливать к вашему комплекту шрифтов. Это наиболее полная на Глава 26. Атрибуты текста сегодняшний день классификация шрифтов. Согласно ей разработчики должны снабдить каждый шрифт специальным цифровым кодом, состоящим из 10 цифр.

Каждая цифра отражает особенности начертания (наличие и вид засечек, жирность, величину очка, расположение наплывов, контрастность, область применения и др.).

Классификация составлена весьма разумно, и, следуя ей, несложно придать такой код любому шрифту, исключая, пожалуй, декоративные. Замена отсутствующей на данной машине гарнитуры на другую, максимально похожую, по замыслу авторов, должна производиться путем сличения цифрового кода PANOSE. К сожалению, все замечательные функции PANOSE работают только в том когда разработчики шрифтов снабжают свои гарнитуры описанным выше кодом PANOSE. А они в большинстве случаев этого не делают (по неизвестной авторам причине). В резуль тате машине замен нечего сравнивать, и результаты автоматической замены шриф тов не удовлетворяют даже самого невзыскательного пользователя. В настоящее время с помощью замены шрифтов можно лишь редактировать текст, но уж никак не выпускать оригинал-макеты. О замене шрифтов читайте в соответствующем раз деле главы 3.

Использование шрифтов в публикации Кроме прямого назначения — передачи информации, шрифты, использованные в публикации, являются элементом дизайна. Большинство гарнитур, особенно те, рисунок которых необычен, имеют стиль и настроение (рис. 26.8).

ИСТОРИЯ МИРА Рис. 26.8. Шрифт дизайна С развитием технологии PostScript появился огромный выбор гарнитур на все слу чаи жизни, и число их быстро растет. Дизайнер стал абсолютно свободен в выборе шрифтового оформления и связан лишь собственным (и клиента) вкусом и здравым смыслом. В такой ситуации можно подбирать гарнитуры по характеру публикации.

Принято, чтобы на каждой странице использовалось не более трех (а лучше двух) наборных гарнитур и не более одной декоративной.

Для достижения хорошего качества текста опытным путем выработаны правила вы бора гарнитур. Так, рубленые обычно применяются для заголовков, с засечками для основного текста. Для основного текста следует использовать лучше всего чи таемый, а именно прямой светлый шрифт. Заголовок, занимающий менее трех строк, рекомендуется набрать пожирнее, чем основной если заголовок имеет три и более строки, то он и основной текст могут быть одинаковой жирности. Гар нитуры заголовка и основного текста должны быть совместимы, часто хорошо смот рится сочетание похожих гарнитур, но одинаковых гарнитур одного начертания для текста и заголовка лучше избегать. При работе над публикацией не теряйте из виду главную цель любого документа — служить средством общения. Эту публикацию должно быть легко прочитать. Перед тем как принимать решение об окончательном дизайне, сделайте пробный отпечаток одной страницы и прочитайте его с расстояния Часть IV. Теория руки. Если это сделать трудно, то, возможно, придется изменить гарни туры на более читаемые или поработать с атрибутами символов и абзацев. Учтите, что лазерный принтер печатает с разрешением в раз меньшим, чем фотона борный автомат. Поэтому при печати на принтере штрихи будут гораздо толще. Чем меньше разрешение принтера, тем толще будут буквы.

Метрические параметры текста При работе над макетом исключительно важны гармоничные, правильные размеры всех элементов публикации. Это размеры символа пробела, а также остальных сим волов, боковые поля символов, интерлиньяж, отступы, отбивки между абзацами, размер полосы набора, поля полосы, формат страницы и разворота, толщина линеек и еще много разных численных значений — от размера засечек до толщины кореш ка создаваемой книги. Все эти величины измеряются в общих единицах.

Поскольку полиграфия является очень старой отраслью производства, в ней сохра нилась и используется традиционная система счисления, основанная на дюймах.

Применение традиционных единиц измерения дает возможность сопоставить разме ры всех элементов публикации — шрифта, полей, страницы и полосы набора и др.

Для того чтобы контакты с типографией и издательствами были дружескими и пло дотворными, вам действительно необходимо знать основные единицы измерения частей публикации. Вот они.

О Пункт — традиционная полиграфическая единица измерения. В пунктах измеря ются величина символов шрифта, расстояние между строками текста, толщина линий и некоторые параметры страницы. Пункт равен 1/72 дюйма или 0,352 мм.

Использование особой единицы в данном случае очень удобно, так как если вы ражать распространенные размеры букв (10, 12, 8 пунктов) и толщину линий (0,25, 0,5, 1 пункт) в миллиметрах, получатся дробные значения.

О Пика — это более крупная единица измерения. В пиках выражается ширина и высота колонок, полос и страниц. В одной пике 12 пунктов, значит, в дюйме 6 пик. В десятичных единицах пика равна 4,236 мм. Использование пик и пунк тов дает возможность сопоставить величину шрифта с остальными элементами публикации — полями, размером страницы и полосы набора и др.

Полиграфические единицы в странах Европы Из-за исторически сложившейся разницы в размере дюйма в Европе и Америке, пункт как единица, производная от дюйма, также различается. Описанный пункт, равный 0,352 мм — пункт PostScript — производное американского дюйма. Шесть пунктов PostScript равны одной пике. Описанные единицы измерения характерны для США и, в связи с распространением языка описания страниц PostScript и систем верстки амери канского производства, стали стандартом и в других странах. В европейских странах до сих пор принята несколько отличающаяся система измерений — в качестве основной единицы здесь используются пункты Дидо, 1/72 часть европейского Один пункт Дидо равен 0,376 мм, или 1,07 пункта PostScript. пунктов Дидо составляют цицеро.

Соотношение размеров символа определяет внешний вид и объем текста. На рис. 26. показаны основные метрические параметры наборного шрифта.

Глава 26. Атрибуты текста Оплечики Кегль Оплечики Интерлиньяж р Рис. 26.9. Параметры шрифта Размеры символов Кегль — это расстояние от нижнего до верхнего выносного элемента плюс поля над и под литерой. Это свободное пространство определяется в самом шрифте и нужно для того, чтобы символы верхней и нижней строк не сливались.

При наборе разными гарнитурами одного кегля (как на рис. видимая величи на символов сильно разнится. Величина и расположение символов сбалансированы художником, создавшим шрифт, так, чтобы они гармонично располагались вдоль строки заданной высоты.

Рис. 26.10. Разные гарнитуры имеют различный размер символов при наборе одним кеглем Для более исчерпывающего описания символов шрифта используются дополнитель ные параметры. Так, высота строчной буквы (называемая также опреде ляет именно размер букв (рис. 26.11). Соотношение прописной и строчной букв задает разницу между прописными и строчным буквами текста одного кегля. По горизонтальному размеру символы характеризуются шириной символа (этот параметр различен у разных символов одного и того же шрифта) и шириной цифры (обычно все цифры шрифта имеют одну ширину, что особенно удобно при наборе таблиц).

Lorem Ipsum Lorem Ipsum Lorem Ipsum Рис. Высота строчных букв у разных гарнитур отличается \ 7060 Часть IV. Теория Исторические названия кеглей В полиграфии иногда используются исторические названия некоторых кеглей. Здесь мы приведем эти названия и в скобках — размер в пунктах. Итак, традиционными считаются бриллиант (3), диамант (4), перл (5), нонпарель (6), миньон (7), петит (8), боргес (9), кор пус (10), цицеро (12), миттель (14), терция (16), текст (20).

Нельзя забывать о том, что текст — это не только символы, но и пустое пространст во между ними. Параметры пробела, расстояния между символами, интерлиньяж, отбивки и отступы — все эти атрибуты очень сильно действуют как на внешний вид текста, так и на объем, им занимаемый.

Принципы выбора кегля для публикации Выбор кегля зависит от ширины блока (полосы), в которой он должен разместиться, то есть от длины строки. На строке должно быть расположено не более 60 символов.

Причем снижение их числа до 50 только улучшает внешний вид текста. Величина набор ного шрифта обычно равна пунктам. Кегль 9 можно использовать в справочниках, осо бенно если несколько увеличить междустрочный пробел. Таблицы, сноски и комментарии набираются меньшим кеглем, чем обычный текст (например, если основной текст имеет кегль, то текст таблицы набирается 8 кеглем).

Размер пробела, боковые поля и емкость шрифта Пробел между словами, вводимый нажатием клавиши , — это тоже символ шрифта. В разных шрифтах ширина пробела различна. Пробел оказывает влияние на легкость чтения и объем текста. Чем шире пробел, тем больший объем займет один и тот же текст. Текст с очень узкими пробелами плохо читается, поскольку слова в нем сливаются. Если пробел слишком легкость чтения тоже сни жается, поскольку текст "разваливается" на несвязанные между собой слова.

поля символов (полуапроши) также определяются при создании шрифта. Чем они больше, тем больший объем занимает текст и тем более светлым и рыхлым он выглядит. Межсимвольные интервалы должны быть заметно меньше пробелов, ина че слова сольются в одно большое слово и текст невозможно будет прочитать.

Меняя размеры пробелов и межсимвольных интервалов, можно в широких пределах менять объем текста.

Емкость. Чем больше символов данного кегля помещается в строку данной длины, тем более емким является шрифт. На рис. 26.12 представлены примеры одинакового текста, набранного шрифтами разной емкости. При подготовке к верстке больших документов (например, книг) обязательно подбирается шрифт емкости, поскольку этот параметр сильно влияет на конечный объем публикации. Емкость шрифта можно до некоторой степени изменить.

На емкость, кроме параметров символов, влияют также размеры боковых полей и пробела. Несмотря на то что и та, и другая величина задаются в шрифте, большин ство текстовых программ позволяют менять их в широких пределах. Варьируя раз мер интервалов, вы можете в широких пределах регулировать объем, занимаемый текстом. Эти параметры регулируются в пределах абзаца. Небольшое увеличение пробела улучшает читаемость. Чтобы уменьшить объем текста, полезно слегка уве личить пробелы, а расстояния между символами наоборот — сократить. Текст станет плотнее, его объем уменьшится, но останется легко читаемым. Однако нельзя забывать Глава 26. Атрибуты текста и о гармонии элементов текста. Так, если пробелы сильно превышают норму, глаз при чтении в образовавшиеся промежутки и скорость чтения такого текста снижается. Если пробелы мало отличаются от интервалов между символами, текст сольется в одно большое слово и станет восприниматься с трудом.

Sit dolor nonummy Sit era! tincidunt ut aliguam ut diem dolor sed ж. sit ut diem diem dolore erat ut к volutpat. dolor aliguam amet.

ellt. sed dlein eu lsmod ut erat Рис. 26.12. Емкость шрифтов Кернинг позволяет настроить межсимвольные расстояния в тексте так, чтобы текст выглядел более равномерно. Межсимвольный пробел не должен быть одинаковым для всех букв текста. Форма литер различна, и для некоторых сочетаний он выгля дит увеличенным по сравнению с другими. Так, на рис. пробел между буквами "Г" и "А" выглядит шире, чем между буквами "И" и "Г".

Рис. Кернинг Как правило, кернинг делается в сторону уменьшения пробела, так чтобы высту пающие части одного символа пары заходили в пространство второго символа. Раз мещение символов становится зрительно более равномерным. Обычно шрифты снабжены таблицами кернинга — списком пар символов, между которыми нужно регулировать пробел. Это, например, "ГО", "ГА", и другие. Если шрифт обладает большой таблицей пар кернинга, он будет хорошо, равномерно смотреться в наборе. Как текст мелкого кегля можно дополнительно не подвергать кернингу. Для крупного текста необходима дополнительная настройка интервалов вручную. Кернинг измеряется в специальных полиграфических единицах — тысяч ных долях круглой шпации.

Шпации — относительные единицы измерения, основанные на кегле. Они характе ризуют горизонтальные размеры текста. Круглая шпация равна кеглю шрифта, по лукруглая шпация — половине кегля, тонкая шпация — четверти. Шпации приме няются при измерениях абзацных отступов, кернинга и других перемещениях Часть IV. Теория символов. Эти перемещения совершаются для улучшения зрительного восприятия текста, поэтому важны не точные значения смещений, а их отношение к величине символов. Применение относительной измерения автоматически делает эти смещения пропорциональными размеру шрифта. В классической полиграфии шпации рассчитывались по отношению к ширине заглавных букв М, N и строчной буквы t данного шрифта. Круглая шпация равнялась ширине заглавной буквы М, полукруглая — ширине заглавной буквы N, а тонкая шпация — ширине строчной буквы t. Все шрифты разные, и ширина букв у них тоже разная. Такой метод расче та ставил величину шпации в зависимость не только от кегля, но и от шрифта набо ра, что, вообще говоря, более корректно. В настоящее время определение шпации упрощено.

в отличие от кернинга, задается не для пар символов, а для абзаца. Он ха рактеризует величину межсимвольного пробела в группе. Пробелы меняются одина ково для всех выделенных символов. Трекинг также измеряется в тысячных долях круглой шпации. Уменьшение отнимает, а увеличение прибавляет к меж символьному расстоянию определенную величину (рис. 26.14).

Sii Ipsum St Ipsum Dolor Sit arlipi- adipiscing sed Amet, Consectetuer adi diem nonum- diem piscing diem nonummy nibh euismod magna erat lincidunt ut lacreet do Ipsum Ipsum Amet, lore magna aliguam erat Sit Amet, elit, sed diem Lorem Ipsum diem euismod Dolor Amet, Con Рис. 26.14. Трекинг Отступы также являются атрибутом абзаца. Отступ слева характеризует расстояние от левой границы блока до начала строк текста, отступ справа — расстояние от пра вой границы блока до конца строк текста. Абзацный отступ (красная строка) опре деляет расстояние от левой границы блока до начала первой строки абзаца (рис. 26.15). Отступы слева и справа применяются для верстки заголовков, стихов, эпиграфов.

Отступ ipsum dolor sit dolor amet, con- em dolor sit amet elit elit sed diem ut nod ut lacreet dolore erat volutpat.

erat volutpat. volutpat.

Рис. 26.15. Отступы Глава 26. Атрибуты текста Абзацный отступ может быть положительным (красная строка) или отрицательным (висячий отступ), как показано на рис. 26.16. Оба типа применяются для отделения абзацев друг от друга, однако их применение различается. Красная строка — наибо лее традиционный способ привлечения внимания к началу каждого абзаца, она ис пользуется в подавляющем большинстве изданий. Висячий отступ более вырази тельный прием, но он сужает полосу набора. Кроме того, чтение текста с висячим отступом замедляется именно его выразительностью — глаз "застревает" на отступе.

nit elit, fled diem diem t ut ut ex en ut a p ex do ut ex en ut dolor fled i i.

fled dolor dolor Ut ad minim ut ] 111 a. ut Рис. 26.16. Красная строка и висячий отступ Величина и размещение красной строки Величина красной строки в публикациях разных издательств и особенно разных лет из дания сильно меняется — в более старых изданиях красная строка была больше, ее ве личина доходила до двух круглых шпаций. В настоящее время стандартная величина аб зацного отступа (красной строки) равна круглой шпации. Избегайте применения красной строки в двух случаях — в многострочном заголовке и в первой строке после заголовка. И то и другое некрасиво.

Текст, смещенный за границу колонки, привлекает внимание, даже если его цвет и кегль остались неизменными. Прием выделения с висячим отступом поэтому очень хорош в учебниках, технической документации. Если поместить в начало каждого абзаца его основную мысль, тезис или подзаголовок, то такой страницей можно пользоваться как опорным конспектом — основные положения темы будут сразу бросаться в глаза. Висячий отступ также очень широко распространен при оформ лении нумерованных списков (совместно с табуляцией).

Отбивки также определяются для абзацев. Отбивка перед абзацем — это вертикаль ное расстояние, на которое смещается предыдущий данному абзац (рис. 26.17). От бивка после абзаца задает расстояние по вертикали, на которое смещается абзац, следующий за данным. Отбивками выделяются заголовки, подписи под рисунками.

Иногда выделение отбивками используется вместо красной строки, то есть все стро ки абзаца начинаются без отступов, одинаково, но каждый из них отделен от других отбивкой с двух сторон. Система верстки с отбивками более молодая, чем верстка IV. Теория с красными строками. Она принята в большинстве стран при составлении техниче ской литературы. Распространено мнение, что система верстки с применением от бивок придает более элегантный вид документу, и текст его легче читается.

dolor silt ut лА Duist* ut ut Рис. 26.17. Отбивки При верстке дизайнер волен выбрать любой способ разделения абзацев. Разумеется, после того как вы выбрали, вам придется придерживаться какого-то одного способа разделения. Выбор разделителя в большой степени определяет вид текста. Публика ция, сверстанная с использованием красных строк, смотрится более привычно для русскоязычного читателя. Напротив, верстка с отбивками придает странице не сколько необычный вид, кроме того, она более просторная, светлая.

Ширина символов для фигурного текста может изменяться простым сжатием и рас тяжением. Этот атрибут изменяется только для всего блока фигурного текста цели ком. В отличие от расширенного и суженного начертаний шрифта, в которых рису нок букв изменяется в соответствии с меняющейся шириной, при сжатии и растяжении нарушается соотношение толщины между горизонтальными и верти кальными штрихами символов, искажаются пробелы в очках букв Б, О, Q и т. д.

Внешний вид и читаемость шрифта ухудшаются. Особенно к этому чувствительны шрифты с засечками, поэтому для них ширину менять нежелательно. Рубленые шрифты меньше искажаются при смене ширины, но и для них эту величину не сто ит менять более чем на В простом тексте невозможно изменить ширину символов.

Интерлиньяж характеризует плотность строк на странице публикации. Раньше, ко гда набор текстов производился вручную, для увеличения расстояния между строка ми текста по вертикали между ними прокладывались тонкие латунные полоски ши риной в 2 пункта — шпоны. В традиционной полиграфии интерлиньяж (между строчный пробел) означал количество пунктов между строками в наборе. Так, если между строками набора прокладывались два шпона, толщина каждого из кото рых составляла 2 пункта, общий интерлиньяж составлял 4 пункта. В настоящее вре мя в понятие интерлиньяжа вкладывается несколько иной смысл. Интерлиньяж Глава 26. Атрибуты текста в большинстве программ определяет расстояния между базовыми линиями смежных строк (см. рис. 26.9). Если текст набран кеглем 11/13, это значит, что кегль состав ляет а интерлиньяж — 13 пунктов. Следовательно, расстояние между смежными строками составляет 2 пункта.

Для обычного (наборного) текста интерлиньяж принято устанавливать на 1/5 часть больше кегля. Так, при наборе 10 кеглем интерлиньяж составляет 12 пунктов, при наборе 8 кеглем — 9,6 пункта. Однако практика, как всегда, сильно отличается от теории. Для мелкого кегля интерлиньяж может быть несколько больше номинально го значения, тогда текст будет легче читать. В некоторых изданиях небольшое уменьшение кегля и расширение интерлиньяжа используют как художественный прием. Страница, набранная таким образом, выглядит очень светлой, воздушной, особенно если имеет широкие поля. Текст крупного кегля требует меньшего интер линьяжа. Интерлиньяж в заголовках обычно устанавливается равным кеглю и даже меньше. Если интерлиньяж меньше, чем кегль текста, он называется отрицатель ным. В наборном тексте отрицательный или даже равный кеглю интерлиньяж при менять нельзя, это приводит к слиянию выносных элементов букв в соседних стро ках, и текст становится нечитаемым. Отрицательный интерлиньяж с очень малыми значениями применяется и как художественный прием (рис. для оформления заставок, заголовков, логотипов.

, Рис. 26.18. Отрицательный интерлиньяж Установка интерлиньяжа также зависит от соотношения высоты прописных и строчных букв. В разных шрифтах это соотношение может быть совершенно раз личным. Если оно мало, то интерлиньяж выбирается несколько большим, если ве лико — меньшим по сравнению со стандартным.

Размещение символов текста Рассмотренные метрические параметры характеризуют сам шрифт. Однако при раз мещении текста верстальщику или дизайнеру приходится определять многие вели чины произвольно. Следующие параметры можно задавать для каждого символа текста отдельно.

Базовая линия — это воображаемая линия, проходящая по основаниям символов текста. Сами символы стоят на базовой линии, а нижние выносные элементы текста как бы свисают с нее. В обычном наборе базовые линии символов совпадают. Сме щение базовой линии применяется чаще всего для набора индексов и для достиже ния специальных эффектов (рис. например, в заголовках и логотипах.

Выключка. Это также атрибут размещения строк текста. Он характеризует их вырав нивание по горизонтали. Выключка задается для абзаца простого текста и для всего блока фигурного текста.

35 Часть IV. Теория Рис. 26.19. Смещение базовой линии По левому краю По центру По краю По формату sit 5it • diem eft. serf diem diem my my ut ut ut ut tereet ut al Рис. Выключка Возможные типы выключки (рис. 26.20) перечислены ниже:

выключка по левому краю считается простейшей. Строки выравниваются по ле вой границе текстового блока. Первые символы каждой строки находятся на од ной вертикали, последние символы на строке располагаются свободно, образуя рваный правый край;

О выключка по правому краю — это зеркальное отражение выключки по левому краю. Символы выравниваются по правой границе блока, так что последние символы строк образуют вертикальную линию, а первые располагаются свобод но, образуя рваный левый край;

выключка по центру располагает текст в середине строки. Для определения положения текста CorelDRAW вычисляет общую ширину всех символов данной строки с учетом пробелов и межсимвольных интервалов, делит эту величину по полам и совмещает найденную середину строки со средней линией текстового блока;

О выключка по формату равномерно распределяет символы по ширине блока.

Крайние символы в правой и левой части строки располагаются по границам блока (с учетом отступов и отбивок), а текст строки равномерно распределяется между этими крайними точками. Последняя строка абзаца не растягивается;

О полная выключка — все строки абзаца, включая последнюю, растягиваются по формату. При этом межсимвольные пробелы в отдельных строках могут возрасти до нескольких сантиметров. Полную выключку называют принудительной.

Из этих типов только два -- по левому краю и по формату — обеспечивают нор мальную читаемость. Они и применяются для набора массива текста. Какой из этих двух типов предпочесть — зависит от жанра, цели публикации и вашего вкуса. Вы ключка по левому краю придает тексту менее формальный вид, верстка с такой вы ключкой светлее. Приверженцы форматирования по левому краю говорят о том, что рваный край строки создает естественные опорные точки, своеобразные "ступеньки" Глава 26. Атрибуты текста для глаза читающего, упрощая ориентацию. Их противники утверждают, что при таком расположении текста глаз в конце каждой строки сталкивается с неожиданно стью (ведь каждая строка заканчивается в другом месте), что замедляет чтение.

Текст, выключенный по формату, смотрится однородным, его массив более темный.

Это наиболее распространенный в России способ выключки. Сторонники этого способа выравнивания настаивают, что в тексте, выключенном по формату, где есть ровная граница колонки, схема движения глаза упрощается, и скорость чтения по вышается.

Все остальные типы выключки применяются реже и только для небольших объемов текста. Выключка по центру и полная используются для оформления заголовков, шмуцтитулов, плакатов, открыток. Выключкой по правому краю иногда набирают небольшие заметки, подписи к рисункам. Этот тип выключки общепринят для набора эпиграфов и посвящений. Полная выключка используется в оформлении (рис. 26.21). Эта же выключка применяется в создании логотипов, когда текст пре вращается в элемент графического дизайна.

a г с ч Рис. 26.21. Полная выключка Дополнительные атрибуты Линии. Текст может быть подчеркнутым, или зачеркнутым линиями.

Наличие и тип линии произвольно задается для каждого символа текста (рис. 26.22).

LOREM IPSUM Рис. 26.22. Линии и текст Регистр. Вид текста, разумеется, зависит от того, в каком регистре его набирать.

Большинство программ предлагают, по крайней мере, три типа подобного формати рования — когда все символы текста становятся прописными, капитель, когда прописные буквы набирают как есть, а строчные — прописными умень шенного кегля, и индексы, которые оформляются путем смещения базовой линии в сочетании с уменьшением кегля.

IV. Теория Форматирование прописными применяется в заголовках и титулах, а также при соз дании текстового дизайна обложек и плакатов, капитель — общепринятый способ выделения колонтитулов и (редко) заголовков, а индексы в изобилии встречаются в специальных текстах (математические, и Ниже базовой линии располагаются подстрочные индексы. линия верхних индексов (их можно увидеть в любых изданиях в качестве номеров примечаний или комментариев) рас положена значительно выше базовой линии остальной строки.

Шрифт в вашем компьютере Компьютерный шрифт представляет собой программу, которая может быть исполь зована во всех приложениях Windows/Mac OS X. Шрифты входят в комплект систе мы. Они разрабатываются производителями приложений (особенно графических векторных программ) и поставляются вместе с ними. Наконец, есть занятые исключительно производством шрифтов на все случаи жизни.

Немного истории В начале 80-х годов прошлого века на компьютерах использовались преимуществен но растровые шрифты. По существу, каждый символ (глиф) шрифта представлял собой маленькое точечное изображение, готовое для печати на принтере или ото бражения на экране. Большинство "серьезных" программ использовали свои шриф товые технологии, и шрифты из одной программы не годились для другой. Растро вые шрифты нельзя свободно масштабировать. Поэтому они были рассчитаны на конкретные устройства вывода (например, отдельно существовали экранные и прин терные шрифты). Для достижения наивысшего качества первые издательские систе мы имели набор растровых шрифтов нескольких кеглей. Единственным достоинст вом растровых шрифтов, принципиальным для тогдашних компьютеров, была высокая скорость их обработки. Дело в том, что в подавляющем большинстве случа ев для вывода текстовой и информации используются растровые уст ройства: принтеры, фотонаборные автоматы (ФНА), мониторы. Для вывода растро вого шрифта на растровое устройство программе достаточно установить те значения пикселов устройства вывода, которые записаны в шрифте.

В середине 1980-х стал использоваться новый класс компьютерных шрифтов — кон турные шрифты. В них каждый глиф шрифта содержится в виде математического описания кривых, составляющих его Для отображения таких шрифтов на растровых устройствах требуется дополнительная стадия — растеризация. Растериза тор должен, исходя из разрешения устройства вывода, рассчитать заполнение ячеек его растровой сетки каждым символом шрифта при выбранном кегле. Впрочем, рас теризатор должен обрабатывать не только кегль шрифта, но также его ширину, вы соту, кернинг и обеспечивать поддержку национальных кодировок и мно гое другое. Поскольку это довольно специфическая задача, шрифтов называют шрифтовыми машинами. Очевидно, что появление контурных шрифтов стало возможно только тогда, когда вычислительной мощности компьютеров хвати ло на их растеризацию "на лету". По крайней мере, растеризация для экранного раз решения должна занимать разумное время, чтобы пользователю не приходилось ждать текста на экране.

Глава Атрибуты текста В это время операционные системы компьютеров IBM и Apple не имели встроенной поддержки контурных шрифтов, т. е. шрифтовой машины. Ведущие производители шрифтов и издательских программ стали разрабатывать и продвигать собственные шрифтовые технологии. Некоторые из них существуют до сих пор и занимают свою "экологическую нишу". Например, технология (Agfa) применяется в лазер ных PCL-принтерах. Шрифты работают на графических компьютерах Amiga и задействованы в технологии Технология TrueDoc Компания Bitstream, издавна специализирующаяся на производстве шрифтов и разра ботке шрифтовых технологий, выдвинула технологию внедрения контурных шрифтов в разнообразные типы документов: от файлов текстовых процессоров до Web-страниц.

Эта технология позволяет внедрять шрифты всех основных типов и гибко задавать пара метры шрифтовой добиваясь компромисса между требованиями качества и скорости растеризации. Многие программы (Microsoft Office, CorelDRAW и др.) исполь зуют технологию TrueDoc. Для Web-дизайнеров компания предлагает полный набор средств поддержки TrueDoc на Web-страницах.

Шрифтовые машины всех разработчиков реализовывали основное преимущество контурных шрифтов — независимость от разрешения устройства вывода и свободное масштабирование при самом высоком качестве. При этом они были несовместимы друг с другом и не позволяли использовать шрифты конкурентов. Очевидно, в такой ситуации должен был победить сильнейший, тот, кто обеспечит наибольшую про граммную поддержку своей технологии.

В г. фирма Adobe выдвинула технологию PostScript и реализовала ее для прин тера Apple LaserWriter. Эта дата стала точкой отсчета для новой эры настольных издательских систем. Интерпретатор PostScript включал растеризатор, позволяю щий обрабатывать как точечные и векторные изображения, так и шрифты. Язык PostScript был реализован для фотонаборных автоматов и стал ядром издательской технологии. Формат шрифтов Туре 1, описывающий контуры символов на языке PostScript, был наиболее гибким, совершенным, обеспечивал наивысшее качество.

За несколько лет формат Туре 1 практически вытеснил прочие с рынка издательских систем.

Дальнейшее развитие технологии, которое обеспечивается вовлечением в разработки сторонних разработчиков, тормозилось закрытостью формата Туре I. Оригинальная технология разметки, созданная Adobe, не была документирована. Поэтому сторон ние разработчики не могли создать собственную шрифтовую машину, которая могла бы хорошо Растрировать шрифты Туре 1. К концу 1980-х разработчики операцион ных систем (Microsoft, Apple, а позже IBM) стали остро нуждаться в контурной шрифтовой технологии для включения в свои операционные системы. При этом они не хотели, чтобы их ключевой блок зависел от каких-либо сторонних произво дителей. Разработчики Adobe среагировали на эту потребность, опубликовав в 1990 "секрет" Туре 1 — технологию разметки. Теперь любой разработчик мог создать шрифтовую машину, работающую с форматом Туре 1 и конкурентоспособ ную с предлагаемой фирмой Adobe. Но этот ход был сделан слишком поздно: в на чале 1991 г. Microsoft и Apple создали собственный открытый формат шрифтов. Тех нология, названная TrueType, включала шрифтовую машину и соответствующий формат шрифтов. Шрифтовая машина TrueType была включена в Mac OS X и Windows IV. Теория Таким образом сложилось современное положение на шрифтовом рынке, где со существуют две основные конкурирующие технологии - TrueType и Туре 1.

За прошедшие годы Adobe, Apple и Microsoft внесли многочисленные усовершен ствования в свои форматы шрифтов и шрифтовые машины, но монополии нико му из них достичь не удалось. Технология PostScript окончательно завоевала рынок издательских систем, и шрифты Туре 1 находятся на нем практически вне конкуренции. Рынок офисных приложений прочно удерживается Microsoft и форматом TrueType.

В 1996 г. Microsoft и Adobe поразили аналитиков заключением договоренности о разработке нового, единого формата шрифтов, получившего название ОрепТуре.

Шрифтовая машина ОрепТуре способна работать как со шрифтами этого формата, так и со шрифтами TrueType и Туре 1. Впервые она была реализована в операци онной системе Windows 2000. Эти события произошли совсем недавно, но пред ставляется, что формат ОрепТуре имеет хорошие перспективы. От создания выигрывают все: Microsoft нарушает монополию Adobe на рынке издательских приложений, Adobe делает свои огромные шрифтовые библиотеки доступными для пользователей офисных приложений, а пользователи, что, важнее всего, избавляются от головной боли при переносе документов между приложе ниями и платформами PC и Macintosh, расширяют свои собственные шрифтовые библиотеки. Насколько оправдаются эти надежды, покажет будущее, но они уже имеют твердую базу — новый формат поддерживается главными фигурами на шрифтовом рынке.

Далее, не вдаваясь в технические детали, мы рассмотрим устройство шрифтов и их растеризацию, а также особенности форматов. При этом мы будем указывать на различия между Туре 1 и TrueType, если они есть.

Шрифтовые машины Если шрифтовая машина TrueType встроена в ОС Windows Windows и Mac OS X, то шрифтовая машина Туре 1 поставляется фирмой Adobe отдельно.

Она называется Adobe Type Manager (или просто ATM) и существует как для плат формы Windows (текущая версия 4.1), так и для Mac OS X (текущая версия 4.6). Без ATM операционная система не сможет отображать шрифты Туре 1 на экране и вы водить их на принтеры, не имеющие встроенной поддержки PostScript. При выводе текста на принтер PostScript растеризация осуществляется встроенными программ ными средствами принтера. Если вы пользуетесь не PostScript-устройством для вы вода, то растеризацию осуществляет шрифтовая машина.

Новые приложения Adobe Оговоримся, что новые приложения Adobe Systems, использующие общую библиотеку не нуждаются в Adobe Type Manager. Функции этой библиотеки эквивалентны тем, что есть в ATM и позволяют "на лету" растеризовать шрифты Туре 1 для экрана и принтера.

Шрифтовая машина Windows 2000 умеет работать как со шрифтами TrueType, так и Туре Поэтому для работы с ними в этой системе ATM не требуется.

Глава 26. Атрибуты Чтобы шрифты были "известны" шрифтовой машине, их необходимо установить.

В Windows для этого надо поместить их в папку (Шрифты). Если на вашем компьютере функционирует ATM, то для установки шрифтов Туре 1 исполь зуйте его панель управления. За более подробными инструкциями обратитесь к ру ководству по операционной системе и ATM.

Диспетчеры шрифтов Управление шрифтами на компьютере — первоочередная задача любого профессио нального пользователя. "Штатные" средства операционной системы для этого вполне достаточны, но слишком примитивны. Многие сторонние разработчики производят про граммы управления шрифтами, диспетчеры шрифтов. Диспетчеры шрифтов не содер жат шрифтовой машины, а служат только для классификации шрифтов, организации их наборы, удобного просмотра, установки и удаления. Единственным исключением из этого правила является Adobe Type Manager 4.0 Deluxe, который кроме шрифтовой ма шины предоставляет и развитые средства управления шрифтами.

Шрифты В файлах шрифта хранится весьма обширная информация. В том числе:

рабочее и полное имя шрифта, имя гарнитуры, к которой принадлежит шрифт и название начертания;

О сведения об авторах шрифта;

уникальный регистрационный номер шрифта;

сведения о метрических размерах символов — их ширине, стандартном размере полей и оплечиков;

информация о парном кернинге. Чем больше таблица пар в шриф те, тем более качественно он будет форматироваться. Если в самом шрифте нет информации о кернинге, эту функцию берет на себя программа верстки (если она обладает возможностью автоматического О таблицы шрифта. Главным достоинством шрифта (особенно наборно го) является легкость чтения. Она обеспечивается в большой степени правиль но подобранным размером полей символов. В зависимости от кегля шрифта для улучшения восприятия нужны разные поля. Мелкий текст будет лучше смотреться со слегка увеличенными полями, в очень крупном поля лучше сильно уменьшить. Таблицы трекинга содержат информацию о зависимости ширины полей от кегля;

описание общих элементов. Если символы шрифта содержат общие элементы, то для экономии места все они описываются в особой области, а в области описа ния каждого символа дается ссылка на общий элемент;

О кодовые таблицы — таблицы соответствия между кодом в таблице ANSI и име нем символа шрифта;

D описание разметки символов. Разметка необходима для качественного воспроизведения символов на устройствах вывода — растеризации;

описание формы каждого символа. Это основная часть файла шрифта.

IV. Теория Описание символов в шрифте В файлах шрифтов находятся математические описания формы контуров символов.

В шрифтах TrueType для этого применяются а в шрифтах Туре 1 сплайны Безье. Последние являются кубическими:

р = где 0 < < и — координаты концов сплайна, а р\ и — координаты управ ляющих точек, лежащих вне кривой (рис. 26.23, а).

В-сплайны — квадратичные:

р = + + где 0 < t < P2 — координаты концов сплайна, а — управляющей точки, ле жащей вне кривой (рис. 26.23, б).

а б Рис. 26.23. Описание символа (а) и кривыми Безье (б) Контур каждого символа описывается серией приведенных кривых. Оба способа описания контуров обеспечивают достаточно высокую точность для любых прило жений.

Разметка Разметка — это средство улучшения растеризации. Дело в том, что при выводе шрифта на экран или принтер производится превращение его из контурного форма та в растровое изображение с конечным разрешением. Чем меньше размер символов и чем меньше разрешение выводного устройства, тем больше вероятность искаже ния формы символа. На рис. 26.24 приведены некоторые примеры.

* •• •• •••• •• • ч Рис. 26.24. Искажение формы символа при выводе Глава 26. Атрибуты текста Если в состав шрифта ввести описание его элементов (толщины штрихов, углы на клона, радиусы округлых штрихов и пр.) и передавать эти данные устройству выво да, то с учетом этих параметров качество улучшится.

В шрифтах Туре 1 разметка производится декларативно. При загрузке шрифта в теризатор отправляются отдельно описание контура шрифта и отдельно — набор команд по его построению. Команды содержат сравнение элементов шрифтов. Так, декларативная разметка определяет, что горизонтальные штрихи должны быть равны вертикальным, засечки должны иметь равную длину, средняя линия шрифта должна проходить на одинаковой высоте, равным должен быть оптический наплыв и высота и пр. Растеризатор такого шрифта — это сложнейшая программа, которая и выпол няет связывание формы символов с командами разметки. Шрифты Туре 1 гораздо проще, чем True Type. Качество их вывода зависит прежде всего от качества ризатора.

В TrueType используется программируемая или жесткая разметка. Для символов точно указываются все действия, которые должен выполнить растеризатор. Дается исчерпывающее описание символов — толщины вертикальных штрихов, горизон тальных штрихов, ширины и высоты символов, угол наклона засечек, поля, величи на оптического наплыва и прочие характеристики. Когда шрифт поступает на обра ботку растеризатором, все его параметры определены, и поэтому растеризатор True Туре имеет очень простое устройство. Шрифты в этом формате, напротив, имеют большой размер файла и сложное строение. Такой шрифт теоретически может обес печить очень высокое качество вывода. Оно прежде всего зависит от качества раз метки в шрифте.

Поскольку создать TrueType-шрифт с хорошей разметкой оказывается сложным де лом, многие производители используют программы автоматической разметки шриф та. Как бы ни были хороши эти программы, они не способны обеспечить столь же хорошее качество, как при ручной разметке. В то же время, производство шрифтов Туре 1 приемлемого качества не связано сложностями разметки, поскольку большую и самую сложную часть работы берет на себя растеризатор, а он — один для всех шрифтов.

Если вы работаете в сфере то мы советуем использовать исключитель но шрифты 1. Они являются "родными" для интерпретатора PostScript и интер претаторов, входящих в программы иллюстрирования (CorelDRAW, Adobe Illustrator, Macromedia Freehand и т. д.). Хотя современные версии интерпретатора PostScript способны интерпретировать фактически "чистый TrueType", лучше гарантировать себя от возможных проблем. Важно и то, что профессионально сделанных TrueType шрифтов, к сожалению, очень немного. Поскольку технология Туре 1 появилась на 6 лет раньше, за этот период был создан весь основной набор гарнитур, используе мый и поныне. С появлением TrueType большая часть шрифтов была просто авто матически перекодирована в новый формат. Ввиду совершенно различных способов описания контуров и разметки, это невозможно сделать без потерь качества, даже при помощи самой "умной" программы. В результате, основная масса шрифтов TrueType не только не использует преимуществ этого формата, но и несет в себе погрешности перекодировки.

К положительным сторонам шрифтов TrueType относится то, что они поддержива ются системой Windows и являются "родными" для офисных тогда как Часть IV. Теория для шрифтов необходима установка отдельной шрифтовой машины. Поэтому при работе в офисных приложениях лучше пользоваться шрифтами TrueType. Про фессионально сделанные шрифты TrueType (такие, как Times New Roman и Courier) за счет лучших алгоритмов разметки обеспечивают даже более высокое качество печати на устройствах с низким разрешением.

Кодировка шрифта Когда вы нажимаете на клавишу, в текстовом редакторе появляется символ шрифта.

Операционная система и шрифтовая машина извлекают из шрифта нужный символ.

Чтобы этот символ соответствовал тому, что изображено на клавишах вашей клавиа туры (а также клавиатур пользователей в других странах), необходимо точно уста новленное соответствие кодов клавиатуры и глифов шрифта, т. е. таблица кодировки.

Исторически первой таблицей кодировки была таблица ASCII. Она содержала всего 128 символов, включавших символы английского алфавита и псевдографические символы, использовавшиеся программами, работающими в текстовом режиме.

Таким образом, таблица ASCII просто игнорировала пользователей, работающих с другими языками, и скоро была расширена до т. н. таблицы OEM ASCII, вклю чающей 256 символов. В них вошли символы других языков. Поскольку 128 симво лов недостаточно, чтобы представить даже только западноевропейские языки, в опе рационную систему (DOS) была введена поддержка кодовых страниц. Алфавиту каждой страны соответствовала определенная кодовая страница. В конфигурацион ных файлах системы указывалась кодовая страница, соответствующая национально му языку. Таким образом, пользователь получал возможность работать с английским и любым другим языком, указав его кодовую страницу.

Pages:     | 1 |   ...   | 14 | 15 || 17 | 18 |



© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.