WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!

Pages:     | 1 |   ...   | 10 | 11 || 13 | 14 |

Имена файлов-документов SGML, как правило, имеют расширение sgml. SGML с начала 1970-х разрабатывался фирмой IBM, а с 1986 года принят в качестве международного стандарта (ISO 8879) для формата документов с логической разметкой. Сначала документ SGML содержит описание вида кодирования и разметки текста и затем сам размеченный текст. HTML — это SGML с фиксированной разметкой. Создатели технологии WWW отказались от полной поддержки SGML только потому, что в начале 1990-х системы, которые могли работать с SGML в реальном времени были очень дороги.

Элементы SGML делятся на четыре категории:

1) описательные маркеры — определяют структуру документа — им соответствуют элементы разметки HTML типа H1, P, A, IMG и т.п.;

2) ссылки на данные — им соответствуют элементы разметки HTML типа &

3) описательные конструкции компонент документа в их структурной взаимосвязи — они не входят в HTML, но определяют его. Их рекомендуется начинать с комбинации знаков ! и заканчивать знаком. Примером конструкции, определяющей ссылку &ref; на словосочетание “The Reference” будет !ENTITY ref"The Reference" ;

4) инструкции по обработки текста — их рекомендуется заключать между знаками и — они вводят элементы текста, ориентированного на конкретную, зависящую от системы обработку (физическую разметку). В HTML с их помощью, например, вставляют код для обработки на сервере WWW страниц.

Документы SGML можно конвертировать как в гипертекст, так и в любой формат, ориентированный на распечатку, например, TEX или Microsoft Word. Ведение документации в формате SGML во многих отношениях оптимально.

С 1996 официально идет разработка формата XML — подмножества SGML, которое предполагается использовать в Internet наряду с HTML. Преимущество XML перед HTML в его четкой связи с SGML, что позволяет стандартным образом вводить в документ новые конструкции, избегая тем самым неконтролируемого введения в язык новых возможностей, как это происходит с HTML.

Упражнение Как на HTML описать заголовок первого уровня “Глава 2”, на который можно будет ссылаться по имени “2” 35. TEX Известный американский математик и теоретик программирования Дональд Кнут (D. E. Knuth) более 10 лет с конца 1970-х годов разрабатывал систему верстки книг TEX (произносится “тех”). Существует множество расширений возможностей базового (plain) TEX. TEX популярен прежде всего в академических кругах, т.к. в целом он весьма сложен для изучения. В отличие от систем, ориентированных на интерпретацию разметки, подобных Microsoft Word или Sun Star Writer, TEX — компилирующая система. Результат компиляции документа TEX — это файл в бинарном формате dvi (device independent), который можно, используя драйверы конкретных устройств (принтеров, экрана), распечатать. TEX использует собственную систему масштабируемых шрифтов, которые масштабируются не в реальном времени, интерпретацией как шрифты True Type или PostScript, а компиляцией при помощи программы METAFONT. В Internet доступны тексты программ TEX и METAFONT — они написаны на Паскале. Шрифты METAFONT написаны на специальном языке, с декларативным синтаксисом. TEX позволяет также использовать шрифты True Type и Adobe Type 1 и Type 3. Прочитать и понять содержимое документа TEX несложно, но скомпилировать и распечатать, а тем более создать новый документ без помощи специалиста или основательной подготовки непросто. Однако TEX до сих пор является почти единственной доступной бесплатно системой, позволяющей получать документы типографского качества. В plain TEX используется физическая разметка, а в наибоA лее популярном его расширении L TEX также и логическая. TEX — это язык макросов, большинство из которых начинаются с символа обратная косая черта и состоят затем из букв. Например, запись в документе plain TEX \centerline{Это {\it мой} заголовок} означает центрировать строку-абзац “Это мой заголовок”, напечатав слово “мой” в нем курсивом, а запись $$\int 1x{dt\over t}=\ln x$$ — формулу x dt = ln x.

t TEX — это особый язык программирования. Энтузиасты TEX написали на нем интерпретатор языка Бэйсик. Документы TEX могут иметь очень сложную структуру и из-за этого их в общем случае нельзя конвертировать в другие форматы. Документы HTML или Microsoft Word теоретически можно всегда конвертировать в формат TEX.

Система GNU texinfo основана на TEX, но использует совершенно другой набор макросов. Макросы в этой системе должны начинаться со знака @. Документы texinfo можно преобразовать как в документ HTML, так и в качественную распечатку. В отличие от SGML, средства для такого преобразования — это часть системы texinfo. Возможности texinfo для верстки документов несколько ограниченней по сравнению с другими развитыми TEX-системами.

A Расширения имен файлов документов TEX — tex; L TEX — tex, latex, ltx, sty (стили) и др.; METAFONT — mf (исходные программы шрифтов), tfm (метрики шрифтов, нужны на этапе компиляции документа TEX), pk (матрицы шрифтов, нужны при печати dvi-файла); texinfo — texi, texinfo.

36. PostScript и PDF PostScript — это универсальный язык программирования (имеет много общего с языками Форт и Лисп), предоставляющий большой набор команд для работы с графикой и шрифтами. Он является фактическим международным стандартом издательских систем. Разрабатывается фирмой Adobe Systems с первой половины 1980-х. Используется, как встроенный язык принтеров для высококачественной печати, а также некоторыми системами X Window при выводе данных на экран дисплея. Существуют и программы-интерпретаторы языка PostScript.

Лучшая из них — это Ghostscript. Программа GhostView предоставляет удобный оконный интерфейс для Ghostscript и существует для большинства ОС.

PostScript-программы можно писать вручную, но обычно текст PostScript генерируется автоматически программами вывода данных.

Расширения имен файлов с PostScript-программой — это, как правило, ps, eps (Encapsulated PostScript, файл-картинка с заданными размерами), pfa (шрифт), pfb (бинарное представление pfa), afm (метрики шрифта, могут быть частично получены из соответствующего pfaфайла), pfm (бинарное представление afm).

Преимущество формата PostScript в том, что он, как и формат DVI, независим от физических устройств воспроизведения. Один и тот же PostScript-файл можно выводить как на экран с разрешением 72 dpi (dot per inch, точек на дюйм) или лазерный принтер с разрешением 600 dpi, так и на типографскую аппаратуру с разрешением 2400 dpi, имея гарантии, что изображение будет наилучшего качества, возможного на выбранной аппаратуре. Возможности PostScript перекрывают возможности DVI, поэтому некоторые TEX-системы при компиляции документов производят сразу файлы в формате PostScript или PDF.

Файлы PostScript можно вручную корректировать, но из-за сложности языка — это очень не просто, особенно если используются символы, не входящие в ASCII. Фактически эти файлы можно рассматривать как “только для чтения” и использовать для распространения информации, не подлежащей изменению. Комментарии в PostScript, как и в TEX, начинаются знаком % и заканчиваются концом строки. Первая строчка PostScript-программы обычно содержит точное название формата файла. Собственно программа начинается в файле с символов %! и заканчивается символами %%EOF. PostScript-программы кроме собственной системы шрифтов могут использовать шрифты True Type фирм Apple и Microsoft.

Различают уровни (levels) языка PostScript. Уровень 1 может поддерживать только черно-белую графику. Уровень 2 может работать с цветом. Уровень 3 — это современное состояние языка.

Данные из файла PostScript можно показывать по мере их поступления, что удобно для использования в Internet. Однако есть две причины, по которым документы PostScript сравнительно редко включаются в web-страницы:

1) они весьма велики по размерам (этот недостаток снимается программами сжатия, работающими в реальном времени);

2) они могут содержать в себе шрифты, защищенные авторскими правами (шрифты их владелец может использовать при печати, но не распространять).

Файлы в формате PDF лишены двух означенных недостатков: они сжаты и из них сложно извлечь отдельные шрифты, — поэтому они стали фактическим стандартом Internet для обмена документами, не подлежащими изменению. Программы для просмотра PDF-файлов доступны бесплатно. Наиболее используемая из них — это Adobe Acrobat Reader. Первая строчка файла в формате PDF начинается со знака %, за которым следует идентификационная запись версии формата PDF, используемой в этом файле. Далее, как правило, идут бинарные данные.

Расширение имени PDF-файла — pdf.

Между документами PostScript и PDF можно осуществлять взаимно-однозначное преобразование, хотя PDF в отличие от PostScript — это не язык программирования, а скорее язык описания документа.

Приложение А. Ответы на все упражнения 1. 87 и 119.

2. 24 КГц.

3. 8192.

4. x = 5.

5. HX = 0.9 + log2 5 - 0.3 log2 3 2.75 бит/сим.

6. I(Y, X1) = 0.5 бит/сим.

7. I(Z, X1) = I(X1, X1) = HX1 = 1 бит/сим, т. е. Z полностью определяет X1 и, следовательно, X1 — это функцией от Z. HZ = бит/сим.

8. I(X1, X2) = (5 - 3 log2 3)/3 0.08 бит/сим.

9. I(X1, Y ) = (10 - 3 log2 3)/8 0.66 бит/сим, HX1 = 2 бит/сим, HY = (26 - 3 log2 3)/8 2.65 бит/сим.

10. I(Z, X1) = (22 - 3 log2 3)/16 1.08 бит/сим, HZ = (54 3 log2 3)/16 3.08 бит/сим.

11. I(X1, Y ) = (3 log2 3 - 2)/9 0.31 бит/сим, I(X2, Y ) = (3 log2 3 + 4)/9 0.97 бит/сим, HX1 = HX2 = log2 3 1.58 бит/сим, HY = (12 log2 3 - 2)/9 1.89 бит/сим.

12. HX = 7/4 = 1.75 бит/сим, HY = (24 - 3 log2 3 - 5 log2 5)/0.95 бит/сим, HZ = (328 - 12 log2 3 - 35 log2 5 - 17 log2 17)/64 2.бит/сим, I(Z, Y ) = (216 - 12 log2 3 - 35 log2 5 - 17 log2 17)/64 0.бит/сим.

13. ML1(X) = 3 бит/сим, ML2, 3, 4(X) = 2.2 бит/сим, HX = log2 5 - 0.2 2.12 бит/сим.

14. code(0) = 10, code(1) = 0, code(2) = 11 — это один из вариантов кодирующей функции. ML(X) = HX = 1.5 бит/сим.

15. code(2n) = 1 · · 1 0 или code(2n) = 0 · · 0 1. HX = n/2n = · · n=n-1 n-ML(X) = 2 бит/сим.

16. ML(X) HX 3.25 бит/сим.

17. inf(s1) = 1, cont(s1) = 2, inf(s2) = 0.5, cont(s2) = 0.75.

18. 1.56 бит/сим.

19. HX 2.17 бит/сим, код Хаффмена ML(X) 2.22 бит/сим, код Шеннона-Фэно ML(X) 2.28 бит/сим.

20. Шеннона-Фэно, Хаффмена: ML1(X1) = 2 бит/сим., ML1(X2) = 2.25 бит/сим., ML1(X3) = 2.7 бит/сим., ML1(X4) = 213/60 бит/сим.

Арифметический: ML1(X1) = 15/6 бит/сим., ML1(X2) = 2.05 бит/сим., ML1(X3) = 2.3 бит/сим., ML1(X4) = 21/60 бит/сим.

21. LХаффмена = 3 бита, Lарифметический = 4 бита.

22. 010001011, 01011111.

23. 81, в 27 раз.

24. Считая, что код генерирутся д.с.в. X с распределением P (X = A) = 2/3, P (X = B) = 1/3, можно получить наилучшие коды, для которых LХаффмена-1(ABAAAB) = 6 бит, LХаффмена-2(ABAAAB) = бит, LХаффмена-3(ABAAAB) = 5 бит, Lарифметический(ABAAAB) = 1 бит 25. ’B’10’C’26. code(AABCDAACCCCDBB) = ’A’10’B’00’C’000’D’100110011001, L(AABCDAACCCCDBB) = 62 бит, длина исходного сообщения — 112 бит. code(КИБЕРНЕТИКИ) = ’К’0’И’00’Б’100’Е’000’Р’100’Н’1111000’Т’100110111, L(КИБЕРНЕТИКИ) = 85 бит, длина исходного сообщения — 88 бит. code(СИНЯЯ СИНЕВА СИНИ) = ’С’0’И’ 00’Н’100’Я’001100’ ’101001011100’Е’11000’В’10100’А’1010101101101111, L(СИНЯЯ СИНЕВА СИНИ) = 114 бит, длина исходного сообщения — 136 бит.

27. Распакованное сообщение — AFXAFFXFXAXAFFA, его длина — 120 бит, длина сжатого кода — 52 бит.

28. 01000010111001.

29. AABCDAACCCCDBB, LZ77: 0,0,’A’ 11,1,’B’ 0,0,’C’ 0,0, ’D’ 7,2,’C’ 11,2,’C’ 5,2,’B’ 0,0,’B’, длина 8 15 = 120 бит; LZSS:

0’A’1 11,1 0’B’0’C’0’D’1 7,2 1 8,1 1 11,1 1 10,2 1 5,1 1 3,1 1 11,1, длина 8 7 + 4 9 = 92 бит; LZ78: 0,’A’ 1,’B’ 0,’C’ 0,’D’ 1,’A’ 3,’C’ 6,’D’ 0,’B’ 0,’B’, длина 9 12 = 108 бит; LZW: 0’A’0’A’0’B’0’C’0’D’ 256 0’C’ 262 259 0’B’0’B’, длина 11 9 = 99 бит. КИБЕРНЕТИКИ, LZ77: 0,0,’К’ 0,0,’И’, 0,0,’Б’ 0,0,’Е’ 0,0,’Р’ 0,0,’Н’ 9,1,’Т’ 5,1,’К’ 0,0,’И’, длина 9 15 = 135 бит; LZSS: 0’К’0’И’0’Б’0’Е’0’Р’0’Н’ 1 9,1 0’Т’1 5,1 1 5,2, длина 3 7 + 7 9 = 84 бит; LZ78: 0,’К’ 0,’И’ 0,’Б’ 0,’Е’ 0,’Р’ 0,’Н’ 4,’Т’ 2,’К’ 0,’И’, длина 9 12 = бит; LZW: 0’К’0’И’0’Б’0’Е’0’Р’0’Н’0’Е’0’Т’0’И’ 256, длина 10 9 = 90 бит. “СИНЯЯ СИНЕВА СИНИ”, LZ77: 0,0,’С’ 0,0,’И’ 0,0,’Н’ 0,0,’Я’ 11,1’ ’ 6,3,’Е’ 0,0,’В’ 0,0,’А’ 5,4,’И’, длина 9 15 = бит; LZSS: 0’С’0’И’0’Н’0’Я’1 11,1 0’ ’ 6,3 0’Е’0’В’0’А’1 5,4 1 10,1, длина 4 7 + 8 9 = 100 бит; LZ78: 0,’С’ 0,’И’ 0,’Н’ 0,’Я’ 4,’ ’ 1,’И’ 3,’Е’ 0,’В’ 0,’А’ 0,’ ’ 6,’Н’ 0,’И’, длина 12 12 = 144 бит;

LZW: 0’С’0’И’0’Н’0’Я’0’Я’0’ ’ 256 0’Н’0’Е’0’В’0’А’ 261 257 0’И’, длина 14 9 = 126 бит.

30. Нет. Это следует из очевидного неравенства для длин кодов log2(LD + 256) < log2(LD) + 8, где LD — это размер словаря.

31. Во всех случаях сообщение — AFXAFFXFXAXAFFA, длина кода LZ77 — 105 бит, LZSS — 62 бит, LZ78 — 108 бит, LZW — 99 бит.

32. 2000 бод.

33. 1) 8000/3 2666.67 сим/сек; 2) 2523 сим/сек; 3) 2000 сим/сек.

34. Пусть X — д. с. в., определяющая передатчик, а Y — д. с. в., определяющая приемник. Тогда P (Y = 00/X = 00) = pp, P (Y = 00/X = 01) = pq,..., P (Y = 00/X = 11) = qq,...

4 i 4 i 35. C14p9q5, C14p14-iqi, C14 = 1471.

i=0 i=36. 0.3%, 7.7%; 0.004%, 0.797%.

37. r = 6, 11 r 16.

38. r 2, r 9.

39. E1: 1. 00 00000, 01 01110, 10 10101, 11 11011;

2. min d = 3, Pнеобнаружения ошибки = 2p2q3 + pq4, код исправляет или обнаруживает все ошибки кратности соответственно до 1 или 2;

3. 00000 01110 10101 00001 01111 10100 00010 01100 10111 00100 01010 10001 01000 00110 11101 10000 11110 00101 00011 01101 10110 10010 11100 00111 01001;

4. Pправильной передачи = p5 + 5p4q + 2p3q2, код исправляет все ошибки кратности 1 и 2 из 10 ошибок кратности 2; 5. 10001 10, 01, 10101 10. E2: 1. 000 0000, 001 0010, 010 0101, 0111, 100 1001, 101 1011, 110 1100, 111 1110; 2. min d = 1, Pнеобнаружения ошибки = p3q + 3p2q2 + 3pq3, код не исправляет и не обнаруживает все ошибки никакой кратности;

3. 0000 0010 0101 0111 1001 1011 1100 0001 0011 0100 0110 1000 1010 1101 1111;

4. Pправильной передачи = p4+p3q, код исправляет 1 из 4 ошибок кратности 1; 5. 1001 100, 0110 011, 1101 110.

2 i 40. нет, т.к. C14 = 28.

i=41. 5510 = 001010101 0001001010111, 20010 100011001000, 1000001000001 000100101, 1100010111100 001011101.

42. 0100 01100010100, 10001101 110011101111001, 10001110110.

43. Первое — нет, второе — да.

44. g(x) = 1 + x + x2 + x4 + x5 + x8 + x10.

45. 1000, 1111.

46. ПТУРХЧЧЮНФЫ.

47. 22: A отправляет B 58, B возвращает 94, A окончательно отправляет 115; 17: B отправляет A 135, A возвращает 15, B окончательно отправляет 143.

48. 53, 51; 247.

49. для a = 33 = 237.

50. = 21, 124.

51. H1 A name=”2” /A Глава 2 /H1.

Pages:     | 1 |   ...   | 10 | 11 || 13 | 14 |



© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.