WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!

Pages:     || 2 |
-- [ Страница 1 ] --

Грушо А.А., Применко Э.А., Тимонина Е.Е.

Анализ и синтез криптоалгоритмов КУРС ЛЕКЦИЙ Москва 2000 2 Введение Курс лекций составлен в соответствии с программой одноименного курса, читаемого в течение ряда лет на факультете защиты информации в Российском государственном гуманитарном университете.

Защита информации опирается на набор механизмов и методов, кото рые, будучи разумно использованы, позволяют гарантировать невозмож ность атак противника на защищаемую информацию. Криптоалгоритмы являются существенной частью этого набора. Криптоалгоритмы – это ал горитмы преобразования данных, использующие “секрет”. Основной па раметр качества криптоалгоритма – устойчивость к попыткам противника открыть “секрет”. Такая устойчивость в криптографии называется стойко стью. Криптографическую стойкость надо обосновывать, так как в защите критической информации логика: “я не могу раскрыть “секрет”, следова тельно, никто не может” неприменима. Методы обоснования криптографи ческой стойкости основаны на накопленном опыте раскрытия “секретов” криптоалгоритмов. Этот опыт сформулирован в методах анализа шифров (один из классов криптоалгоритмов), т.е. в найденных методах и подходах в раскрытии “секретов”. Могут найтись гении, придумавшие новые методы анализа, тогда надо пересмотреть стойкость уже используемых криптоал горитмов или опереться на вновь найденные методы при синтезе новых криптоалгоритмов. Кроме стойкости криптоалгоритмы должны удовлетво рять ряду других требований, например, экономичности, скорости реали зации и т.п. Совокупность подходов, позволяющих удовлетворить задан ному набору требований, составляет теорию синтеза криптоалгоритмов.

Методы анализа и синтеза основаны на математике. В основном нужды анализа и синтеза криптоалгоритмов обслуживают дискретная математика, алгебра и теория вероятностей. Более того, криптография дала развитие многим направлениям математики. Изучение вопросов анализа и синтеза начнем с описания простейших шифров.

В соответствии с традицией современной криптографии курс лекций содержит описание наиболее известных универсальных методов криптоа нализа, методов анализа блочных и поточных шифров, методов анализа хэш-функций и алгоритмов с несимметричным ключом. По мере знакомст ва с методами анализа читателю предлагаются разделы, содержащие мето ды синтеза криптоалгоритмов.

Глава 1. Примеры шифров.

1.1. Определение шифра, простейшие примеры.

Пусть даны конечные множества Х, Y, К. Будем интерпретировать элементы Х как открытые сообщения, элементы Y как шифрованные тек сты, элементы К - как ключи.

Определение 1. Отображение Т: Х К Y называется шифром, - если для k К Т (у, k) = х.

Пример 1. Пусть А = { a1,...,a m } - конечный алфавит, S - множест m во всех подстановок на А. Для некоторого натурального n проложим n Х = A. Если х = ( ai1,...,ain ), k S, то определим шифр простой замены m следующим образом:

Т(х, k) = (k(аi1 ), k(ai2 ),..., k(ain )).

- Так как в группе S для каждого элемента k есть обратный k так, m - что k k = е - тождественная подстановка, то - Т (( k(аi1 ), k(ai2 ),..., k(ain )), k) = -1 -1 - = (k k(аi1 ), k k(ai2 ),..., k k(ain )) = ( ai1,...,ain ) = х.

Таким образом, мы доказали, что для n шифр простой замены дей ствительно удовлетворяет определению шифра.

Пример 2. Пусть А = { a1,...,a m } - конечный алфавит, n -натуральное, n S - симметричная группа подстановок на множестве {1,...,n}, Х = A. Если n 1 n х = ( ai1,...,ain ), k = S, то шифр перестановки на Х опреде j1 jn n ляется следующим образом:

Т(х, k) = ( ai j1, ai j2,..., ai jn ).

- Если k (j1,...,j ) - обратная к k подстановка в S, то n n - Т (( ai j1, ai j2,..., ai jn ), k) = ( ai1,...,ain ).

Тем самым также доказано, что шифр перестановки удовлетворяет определению шифра.

Пример 3. В отечественной криптографии следующий шифр Вернама [Ш., с.346] получил название гаммирование. Пусть А = {0,..., m-1} - алфа n вит, Х = A - множество открытых текстов. Рассмотрим кольцо вычетов n Z/m. Положим К= А и для х Х, k К определим преобразование у = Т(х, k) = х + k, где + - сложение по mod m, т.е. сложение в Z/m (соответственно обратная операция обозначается -). Введенное преобразование - шифр, т.к. для лю бого фиксированного k существует обратное отображение - Т (у, k) = у - k = х.

Традиционно для данного вида шифра ключ К обозначается греческой буквой, откуда в отечественной криптографии и появилось соответст вующее название. Так как гамму при больших n часто записывали в блок нот, то за рубежом используется термин блокнотный шифр (pad).

Пример 4. Американский стандарт шифрования, известный под на званием DES [Хоф., с.250]. Этот шифр реализует простую замену на алфа вите из всех двоичных векторов длины 64 бита. Выбор подстановки осу ществляется по ключу длиной 56 бит. Ключ преобразуется в 16 48-битовых комбинаций. Подстановки вычисляются для любого 64-битного вектора открытого текста путем реализации 16 циклов повторения одного преобра зования. На вход i-го преобразования поступают два 32-битных (левый Li-1, правый - Ri-1) вектора, полученных от предыдущего цикла или это входной вектор переставленный по перестановке IР, и разделенный попо лам на две 32-битных части (левую L и правую R ). Еще одним входом 0 для i-го цикла преобразования является 48-битная комбинация ключа. Ре зультатом i-го цикла преобразования является составленный из двух 32 битных частей (левой Li и правой Ri ) 64-битный вектор промежуточного шифртекста. Схема DES условно представлена на рисунке 1. На этой схе ме - побитовое сложение двух 32-битных векторов по модулю 2, IР - пе -1 - рестановка бит, IР - обратная к IР перестановка. Перестановки IР и IР представлены в таблице 1.

- IP IP 58 50 42 34 26 18 10 2 40 8 48 16 56 24 64 60 52 44 36 28 20 12 4 39 7 47 15 55 23 63 62 54 46 38 30 22 14 6 38 6 46 14 54 22 62 64 56 48 40 32 24 16 8 37 5 45 13 53 21 61 57 49 41 33 25 17 9 1 36 4 44 12 52 20 60 59 51 43 35 27 19 11 3 35 3 43 11 51 19 59 61 53 45 37 29 21 13 5 34 2 42 10 50 18 58 63 55 47 39 31 23 15 7 33 1 41 9 49 17 57 Таблица 1. Начальная и обратная перестановки DES.

Блок открытого текста 64 бит IP Начальная перестановка L R 0 K f • L1 R K f • L15 R K f • L16 R - IP Обратная перестановка Блок шифртекста 64 бит Рис. 1. Схема алгоритма DES.

Алгоритм вычисления функции f представлен на рисунке 2.

Ri-1 Ki Расширение E 86 бит S1 S S3 S S5 S S S8 Подстановка 2 4 6 84 бит P Перестановка f(Ri-1, Ki ) = P(S(E(Ri-1)Ki )) Рис. 2. Схема функции усложнения DES.

Е Р 32 1 2 3 4 5 16 7 20 4 5 6 7 8 9 29 12 28 8 9 10 11 12 13 1 15 23 12 13 14 15 16 17 5 18 31 16 17 18 19 20 21 2 8 24 20 21 22 23 24 25 32 27 3 24 25 26 27 28 29 19 13 30 28 29 30 31 32 1 22 11 4 Таблица 2. Функция расширения и перестановка в функции f усложне ния DES.

Схема Si бокса представлена на рисунке 3. S боксы DES приведены в таблице 3. Здесь контрольные биты CL и CR являются входами в таблицу по горизонтали, а 1 – 4 биты – входами в таблицу по горизонтали. Так, на пример, S1(1,0,1,1,1,0)= (1,0,1,1).

1 2 3 CL Si CR Рис. 3. Схема S-бокса DES. Здесь CL – левый контрольный бит, CR – правый контрольный бит.

S CL СR 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 0 14 4 13 1 2 15 11 8 3 10 6 12 5 9 0 0 0 15 7 4 14 2 13 1 10 6 12 11 9 5 3 1 4 1 14 8 13 6 2 11 15 12 9 7 3 10 5 1 15 12 8 2 4 9 1 7 5 11 3 14 10 0 6 S CL СR 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 0 15 1 8 14 6 11 3 4 9 7 2 13 12 0 5 0 3 13 4 7 15 2 8 14 12 0 1 10 6 9 11 1 0 14 7 11 10 4 13 1 5 8 12 6 9 3 2 1 13 8 10 1 3 15 4 2 11 6 7 12 0 5 14 S CL СR 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 0 10 0 9 14 6 3 15 5 1 13 12 7 11 4 2 0 13 7 0 9 3 4 6 10 2 8 5 14 12 11 15 1 13 6 4 9 8 15 3 0 11 1 2 12 5 10 14 1 1 10 13 0 6 9 8 7 4 15 14 3 11 5 2 S CL СR 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 0 7 13 14 3 0 6 9 10 1 2 8 5 11 12 4 0 13 8 11 5 6 15 0 3 4 7 2 12 1 10 14 1 10 6 9 0 12 11 7 13 15 1 3 14 5 2 8 1 3 15 0 6 10 1 13 8 9 4 5 11 12 7 2 S CL СR 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 0 2 12 4 1 7 10 11 6 8 5 3 15 13 0 14 0 14 11 2 12 4 7 13 1 5 0 15 10 3 9 8 1 4 2 1 11 10 13 7 8 15 9 12 5 6 3 0 1 11 8 12 7 1 14 2 13 6 15 0 9 10 4 5 S CL СR 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 0 12 1 10 15 9 2 6 8 0 13 3 4 14 7 5 0 10 12 4 2 7 12 9 5 6 1 13 14 0 11 3 1 9 14 15 5 2 8 12 3 7 0 4 10 1 13 11 1 4 3 2 12 9 5 15 10 11 14 1 7 6 0 8 S CL СR 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 0 4 11 2 14 15 0 8 13 3 12 9 7 5 10 6 0 13 0 11 7 4 9 1 10 14 3 5 12 2 15 8 1 1 4 11 13 12 3 7 14 10 15 6 8 0 5 9 1 6 11 13 8 1 4 10 7 9 5 0 15 14 2 3 S CL СR 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 0 13 2 8 4 6 15 11 1 10 9 3 14 5 0 12 0 1 15 13 8 10 3 7 4 12 5 6 11 0 14 9 1 7 11 4 1 9 12 14 2 0 6 10 13 15 3 5 1 2 1 14 7 4 10 8 13 15 12 9 0 3 5 6 Таблица 3. S боксы DES.

Ключи К1,..., К16 получаются из 64 бит ключа DES следующим обра зом. Определим vi, 1 i 16 следующим образом: vi =1 для i = {1, 2, 9, 16} и vi =2 для остальных i. Из 64 бит ключа выбираются 56 бит и делятся на две части С и D по 28 бит согласно РС1 в таблице 4. С и D записы 0 0 0 ваются в два циклических регистра сдвига влево. На каждом цикле оба ре гистра сдвигаются на vi, 1 i 16, бит, получая таким образом Сi и Di. В сумме получается сдвиг на 28 бит, что возвращает заполнения регистров в исходное положение. Ключ Кi, 1 i 16, получается из Сi и Di согласно РС2 в таблице 4.

РС Сi Di 57 49 41 33 25 17 9 63 55 47 39 31 23 1 58 50 42 34 26 18 7 62 54 46 38 30 10 2 59 51 43 35 27 14 6 61 53 45 37 19 11 3 60 52 44 36 21 13 5 28 20 12 РС 14 17 11 24 1 3 28 15 6 21 23 19 12 4 26 16 7 27 20 13 41 52 31 37 47 30 40 51 45 33 44 49 39 56 34 46 42 50 36 29 Таблица 4.

При любом данном k расшифрование DES отличается от зашифрова ния только тем, что регистры сдвигаются вправо в порядке, обратном за - шифрованию. Начинается расшифрование с перестановки бит IР, а за канчивается перестановкой IР. DES сыграл в США огромную роль при формировании системы электронных платежей. В настоящее время извест но более 65 официальных производителей реализаций DES в виде про граммного обеспечения или микросхем.

Пример 5. Отечественный стандарт шифрования ГОСТ 28147- [Schn. 96, c. 331]. Рассмотрим режим простой замены ГОСТ 28147-89.Этот режим является основным и на его основе реализуются другие режимы шифрования.

Исходный открытый текст М (бинарная последовательность) разбива ется на блоки длиной 64 бит:

М = М1 М2... Мt, | Mi | = 64.

Длина ключа К равна 256 битам. Ключ К разбивается на блоки длиной бит:

К = Р1 Р2... Р8, | Рi | = 32, i = 1,…,8.

При шифровании используется ключевая последовательность:

(К1,К2,...,К31,К32)=(Р1,Р2,...,Р8, Р1,Р2,...,Р8, Р1,Р2,...,Р8, Р8,Р7,...,Р1), а при расшифровании используется ключевая последовательность:

(К1,К2,...,К31,К32)=(Р1,...,Р7,Р8, Р8,Р7,...,Р1, Р8,Р7,...,Р1, Р8,Р7,...,Р1), Таким образом, Кi = Кn+1- i, i = 1,2,...,n;

n = 32.

Функция сдвига R определяется следующим образом:

R(1 2... 32 )= 12 13... 32 1 2... 11.

Обозначим через + сложение по модулю 232;

- побитное сложение (ис ключающее ИЛИ);

+ - сложение по модулю 232-1.

Блок подстановки реализует функцию:

f S ( w ), | w | = 32.

Функция f S ( w ) - это подстановка на множестве { 0, 1 }32. Параметр S является сменным и определяет долговременные ключи криптосистемы ГОСТ 28147-89. Подстановка S задается в виде последовательности S = (1, 2,...,8), где i - подстановка на множестве = { 0, 1, 2,..., 9, A, B, C, D, E, F } (множество всех цифр 16-ричной системы счисления). Ка ждый элемент из естественным образом отождествляем с соответст вующим четырехразрядным двоичным числом (последовательностью из четырех бит). Из определения S следует, что число различных выборов этого параметра равно (16)!8. Значение функции f S ( w ) вычисляется сле дующим образом. Если w = v1 v2... v8, | vi | = 4, то f S ( w ) = 1(v1) 2(v2)... 8(v8).

Процедура зашифрования выглядит следующим образом. Пусть М = 1 2... 64 - блок открытого текста. Введем обозначения:

а0 = 32 31... 1, b0 = 64 63... 33.

Тогда, процедура зашифрования блока М при помощи криптоалгоритма ГОСТ 28147 - 89 описывается следующим рекурсивными уравнениями:

xi=ai-1 + ki, yi = f S ( xi ), zi = R ( yi ), (1) ai = Zi b i-1, bi = ai-1, i = 1,…,n-1;

n=32.

xn = an-1 + kn, yn = fs ( xn ), zn = R ( yn ), (2) an = an-1, bn = zn bn-1.

Если an = 1,2,...32, bn = 1,2,...32 и Т - блок шифрованного текста, соответствующий блоку открытого текста М, то Т = ГОСТК(М) = 32...1 32...1.

Убедимся, что ГОСТК| (Т) = М, где Т = ГОСТК (М) = 32...1 32...1, an = 1...32, bn = 1...32, K| = Kn Kn-1... K1, т.е. Ki| = Kn+1-i, i = 1,…,n.

Из сказанного выше следует, что а0 = an, b0 = bn.

И при i = 1, из системы (1) получим:

x1 = a0 + k1 = an + kn.

Поскольку, согласно (2), ап = ап-1, то x1 = an-1 + kn = xn.

Поэтому, учитывая (1) и (2) будем иметь:

у1 = f S ( x1) = f S ( xn ) = yn, z1 = R ( y1) = R ( yn ) = zn, a1 = z1 b0 = zn bn = zn ( zn bn-1 ) = bn-1, b1 = a0 = an = a.

n- Допустим, что мы уже установили справедливость соотношений ai-1 = b, bi-1 = a, (3) n-i+1 n-i+ при всех k i-1, i 2. Докажем их справедливость для k = i. Согласно ал горитму зашифрования и индуктивному предположению (3), из (1) следует, что xi = a'i-1+ k'i = b + k = an+ i + kn+1- i = xn+1- i.

n+1-i n+1-i Следовательно, yi = f S ( x ) = y, n+1-i n+1-i z'i = R( y ) = z, n+1-i n+1-i ' a' = z'i bi-1 = zn+1-i an+1-i = zn+1-i (zn+1-i bn-i ) = bn-i, i ' bi = a' = bn+1-i = an-i.

i- Таким образом, для любого i = 1,…,n.

a'i = b, b'i = a.

n-i n-i ' В частности, a' = b1, bn-1 = a1.Поэтому из (1) и (2) будем иметь:

n- ' x' = a' + kn = b1 + k1 = a0 + k1 = x1, n n- y' = fs' (x1) = y1;

z' = R( y1) = z1, n n a' = a' = b1, n n- ' ' bn = z' bn-1 = z1 a1 z1 (z1 b0 ) = b0.

n Следовательно, Т’ = ГОСТК(Т) = М и взаимная однозначность криптогра фического преобразования ГОСТ 28147-89 установлена.

1.2. Стойкость шифров.

Данное в предыдущем параграфе определение шифра не разграничи вает хорошие и плохие шифры. Однако главная цель шифра - надежная защита скрываемой информации. Поэтому качество шифра оценивается прежде всего понятием надежности защиты. В криптографии принят тер мин “стойкость” шифра. Под этим понимается устойчивость защиты перед атаками противника, получившего какие-либо сведения, связанные с шиф ром или информацией, закрываемой с помощью шифра, или просто сам шифртекст.

Рассмотрим подробнее ситуацию, в которой ведется криптоанализ. В - определение шифра входят следующие параметры Т, х, у, k, Т. Защищае мая информация описывается параметром х. Сама идея криптоанализа ос нована на том, что противник перехватил и имеет на руках у. Классифици руем основные условия криптоанализа.

1. Известны только один или несколько шифртекстов у. В этих усло виях решают следующие задачи:

• найти Т (определение типа шифра) - • найти Т, Т, х (дешифрование по шифртексту).

2. Известны одна или несколько пар (х, у). В этих условиях надо опре - делить вид шифра Т (Т ) и найти k. Это редкая ситуация.

- 3. Известны вид шифра Т (Т ), один или несколько шифртекстов у.

Найти:

• х (бесключевое чтение);

• k, х (дешифрование по шифртексту при известной шифрсистеме).

- 4. Известны: вид шифра Т, Т, одна или несколько пар (х, у). Найти k.

Это типичные условия криптоанализа. Стойкость шифров оценивается именно в этих условиях. Иногда отдельно возникают ситуации, когда из вестно много пар (х, у) так, что можно подобрать х или у, удовлетворяю щие некоторым дополнительным условиям. Тогда говорят об атаке с ис пользованием выбранного открытого или шифрованного текстов.

- 5. Известны Т, Т, шифртекст у или пары (х, у), некоторая форма - преобразования Т(., k), но неизвестны k и Т (., k). Допустимость таких постановок задач рассматривалась Диффи и Хеллманом в 1976 г. Системы шифрования, где допускается возможность знания Т(., k) без раскрытия k - и Т получили название систем с открытым ключом.

Разрешимость для противника указанных задач определяет стойкость шифра в соответствующих условиях, а методы решения этих задач назы ваются методами криптоанализа. Универсальные методы криптоанализа - это такие методы, которые с определенными вариациями применимы ко многим шифрам.

В криптографии разработаны два базовых подхода в оценке стойкости шифров. Основы первого подхода (совершенная секретность) К. Шеннон изложил в своей работе [Ш., с.360] в 1948 г. Рассмотрим этот подход. К.

Шеннон предложил следующую модель обращения с параметрами, описы вающую шифрование и действия противника. Пусть Х = {х1,..., х }, Y = {y1,...,y } - множества открытых сообщений и воз n m можных шифртекстов. Открытый текст для передачи в шифрованном виде выбирается случайно в соответствии с распределением n {Р(х1),...,Р(х ), Р(xi ) 0, P(xi ) = 1}. Тогда при решении задачи вскры n i= тия x по известному у противник может вычислить апостериорные веро i j ятности сообщений, которые могли быть посланы Р( х у ), s=1,...n. Если s j задача дешифрования решена и открытый текст найден, то апостериорное распределение вырождено:

Р( хi у ) = 1, Р( х у ) = 0 при s i.

j s j Таким образом в апостериорных вероятностях {Р( ху), x X} отра жаются даже частичные сведения об открытом тексте, полученном при пе рехвате криптограммы. Шеннон определил совершенную секретность (стойкость) шифра условием: апостериорные распределения на открытых текстах при любом уY совпадают с априорным распределением на Х, т.е.

Р( ху) = Р(х) для любых x X, у Y.

r r r Пример 1. Пусть Х = {0, 1}, Y = {0, 1}, K = {0, 1}, r - натуральное и - T(x, k) = (x k)(mod 2), T (y, k) = (y k)(mod 2), т.е. рассматривается гаммирование в двоичном алфавите. Пусть также (Р (x), x X) - произвольное распределение вероятностей на Х. Предпо X ложим, что k выбирается случайно и равновероятно из К, то есть к К, Р (k) =. Иными словами, знаки гаммы выбираются из множества K 2r {0, 1} независимо друг от друга и от открытого текста с равными вероят ностями Р(0) = Р(1) =. Тогда для любого у Y Р(у) = P( x, k) = PX ( x ) P(k x ) = xX kK xX y=( xk )(mod 2 ) kK y=( xk )(mod 2 ) 1 = PX ( x ) =, 2r 2r xX P( x, y) PX ( x )PK (( x k )(mod 2 )) = P(yx) = =.

P(x) PX ( x ) 2r По формуле Байеса PX ( x )P( y x ) PX ( x ) P(ху) = = = PX ( x ).

P( y ) 2r 2r Следовательно, гаммирование при помощи последовательности, по лученной при помощи реализации независимых равновероятных случай ных векторов, является совершенным шифром.

Подход Шеннона превратил криптографию из искусства в науку, т.к.

появилась возможность доказывать защищенность информации при помо щи шифра. Однако реализовать последовательность независимых и равно вероятных случайных величин оказалось делом сложным. Кроме того, объ ем ключа в совершенном шифре совпадает с объемом сообщения, что за трудняет выполнение условия секретности ключа.

Следующим шагом в теоретическом подходе к оценке стойкости шифров послужила оценка числа открытых текстов, которые мы можем получить, применяя все возможные способы преобразования имеющихся шифр текстов при неизвестном заранее ключе. Смысл этого подхода пояс ним на примере, не связанном с криптографией.

Пример 2. Пусть мы играем в игру: надо угадать слово по имеющим ся в порядке их следования некоторым буквам этого слова. Предположим, что дана буква “п”. Если нет каких-либо ограничений на возможное слово, позволяющее однозначно назвать допустимое слово по одной известной из него букве, то существует много слов, имеющих букву “п”, и мы не можем даже приблизительно указать слово, которое нам предложили угадать. То есть мы не получаем достаточно информации, спрятанной за этим словом.

В аналогичных условиях мы не можем восстановить слово, даже зная не сколько букв. Например, нам известно, что первыми тремя буквами слова являются буквы “при”. Без дополнительных ограничений мы можем ука зать множество различных по смыслу слов, имеющих приставку “при”.

Поэтому это буквосочетание почти ничто не дает к пониманию смысла не известного слова.

Аналогично, если при дешифровании уравнение Т(х, k) = у имеет мно го решений х, а ключ может принимать любые допустимые значения, то возможно много осмысленных текстов х, удовлетворяющих имеющимся в нашем распоряжении ограничениям и имеющих примерно одинаковую ве роятность их появления в качестве открытых текстов. Тогда нет алгоритма, решающего задачу дешифрования (в смысле однозначного нахождения от крытого текста и ключа). Наоборот, во многих моделях шифров можно до казать, что такое решение единственно.

Другой подход к определению стойкости берет начало в той же работе Шеннона [Ш., с.387] и называется практической стойкостью или сложно стный подход к стойкости. Традиционно рассматриваются ситуации 3.б или 4. Рассмотрим выражение Т(х, k) = у как уравнение относительно х и k.

Тогда решение этого уравнения предполагает существование алгоритма, для которого в математике определено понятие сложности [Гэ.]. Слож ность характеризуется двумя параметрами: число операций для вычисле ния результата (трудоемкость алгоритма) и объем необходимой памяти.

Число операций при данном уровне развития вычислительной техники свя зано со временем работы алгоритма, поэтому стойкость можно выразить в терминах времени работы алгоритма дешифрования. Естественное требо вание надежности шифра - высокая сложность всех возможных алгоритмов дешифрования.

Замечание 1. Возможно повышать сложность алгоритмов дешифро вания, повышая сложность преобразования Т(х, к) = у. Однако, если слож - ность вычисления Т(х, k) и Т (у, k) при известном k будут велики, то прак тически такой шифр трудно использовать. Поэтому наряду с требованием сложности решения уравнения Т(х, k) = у при неизвестном k, привлекают - естественное требование простоты вычисления Т(х, k) и Т (у, k) при из вестном k.

Замечание 2. Требование высокой сложности при всех возможных ал горитмах дешифрования неконструктивно, т.к. опирается на потенциаль ную возможность перечисления всех возможных алгоритмов дешифрова ния. Практически [Ru.] это требование заменяется на реализуемое условие высокой трудоемкости при всех известных создателям шифра методах де шифрования. Большинство универсальных методов опубликовано в лите ратуре и мы будем рассматривать задачу синтеза шифров, стойких относи тельно универсальных методов.

Глава 2. Универсальные методы криптоанализа.

По умолчанию, если не оговаривается противное, будем считать, что задача дешифрования решается в условиях 4 предыдущего параграфа, ко - гда известна одна или несколько пар (х, у) и известны Т и Т, а неизвестен только ключ.

Несмотря на название, не все универсальные методы всегда примени мы. Так как некоторые из них значительно снижают стойкость шифра, то создатели стараются делать так, чтобы универсальные методы были к их шифрам неприменимы. Вместе с тем, все множества Х, Y, К конечны. По этому потенциально можно перебрать все их элементы и найти все реше ния уравнения Т(х, k) = у. Следовательно, множество методов, применимых к данной шифрсистеме, непусто.

2.1. Метод полного перебора.

Рассмотрим уравнение относительно k К при известной паре (х, у), х Х, у Y:

Т(х, k ) = у. (1) Пусть для простоты для пары (х, у) существует единственное k, удовлетворяющее (1). Упорядочим множество К в соответствии с задан ным порядком и будем последовательно проверять ключи из К на предмет равенства в уравнении (1). Если считать проверку одного варианта ключа k К в уравнении (1) за одну операцию, то полный перебор ключей потре бует К операций, где знаком обозначается число элементов в множе стве. Пусть ключ в схеме шифрования выбирается случайно и равноверо ятно из множества К. Тогда с вероятностью трудоемкость метода пол K ного перебора равна 1. Это происходит в том случае, когда случайно вы бран ключ, расположенный в нашем порядке на первом месте. Поэтому естественно в качестве оценки трудоемкости метода взять математическое ожидание (среднее) число шагов в переборе до попадания на использован ный ключ. Найдем среднее число шагов в методе полного перебора, когда порядок фиксирован, а выбор ключа случаен и равновероятен.

Пусть случайная величина - число опробований включительно до момента обнаружения использованного ключа. При i = 1,...,К случайные величины = 1, если использованный ключ находится в порядке на месте i i и = 0 в противном случае. Тогда i K Е = i P( = 1). (2) i i= Если считать, что все ключи расположены в установленном порядке, то процедуру равновероятного выбора ключа можно представлять как рав новероятный выбор числа i в последовательности натуральных чисел 1,...,К. Тогда P( = 1) = для любого i = 1,...,К. Подставляя полу i K ченные значения в (2) получим K K ( K +1) Е = i =.

K K i= K При больших К можно приблизительно считать Е.

Пример 1. В DES 56-битный ключ. Значит К= 256 1017. Средняя трудоемкость полного перебора 255 0,51017.

Алгоритмы полного перебора допускают распараллеливание, что по зволяет значительно ускорить нахождение ключа. Можно предложить два направления в организации параллельного вычисления ключа [Ама.].

Во-первых, построение конвейера. Пусть алгоритм проверки равенст ва Т(х, к) = у представим в виде детерминированной цепочки простейших действий (операций) О1, О,..., О.

2 N Возьмем N процессоров А1,..., А, зададим их порядок и положим, N что i-ый процессор выполняет три одинаковые по времени операции:

1) прием данных от (i-1)-го процессора;

2) выполнение операции Оi ;

3) передача данных следующему (i+1)-му процессору. Тогда конвейер из N последовательно соединенных, параллельно и синхронно работающих процессоров работает со скоростью v/3, где v- скорость выполнения одной операции процессором. Если мы со скоростью v/3 подаем на вход ключи k К, то с такой же скоростью будем получать результат на выходе. По стоянная для процессора задержка N тактов между моментом входа ключа k и ответом, является ли ключ k решением (1), мала по сравнению с К.

Поэтому рассмотренный конвейер подтверждает допустимость предполо жения о том, что сложный алгоритм вычисления Т(х, к) и сравнение с у, можно считать элементарной операцией (на самом деле, в нашем примере требуется 3 элементарные операции независимо от сложности алгоритма проверки ключа при К>>N).

Второе направление распараллеливания состоит в том, что множество натуральных чисел 1,2,...,К разбивается на непересекающиеся подмно жества В1,..., В. В каждом из них может быть свой порядок. Система из R R машин перебирает ключи так, что i-ая машина осуществляет перебор клю чей из множества Вi, i = 1,...,R. Система прекращает работу, если одна из машин нашла ключ.

- Пример 2. Если одна машина опробует один ключ за 10 сек, то для того, чтобы найти ключ DES полным перебором за 24 часа на R-машинной системе при В1 =.... = В надо, чтобы R 1017 = = 5,787 105 машин.

R= 2 864 108 2 Если нас устраивает срок 100 суток, то таких машин надо всего 5787.

В последнее время широкое распространение получили глобальные сети ЭВМ. Можно сделать вирус, который выполняет следующую задачу:

опробует ключи в свободное время процессора, начиная с некоторого но мера;

в случае положительного решения передает ответ и самоуничтожает ся, а также распространяет вирус, который всем другим работающим над опробованием вирусам приказывает самоуничтожиться.

Аналогичная идея распараллеливания предложена в “китайской лоте рее” [Schn. 96]. В каждый телевизор или радиоприемник на внутреннем рынке Китая, вмонтирован чип, который принимает открытый и шифро ванный текст и начинает опробование заданного участка ключей DES. Ес ли ключ найден, то аппарат дает сигнал, а его владелец должен сообщить о сигнале в правительственный орган, там его ждет приз. Если правительст ву нужен очередной ключ, то передается в широковещательной передаче открытый и шифрованные тексты, по которым включаются чипы в телеви зорах и радиоприемниках. По данным [Schn. 96] на 1995 год “китайская лотерея” при использовании чипа в 1 млн. операций в сек. могла позволить вскрыть ключ DES в Китае за 280 сек, в США - за 97 сек.

Самой большой сложностью в изложенном подходе является органи зация деления ключевого множества. Однако можно сделать старт с любо го числа и случайно выбранного ключа. Время опробования увеличится, но схема значительно упростится. Рассмотрим задачу о среднем времени оп робования N процессорами (машинами) ключей из множества К при старте каждого процессора со случайной точки при каждом очередном опробова нии. Пусть все машины проработали шагов. Тогда сделано N опробо ваний. Рассмотренная задача имеет аналог в задаче распределения частиц в классической задаче о размещениях [Кол. 76]. Предположим, что все ма шины работают синхронно. Обозначим число тактов опробования до пер вого обнаружения ключа через.

Если частицы бросаются порциями по N штук (т.е. машины работают синхронно), то вероятность того, что из комплекта с номером i ни одна частица не попадет в данную ячейку равна q= (1- )N.

K Тогда вероятность того, что произойдет первое попадание в данную ячейку на комплекте с номером t, равна 1 P( = t) = qt-1(1- q) = (1- (1- )N )t-1 (1- )N.

K K Среднее геометрического распределения равно 1 Е = =.

1- q 1- (1- )N K Так как N << К, то K =.

Е N N 1-1+ K Пример 2. При случайном старте каждого чипа при полном опробо - вании и при времени одного опробования на одном чипе 10 сек для оп ределения ключа за 100 суток потребуется N = 11574 машин.

То есть случайный старт в два раза увеличивает необходимое количе ство процессоров при одном и том же времени ожидания результата.

2.2. Аналитический метод.

Пусть множество ключей К представимо в виде прямого произведения множеств К = К1 К... К.

2 r Например, множество ключей DES К = {0, 1}. Пусть дешифровщик получил открытое сообщение х=х1х...х и шифрсообщение у= y1у...у, 2 s 2 s где для простоты считаем, что х и у слова длины s в одном алфавите А, т.е.

хi, уi А. Тогда можно составить систему уравнений шифрования, выпи санную для Т в каком-либо базисе операций:

у1 = f1 (x1,...x, k1,....,k ) s r............................ (1) у = f (x1,...x, k1,....k ) s s s r В этих уравнениях при известных f, х, у остаются неизвестными толь ко k1,....,k.

r Отметим, что К= К1К...К и полный перебор требует 2 r K опробований.

Анализ получившейся системы (1) может подсказать более быстрые способы ее решения, чем полный перебор.

Пример 1. Пусть система (1) может быть преобразована к виду:

g1 (x, y) = h1 (x, y, k1) g (x, y) = h (x, y, k1, k ) (2) 2 2....................................

g (x, y) = h (x, y, k,..., k ).

1, k r r 2 r Тогда [Ш., стр. 397], опробуя К1 вариантов часть ключа k1 К1 и используя для проверки правильности первое уравнение в (2), мы можем восстановить k1. Подставив полученное значение во второе уравнение мы используем его для проверки правильности варианта для k К, затратив 2 при этом не более К операций опробования. Найдя k, мы подставим 2 его в третье уравнение и т.д. В результате весь ключ k = (k1, k,..., k ) мы 2 r получим, проведя не более, чем К1+К +...+К опробований. Это 2 r число, как правило, значительно меньше, чем K = (К1К...К ). Например, при К1=К, r=2, трудо 2 r 2 емкость метода ~ 2 K. В этом случае для 56-битного ключа вместо 1 56 2 1017 достаточно выполнить 22 < 109 операций.

2 Пример2. Значительное упрощение задачи дешифрования мы полу чаем, когда в системе (1) мы каким-либо образом можем выделить линей ную подсистему уравнений. В этом случае можно применить известные методы решения систем линейных уравнений, которые по трудоемкости и памяти значительно меньше переборных методов. В самом деле, пусть в (1) выделена подсистема r g (x, y) = bij k, i = 1,...,t.

i j j = Применим для ее решения метод Гаусса и найдем трудоемкость для случая, когда g ( ) {0, 1} и линейная система рассматривается над GF(2).

i Если система линейных уравнений с r неизвестными совместна и имеет вид r bij k = сi, i=1,...,r, j j = то ее решение методом Гаусса предполагает на первом этапе выделение строк с bi1 = 1 не более r операций, вычитание из первой строки с bi1 = остальных строк с bm1= 1 не более (r+1)(r-1) операций. Итого получаем оценку r операций на первом этапе. На втором этапе делаем то же самое с подсистемой r ( b k = сi1).

ij j j= Оценка трудоемкости здесь (r-1) операций. Продолжая этот алго ритм, в результате получим трудоемкость метода r r(r +1)(2r +1) r.

k 2 = 6 k= Таким образом, нахождение 64-битного ключа методом полного пере бора составило бы 2 1019 операций, а, если задача сведена к решению линейной системы уравнений, то трудоемкость не превосходит 8,7104 операций.

Пример 3. В книге Гилла [Гилл] линейные рекуррентные последова тельности над GF(2) рекомендуются в качестве хорошего шифра. Линейная рекуррента описывается законом t- =, n= 0, 1,..., (3) i n+i n+t i= где сложение и умножение осуществляется в GF(2).

Иногда говорят, что такие рекуррентные последовательности порож даются линейными регистрами сдвига (регистром сдвига с линейной об ратной связью). Последовательность {, s = 0, 1,...} может использоваться s в шифре гаммирования по mod2, ключом является начальное заполнение регистра сдвига (,1,...,t-1) = (0). Нетрудно видеть, что существует мат рица А такая, что любой вектор последовательных t значений рекурренты равен степени матрицы А, умноженной на (0). Если закон рекурренты из вестен, то задача определения ключа сводится к решению системы линей ных уравнений размера tt и поэтому данный шифр нестойкий.

Если линейная рекуррента неизвестна, то при известной получаем линейную систему относительно коэффициентов i, решив ее, можем уз нать ключ (0) [Mey.].

Пример 4. Пусть двоичная гамма в шифре гаммирования по mod получена при помощи нелинейной рекурренты (при помощи регистра сдвига с нелинейной обратной связью или просто нелинейного регистра сдвига) = f(,,..., ), n = 0, 1,... (4) n+t n n+1 n+t- Пусть f такова, что при любом начальном заполнении регистра после довательность периодична, тогда порождающий ее нелинейный регистр сдвига называется регулярным. Тогда оказывается, что для любого началь ного заполнения существует линейная рекуррента вида (3) размера v (v t) такая, что порождаемая ею последовательность совпадает с последова тельностью, порождаемой при этом начальном заполнении регистром сдвига с нелинейной обратной связью.

Доказательство существования линейной рекурренты очевидно, так как, если последовательность,1,...,T, T +1,... периодична с периодом Т, то линейный регистр сдвига вида =, n = 0, 1,..., порождает ту же n+T n последовательность, что (4).

Определение 1. Длина минимального линейного регистра сдвига, по рождающего данную периодическую последовательность (регулярного не линейного регистра сдвига), называется линейной сложностью регулярно го нелинейного регистра сдвига.

Если гамма для шифра гаммирования порождается регулярным нели нейным регистром сдвига с линейной сложностью Т, и ключом является начальное заполнение регистра, то из существования линейного регистра сдвига длины Т, порождающего данную гамму, следует, что нахождение ключа сводится к линейной системе размера Т. Откуда сложность дешиф T рования не превосходит. Однако построение эквивалентного мини мального линейного регистра сдвига по последовательности гаммы, не является простой задачей. Вместе с тем, чем меньше линейная сложность, тем проще задача дешифрования. Для полноты картины необходимо найти конструктивные условия регулярности нелинейного регистра сдвига. До кажем следующую теорему.

Теорема 1. Нелинейный регистр сдвига (4) над GF(2) регулярен тогда и только тогда, когда f(,,..., ) = + g(,..., ). (5) n n+1 n+t-1 n n+1 n+t- Д о к а з а т е л ь с т в о. Если f имеет структуру (5), тогда для любой цепочки х,....., хt f(0, х,....., хt ) =1 + f(1, х,....., хt ). (6) 2 Обратно, если при всех х,....., хt выполняется (6), то имеет место представление (5). В самом деле, обозначив через g(x,....., хt ) = = f(0, х,....., хt ), получим (5). Всегда из (6) следует, что t f(х1, х,....., хt ) = х1 f(1, х,....., х ) + (1 + х1) f(0, х,....., х ) = 2 t t = х1 (f(0, х,....., хt ) + f(1, х,....., хt )) + f(0, х,....., х ) = 2 2 = х1 + f(0, х,....., хt ).

Рекуррента определяет отображение множества t-мерных векторов в себя F: (х1,..., хt ) (х,....., хt, f(х1,..., хt )).

Рекуррента регулярна тогда и только тогда, когда F – взаимно-однозначное соответствие. Если верно (5) и существуют два вектора, переходящие при F в один, то они могут отличаться только в х1 и f(0, х,....., хt ) = f(1, х,....., хt), 2 что противоречит (6). Обратно, при регулярности (4) имеем взаимно однозначное отображение F, то есть для любых (х,....., хt ) вектора (х,.....,хt, f(0, х,.....,х )) (х,....., хt, f(1, х,....., хt )).

2 2 t 2 Следовательно, f(0, х,....., хt ) = 1 + f(1, х,....., хt ), 2 что и требовалось доказать.

2.3. Метод “встреча по середине”.

Рассмотрим каскадный метод построения сложного шифра из исход ных простых. Даны два шифра Т1(х, k1) и Т2 (z, k2). Шифртекст y получа ется из открытого текста х композицией отображений Т1 и Т, то есть y = Т ( Т1(х, k1), k ).

2 Ключ шифра - вектор k = (k1, k ), где k1 K1, k K, K = K1K.

2 2 2 Разумеется, в Т1 и Т согласованы области определения и значений при любых k1 K1 и k K и расшифрование происходит применением сле 2 дующего преобразования:

- х = Т1 -1 ( Т (y, k ), k1).

2 K1 K Трудоемкость полного перебора равна. Вместе с тем можно сократить перебор, увеличив используемую память [Men., c.235]. Пусть для известной пары (х, y) ключ (k1, k ) определяется единственным обра ( зом. Для всех k1i) K1, i = 1,..., K1, построим таблицу ( z 1 = Т1(х, k11) )......................... (1) z = Т1(х, k1K1 ).

K Вычисление таблицы (1) потребует K1 операций опробования. По строим следующую таблицу для всех k( j) K, j=1,| K2 |.

-1 (1) z1 = Т (y, k ) 2......................... (2) ( K2 ) - z|K2| = Т (y, k ).

Вычисление (2) потребует K операций опробования. Объединим таблицы (1) и (2) и проведем их упорядочение в соответствии с некоторым порядком на множестве значений промежуточных шифртекстов z. Извест но [Pe.], что сложность упорядочения таблицы размера (K1+K ) оценивается величиной (K1+K )ln(K1+K ). Пара zi = z при 2 2 j ( некоторых (i, j) определяет использованный ключ (k1i), k( j) ). Для ее нахо ждения достаточно просмотреть таблицу. Число операций, которые мы за тратили (K1+K )+(K1+K ) ln(K1+K ). Если |K| = N и 2 2 K1=K, то метод “встреча по середине” дает оценку N lnN, что зна чительно меньше N при N. Такой метод требует памяти размера 2N.

Пример 1. Двойной DES. Пусть для повышения стойкости использу ется повторное шифрование алгоритмом DES на разных ключах K1и K.

x DES DES y K1 K Тогда метод “встреча посередине” дает оценку трудоемкости 256 ln 2112 1001017 = 1019, что значительно меньше полного перебора ( 1034 ). Однако требуемая память 1017 является значительной.

Пример 2. Рассмотрим следующий шифр, допускающий быструю реализацию на ЭВМ. Для произвольного целого неотрицательного числа n обозначим - двоичное представление n, l - длина двоичного пред ставления n, [n] - разбиение двоичного числа n на байты (дописав слева ну ли, если необходимо). Для вектора целых неотрицательных чисел n = (n1, n,..., n ) положим = (,< n >,..., ), 2 s 2 s [n ]= ([n1], [ n ],...,[ n ]).

2 s Рассмотрим симметричную группу подстановок S и для любого g S будем отождествлять записи:

...m...... < m >......[m]...

g = =...i...... < im >... = ]..., m = 0,...,255.

...[i m m Пусть дана таблица подстановок из S : g,..., g, где М= 1024.

256 0 M - Эта таблица записана в памяти так, что для i = 0,...,M-1, подстановка gi имеет адрес длины l = 10. Тогда адреса = (k1,..., k ) 8 подстано вок задаются двоичным вектором < >= (,..., ), l<> = 80. С дру гой стороны [] = ([r1],...,[r ]) - вектор из 10 байт. Пусть открытый текст х представим в виде последовательности байт х = (х1,..., хl ). В качестве шифра рассмотрим простую замену байт открытого текста по подстановке g S, полученной по правилу:

g = g...g, k1 k где = (,..., ) - 80-битный ключ шифрования, который выби рается случайно и равновероятно, ki = 0,....M-1, l = 10, g взято из k i таблицы. Пусть даны открытый текст х и шифртекст у. Рассмотрим атаку “встреча по середине” при условии, что таблица подстановок известна про тивнику. Разобьем ключ на две 40-битных половины и будем опробовать каждую из них, строя две таблицы:

(k1k2k3k4) z = g gk2 gk3 gk4 (x);

k1, k2, k3, k4 = 0,...,M-1, k - -1 -1 - ~(k k6k7k8) = gk81gk7 gk6 gk5 (y);

k5, k6, k7, k8 = 0,...,M-1.

z Эти вычисления потребуют 2(1024) = 241 2 1012 операций опробо вания и памяти 241 l байт.

Проведем единое упорядочивание двух таблиц и выбор пар одинако вых последовательностей z. Сложность упорядочивания оценивается сле дующим образом 241 l ln(241l) 41 241 l ln 2 8 l операций.

2.4. Метод “разделяй и побеждай”.

Пусть по-прежнему даны множества X открытых текстов, Y - шифро ванных текстов, K - ключей, и шифр T: X K Y..

Предположим, что множество ключей K допускает представление K = K1 K2. То есть каждый ключ k K может быть записан в виде век тора k = (k1,k2), где k1 K1, k2 K2.

Предположим дополнительно, что существует критерий h, позво ляющий при известных х и y проверять правильность компоненты k1 в ключе k = (k1,k2). То есть для любого k2 функция h(x,y,k1) = 1, если k2 K2 такой, что T(x,(k1,k2))= y, и h(x,y,k1) = 0, если k2 K T(x,(k1,k2)) y.

Если известные открытый и шифрованный тексты достаточно длин ные, то достаточно часто существует единственный ключ k такой, что T(x, k) = y, поэтому сделанное предположение допустимо. Тогда метод “разделяй и побеждай” предлагает опробовать сначала элементы множест ва K1, отбраковывая варианты k1 по критерию h. Отсюда мы определим k - первую компоненту вектора k = (k1,k2). Затем, используя уравнение T(x,(k1,k2))= y относительно неизвестного параметра k2 K2, опробуем варианты k2. Трудоемкость определения компоненты k1 равна в среднем K операций опробования, соответственно трудоемкость определения k K равна в среднем операций опробования. Тогда в среднем трудоем K1 K2 K1 K кость метода равна + против при методе полного пере 2 2 бора.

Данный метод является обобщением изложенного в п. 2.2 аналитиче ского метода подбора системы уравнений, зависящих от части ключей.

Основная проблема при применении метода “разделяй и побеждай” [Gol. 95] состоит в нахождении критерия h, который зависит от конкретно го преобразования T или вообще может не существовать. Иногда критерий h может описываться вероятностно-статистической моделью. Мы рассмот рим такой пример в разделе “Статистические методы анализа”.

Пример. Рассмотрим вариант двойного DES. Пусть используются два ключа DES k1 и k2. Открытый текст x разбивается на последователь ность 64-битных блоков x = x1,x2,K, x2N, а последовательность 64-битных блоков шифрованного текста y = y1,y2,K, y2N получается поочередным применением алгоритма DES с ключами k1 и k2 к блокам открытого тек ста, сложенным с предыдущим блоком шифртекста. Схема шифрования приведена на следующем рисунке.

x x x 2 3 2N x DES, K DES, K DES, K DES, K 1 2 1 y y y y 1 3 2N- y 2N Пусть известны открытый и шифрованный тексты x, y и N доста точно велико. Для применения метода “разделяй и побеждай” выделим четные и нечетные пары блоков в (x,y): A ={(x2k +1,y2k +1),k = 0,N -1} и B = {(x2k,y2k ),k = 1,...,N}. Преобразуем эти множества в следующие:

A = {(x2k+1 y2k,y2k+1),k = 0,...,N -1,y0 = 0}, B = {(x2k y2k-1,y2k ),k = 1,N}.

Блоки из A получены по ключу k1. Определим его опробованием, за тратив в среднем операций опробования. В качестве h здесь берем функцию равную единице, когда DES(x2k+1 y2k,k1) = y2k+1, k = 0,N -1.

Затем ищем k2, опираясь на множество B и уравнение DES(x2k y2k-1,k2) = y2k. Определение k2 потребует в среднем опе раций опробования. Тогда трудоемкость определения ключа k = (k1,k2) в среднем равна 256 операций опробования.

2.5. Методы криптоанализа при неравновероятносй гамме. Рас стояние единственности.

Пусть открытые тексты - слова длины n в алфавите Z/m. Для того, что бы объяснить математическую теорию, разработанную для решения зада чи, предположим, что гамма может принимать только r значений. Множе ство открытых Х и шифрованных текстов Y погружены в пространство n n V всех последовательностей длины n в алфавите Z/m. Следуя n [Ш., стр. 375], операцию дешифрования можно представить графически в виде ряда линий, идущих от каждого шифртекста y Y к различным n x V. В сделанных выше предположениях каждый y Y связан ровно с n n n k = r различными x V. Обозначим их x(1),..., x(k). Среди линий, идущих n от y к x(1),..., x(k ) имеется открытый текст х. Если мы знаем признаки от крытого текста (например, читаемость) и среди x(1),..., x(k) ровно один текст х удовлетворяет этим признакам, то тем самым процедура дешиф рования завершена. Однако возможна ситуация, когда несколько текстов среди x(1),..., x(k) удовлетворяют признакам открытого текста. Тогда цель дешифрования - получение достоверной информации из раскрытого от крытого текста - недостигнута. Ясно, что на возможный исход дешифрова ния влияет r. Если r = 1, то от y ведет всего одна линия к х и, по условию, этот текст и есть открытый. Проблемы неоднозначности здесь нет. Если r n = m, то от у ведет m различных линий ко всем элементам V. Значит, лю n бой текст из Х является возможным открытым текстом, что не дает нам n возможности достигнуть цели дешифрования и этот случай обязательно порождает неоднозначность прочтения криптограммы. Для того, чтобы понять при каких r возможно однозначное дешифрование, а при каких r невозможно, рассмотрим следующую модель. На множестве ключей зада на равномерная мера, т.е. любая допустимая гамма появляется с вероятно стью 1/K. Мы также предположим, что для любого заданного шифртек ста у, полученного из открытого текста х, все линии, связывающие у с x(1),..., x(k), кроме (у, х ), получены случайным и равновероятным выбо n ром с возвращением из (m - 1) возможностей. Это предположение было впервые введено Шенноном [Ш.Б стр.374] при определении “случайного шифра” (фактически мы рассматриваем частный случай “случайного шиф ра”). Если модель с этим и следующими предположениями позволит оце нивать r, допускающее однозначное дешифрование, и полученная оценка может быть подтверждена экспериментами, то теория правильно отражает суть вопроса.

(i) Обозначим случайную величину, равную 1, если х является от i крытым текстом, и 0 в противном случае. Тогда число открытых текстов без х среди x(1),..., x(k) равно k = -1.

i i= k (i) Тогда Е = Еi -1. Для всех х, которые не равны х, i= X (i) Еi =. В случае х = х, Е = 1. Тогда i mn - X Е = (k-1). (1) mn - Если соотношение параметров таково, что Е <<1, то по оценке Мар кова P( 1) Е <<1.

Это означает, что появление ложных открытых текстов маловероятно или что х выделяется однозначно с большой вероятностью. Для изучения соотношений между параметрами необходимо оценить Х.

До сих пор мы представляли множество открытых сообщений х как подмножество множества V всех слов длины n. Однако нет оснований n считать, что какая-либо последовательность не может стать сообщением.

Просто вероятность встретить в качестве сообщения одни слова много больше, чем другие. Поэтому предполагают, что все последовательности длины n упорядочены в соответствии с их вероятностями появления в об щении на данном языке. Тогда собственно осмысленные (в бытовом пони мании этого слова) выражения относятся к более вероятным, чем последо вательности, смысл которых нам неясен (трудно представить себе общение при помощи труднопроизносимых буквосочетаний).

n Поскольку значения k, m и Х велики, то оценку Х можно сде лать асимптотически, предполагая n большим. Такие оценки Шеннон раз работал в работе “Математическая теория связи” [Ш., с. 265], к которой сейчас и обратимся.

Пусть p(a1),...,p(a ) (2) m вероятности появления букв на фиксированном месте i в открытом сооб щении длины n (1 i n). Предположим, что буквы в сообщении появля ются независимо друг от друга с одним и тем же распределением (2). По добная модель открытых сообщений является грубой, но, как и выше, оценка для r, близкая к экспериментальной, покажет, что наш механизм анализа отражает сущность проблемы. Обозначим через i, i = 1,...,m, час тоты букв a1,..., a в последовательности х. Тогда вероятность выбора х в m нашей схеме равна P(x) = p (a1)pm (a ).

m m Будем считать, что p(ai ) >0, H = - p(ai ) log p(ai ). Теперь мы можем i= сформулировать следующую теорему Шеннона.

Теорема 1 (К. Шеннон). Для любых >0 и >0 можно найти такое n, что для любого n > n последовательности из V распадаются на 0 0 n два непересекающихся класса В и B так, что 1) P( B )< 2) x B выполняется неравенство log2 P-1(x) - H <.

n Д о к а з а т е л ь с т в о. Возьмем произвольные малые >0 и >0 и рассмотрим события B = {x V, i - np(a ) > n }, i = 1,…,m.

i i ( ( По закону больших чисел n0i), что n > n0i) P( B ) <. (3) i m m ( Определим B = B. Тогда из (3) для n > max { n0i) } U i i i= m P( B ) P( B ) <. (4) i i= m Множество В = Bi может быть представлено в следующем виде:

I i= В = {x V, i (i=1,..., m)i - np(ai ) n }. (5) Обозначим i = i - np(ai ), i=1,..., m. Из (5) следует, что i -n i n.

Выразим Р(х), x В, через введенные параметры.

np(a1)+1 np(am )+m Р(х) =( p(a1)) (p(a )).

m Тогда m m log = -n p(ai ) log p(ai ) - i log P(ai ).

2 2 P(x) i=1 i= Получаем, что x В m m log2 P-1(x) i log P(ai ) log p(ai ).

- H 2 n n i=1 i= m Поскольку p(ai ) >0, то log p(ai ) = const, не зависит от n. Теорема i= доказана.

Пусть 0 < < 1, - произвольное малое число. Пусть все последова тельности длины n расположены в порядке убывания вероятностей их по явления. Как отмечалось выше, множество открытых сообщений модели руется начальным участком таких последовательностей. Обозначим через () - число наиболее вероятных последовательностей таких, что сумма n их вероятностей 1-, а сумма вероятностей любого набора из ( () - 1) n этих последовательностей < 1-. Следующая теорема показывает, что при n множество последовательностей, составляющих в нашей модели от крытый текст, не зависит от.

Теорема 2 (К.Шеннон). Для любого > log2 n ( ) lim = H.

n n Д о к з а т е л ь с т в о. Пусть Q () - множество наиболее вероятных n последовательностей таких, что P( Q ()) 1-, а исключение любой по n следовательности из Q () образует множество, вероятность которого n меньше 1-. Возьмем малое >0 и рассмотрим множество В из предыдущей теоремы. Тогда для x В - log2 P(x) H - < < H + n или - n(H-) > log P(x) > - n(H+).

Отсюда 2-n(H + ) < P(x) < 2-n(H - ). (6) Рассмотрим оценки для Q (). По определению Q () P(Q ()) 1-.

n n n Поскольку Q () = (Q () ) ( Q () B ), U IB I n n n тогда P(Q ()) = P(x) = P(x) + P(x).

n xQn (x) xQn (x) IB xQn (x) IB Для второй суммы справедлива оценка P (Q () ) P( B )<.

IB n P(Q () B )) = P(x) < I 2-n(H - ) = n xQn (x) IB xQn (x)IB = Q () B ) 2-n(H - ) Q () 2-n(H - ) = I n n = () 2-n(H - ).

n Следовательно, 1-. P(Q ()) < () 2-n(H - ) +.

n n Отсюда получаем () > 2n(H - ) (1- 2).

n Докажем, что множество Q () содержит минимальное число после n довательностей среди всех множеств С, таких что P(C) 1-. Доказатель ство будем вести от противного. x Q (), x C и yC, n y Q (), такие последовательности, что P(x) P(y), так как в Q () со n n держатся наиболее вероятные последовательности. Предположим, что C \ Q ()< Q ()\ C n n (т.е. Q () - не минимальное множество). Тогда n P(x) < P(x), xC\Qn ( ) xQn ( )\C так как справа слагаемых хотя бы на 1 больше и все они не меньше слагае мых в левой сумме. Пусть y имеет наименьшую вероятность среди всех y Q ()\ C. Следовательно, n P(x) P(x).

x(Qn ( )\C)\{y0} xC\Qn ( ) Поскольку Q ()\{y } = (Q () ) (( Q ()\C)\{y }), U IC n 0 n n то, учитывая, что по определению множества Q () n P(Q ()\{y }) < 1 -, n получим P(C) = P(Q () ) + P(C\ Q ()) P(Q () ) + IC IC n n n + P(Q ()\C\{y }) = P(Q ()\{y }).

n 0 n Тогда P(C) <1 -, что противоречит предположению. Следовательно, Q () - минимальное n множество векторов, имеющих максимальную вероятность. Отсюда и из (6) p(x) Q () В= 2n(H + ).

1 < n 2-n(H + ) xB xB Таким образом, 2n(H - ) < Q ()< 2n(H + ) n или log ( ) 2 n H- < < H +.

n Следовательно, log2 n ( ) lim = H, n n что и требовалось доказать.

Множество открытых текстов можно представить как объединение В и B. Множество B имеет маленькую вероятность, множество В оценива- ется по теореме 2.

Х 2nH (x).

Следовательно, X n E = (r -1) mn - при r E = ( 2H )n 0.

m Это выполняется, когда r 2H < 1, m то есть при r, удовлетворяющих неравенству log r - log m + H < 0, (7) 2 возможно однозначное дешифрование.

2.6. Перекрытия гаммы.

Рассмотрим шифр гаммирования yi = xi + i, i = 1,2,...,n, где х= x1x.......- открытый текст, y = y1y.... - шифрованный текст и 2 = 1...... - ключ шифра гаммирования по mod m.

Предположим, что одна использовалась дважды для зашифрования двух открытых текстов х и х’. Дешифровщик получил два шифртекста y и y’, полученных при зашифровании открытых текстов х и х’ одной. Тогда y - y’ = x + - x’ - ‘ = x - x’.

Таким образом, дешифровщик имеет разность открытых текстов x - x’.

Идея следующего метода изложена в [Ш., с.396]. Пусть дешифровщик уга дал, что в х начиная с места i стоит слово а1а...а. Тогда 2 r + y, - yi + a1 = x, i i...........................

y, - yi+r + a = x,.

i+r r+1 i+r То есть, дешифровщик может сразу прочитать, что написано в теле грамме начиная с места i по место i+r в открытом тексте x’. Если дешиф ровщик лишь предполагает, что начиная с места i в х стоит слово, а1а...а, то читаемость участка x... x, в открытом тексте x’ является 2 r +1 i r + критерием правильности его предположения. Если дешифровщик угадал слово в х и подтвердил его правильностью в x’, то он может прогнозиро вать текст в х и в x’ слева и справа от i и i+r. Правильность догадки тут же подтверждается читаемостью второго текста. Таким образом, можно про читать оба текста. Этот метод дешифрования называется “протяжкой веро ятного слова”.

Если есть две криптограммы y и y’ (или два куска криптограмм), то возникает вопрос о том, можно ли узнать до протяжки вероятного слова о том, зашифрованы ли они одной. Для решения данной задачи опять рас смотрим простейшую модель открытого текста - последовательность неза висимых испытаний по полиномиальной схеме с вероятностями p(a1),..., p(a ) (распределение Р). Тогда случайная величина i = xi - x, m i имеет распределение Р* = P*P, где Р* - свертка распределения Р с собой.

Если Р - неравновероятное распределение, то Р*=(p* (a1),...,p* (a )) также m неравновероятное распределение. Тогда y - y’ = x - x’- независимые слу чайные величины с распределением Р*. Если х зашифровывается с помо щью, а х’ - с помощью ‘, то y - y’ = x - x’ + - ‘.

В наших предположениях - ‘ - равновероятно распределенные случай ные величины. Следовательно, y - y’ - также независимые и равновероятно распределенные случайные величины. Значит, статистический критерий, проверяющий гипотезу Н о равновероятности y - y’ против альтернативы * Н1, что y - y’ имеет распределение Р, дает ответ о наличии перекрытия в y и y’.

Обычно схема получения гаммы следующая: имеется конечный авто мат А без входа, в котором начальное состояние есть ключ k. Функция вы хода этого автомата есть для шифрования. Например, линейный регистр сдвига с линейной и нелинейной обратной связью. При таком способе по лучения повтор получается, когда автомат начинает вырабатывать пе риодическую последовательность. Период последовательности возникает обязательно из-за конечности множества состояний автомата. Если период небольшой, то его можно опробовать и, применяя критерий на перекрытие, найти, а затем дешифровать криптограммы. Если n - число состояний ав томата велико, то можно получить большой период, а, следовательно, мало шансов на перекрытие.

Пусть S- множество состояний автомата А, k - случайное начальное состояние. Период возникает, когда возникает повторение в последова тельности A(k), A (k),.... Пусть А - случайная равновероятная подстановка на {1,…,n}. Тогда возврат возможен только в точку k. Если - длина полу ченного цикла, и случайная величина i = 1, если длина цикла равна i, и i = 0 в противном случае, то i Cn-1 (i -1)!(n - i)! (n -1)!(n - i)!(i - 1)! - P(i = 1) = = =.

n! (i -1)!(n - i)!n! n Тогда n =.

i i i= Отсюда n n i n + E = =.

iE = i n i=1 i= При n = 2 E 1018, что дает мало шансов ожидать перекрытия да же при очень большой интенсивности переписки.

Если А - случайное отображение (не взаимно-однозначное) и - длина цикла, а h - длина подхода, то тогда h ~ n, ~ n и h+ ~ n. Следова 64 32 тельно, при n = 2 h+ ~ 2 ~ 10, что является не очень большой ве личиной и можно ожидать перекрытия гаммы.

2.7. Корреляционные атаки на поточные шифры.

Чаще всего цель статистических методов криптоанализа [Meier 89] со стоит в том, чтобы построить критерий Н, необходимый для применения метода “разделяй и побеждай”. Оказывается, что большинство поточных шифров дают возможность применять против них корреляционные методы атак. Идея метода состоит в том, чтобы заменить исходное преобразование в шифре другим, зависящим от части ключа, что открывает возможность применения метода “разделяй и побеждай” или аналитических методов. В последнем случае часто стремятся свести задачу криптоанализа к решению системы линейных уравнений. Замена одного преобразования другим осу ществляется так, чтобы сохранялась корреляционная связь с известной по следовательностью знаков шифра, полученной при настоящем преобразо вании. Тогда при опробовании части ключа эта статистическая связь дает критерий Н для определения правильного варианта опробоваемой части ключа. Если происходит сведение к линейной системе уравнений, то ука занная статистическая связь позволяет построить линейную систему отно сительно элементов ключа.

Пример 1. Рассмотрим генератор поточного шифра [Meier 89], в ко тором имеется известная двучленная линейная рекуррентная последова тельность, усложненная некоторой булевой функцией f (неравновероят ной), как это представлено на рис. 1.

a a a a r r -1 k f a x z y Рис. ai+r = ai + ai+k-1, 1 k r, i = 1, 2, …. (1) Мы считаем, что известна последовательность z = (z1,…,z ) длины N.

N Таким образом, задача будет решаться в предположении, что известны от крытые и шифрованные тексты. Выходная последовательность линейного регистра будет обозначаться а = (a1,…,a ). Неизвестным ключом является N начальное заполнение регистра, которое выбирается случайно и равнове роятно.

Для целей криптоанализа примем следующую модель схемы 1.

a a a a r r -1 k a z Рис. Здесь = (1,…, ) - последовательность независимых одинаково распре N деленных {0, 1} случайных величин с вероятностью 0, равной р. Соответ ствие вероятностной модели на рис. 2 детерминированному автомату рис.

1 может быть оправдана, если нам удастся найти начальное заполнение ре гистра. Поэтому мы и далее будем строить грубые вероятностные модели, оправдывая сделанные допущения достижимостью конечной цели. Если ключ определить не удается, то это может произойти из-за ошибки стати стического критерия, или неадекватности модели. В любом случае крип тоанализ надо начинать заново.

Отметим, что величина а для каждого n присутствует в нескольких n линейных соотношениях. Например, а + a + a = 0, (2) n n-r n-r+k- a + a + а = 0, (3) n+r-k+1 n-k+1 n a + а + a = 0, (4) n+r n n+k- Характеристический многочлен рекурренты равен k-1 r С(х) = 1 + x + x.

Тогда справедливо следующее равенство:

j j i при j = 2i (С(х)) = С(х ).

Отсюда мы можем получить новые трехчленные соотношения.

Возможны другие производные соотношения, если в (2) вместо a n-r подставить правую часть равенства:

a = a + a.

n-r n-2r n-2r+k- Или в (2) вместо a подставить правую часть равенства n-r+k- a = a + a, n-r+k-1 n-2r+k-1 n-2r+2k- и т.д. Таким образом, можно набрать m линейных соотношений относи тельно а.

n Согласно модели для любого n p = P(z = а ) > 0,5. Фиксируем а и n n n индекс n будем далее опускать. Для m линейных соотношений из рекур ренты, обозначив через bi, i=1,...,m, суммы слагаемых без а, получим n следующую систему a + b1 = a + b = 0 (5).................

a + b = m Реально вместо а будем подставлять z. Обозначим значение сумм zi n c линейными формами на соответствующих местах в формуле (5) через yi.

Получим линейные формы z + y1 = L z + y = L (6) 2.................

z + y = L m m Если z = a, yi = bi, то Li = 0. i= 1,...,m. (7) При достаточно большом количестве m соотношений в (5) мы надеем ся, что удастся статистически различить случаи z = a от z a. Если стати стически эти случаи различаются, то среди большого числа z найдутся n такие, для которых такое статистическое обоснование z = a будет хорошо заметно. Тогда выразим все а, соответствующие таким случаям (z = a) n через начальное заполнение регистра сдвига. Мы получим систему линей ных уравнений, у которых правые части с большой вероятностью совпа дают со значениями а. Если система решается, то получим ключ. Если n система не решается, то надо опробовать малое число уравнений с непра вильно определенной правой частью. Решая такие системы, находим ключ.

2.8. Статистические модели.

Для того, чтобы оценить реализуемость метода, рассмотрим следую щую вероятностную модель. Рассмотрим набор случайных величин A = {a, bij, i=1,...,m, j=1,...,t}, удовлетворяющих системе уравнений:

t a + = 0, i=1,...m.

b ij j= Замечание 1. В модели, рассмотренной в п. 2.6, t=2.

Аналогично рассмотрим набор случайных величин Z = {z, yij, i=1,...,m, j=1,...,t}.

Эти случайные величины представляют z. Два набора связаны следую n щим соотношениями P(z=a) = p, P(bij = yij ) = p.

Замечание 2. Такие соотношения можно получить следующим обра зом. Так, например, в модели (2) z = a +, yij = bij + ij, где - независимые, одинаково распределенные случайные величины с P( = 0) = p.

Обозначим t bi =, i=1,...m, b ij j= t yi = yij, i=1,...m.

j= Положим Li = z + yi, i=1,...m.

Пусть вероятность s(t,p) = s = P(yi = bi ) не зависит от i. По формуле пол ной вероятности получим рекурренту s(t,p) = ps(t-1,p) + (1-p)(1- s(t-1,p)), s(1,p) = p.

2 Замечание 3. Для t=2 s(2,p) = p + (1-p).

Обозначим через B события, состоящие в том, что k из m линейных k форм Li равны 0. Тогда следующий вывод ”z = a” определяется апостери орной вероятностью m psk (1- s)m-k k * P(z=a| B ) = = p.

k m m psk (1- s)m-k + (1- p)(1- s)k sm-k k k Это апостериорная вероятность того, что z=a. Аналогично m (1- p)(1- s)k sm-k k * P(za| B ) = = 1-p.

k m m psk (1- s)m-k + (1- p)(1- s)k sm-k k k * Идея состоит в том, что мы интуитивно ожидаем, что p увеличивает ся по сравнению с р, если z = a и уменьшается, если z a. Поэтому найдем * математическое ожидание p в двух случаях z = a и za. При z = a * * E ( p ) = E(p | z = a) = m m psk (1- s)m-k = k psk (1- s)m-k + (1- p)(1- s)k sm-k sk (1- s)m-k.

k= Далее при z a * * E1( p ) = E(p | z a) = m m p(1- s)m-k sk = sm-k (1- s)k.

k k=0 psk (1- s)m-k + (1- p)(1- s)k sm-k При р= 3/4, t=2, m=20 получим * E ( p ) = 0,9, * E1( p ) = 0,3.

Осталось оценить число допустимых соотношений m как функции от длины регистра r и длины текста N. Пусть t-членное соотношение полу чено с использованием равенства j j (С(х)) = С(х ), j = 2i, i= 1,...,m.

m Тогда длина задействованного участка при i=m равна r2. Таких со m отношений N- r2 >0. Тогда общее число соотношений равно N N log2 log r r N T = (N - 2mr) = N( log +1) - 2mr = r m=0 m= N log2 + N r = N(log + 1) - (2 -1)r = r N 2N = Nlog + N - ( - 1)r = r r N = Nlog + r - N. (1) 2r Каждое соотношение (1) связано с t+1 знаками последовательности z.

Поэтому среднее число m соотношений на один знак равно T (t +1) N r m = = (log + - 1)(t+1).

N 2r N r Для наших приложений (t + 1) << 1. Отсюда из формулы (1) полу N чим приближенное равенство N m (t + 1) log.

2r 2.9. Линейный криптоанализ блочных шифров.

Линейный криптоанализ [Matsui 93] является атакой при известном открытом и шифрованном текстах на итеративные шифры типа DES, в ко торых “криптографически слабая” функция повторяется r раз. Предполага ется, что открытый текст выбирается случайно и равновероятно, а подклю чи в каждом раунде независимы друг от друга.

Замечание 1. По-видимому, не имеет значения каким образом выбира ется открытый текст.

Часто линейный криптоанализ является наиболее эффективным мето дом, тогда сложность линейного криптоанализа итеративных блочных шифров может являться мерой их слабости.

Линейный криптоанализ Мацуи r-раундового DES требует значитель ного числа открытых текстов. Это следует из следующей таблицы.

Количество ра- Количество известных открытых текстов ундов для нахождения ключа 233 Eurocrypt ' 247 Crypto ' Сложность атаки связана с количеством необходимых известных от крытых текстов, т.к. для любой пары (открытый текст, шифртекст) требуется небольшое количество вычислений для реализации алгоритма.

Например, атака на r=8 DES занимает 40 сек. на рабочей станции, а атака на r=12 DES занимает 50 час, что примерно в 4500 раз больше.

Эта атака может быть проведена, если имеется только шифртекст.

Мацуи были получены следующие результаты:

• если известно, что открытый текст на английском языке, представ ленный в ASCII кодах, то при r=8 DES вскрывается при 2 извест ных шифртекстах;

• если открытый текст является случайным ASCII кодом, то при r= DES вскрывается при 237 известных шифртекстах.

Рассмотрим основную идею линейного криптоанализа. Пусть S – {0,1} – случайная величина с P{S=1}=p. (S) =|1- 2 p |.

Лемма 1. Если - независимые бинарные случайные вели S(1 ),K,S(n) чины, тогда n (S(1) K S(n) ) = (S ).

(i) i= Д о к а з а т е л ь с т в о. В силу независимости S и S (1) (2) P(S(1) S(2) = 1) = P(S =1)P(S =0) + P(S =0)P(S =1) = (1) (2) (1) (2) = p1+ p - 2 p1 p.

2 Тогда (S S ) = 1 - 2 p(S(1) S(2) = 1) = 1 - 2 p1 - 2 p2 + 4 p1 p2 = (1) (2) = (1- 2 p1)(1- 2 p2 ).= (S ) (S ).

(1) (2) Утверждение леммы следует из-за ассоциативности операции :

S(1) (S(2) S(3) ) = (S(1) S(2) ) S(3).

Заметим, что 0 (S) 1. При этом 0 = (S) при р =, а (S)= 1 при P(S=1) = 1 или P(S=0) = 1.

Рассмотрим схему произвольного итеративного блочного шифра в i-ом раунде.

r X (i) r Е K(i) i=1, …, r.

r Y r(i) r r Y (i) = E(X (i);

K(i)) (1) r Здесь Е – функция шифрования, X (i) - блок открытого текста в i-ом r r раунде, Y (i) - блок шифртекста, K (i) - подключ, используемый в i-ом раун r r r де. Y (i), X (i) Vn, K (i) Vm, n – размер блока, m – размер подключа.

r r Обозначим через (X,) = X11 K X n = Xi1 …Xik = n r r = X[i1,…,i ]- скалярное произведение двоичных векторов X и, где k r (i1,…,ik ) единичные координаты вектора.

Определение 1. Линейным статистическим аналогом нелинейной функции (1) будем называть случайную величину r r r r r r S(i) = (Y (i),(i)) (X (i), (i)) (K (i), (i)), (2) если вероятность Р(S(i) = 1) = p для случайно выбранного открытого r текста X (i).

Отклонение (S(i)) =|1- 2 p | определяет эффективность линейного статистического аналога (2).

Замечание 2. Массе [Massey 94] называет S(i) тройной суммой и предлагает обобщение линейного криптоанализа, рассматривая тройную сумму для i-го раунда как случайную величину S(i) вида r r r S(i) = fi ( X (i)) gi (Y (i) ) hi ( K (i) ), где fi,gi,hi - равновероятные булевы функции. В определении Мацуи fi,gi,hi - линейные функции.

Определение 2. Последовательные тройные суммы S(i+1) и S(i) на зываются связанными, если fi+1 = gi.

Из определения следует, что r r r r S(i) S(i +1) = fi (X (i)) gi (Y (i)) hi (K(i)) fi+1(X (i +1)) r r gi+1(Y (i +1)) hi+1(K(i +1)), r r Y (i) = X (i +1).

Определение 3. Если S(1), …, S(n) - связанные тройные суммы, то то гда n r r r S1K n = S(1) K S(n) = f1(X (1)) gn (Y (n)) hi (K(i)) (3) i= и S1K n называется n-раундовой тройной суммой.

В случае линейных функций формула (3) дает линейное соотношение n r r r r r v S1K n = ( X (1), ) (Y (n), ) (4) (K(i), (i)), i= которое выполняется с вероятностью, определяемой (S(1).... S(n)) и леммой 1.

Определение 4. Эффективным линейным статистическим аналогом называется линейный статистический аналог (4) из заданного множества с наибольшим.

Для применения линейного криптоанализа необходимо решить сле дующие задачи:

1. нахождения эффективного линейного статистического аналога и вычисление его вероятности;

2. определения ключа (или некоторых бит ключа) с использованием эффективного линейного статистического аналога.

Для нахождения эффективного линейного статистического аналога рассмотрим сначала задачу нахождения статистических аналогов для S-боксов алгоритма DES.

Нелинейная функция, реализующая а-ый S-бокс алгоритма DES, мо жет быть записана в виде r r r Y = Fa (X K), a = 1,8, (5) r r r Y V4, X,K V6.

r Пусть 1 i <64, 1 j <16, а k - двоичное разложение числа k N. Ли нейным статистическим аналогом каждого из уравнений (5) будет урав нение вида r r r r (Y, j) = (X,i ), (6) r r r X = X K.

Обозначим через Sa (i, j), a = 1,8, i = 1,63, j = 1,15, число ненулевых r X V6 для а-го S-бокса DES таких, что для i и j выполняется равенство (6).

Когда Sa (i, j) 32 можно сказать, что есть статистическая связь между входными и выходными битами а-го S-бокса.

Пусть * * Sa (i*, j*) : | Sa (i*, j*) - 32 | = max | Sa (i, j) - 32 | (7) 1 i 1 j Тогда уравнение r r r r* r* r* (X,i ) (Y, j ) = (K,i ) (8) является эффективным линейным статистическим аналогом а-го S-бокса в классе всех линейных статистических аналогов вида (6) с вероятностью * Sa (i*, j*) pa =, a = 1,8. (9) Все значения для S5(i, j) приведены в таблице 1. Значение S5(i, j), имеющее наибольшее отклонение от, помечено * в таблице 1. Следова r* r* * тельно, S5 (i*, j*) = 12, где j = (0,1,0,0,0,0), i = (1,1,1,1).

Отсюда эффективным линейным статистическим аналогом 5-го S-бокса является уравнение r r r Y [1,2,3,4] X [2] = K [2], (10) и это уравнение выполняется с вероятностью p5 =.

i Значения j S(i, j) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 1 32 32 32 32 32 32 32 32 32 32 32 32 32 32 2 36 30 34 30 34 28 32 36 32 34 30 34 30 32 3 32 30 38 30 30 36 28 32 32 30 38 30 30 36 4 34 30 32 32 34 30 32 32 34 34 36 28 30 30 5 34 34 28 32 42 26 28 32 34 22 32 36 30 34 6 30 28 26 30 28 34 32 32 30 32 30 26 24 34 7 34 32 34 30 40 38 32 28 38 32 26 30 32 26 8 32 34 38 32 32 30 26 30 34 36 20 34 38 28 9 28 38 30 32 28 26 26 38 30 32 28 34 26 24 10 36 32 32 30 26 34 34 34 34 30 34 36 28 28 11 36 36 36 38 34 30 30 30 30 30 34 32 24 28 12 34 32 30 32 34 36 42 30 36 30 24 30 36 26 13 38 32 34 32 30 36 22 30 32 30 36 30 40 26 14 30 30 32 30 36 32 34 30 32 36 34 28 38 30 15 30 30 40 38 36 32 34 34 36 40 30 40 26 34 16 34 30 32 32 30 26 24 32 30 30 28 32 34 42 12* 17 34 30 32 36 34 30 28 36 34 34 32 24 26 34 18 30 32 30 34 28 30 24 36 38 36 38 30 36 26 19 26 32 34 30 36 34 32 36 26 36 34 26 36 30 20 36 28 32 32 32 32 32 28 28 36 36 32 36 28 21 36 32 28 28 36 24 24 32 32 28 36 40 36 32 22 32 38 38 34 30 36 32 36 32 38 34 34 34 32 23 36 26 30 38 30 28 36 36 28 26 34 30 34 32 24 38 32 34 36 22 28 34 34 32 30 32 34 36 30 25 34 36 26 32 30 36 30 38 40 38 36 42 32 34 26 34 34 24 30 36 32 34 30 32 36 34 32 30 30 27 34 38 28 26 32 32 34 38 40 32 30 28 26 30 28 32 30 34 36 32 26 34 30 38 28 32 34 30 32 29 36 30 38 24 32 30 34 42 30 24 24 34 34 32 30 28 24 32 30 30 30 34 30 34 30 38 36 36 36 31 28 40 24 34 26 26 30 30 34 30 30 24 32 32 32 32 32 32 32 32 32 32 32 32 32 32 32 32 32 33 32 32 32 32 32 32 32 32 32 32 32 32 32 32 34 28 30 34 30 34 28 40 28 32 26 38 34 30 16 35 32 30 30 38 30 28 36 32 32 30 30 30 38 36 36 30 38 36 32 38 30 36 36 26 30 36 32 46 34 37 38 34 32 32 38 34 32 28 26 34 24 32 30 38 38 34 36 30 30 32 34 28 36 30 28 30 38 32 30 39 22 32 30 38 36 38 28 32 38 20 34 34 32 38 40 36 30 30 32 36 26 34 34 26 36 32 38 30 28 41 32 34 38 32 32 38 34 34 30 24 32 30 26 32 42 32 28 24 38 38 38 26 38 34 30 30 24 36 28 43 40 32 36 38 30 26 38 34 38 30 38 28 32 36 44 34 36 26 32 26 32 38 30 28 34 28 30 36 38 45 30 28 30 32 30 24 34 30 32 26 24 30 32 30 46 38 34 28 38 36 36 30 22 24 32 30 36 30 34 47 38 26 28 38 28 36 30 34 36 36 26 32 34 30 48 34 30 32 28 26 30 28 36 34 34 32 32 34 34 49 34 30 32 32 30 34 32 32 30 30 28 32 34 34 50 38 32 30 30 40 34 36 32 42 32 34 30 36 34 51 26 32 42 34 32 30 28 32 38 32 22 34 36 30 52 32 20 36 28 32 36 24 28 32 28 32 28 28 32 53 24 32 32 40 28 36 32 32 28 28 32 36 36 28 54 36 30 26 30 30 40 32 36 28 30 30 38 34 28 55 24 26 26 26 38 32 36 44 32 34 30 34 34 36 56 34 36 26 32 30 36 30 26 36 26 32 38 36 30 57 30 40 34 28 38 28 26 30 28 34 36 30 32 34 58 38 22 32 34 36 32 30 38 28 32 34 36 30 30 59 30 26 28 22 32 24 30 22 36 36 30 32 34 30 60 24 26 30 32 28 34 34 26 34 36 32 42 30 36 61 36 34 34 36 36 30 34 30 42 32 32 34 34 36 62 28 36 28 34 34 30 34 34 30 30 30 36 28 32 63 28 28 28 46 38 26 30 34 30 38 30 32 32 28 Таблица 1 Значения S5(i, j).

Уравнения для эффективных линейных статистических аналогов всех S-боксов приведены в следующей таблице 2. Здесь r r r X = (x1,K, x6 ), Y = (y1,K, y4 ), K = (k1,K, k6 ) - входные, выходные и ключевые вектора соответственно.

№ S- = Эффективное линейное уравнение р бок =|1 - 2 p | са x2 y1 y2 y3 y4 = k2 7 32 9 1 x1 x5 y1 y3 y4 = k1 k5 1 1 x1 x5 y1 y2 y3 y4 = k1 k5 1 1 x1 x5 y1 y2 y3 y4 = k1 k5 1 1 x1 x3 y1 y2 y3 y4 = k1 k 1 1 x1 x3 x5 x6 y2 y3 = k1 k3 k5 k 1 1 x1 x3 x5 x6 y1 y4 = k1 k3 k5 k6 1 3 x2 y1 y2 y3 y4 = k2 5 x2 y2 y3 y4 = k2 9 32 7 x1 x5 y1 y3 y4 = k1 k 7 x1 x2 x3 x5 x6 y2 = k1 k2 k3 9 k5 k 1 x2 y1 y2 y3 y4 = k2 1 x1x5y1y2 y3 =k1k Таблица 2.

Исходя из результатов таблицы 2, можно сделать вывод, что эффек тивным линейным статистическим аналогом одного раунда DES является уравнение (10). С учётом функции расширения и перестановки алгоритма DES (см. таблицу 2 п.1.1) имеем эффективный линейный статистический аналог i-го раунда DES r r r Y (i)[2,8,14,24] X (i)[17] = K (i)[26], (11) с = 5/8.

Мацуи не описывал алгоритма получения эффективных линейных аналогов для r-раундового DES, но из финальных результатов можно пред положить, что основная идея состоит в следующем: использовать связан ные тройные суммы с наибольшим.

Поясним это на примере. Для этого рассмотрим схему 3-раундового DES.

PL P PR r K(1) Y(1) Х(1) f(1) r K(2) Y(2) Х(2) f(2) r K(3) Y(3) Х(3) f(3) С С L R Рис. 1. Схема 3-х раундов DES.

Эффективными линейными статистическими аналогами 1-ой и 3-ей итераций являются уравнения r r r Y (1)[2,8,14,24] X (1)[17] = K (1)[26], r r r Y (3)[2,8,14,24] X (3)[17] = K (3)[26], каждое из которых выполняется с вероятностью 16. r r r r Учитывая, что X (1) = PR, X (3) = С, Y (1) = PL X (2), L r r Y (3) = С X (2), после сложения этих уравнений получим R r r ( PR С )[17] ( PL С )[2,8,14,24] = ( K (1) K (3))[26]. (12) L R 5 5 По лемме 1 = = и это уравнение выполняется с вероятностью 8 8 1- р = =.

2 r r Найти биты ключа K (1) K (3) можно, решая уравнение (12) с ис пользованием следующего алгоритма.

Алгоритм. Пусть N-число всех открытых текстов и Т-число откры тых текстов, для которых левая часть (11) равна 0.

Если Т > N/2, то r r 0, p > 1/ K (1) K (3) =.

1, p < 1/ Если Т < N/2, то r r 1, p > 1/ K (1) K (3) =.

0, p < 1/ Успех алгоритма возрастает с ростом N и =|1- 2 p |. Вероятность ус пеха определяется следующей леммой.

Лемма 2. Пусть N –число открытых текстов и р - вероятность выпол нения линейного уравнения (2). Предположим, что =|1- 2 p | 0. Тогда вероятность успеха алгоритма имеет вид P (x)dx, - N где x (x) = e. (13) Числовые вычисления (13) сведены в таблице 3.

N 1 1 162 82 Русп 0,841 0,921 0,977 0, Таблица 3.

2.10. Дифференциальный криптоанализ.

Пусть некоторый блочный шифратор с длиной блока N строится по схеме.

Y(1) = X(2) Y(2) X(r) Х(1) f f f Y(r), Z(1) Z(2) Z(r ) Рис. где Z = (Z(1), Z(2),…,Z(r)) получается по некоторой схеме из Z, или независимо и равновероятно выбирается для каждого цикла. Пусть Х(1) и Х* (1) – пара открытых текстов. Рассмотрим следующие разности:

Х(1) = Х(1) - Х* (1), Y(i) = Y(i) - Y* (i).

Если мы знаем открытый и шифрованный текст в одном i-ом цикле DES, то несложно определить часть ключа Z(i), которая используется в i-ом цикле (идея Шеннона о суперпозиции простых шифров для получения сложного шифра). Но, если мы знаем Х(i), Y(i) и Y* (i), то задача становится более сложной, но также решается, если решается предыдущая задача.

Определение 1. Преобразование f называется криптографически слабым, если по Y(r-1), Y(r) и Y* (r) для некоторого (малого) числа пар (Х(1), Х* (1)) можно найти (хотя бы часть) Z(r).

Идея дифференциального криптоанализа [Biham 93] заключается в том, чтобы найти такие Х(1), что при случайном равновероятном выборе Х(1), Z(1), Z(2),…Z(r-1) с вероятностью более появится 2N Y(r-1).

Определение 2. Пара (, ) возможных значений вектора ( Х(1), Y(i)) называется дифференциалом i-ого цикла.

Тогда дифференциальный криптоанализ описывается следующей моделью.

Y(1) = X(2) Y(2) X(r) Х(1) f f f Y(r), Z(1) Z(2) Z(r ) Y* (1) = X* (2) Y* (2) X* (r) Х* (1) f f f Y* (r).

Рис. Пусть f определяет операции в и f криптографически слаба. Тогда возможна следующая атака.

1. Выбираем дифференциал (r-1) – го цикла (, ), для которого вероятность Р( Y(r-1) = Х(1) = ) большая.

2. Случайно выбираем Х(1) и подбираем Х* (1), чтобы Х(1) =. Пусть известны Y(r) и Y* (r).

3. Делаем предположение, что Y(r-1) = и, зная Y(r) и Y* (r), находим Z(r ).

4. Повторяем 2 и 3 пока один (частичный) ключ не начнет появляться чаще других. Это и будет Z(r ).

5. Повторяем 1-4 до нахождения полного ключа.

2.11. Метод коллизий для хэш-функций.

Для контроля целостности сообщений, передаваемых по каналу связи, используется следующий метод. Пусть А = {a1,...,a } - алфавит, А* - m множество слов конечной длины в алфавите А. Пусть определена функция l Н: А* А, которая обладает тем свойством, что значения функции Н на словах, которые даже при отличии друг от друга только в одном знаке дают значительно отличающиеся хэш значения. Тогда, получив на приемном конце сообщение и его хэш, можно вычислить значение хэш от сообщения, сравнить с полученным хэш по каналу связи, и подтвердить или опровергнуть, что сообщение не искажено.

Если функция Н зависит также от ключа k K, то помимо проверки целостности добавление значения хэш к сообщению подтверждает истинность сообщения. Такой способ подтверждения истинности называется кодом аутентификации (Message Autentification Code - MAC).

Однако, такое подтверждение истинности еще не является электронной подписью. Подтверждение истины называется подписью, если ее могут проверить все, не знающие ключи. Например, в суде можно поверить истинность, не раскрывая ключи. Приведенный выше способ проверки подлинности сообщения непригоден, так как влечет раскрытие ключа. Для того, чтобы код аутентификации стал электронной подписью сообщения, необходимо использовать хэш-функции с дополнительными свойствами.

Например, использовать систему с открытым ключом. Напомним, что у корреспондента В имеются два алгоритма Е и D, каждый из которых B B l l l преобразует слово из А в слово из А и каждый определен на А. Первый алгоритм известен всем, а второй - только владельцу В. Обладание алгоритмом D однозначно (юридически) определяет корреспондента В.

B l Считаем, что Е и D удовлетворяют соотношениям А B B Е D () =, D Е () =.

B B B B Тогда электронной подписью документа М А* называется С = D (Н(М)).

B Проверка подписи под документом М возможна любым лицом, у которого есть Е. Для этого проверяющий вычисляет Н(М) (Н( ) - известна B всем, М проверяющий получает вместе с подписью С ). Второй шаг проверки - вычисление Е (С) = Е D ( Н(М)) = Н(М).

B B B Если вычисленное значение хэш от М совпало с результатом применения алгоритмов Е к С, то подпись В считается подтвержденной (даже в суде).

B Свойства хэш-функций.

1. Если М М’ хотя бы в одном знаке, то Н( М) Н(М’) примерно на половине знаков.

Это свойство отмечалось выше. Отметим также, что могут найтись такие М М’, что Н( М) = Н(М’), но выбор таких М и М’ случайно маловероятен, а подбор труден.

l 2. Для произвольной строки А трудно подобрать М А* такое, что Н( М) =.

3. Н( М) вычисляется быстро.

Выполнить п. 1)-3) не просто. В РФ принят стандарт ГОСТ 3411.94 на хэш. Длина хэш 256 бит.

Построение хэш.

Обычно хэш Н( ) строится следующим образом.

l l l 1) Выбирается функция h: А А А, удовлетворяющая свойствам 1-3.

Например, когда длина хэш была 64 бита, то брали следующую схему X Y DES ключ Z Рис. z = h(x,y) = DES (x).

y 2) А*, = 1..., t где длина блока i равна l, а блок дополнен до блока длины l(если это t необходимо). Н( ) вычисляется по следующему алгоритму.

= h(1, ) 1 =h(1, ) 2 =h(, ).

t-1 t-2 t Основная атака на хэш - это метод коллизий. Пусть В - мошенник, а D - лицо, подвергающееся атаке. В готовит два документа М и М’ так, что документ М пользователь D охотно подпишет, а В заинтересован в подписи D под документом М’. Тогда, подписав у D документ М, В получает подпись С = D (Н(М)). Если М’ выбрано так, что Н( М) = Н(М’), B то В предъявляет суду (М’, С). Судья убеждается, что подпись под М’ принадлежит D. тогда атака удалась.

Каким образом можно выбрать два таких сообщения? По свойству подбор осуществить сложно.

Оказывается, с большой вероятностью злоумышленник может реализовать подбор такого сообщения следующим образом. Такой подбор основан на задаче о днях рождения.

В выбирает два нужных сообщения М и М’, при этом D может подписать сообщение М, но не подпишет сообщение М’. Варьируя в сообщениях интервалами, шрифтами, форматами и т.п., В получает n пар вариантов М и М’ без изменения их смысла. И, следовательно, n пар соответствующих им хэш-функций.

' H(M1) H(M1) ' H(M ) H(M ) (1) 2 ' H(M ) H(M ) n n Затем, просматривая все пары, ищет совпадения. Сообщения M1,…,М отличаются слабо, а их хэш-функции отличаются значительно, n так что мы можем считать, что значения хэш-функций выбираются случайно, равновероятно и независимо друг от друга. Каково должно быть значение n, чтобы такая пара появилась с большой вероятностью?

Обозначим |Аl | = N и пусть р – вероятность того, что имеется пара ' ' сообщений Mi и Mi таких, что H(Mi ) = H(Mi ), то есть вероятность успешной атаки. Нам проще вычислить вероятность противоположного события, то есть, что в (1) нет такой пары.

N N - n n n (N - n)!n!(N - n)1 [(N - n)!] 1 – p = = =. (2) N N n!(N - 2n)!N! N!(N - 2n)!

n n Условия, налагаемые на n, при которых вероятность (2) мала, приводятся в следующей теореме.

n Теорема. Пусть N, n, но t >0, тогда N -t р = (1 - e ) (1 + (1)).

Д о к а з а т е л ь с т в о. Используя формулу Стирлинга, получим:

[(N - n)N -n e-N +n 2 (N - n)]2 (1+(1)) [(N - n)!] 1 – p = = = N N!(N - 2n)!

N e-N 2N (N - 2n)N -2n e-N +2n 2 (N - 2n) n (1- )2N -2n N = (1+(1)).

2n (1- )N -2n N Отсюда, используя разложение логарифма в ряд, получим n 2n ln( 1-p) = [(2N-2n)ln(1- ) – (N-n)ln(1- )](1+ (1)) = N N n n2 n3 2n 2n = [(2N-2n)( - - + O( )) - (N-n)( - - + 2 3 N N 2N N N n3 n + O( )](1+(1)) = - (1+(1)) = -t (1+(1)).

N N Таким образом, -t 1 - р = e (1 + (1)), и -t р = (1 - e ) (1 + (1)), что и требовалось доказать.

64 Пример. Если N = 2, то при выборе n = N = 2 сообщений, - вероятность успешной атаки будет равна р = (1 - e )(1 + (1)).

2.12. Анализ схем шифрования, использующих многократно один блочный шифр.

Пусть для определенности используется DES. Достижения в криптографии и электронике в 90-х годах позволили снизить время дешифрования DES, что позволяет делать недорогие системы для его дешифрования. Возникла идея построения нового алгоритма, у которого стойкость выше, чем у DES, а в качестве компоненты алгоритма используется DES. Наибольшую потребность в этом испытывают финансовые структуры, которые не хотели бы отказываться от DES из-за значительных дополнительных вложений и других трудностей, но нуждаются в стойких системах шифрования. В этих структурах наиболее употребительным является режим с зацеплением блоков (СВС).

Режимы использования DES [Men., c.229].

1. Режим электронной книги (ЕСВ).

ОТ ОТ К К ШТ ШТ Рис. 2. Режим с зацеплением (СВС).

ОТ ОТ ОТ IV К К К ШТ ШТ ШТ Рис.2.

Здесь IV – инициальное значение.

3. Режим с обратной связью по шифртексту (CFB).

ОТ ОТ ОТ IV К К К ШТ ШТ ШТ Рис. 3.

4. Режим с обратной связью (асинхронный) ((OFB).

ОТ ОТ ОТ IV К К К ШТ ШТ ШТ Рис. 4.

Были придуманы схемы шифрования, многократно использующие DES.

Пример 1. Двойной DES в режиме электронной книги.

ОТ К К ШТ Рис. 5.

Двойной DES не стоек к методу “встреча посередине”.

Пример 2. Тройной DES в режиме электронной книги [Men., c.272].

Стойкость данного алгоритма не превосходит стойкости DES, если используется атака с выделенным открытым текстом.

ОТ DES(К1) - DES (К ) DES(К1) ШТ Рис. 6.

Пример 3. Тройной DES с зацеплением.

ОТ ОТ IV DES(К1) DES(К1) -1 - DES (К ) DES (К ) 2 DES(К1) DES(К1) ШТ ШТ Рис. 7.

Оказывается, что стойкость данного тройного DES такая же как стойкость в режиме электронной книги при атаке с выбранным шифртекстом. Слабость данного алгоритма заключается в том, что шифртекст известен и он же идет на вход следующего блока.

Пример 4 [Biham 94]. Возникло много модификаций тройного DES, когда зацепление проходит внутри. Рассмотрим следующий вариант тройного DES: СВС/CBC/ECB.

P P1 P P 0 IV 1 Z Z1 Z Z 0 К1 К1 К1 К L L1 L 0 IV V V1 V 0 К К К К 2 2 2 W W1 W2 W К3 К3 К3 К C C1 C C 0 Рис. 8.

Рассмотрим один из вариантов дешифрования этой схемы методом выбранного шифртекста. Сначала будем искать ключ К3. Пусть известны открытые и шифрованные тексты. Среди всех шифртекстов выберем две тройки блоков следующего вида (C, C1, C ) и (C*, C1, C ), где C C*.

0 2 0 2 0 Обозначим для первой тройки через Wi - вход последнего блока, Vi - вход второго блока и через Zi, Li - вход и выход первого блока соответственно, Рi - открытый текст. Соответствующие обозначения для второй тройки – W*, V*, Z*, L*, P*. Для выбранных троек имеем следующие соотношения.

i i i i i * Из того, что С1 = С1, С2 = С *, следует * * W1 = W1, W2 = W*, V1 = V1, V2 = V*. (1) 2 Отсюда L2 = L*, и, следовательно, Z 2 = Z *. Тогда 2 V1 = W + L1, * * V1 = W* + L1.

Из этих соотношений с учетом (1) получим * W + W* = L1 + L1. (2) 0 Аналогично, Z 2 = P + L1, * Z * = P* + L1.

2 Откуда следует, что * P + P* = L1 + L1. (3) 2 Из соотношений (2) и (3) получим P + P* = W + W*. (4) 2 2 0 Так как мы знаем открытый текст, то нам известно P + P*. Тогда мы 2 знаем W + W* и С, С* и можем опробовать ключ К3, что в среднем 0 0 0 потребует 255 операций.

* Нахождение вероятностей таких пар троек, у которых С1 = С1 и * С2 =С следует из задачи о днях рождения. А именно, если вероятность такой пары при произвольном С есть, то вероятность хоть какой 1 нибудь пары ~ =. Значит надо иметь ~ 264 блоков шифртекста 2128 для определения ключа К3.

Зная К3, находим Wi и, применяя аналогичную технику, определяем К и К1. Для данной атаки потребуется 3255 операций опробования и 3 264 блоков шифртекста.

2.13. Атака на тройной DES с помощью линейного криптоанализа.

Рассмотрим схему тройного DES в режиме CBC/ECB/CBC [Biham 94].

P P1 P P 0 2 IV 1 Z Z1 Z Z 0 К1 К1 К1 К L L1 L 0 К К К К 2 2 2 V V1 V 0 IV W W1 W2 W 2 0 К3 К3 К3 К C C1 C C 0 Рис. 1.

Пусть найдено достаточно много шифртекстов (C, C1, C ), где C1 и 0 C - фиксированы, а C - произвольные и различные.

2 1) Сначала атакуем ключ К. Обозначим через Wi - вход последнего блока, Vi - выход второго блока и через Zi, Li - вход и выход первого блока соответственно, Рi - открытый текст. Для всех векторов L1 = D ( V1), V1 = C + W1.

K2 Отсюда L1 = D ( C + W1). (1) K2 Для всех векторов V = W2 + C1 одно и то же, так как W2 = D (C ). Следовательно, для них L = D ( V ) одно и то же.

K3 2 2 K2 Отсюда получаем P = D ( C + W1) + Z, (2) 2 K2 0 где для всех C вектора W1 и Z остаются одинаковыми. Нам известны 0 P и C, а неизвестны К, W1 и Z. Пусть D* () – линейный 2 0 2 2 K статистический аналог = D ( ). Тогда K P = D* ( C + W1) + Z - (3) 2 K2 0 - линейное уравнение относительно К, W1 и Z. Набирая и решая системы 2 при различных (C, P ), статистически выделяем решение К, W1 и Z.

0 2 2 2) Е ( W1) = C1.

K Отсюда с помощью метода полного перебора получим К3.

3) Зная К, К3, получим L и, зная Z, методом полного перебора из 2 2 соотношения Е ( Z ) = L находим К1.

K1 2 2.14. Техника атаки на тройной DES, основанная на задаче о днях рождения.

Рассмотрим схему тройного DES CBC/CBC/CBC [Biham 94].

P P1 P P 0 IV К1 К1 К1 К Z Z1 Z 0 IV К К К К 2 2 2 H H H H IV К3 К3 К3 К C C C C Пусть найдено 233 шифртекстов вида (C, C, C, С). Атака сначала ведется на ключ К3. На выходе второго блока шифрования имеем четверку вида (?, Н, Н, Н), где Н = С + D (C).

K Н - это случайная функция от С, не являющаяся подстановкой. По результатам задачи о днях рождения с большой вероятностью существуют С и С*, дающие одно и то же Н, так как Н – не взаимно-однозначное отображение. Тогда для двух С и С* появится одно и то же P3.

Действительно, для С и С* Z = D (Н) + Н.

2 K Отсюда P3 = Z + D ( Z3) = Z + D ( D (Н) + Н)).

2 K1 2 K1 K Для такой пары С и С* имеем уравнение С + D (C) = С* + D (C* ), K3 K где С и С* известны. Методом полного перебора находим ключ К3.

Аналогичным образом находим К и К1.

2.15. Криптоанализ режима DES, предложенного в качестве стандарта ANSI X9.52.

Для повышения стойкости тройного DES было предложено усилить режим с зацеплением тройного DES маскировками (СВСM). Biham и Knudsen [Biham 98] построили атаку на эту систему, значительно снижающую стойкость. Поэтому данный алгоритм в последний момент был снят с голосования по принятию его как стандарта.

P P1 P P 0 2 IV Е(К1 ) Е(К1) Е(К1) Е(К1) M1 Z1 M Z M Z3 M 2 2 3 L1 L L D(К ) D(К ) D(К ) D(К ) 2 2 2 Y1 Y Y3 Y 2 W1 W W W 2 3 E(К1) E(К1) E(К1) E(К1) C* C* C* C* 1 2 3 Рис.1.Схема СВСМ.

Схема маскировки выглядит следующим образом (OFB).

IV E(К ) E(К ) E(К3) E(К ) 3 3 M1 M M3 M 2 Рис. 2.

Рассмотрим два блока шифртекста длины 2 С1 и С. Ключи К1, К, К и произвольные IV неизвестны. Допустим, что дан такой 2 64 открытый текст, что получено 2 С1, а затем 2 С. Период схемы OFB 64 самое большее 2 (в среднем 2 ). Поскольку IV неизвестно, то не будем принимать во внимание первый блок С1 и первый блок С.

Обозначим блоки открытого текста (после удаления первых блоков) в первых р шагах через Р1,1, …., Р1, p. Тогда входы на первые блоки шифрования DES на ключе К1 равны Q1,i = P1,i + C1, i =1,…, p.

Q1,i зашифровываются в C1 при использовании маскирующего блока Мi.

Аналогично для любого i P - блок открытого текста, который под 2,i действием той же маскировки Мi переводится в С.

Q = P + C, i =1,…, p.

2,i 2,i Опробуем ключ К1. Если мы угадали ключ, то должно выполняться равенство E ( P1,i + C1 ) + D ( C1) = Li + Yi i = 1,…, p.

K1 K Аналогичное равенство выполняется и для С :

E ( P1,i + C ) + D ( C ) = Li + Yi i = 1,…, p.

K1 2 K1 Рассмотрим отображение Е () + V, K где V – фиксировано. Это отображение пространства 64-мерных выборок в себя. Пусть V - случайно. Тогда с большой вероятностью существует ровно одна неподвижная точка этого отображения. Эта задача может быть проинтерпретирована следующим образом. Пусть N = 2 дробинок размещают по 2 ящикам. Какова вероятность того, что ровно одна N дробинка попадет в свой ящик? N общее число размещений N дробинок по N ящикам. Тогда число благоприятных событий (ровно одна дробинка попадет в свой ящик) будет равно N и, соответствующая вероятность N(N -1)N -1 - р = = (1- )N ~ e.

N N N Если для некоторого i эта точка равна Мi + D (С ), то тогда K1 K,i Q = D ( Мi + Е ( Мi + D (С ))) = K,i K1 K2 K1 K,i = D ( Мi + V + ( Мi + D (С ))) = K1 K1 K,i = D ( V + D (С )).

K1 K1 K,i Тогда атака состоит из следующих шагов:

1. Выбираем произвольный блок V.

2. Опробуем ключ К1. Пусть К’ – очередной проверяемый ключ.

3. Вычисляем T1 ( К’) = D ( V + D (C1 )), (1) ' ' K K T ( К’) = D ( V + D (C )).

' ' 2 K K Находим подходящие тексты такие, что Q1,i = T1 ( К’), Q = T ( К’).

2, j 4. Если нашли такие открытые тексты, то вычисляем U = D (C1 ) + D (C ).

' ' K K С учетом (1) последнее равенство влечет U = Е ( Q1,i ) + Е ( Q ).

' ' 2, j K K Теперь проверяем равенство U = Е ( Q ) + Е ( Q1, j ).

' ' 2,i K K 5. Если равенство выполняется, то ключ К1 = К’. Если равенство не выполняется, то опробуем новый К’.

6. Если ключ К1 не найден, то опробуем другое V и повторяем действия 1-5.

Объясним причину работы атаки. Поскольку неподвижная точка одна, то Мi + D (С1 ) = М + D (С ).

' ' j K K Тогда D (С1 ) + D (С ) = Мi + М = U. (2) ' ' 2 j K K Рассмотрим теперь Q1, j и Q. Для них соответствующие маскировки 2,i М и Мi, а выходы из блока расшифрования на ключе К равны j D (С1 ) + М и D (С ) + Мi.

' ' j K K Отсюда, согласно (2), Y1, j = D (С1 ) + М = D (С ) + Мi = Y.

' ' j 2 2,i K K Раз равны выходы, то равны и входы:

L1, j = L 2,i Тогда Z1, j = М + L1, j j Z = Мi + L.

2,i 2,i Сложив два последние равенства, получим Е ( Q1, j ) + Е ( Q ) = Z1, j + Z = Мi + М = U.

' ' 2,i 2,i j K K Если К1 К’, то последнее равенство не выполняется.

Ключ К затем находится проще. Общая сложность атаки 258 при 64 известных выбранных шифртекстах длины 22 = 2.

Глава 3. Синтез криптоалгоритмов.

3.1. Синтез поточных шифров.

Пусть открытый текст - последовательность букв х = х1х...., ключ - последовательность символов z = z1z..., а шифртекст - последователь ность букв y = y1y...., где yi = E(xi,z ) - функция зашифрования.

2 i Часто последовательность z получается с помощью генератора, то есть автономного автомата. При этом стойкость оценивается следующими спо собами [Ru.]:

1. С помощью теоретико-информационного подхода.

2. С помощью практического подхода. Пусть М1,...,М - известные n методы криптоанализа и для определения ключа по открытому и шифро ванному тексту с помощью метода Мi требуется не более Ni операций.

Тогда стойкость поточного шифра N оценивается N Ni.

min i=1,...,n 3. С помощью нижней оценки (доказанная стойкость), то есть с помо щью оценки снизу для средней трудоемкости по всем методам.

Таким образом, для стойкости шифра против известных методов надо сконструировать такое устройство, которое дает хорошие характеристики по всем методам анализа.

Построим пример синтеза такой системы.

1) Любой генератор z обладает периодом (структура произвольного отображения).

Подстановка Произвольное отображение Тогда любой период - попадание на цикл структуры. Если мы попали на малый период, то тогда в исходной гамме появился повтор. Как показа но ранее, это слабость, приводящая к дешифрованию. Следовательно, со ответствующее устройство должно обладать максимальным периодом.

Число циклических точек произвольного отображения не больше числа циклических точек подстановки. Таким образом, в подстановке меньше шансов на короткий цикл. Наилучший вариант, когда цикл в подстановке единственен, тогда все точки лежат на нем и повторение произойдет не скоро. Оказывается, что регистр сдвига с линейной обратной связью (РСЛС) при определенных многочленах (примитивных) состоит из двух n циклов длины 1 и длины 2 - 1 (полноцикловые РСЛС).

2) Гамма должна быть по статистическим свойствам приблизительно равновероятна, иначе можно применить метод зигзагообразного чтения.

Таким образом, если РСЛС полноцикловая, то распределение знаков должно быть приблизительно равновероятным.

3) Однако РСЛС нестойка к аналитическим методам (линейная систе ма). Следовательно, необходимо, чтобы выходная гамма была нелинейной функцией от текущего вектора в регистре. При этом, если f - неравноверо ятна, то и гамма - неравновероятна. Отсюда функция f должна быть равно вероятной.

Построим пример, удовлетворяющий требованиям 1)-3).

Пример 1. f(x1,x,x ) = x1 + x x 2 3 2 f Рис. Действительно, x1 x x f 2 0 0 0 0 0 1 0 1 0 0 1 1 1 0 0 1 0 1 1 1 0 1 1 1 P(f = 0) = P(f = 1) =.

4) Однако, схема на рис. 1 подвержена корреляционным атакам, сле довательно, надо выбирать большое n и функцию f выбирать таким обра зом, чтобы ее трудно было аппроксимировать линейной рекуррентой для корреляционной атаки (и метода “разделяй и побеждай”).

5) При n большом и функции f с высокой степенью нелинейности по лучается большой линейный профиль и, следовательно, корреляционная атака не эффективна.

6) Схема на рис. 1 не подвержена атаке “встреча посередине”.

Из условий 1)-6) следует, что схема на рис. 1 - хорошая схема поточ ного шифра. Однако, против 4) эти схемы все-таки слабы.

Рассмотрим и другие генераторы поточных шифров.

Пример 2. Линейный генератор, управляемый часами [Goll.].

* Рис. В этой схеме выбираются только те знаки, которые соответствуют единице в последовательности *. Для таких шифров также построены ус пешные корреляционные атаки.

Пример 3. Генератор Шнорра [Schnorr 88].

f f r Рис. n Сложность восстановления f ~ n2 + O(n).

3.2. Синхронизация поточных шифров.

ОТ Канал ШТ ОТ Рис. В этой схеме гамма должна вырабатываться синхронно. Если проис ходит сбой, то рассматриваются две схемы: перезапуск и самовосстановле ние.

1. Автономный поточный шифр (требует перезапуска при сбое).

f f Рис. В этой схеме функция f зависит от ключа, а начальное заполнение РСЛС передается по каналу для синхронизации шифров при перезапуске.

2. Самовостановление.

f f Рис. При передаче и приеме содержимое регистров заполняется ширтек стом. Функция f зависит от ключа. При сбое бита в канале расшифрования не происходит, пока искаженный бит находится в регистре. После того, как искаженный бит покидает регистр, правильное расшифрование восстанав ливается автоматически. Таким образом, происходит самовосстановление синхронной работы шифраторов на передающем и принимающем узлах.

3.3. Синтез блочных шифров.

Пусть по-прежнему преобразование Y=T(x,k) должно давать трудоем кость восстановления К не ниже порога по всем известным методам криптоанализа блочных шифров.

Основная идея достигнуть этого (по Шеннону) - итерация простых шифров. Однако, надо иметь в виду, что не всегда суперпозиция простых шифров дает сложный шифр.

Определение 1. Шифр обладает свойством С, если статистические свойства шифртекста “сложно” зависят от статистических свойств откры того текста.

Определение 2. Шифр обладает свойством D, если а) каждый знак открытого текста (ОТ) влияет на все знаки шифртекста б) каждый знак ключа влияет на знаки шифртекста (ШТ).

Необходимыми условиями стойкости блочных шифров являются свойства С и D.

Рассмотрим два простых шифра: простую замену и перестановку.

1. Статистические характеристики шифртекста после простой замены равны по значениям статистическим характеристикам открытого текста.

Однако, если выписать значения вероятностей любой характеристики шифртекста через статические характеристики открытого текста, то необ ходимо использовать. Таким образом, сложность вычисления статисти ческих характеристик шифртекста не проще сложности вычисления.

Следовательно, простая замена может порождать свойство С.

2. Вероятности знаков шифртекста после перестановки совпадают с вероятностями знаков открытого текста. Поэтому их вычисление просто.

Однако другие статистические характеристики шифртекста (биграммы и т.д.) зависят от многих характеристик открытого текста (если открытый текст не является последовательностью независимых испытаний). Таким образом, перестановка может порождать свойство Д.

Следовательно, основная идея построения стойкого блочного шифра - композиция i (i=1,2,...,r) пар простых замен (с нелинейным преобра i зованием ) и перестановок.

i i По виду композиции различают два вида блочных шифров: каскадные шифры и произведение шифров.

а) Каскадный шифр представляет собой композицию простых шиф ров, когда ключ каждой операции выбирается независимо. Такие шифры подвергаются атаке “встреча по середине” (если ключи малы, то возможна атака “встреча по середине”, если ключи большие, то общий ключ очень большой).

б) Произведение шифров. Выбор ключей для каждой компоненты произведения производится по некоторому алгоритму из одного основно го.

Например, DES - произведение шифров.

Определение 3. Инволюцией называется преобразование f такое, что f = f -1, т.е. х f(f(x))=x.

Например, 1) f(x)= c - x (mod m) f(f(x))= f(x) + c = - ( - x+c)+ c = x.

2) Перестановки:

f(x1, x2, x3, x4)=(x3 x4 x1 x2).

f(f(x1, x2, x3, x4)=f(x3, x4, x1, x2)=(x1 x2 x3 x4).

Блоки для построения удобного шифрования, расшифрования [Massey 94].

1) Инволюции-перестановки:

Y PI PI X X Рис. 1.

2) Инволюции:

Y X In(·) In(·) X Y=In (X) Z Z Z Рис. 2.

3) Групповые шифры (например, гамма):

Y X X Z Z- Рис.3.

Здесь Y=X Z - операция в группе, Z-1 - обратный элемент к Z в группе.

Можно получить совершенный шифр для одноразового равновероят ного Z.

Утверждение 1. Если использовать инволюции в блоках, то шифро вание/расшифрование отличаются порядком ключей.

f f X —> —>....... —> —>Y K1 Km K Рис. 4. Шифрование.

f f Y...

Кm К К Рис. 5. Расшифрование.

Наиболее часто используются три способа построения блочного шифра:

а) Последовательность: инволюция, инволюция - перестановка (PI).

Примеры: DES;

FEAL;

LOKI.

б) Чередование группового шифра и инволюции. (при обращении надо брать Z-1i). Пример: PES.

в) Чередование группового шифра, инволюции, инволюции - пере становки, так что выполняется соотношение PI(a b)=PI(a) PI(b) Y X = X PI PI Z PI Z Рис. 6.

Действительно, PI(x PI(z))=PI(x) PI(PI(x))=PI(x) Z.

Пример: IDEA In(•) PI In(•) PI In(•) X..... Y Z(1) Z(2) Z(R) Z Рис. 7.Случай а).

При расшифровании изменяется порядок ключа.

In(•) In(•) Х.. Y ZA(1) ZB(1) ZA(R) ZB(R) ZA(R+1) Z Рис. 8. Случай б).

При расшифровании изменяется порядок ключей и каждый А-подключ за меняется на обратный в группе.

In(•) PI In(•) Х..... Y ZA(1) ZB(1) ZA(2) ZA(R) ZB(R) ZA(R+1) Z Рис. 9. Случай в).

При расшифровании изменяется порядок ключей, ключи ZA(1) и ZA(R+1) заменяются на обратные в группе, а все остальные А-подключи заменяются на обратные с перестановками следующим образом:

PI(Z-1)=(PI(Z))-1.

3.4. Слабости блочных щифров.

. Для блочных шифров характерны следующие слабости, которые мы иллюстрируем на примере DES [Massey 94]:

1. Морфизм DES.

Пусть Х- входной вектор, а X - его отрицание.

Теорема 1. DES( X, Z )= DES( X,Y ).

Д о к а з а т е л ь с т в о. Из отрицания Z,ключа Z следует, что все производных подключей Z,берутся с отрицанием. Если вместо Ri-1 и Zi в i алгоритме DES взять R и Z, i-1 i f(Ri-1,Zi)=f( R, Z ), i-1 i тогда при использовании R, L и Z получим отрицание Li и Ri i-1 i-1 i = R и L i i- Ri’= L f( R, Z )=Li-1 1 f(Ri-1,Zi)=Li-1 f(Ri-1,Zi)= R.

i-1 i-1 i i Теорема доказана.

Замечание 1. Слабость используется при опробовании.

2. Слабые ключи DES.

Определение 1. Ключ К называется слабым ключом DES, если DESk(•)=DESk-1(•), то есть Y=Dk(X) и X=Dk(Y).

Известно, что DES имеет 4 слабых ключа 00000001 11111110 11100000 4 11110001 00011111 4 00001110 В случае слабого ключа возможно частичное дешифрование при на личии достаточно длинных открытого текста и шифртекста.

3. Полуслабые ключи DES.

Определение 2. Ключ К называется полуслабым ключом, если суще ствует К1=К такой, что DES (•)=DES-1K(•).

K DES имеет не менее 12 полуслабых ключей.

Опасность состоит в том, что преобразования, реализуемые DES для различных ключей, могут образовать группу. Тогда при суперпозиции пре образований для К1 и К2 может существовать ключ К3 такой, что DK1(DK2(•))=DK3(•).

В этом случае усиления DES при тройном DES не произойдет.

Замечание 2. В 1992 году Wernsdorf доказал, что множество DK, k V64 не образует группу и нет подгрупп.

} { 4. Зависимость знаков шифртекста от знаков открытого текста.

Доказано, что в DES при выбранных перестановках это свойство достигается на 4 циклах (т.е. через 4 цикла каждый бит в выходном блоке зависит от каждого бита во входном блоке).

3.5. Алгоритм IDEA.

Рассмотрим другие способы реализации свойства D в блочных шиф рах. В алгоритме IDEA [Massey 94] свойство D достигается использовани ем следующей схемы.

М-А-бокс IDEA:

U1 U ZB + ZB + T1 T Рис. 1. М-А-бокс IDEA.

Здесь - умножение в мультипликативной группе поля Z*216+1 = GF( 216+1)*, где 216+1 - простое множество для n = 1,2,4,8,16;

+ - сложение по mod 216.

Здесь каждый выход зависит от всех четырех входов.

Для реализации свойства С в IDEA используется следующая схема + + Y=X ZA, т.е. (Y1,Y2,Y3,Y4)=(X1 ZA1, X2 ZA2, X3 ZA3, X4 ZA4) (X1,X2) (X3,X4) (X1 X3,X2 X4) • • M-A ZB ZB • (T1,T2) (Y1,Y2)=(X1 T1,X2 T2) (Y3,Y4)=(X3 T1,X4 T2) Рис. 2.

Алгоритм IDEA - итеративный блочный алгоритм, в котором описан ные преобразования используются следующим образом.

X1 X2 X3 X Z(1) Z(1)2 Z(1)3 Z(1) + + • • Z(1) + Z(1) +....

7 раундов Z(9)1 Z(9)2 Z(9)3 Z(9) выходное + + преобразование Y1 Y2 Y3 Y Рис. 3.

При расшифровании используют алгоритм шифрования с изменени ем порядка использования ключей.

Глава 4. Системы с открытым ключом.

4.1. Алгоритм Евклида и его сложность.

Рассмотрим математические вопросы, связанные с шифрами, использующие операции с целыми числами. Обозначим N – множество натуральных чисел, N - множество натуральных чисел с 0, Z –множество целых чисел. Если a,b Z, b 0, то по теореме Евклида существует единственная пара целых чисел q, r таких, что a = bq + r, 0 r < b. (1) Здесь r называется остатком. Существует несколько обозначений для остатков:

r = R (a), r = a(mod b) и другие.

b Простейшие свойства остатков.

1. R-b (a) = Rb (a), так как a = q b + r a = (-q)(-b) + r 0 r <| b | 0 r <| b | 2. R (a + ib) = R (a), i Z, b b так как a + ib = (q + i)b + r.

Если r = 0, то b делит a (обозначается b/a).

Из свойства 1 следует, что, если а делится на d, то а делится на –d.

Поэтому среди всех общих делителей а и b существует наибольший натуральный делитель (обозначается НОД(а, b)). Если НОД(а, b) = 1, то а и b взаимно просты.

Лемма 1. Для любых а, b, i Z НОД(а, b) = НОД(а+ ib, b).

Д о к а з а т е л ь с т в о. Если d/a, d/b, то a = Q1d, b = Q d. Тогда a + ib = d( Q1+ iQ ), то есть d/(a + ib). Значит НОД(а, b) НОД(а+ ib, b).

Аналогично, пусть d/(a + ib) и d/b, то есть a + ib = Q1d, b = Q d. Тогда a = d( Q1- iQ ), то есть d/a. Это значит, что НОД(а, b) НОД(а+ ib, b). Из полученных неравенств следует, что НОД(а, b) = НОД(а+ ib, b). Лемма доказана.

Равенство в следующей лемме называется рекурсией Евклида.

Лемма 2. Для любых n1, n Z, n 0, 2 НОД (n1, n2 ) = НОД (n2, Rn2 (n1)).

Д о к а з а т е л ь с т в о. Так как n1 = n q +R ( n1 ), то по лемме 1:

2 n НОД(n1, n ) = НОД(n1-q n, n ) = (R ( n1 ), n ).

2 2 2 n2 Лемма доказана.

Следствие. Если НОД(n1,n ) = НОД(R (n1),n ) = 2 n2 = НОД(R, R ( n1 )= …=НОД(0, r), Rn2 (n1) n то r = НОД(n1, n ). (2) Данный способ нахождения НОД(n1,n ) называется алгоритмом Евклида.

Пример 1.

НОД(54,30) = НОД(24,30) = НОД(6,24) = НОД(0,6) = 6, НОД(156,117) = НОД(39,117) = НОД(0,39) = 39.

В криптографии возможность применения любого алгоритма определяется сложностью этого алгоритма. Оценим сложность алгоритма Евклида. Будем считать за одну операцию одно деление в алгоритме Евклида. Отметим, что каждое равенство в (2) связано с одной операцией деления. Обозначим через m(d) минимальное число n1> 0, для которого существует n, n1> n >0 такое, что НОД(n1, n ) вычисляется при помощи 2 2 (2) за d операций деления.

Легко вычислить m(d) для малых значений d.

m(1) = 2 (n1 = 2, n = 1);

m(2) = 3 (n1 = 3, n = 2);

m(3) = 5 (n1 = 5, n = 3).

Пусть n1 = m(d) и n - такое, что НОД(n1, n ) вычисляется за d шагов 2 алгоритма Евклида (2). Обозначим n1 = q1 n + r, n = q r + r. Тогда для 2 2 2 вычисления НОД(n, r) надо (d –1) операции в алгоритме Евклида, а для вычисления НОД(r, r ) надо (d –2) операции в алгоритме Евклида. Из определения n1 следует m(d) = q1 n + r. (3) Вместе с тем, n m(d-1). Это следует из того, что для n существует r, 2 позволяющее вычислять НОД(n, r) за (d –1) делений, а m(d-1) – наименьшее из натуральных чисел, обладающих этим свойством.

Аналогично, для нахождения НОД(r, r ) требуется (d –2) деления, а m(d-2) – наименьшее из таких чисел. Тогда r m(d-2). Из этих оценок и (3) следует, что m(d) m(d-1) + m(d-2). (4) Рассмотрим рекуррентное соотношение Ф(d) = Ф (d-1) + Ф (d-2). (5) При начальных условиях Ф(1) = 2, Ф(2) = 3. Тогда из неравенства (4) и равенства (5) и начальных значений Ф(1) = m(1), Ф(2) = m(2) следует, что Ф(d) m(d) для всех d 1. Рекуррентное соотношение (5) определяет числа Фибоначчи (1202 г.). Найдем эти числа методом производящих d функций. Пусть Ф(d) x = Ф(x) – формальный ряд. Для d d = d d -1 2 d- Ф(d) x = xФ(d-1)x + x Ф(d-2)x.

Суммируем по допустимым d.

d d -1 2 d- Ф(d) x = x Ф(d-1)x + x Ф(d-2)x.

d =3 d =3 d = Отсюда 2 Ф(x) – 3x -2x = x(Ф(x) – 2x) + x Ф(x).

2 Ф(x)(1 - x - x ) = x + 2x.

x2 + 2x x +1 x + Ф(x) = = -1 - = -1 - = 1+ 5 1- 1- x - x x2 + x - (x + )(x + ) 2 5 -1 1+ ( ) ( ) 2 = -1 - -.

1+ 5 1- 5(x + ) 5(x + ) 2 d d 5 + 3 5 + 5 5 - 3 5 - 1 (d) = + (1,171)(1,618)d.

10 2 10 Отсюда d 1,44log2 (d) - 0,328.

Тогда из неравенства Ф(d) m(d) следует d 1,44 log m(d).

Следовательно, для всех n d 1,44log2 n определяет верхнюю границу сложности алгоритма Евклида.

Пример 2.

n 10100 d 1,44 log2 10100 478.

Существуют другие алгоритмы вычисления НОД. Алгоритм Стейна [Massey 94] основан на следующих равенствах:

1. если n1 и n2-чётные, то n1 n НОД(n1,n2 ) = 2НОД(, );

2 2. если n1-чётное, n2-нечётное, то n НОД(n1,n2) = НОД(,n2 );

3. если n1 и n2-нечётные, то n1 - n НОД(n1,n2 ) = НОД(,n2 ).

Сложность алгоритма Стейна. Пусть µ(s) – минимальное значение n1+ n2, что s делений потребуется для нахождения НОД(n1, n2 ), n1 n2 > 0. Тогда s log2 n1 +1. (6) Пример 3.

µ(1)=2 ( n1=1, n2 =1);

µ(2)=4 ( n1=3, n2 =1).

4.2. Арифметика остатков Определение 1. a сравнимо с b по модулю n a b(n), (1) если R (a) = R (b).

n n Отношение (1) есть отношение эквивалентности. Это отношение разбивает на непересекающиеся классы вычетов. Класс вычетов будем обозначать [a], a,b [a] a b(n).

/ n = {[a]} -коммутативное кольцо:

1. [a] + [b] = [a + b] корректно определенная коммутативная, ассоциативная операция.

2. [a] [b] = [a b] корректно определенная коммутативная, ассоциативная операция.

3. ([a] + [b]) [c] = [a c] + [b c].

Докажем, что результат операции сложения не зависит от выбора представителей (корректность).

~ + r, a + b = nq1 +r1 +nq + r, r1 + r = n q 2 2 ~ + r.

a + b = nq1 +r1 +nq1 + r, r1+ r = n q 1 2 2 Для операции умножения корректность доказывается аналогично.

Лемма 1.

a [b] a - b = kn.

Доказательство непосредственно следует из (1).

Лемма 2. В любом классе вычетов существует единственное наименьшее неотрицательное число.

Д о к а з а т е л ь с т в о.

a N, a [a] r < n r [a].

Если a > n: a = qn + r, r < n, то a – r = qn и по лемме 1 r [a].

Докажем единственность от противного. Предположим, что r1 r, r1 < n, r1 [a]. Пусть r1 < r, тогда r - r1 = qn > 0 q 1, но так как r < n, r1 < n, то r - r1 < n – противоречие. Следовательно, не существует такого r1. Лемма доказана.

С другой стороны, a,b, a > b > 0, Rb (a) = r = a(modb).

Следующие свойства остатков важны для дальнейшего.

1. (c d)(modb) = (c(modb) d(modb))(modb), где {+, -, }.

2. (a(c+d))(modb) = ( (ac)(modb) + (ad)(modb))(modb).

Использование вычетов в криптографии основано на существовании алгоритма быстрого возведения в степень.

Пусть a22(modn) = (a2 )2(modn) = (a2(modn))2 (modn), где a2 (mod n) – остаток от деления a2 на n, следовательно, его проще возводить в квадрат, чем число a2. Таким образом, любая степень числа два позволяет быстрее возводить в степень, если последовательно приводить промежуточные результаты по модулю n.

k a2 mod n = ((a2 (mod n))2 (mod n))2 (mod n) K Если х – произвольное число, то существует представление x = a0 20 + a1 21 + K + ak 2k и тогда возведение в степень опирается на быстрый алгоритм возведения в степень числа 2:

0 x a (mod n) = (aa02 (mod n) aa12 (mod n)Kaak 2k (mod n)) (mod n) Пример 1.

312(mod19) = (38 mod19)(34 mod19) (mod19);

34 (mod19) = (32(mod19))2 (mod19) = 92 (mod19) = 5;

38(mod19) = (34 (mod19))2 (mod19) = 52 (mod19) = 6;

312(mod19) = (6 5)(mod19) = 11.

Можно доказать, что возведение в степень k требует в среднем 1,5k операций.

4.3. Основные теоремы о вычетах.

Пусть n взаимно-простое с а число, а 0;

r =0, r1,…,r - 0 n- наименьшие неотрицательные представители различных классов вычетов mod n. Рассмотрим множество чисел:

u = (ar )(modn), u1 = (ar1)(modn),…, u = (ar )(modn).

0 0 n-1 n- Лемма 1. Числа u, u1,…, u - различные.

0 n- Д о к а з а т е л ь с т в о. Предположим противное. Тогда i >j:

ui = u и по лемме 1 п. 4.2 ari -ar = nq, q Z. Тогда j j a(ri -r ) = nq.

j Так как n простое и взаимно простое с a, то n делит (ri -r ). Однако по j лемме 1 п. 4.2 это противоречит тому, что ri и r выбирались из разных j классов вычетов. Лемма доказана.

Следствие 1. Числа u, u1,…, u - наименьшие неотрицательные 0 n- представители всех классов вычетов.

Следствие 2. Среди чисел u, u1,…, u есть 1.

0 n- Следствие 3. Если n простое, НОД(a,n) = 1, то уравнение ax 1(modn) имеет единственное решение с точностью до класса.

Доказательство следует из следствия 2.

Определение1. Функция Эйлера (n), nN, определяется как число натуральных чисел, меньших n и взаимно простых с n, то есть (n)= |{a: НОД(a,n) = 1, a

Если n простое, то (n)= n-1. Если n=pq, где p и q простые, то (n)=(p-1)(q-1).

Пусть для nN r1, r2,…, r (n) - все взаимно простые с n натуральные числа, меньшие n. Будем называть этот набор системой представителей для n. Пусть a Z и НОД(a,n) = 1. Рассмотрим набор чисел u1 = (ar1)(modn), u2 = (ar2)(modn),…, u (n) = (ar (n) )(modn). (2) Лемма 2. Если НОД(a,n) = 1, то набор чисел u1, u2,…, u (n) является системой представителей для n.

Д о к а з а т е л ь с т в о.

Сначала докажем, что [u1], [u2],…, [u (n) ] -различны. Предположим противное. Тогда существуют ui и u такие, что j ui u (modn).

j Отсюда следует ari -ar = nq при некотором q. Так как НОД(a,n) = 1, то в j произведении a(ri -r ) сомножитель (ri -r ) делится на n.Это значит, что ri j j и r лежат в одном классе вычетов по modn. Пусть ri > r, тогда j j ri -r =n. Это противоречит тому, что 0< ri -r 1, то из равенства ari = nq+ ui следует, что d|ari. Это противоречит (3). Отсюда следует, что u1, u2,…, u (n) - система представителей. Лемма 2 доказана.

Лемма 2 является основой для доказательства ряда важных для криптографических приложений результатов.

Теорема 1. Если nN, aZ, НОД(a,n) = 1, то уравнение ax 1(modn) имеет единственное решение в кольце вычетов по modn.

Д о к а з а т е л ь с т в о. Так как 1 принадлежит системе представителей для n, то в наборе u1, u2,…, u (n) из леммы 2 найдется 1.

Соответствующее ri такое, что 1= ui = ari (modn) определяет искомое. Теорема доказана.

Теорема 2 (Обобщенная теорема Евклида). Для любых a и b из Z найдутся u, v из Z, такие, что au + bv = НОД(a,b).

Д о к а з а т е л ь с т в о. Пусть сначала НОД(a,b) = 1, тогда по теореме 1 уравнение ax 1(modb) имеет единственное решение x u(modb) в кольце вычетов по модулю b. Это означает, что при некотором v:

au-1=bv.

Если НОД(a,b)=d, то a=a1 d, b=b1 d и НОД(a1,b1 ) = 1. Тогда для a1 и b1 найдутся u и v, что a1 u+b1 v=1. Умножая обе части равенства на d, получим требуемое равенство. Теорема доказана.

Теорема 3 (Теорема Эйлера). Если nN, aZ, НОД(a,n) = 1, то a ( n ) (modn)=1.

Д о к а з а т е л ь с т в о.

Из леммы 2 следует, что если r1, r2,…, r (n) - система представителей для n, то u1 = (ar1)(modn), u2 = (ar2)(modn),…, u (n) = (ar (n) )(modn).

также система представителей для n. Тогда u1u2… u (n) r1r2… r (n) (modn) и u1u2… u(n) ar1ar2…a r(n) (modn).

Из этих равенств при некотором q имеем r1r2… r(n) = a ( n ) r1r2… r (n) + nq. (4) Так как НОД(ri,n)=1, i=1,…, (n), то НОД(r1r2… r (n),n)=1. Поэтому в ра венстве (4) q делится на r1r2… r (n). Отсюда получаем 1= a ( n ) +nq’.

Полученное равенство эквивалентно утверждению теоремы.

Следствие 4 (Малая теорема Ферма). Если n - простое число, НОД(a,n)= 1, то n - a 1(modn).

Следствие 5. Если НОД(a,n) = 1, то - a a ( n ) -1 (modn).

То есть, при известном значении функции (n) обращение в кольце вычетов сводится к возведению в степень.

В заключение приведем без доказательства полезную теорему [Massey 94].

Теорема 4. (Китайская теорема об остатках).

Пусть m1, K,mk, НОД (mi,m ) = 1, i j. Тогда для j r1, K,rk, 0 ri < mi, i = 1,k единственное решение 0 x < n = m1 K mk системы Rm (x) = ri i = 1, K,k.

i 4.4. Квадратичные вычеты.

Пусть р- простое, а < р, р>2.

Определение 1. а – квадратичный вычет x : x2 a( p).

Пример 1. Пусть р = 7, тогда 1, 2, 4 – квадратичные вычеты, а 3, 5, 6 – не квадратичные вычеты:

12 = 1 1 (mod7) 22 = 4 4 (mod7) 32 = 9 2 (mod7) x : x2 = 3, 5, 6 (mod 7) / 42 = 16 2 (mod7) 52 = 25 4 (mod7) 62 = 36 1 (mod7) p -1 p - Теорема 1. Существует квадратичных вычетов и не 2 квадратичных вычетов в GF(p). У каждого квадратичного вычета суще p -1 p - ствуют два корня 1 и 2 такие, что 0 < 1, < 2 p -1, 2 где 1 называется основным корнем.

Д о к а з а т е л ь с т в о. ( p) (-)2 ( p). При p > 2 [] [-], следовательно, уравнение = x (modp) имеет не ме 2 нее двух корней. Если = (modp) и = (modp), то 2 - 0( p), ( - )( + ) 0( p).

Тогда или -(n) или (n). Отсюда имеет ровно два значения корня квадратного или ни одного. Ровно половина ненулевых элементов GF(p) есть квадратичные вычеты.

( p -1)(q -1) Теорема 2. Если n = p q, где p, q – простые, то квадратичных вычетов по modn и у каждого квадратичного вычета корня.

4 Пример 2. n = 35 = 5 7 = 6 квадратичных вычетов по mod 35: 1, 4, 9, 11, 16, 29. Каждый квадратичный вычет имеет ровно 4 кор ня.

Определение 2. Для целого а и простого p>2 символ Лежандра опре деляется следующим образом:

L(a, p) = 0, если р/а;

L(a, p) = 1, если а- квадратичный вычет по mod p;

L(a, p) = -1, если а- не квадратичный вычет по mod p.

p- Теорема 3. L(a, p) = a (mod p).

Д о к а з а т е л ь с т в о.

p- 1. p / a ( p а) (mod p) = 0.

2. а- квадратичный вычет, то есть x2 = a (mod p). Тогда по теореме Ферма p-1 p- p- 2 a (mod p) = x (mod p) = x 1 (mod p).

p - Таких a ровно. Рассмотрим уравнение p- x 1 (mod p).

Любое а – его корень. Отсюда каждое a является корнем одного из сомно жителей в следующем уравнении:

p-1 p- 2 (x -1)(x +1) 0 (mod p).

p - Значит, значений квадратичных вычетов а являются корнями урав нения p- x -1 0 (mod p).

Тогда по основной теореме алгебры остальные а, не являющиеся квадра тичными вычетами, являются корнями уравнения p- x +1 0 (mod p).

Если а- не квадратичный вычет, тогда p- a = -1(mod p).

Теорема доказана.

Определение 3. Пусть р- простое, g < p. g называется примитивным элементом мультипликативной группы поля GF(p) (или примитивным эле a ментом по mod p), если 0 < n p-1 a: n g (mod p).

Пример 3. При p = 11, 2 есть примитивный мультипликативной груп пы GF(11).

210 = 1024 1 (mod11);

21 = 2 2(mod11);

28 = 256 3(mod11);

22 = 4 4(mod11);

24 = 16 5(mod11);

29 = 519 6(mod11);

27 = 128 7(mod11);

23 = 8 8(mod11);

26 = 64 9(mod11);

25 = 32 10(mod11).

Каждое число n(1;

10) может быть представлено в виде 2а (mod p).

Для р = 11 числа 2, 6,7,8 являются примитивными элементами муль типликативной группы GF(11). Остальные не являются примитивными элементами.

Замечание. В GF(p) (p-1) примитивных элементов.

Нахождение примитивного элемента, вообще говоря, не является про стой задачей. Примитивный элемент находится легко, если известна фак торизация р-1. Пусть g1, K, gn - простые множители р-1. Для того чтобы проверить, является ли g примитивным элементом по mod p, вычисляется ( p-1) gi l = g (mod p), i = 1, n. Если для некоторого i это число равно 1, то g- не примитивный элемент. Если это не выполняется ни для какого i = 1, n, то g- примитивный элемент.

Пример 4. При р = 11 имеем р - 1 = 10 = 2 5. Проверим, что число является примитивным элементом мультипликативной группы GF(11).

(11-1) 2 = 4(mod11) 1, (11-1) 2 = 10(mod11) 1, следовательно, 2 – примитивный элемент. Проверим 3.

(11-1) 3 = 9(mod11) (11-1) 3 = 243(mod11) = 1, следовательно, 3 не примитивный элемент мультипликативной группы GF(11).

4.5. Факторизация. Логарифмирование в конечных полях.

Факторизация числа означает нахождение его простых множителей.

Пример 1.

10 = 2 5, 60 = 2 2 3 5, 252601 = 41 61 101, 2113- 1 = 3391 23279 65933 1868569 1066818131868207.

Проблема факторизации – одна из старейших в теории чисел. Слож ность самого быстрого алгоритма факторизации [Schn96]:

ln n ln ln n e Пусть (n) – число простых чисел n.

Теорема. (Чебышева о числе простых чисел [Massey 94]).

(n) lim = 1.

n n ln n Все современные тесты на простоту основаны на обобщениях теоре мы Ферма.

N Если имеет порядок N ( =1(modp)) в мультипликативной группе 0 2 N - поля GF(p), что предполагает, что = 1,,, K, - различны, и i =, где 0 i < N. Тогда i называется дискретным логарифмом от по основанию и обозначается i = log.

x y = f (x) =, 0 x < N, c - x = f (y) = log y при этом:

(1) вычислять экспоненту легко: требуется не более 2[log2 N] операций в алгоритме быстрого возведения в степень;

(2) вычисление дискретного логарифма в GF(p) является очень сложной задачей, когда р-1 имеет большой простой множитель.

Для вычисления x = loga y в GF(p), когда имеет мультипликатив N ный порядок N ( =1(modp)), используют алгоритм Shank [Massey 94].

Выбирается некоторое целое d, где d N.

Тогда x = Qd + r, 0 r < d N и N 0 Q < N.

Далее все вычисления ведутся в GF(p).

- 1. Для = 0, 1, …, d-1 вычисляем а = aa и запоминаем (, ) = log ( ) - это все логарифмы такие, что log < d.

2. Составляем таблицу (,log ) для 0 log < d – таблицу малых логарифмов.

-d N -d 3. Вычисляем = с помощью алгоритма быстрого возведе ния в степень.

Заметим, что x Qd +r y = = = aQd ar, -Qd r y = и, следовательно, -d y( )Q = ar.

-d -d 4. Для q = 0, 1, 2, … вычисляем y ( )q до тех пор, пока y ( )q не станет равным некоторому = в таблице.

qd + qd qd -d 5. Тогда x = qd + и = = y( )q = y.

Сложность алгоритма имеет порядок 2 N операций умножения и память N.

Пример 2. Найдем x = log513, здесь 5- примитивный элемент GF(23), и N = 22 (522 = 1(mod23)).

(0) d = (1) 50 = 51 = 52 = 25 = 53 = 5 2 = 10 3 операции умножения.

54 = 510 = (2) log 1 2 4 5 10 -d N -d (3) = = 17 = 16 1 = = 5 5 = 4 -d = 2 2 = 4 = 3 5 = = 4 4 = 16 = 16 16 = (4) y = 13 не принадлежит входу в таблице (q = 0).

y -d = 1315 = 11 не принадлежит входу в таблице (q = 1), 2 операции умножения -d -d (y ) = 1115 = 4 принадлежит входу в таблице при q = 2.

Следовательно, (4, 4) = (4, ) x = qd + = 25 + 4 = 14.

x = log513 = и для его нахождения требуется 5 операций умножения.

Проблема дискретного логарифмирования упрощается, если основа ние логарифма имеет порядок N и N = N1 N2 и сводится к дискретному логарифмированию по основанию, имеющему порядок N1, и дискретному логарифмированию по основанию, имеющему порядок N2.

Алгоритм [Massey 94] нахождения дискретного логарифма, когда ос нование логарифма имеет порядок N и N = N1 N2 приведен ниже. Пусть N x = log y (a = 1, N = N1 N2 ).

N (0) Вычисляем y1 = y с помощью алгоритма быстрого возведения в степень.

N (1) Вычисляем 1 = с помощью алгоритма быстрого возведения в степень.

(2) Находим x1 = log1 y1.

N -x (3) Вычисляем с помощью алгоритма быстрого возведения в сте пень.

N -x (4) Вычисляем y2 = y.

N (5) Вычисляем 2 = с помощью алгоритма быстрого возведения в степень.

(6) Находим x2 = log2 y2.

(7) Получаем x = x N1 + x1.

4.6. Схема RSA.

RSA [Schn 96] используется как для шифрования, так и для подписи.

Выберем p и q – большие простые числа. Пусть модуль n = pq, функ ция (n) = (p-1)(q-1) – функция Эйлера. Возьмем произвольное 1 е<(n) такое, что НОД(е, (n)) = 1. Тогда существует единственное 1 d <(n) такое, что ed(mod(n)) = 1.

Система шифрования RSA – это система с открытым ключом, где е –открытый, а d – секретный ключи. Если 0 x

С = хe (mod n).

Возможность расшифрования следует из следующей теоремы.

Теорема 1. Если p и q – большие простые числа, ed(mod(n)) = 1, то х, 0 x

d (хe ) (modn) = x.

Д о к а з а т е л ь с т в о. Пусть НОД(х, n) =1. Тогда d e d k(n)+ (хe ) = х = x.

Поэтому по теореме Эйлера d (хe ) (modn) = (х( x(n) (modn)))(modn)= (x 1)(modn) = x.

Если НОД(х,n) 1, то или х =0(modn), или НОД(х,n) = p, или НОД(х,n) = q.

Если х =0(modn), то хe d =0(modn). Пусть НОД(х,n) = p. Тогда х = х1p, где (х1, n) =1.

e d k( p-1)(q-1)+1 k( p-1)(q-1) k( p-1)(q-1) х = x = px1p x1 y(modpq).

Если mp= y(mod(pq)), то mp = pqk + y, следовательно, y = py1. Тогда m y1(modq. Следовательно, k( p-1) q- x1((pх1) ) y1 (modq).

Pages:     || 2 |



© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.