Network Working Group Request for Comments: 1321
R. Rivest
MIT Laboratory for Computer Science
and RSA Data Security, Inc.
April 1992
Алгоритм MD5
The MD5 Message-Digest Algorithm
Статус документа
Этот документ содержит информацию для сообщества Internet. Документ не задает каких-либо стандартов. Разрешается свободное распространение документа.
Благодарности
Автор благодарит Don Coppersmith, Burt Kaliski, Ralph Merkle, David Chaum и Noam Nisan за множество полезных комментариев и предложений.
Оглавление
1. Введение.
.1
2. Термины и обозначения ............................................................................................................................................................................. 1...
3. Описание алгоритма MD5 .................................................................................................................................................... ..... .. ................. 2
3.1 Этап 1. Добавление битов заполнения ............................................................................................................................ .................. 2
3.2 Этап 2. Добавление размера сообщения ............................................................................................................................. .............. 2
3.3 Этап 3. Инициализация буфера MD .................................................................................................................................................. 2...
3.4 Этап 4. Обработка сообщения блоками по 16 слов ......................................................................................................................... 2...
3.5 Этап 5. Вывод .................................................................................................................................................................................. ......3...
4. Заключение ................................................................................................................................................................................................ ..3..
5. Различия между MD4 и MD5 ................................................................................................................................................ ...................... 3
Литература ..................................................................................................................................................................................................... ..3...
Приложение A – Пример реализации ..................................................................................................................................................... ...... 4
A.1 global.h ........................................................................................................................................................................... ..... .... ................ 4
A.2 md5.h ..................................................................................................................................................................................... .. ............... 4
A.3 md5c.c ................................................................................................................................................................................................ ..5..
A.4 mddriver.c ..................................................................................................................................................................................... .. ....... 9
A.5 Тестовый набор ............................................................................................................................................................................ ....1..1.
Вопросы безопасности ............................................................................................................................................................. ...................... 12
Адрес автора ...................................................................................................................................................................................... ............. 12
1. Введение
В этом документе описывается алгоритм цифровых подписей1 MD5. Этот алгоритм принимает на входе сообщение произвольного размера и выдает в результате 128-битовый “отпечаток” ("fingerprint") или цифровую подпись ("message digest"). Предполагается, что потребуются нереальный объем вычислений для создания двух сообщений, цифровые подписи которых совпадут, или подбора сообщения по имеющейся цифровой подписи. Алгоритм MD5 предназначен для создания цифровой подписи (сигнатуры), когда требуется безопасно “сжать” большой файл перед тем, как шифровать его с использованием закрытого (секретного) ключа в системах с открытыми ключами типа RSA.
Алгоритм MD5 разработан для обеспечения достаточной скорости на 32-битовых машинах. В дополнение к этому MD5 не требует использования больших таблиц подстановки; кодирование алгоритма может быть достаточно компактным.
MD5 является расширением алгоритма цифровых подписей MD4 [1,2]. MD5 несколько медленней, чем MD4, но устроен более “консервативно”. Причиной разработки MD5 послужило ощущение того, что алгоритм MD4 может быть адаптирован для применения быстрее, нежели предполагалось; поскольку при разработке MD4 основным требованием была высокая скорость, он находится “на самом краю” допустимости в плане устойчивости к криптоаналитическим атакам. MD5 немного проигрывает в скорости, но существенно выигрывает в безопасности. Алгоритм MD5 открыт для обозрения (public domain) и возможно будет адаптирован в качестве стандартного.
Для приложений OSI идентификатор объекта MD5 имеет форму
md5 OBJECT IDENTIFIER ::= iso(1) member-body(2) US(840) rsadsi(113549) digestAlgorithm(2) 5}
В идентификаторе типа X.509 (AlgorithmIdentifier [3]) параметры для MD5 должны иметь тип NULL.
2. Термины и обозначения
значений, а “байт” - для последовательность байтов, в
восьмибитовых. которой каждая
В этом документе термин “слово” (word) используется для 32-битовых Последовательности битов могут интерпретироваться естественным путем как
1message-digest algorithm
Перевод RFC 1321
группа из 8 последовательных битов интерпретируется как байт, в котором старший (наиболее значимый) бит располагается первым. Подобно этому последовательность байтов может интерпретироваться как последовательность 32-битовых слов, в которой каждая группа из 4 последовательных байтов интерпретируется как слово, где младший (наименее значимый) указывается первым.
Запись x_i означает x i-ое (x[i]). Если индекс представляет собой выражение, оно будет заключаться в фигурные скобки x_{i+1}. Символ ^ используется для обозначения степени (экспонента) - x^i означает x в степени i.
Символ "+" обозначает сложение слов (т. е., сложение с использованием модуля 2^32). Запись X <<< s означает 32-битовое слово, полученное циклическим сдвигом X влево на s позиций. not(X) означает побитовое дополнение X, а X v Y побитовую операцию X OR Y (X ИЛИ Y). Запись X xor Y означает побитовую операцию X XOR Y (исключающее ИЛИ), а XY побитовую операцию X AND Y (X И Y).
3. Описание алгоритма MD5
Начнем с допущения о наличии на входе сообщения размером b битов, для которого нужно создать цифровую подпись. Здесь b означает неотрицательное целое число; b может принимать нулевое значение и не обязано быть кратным 8; это значение может быть неограниченно большим. Биты исходного сообщения будем представлять следующим образом:
m_0 m_1 ... m_{b-1}
Для создания цифровой подписи выполняется процесс из 5 описанных ниже этапов.
3.1 Этап 1. Добавление битов заполнения
Сообщение дополняется (padded) до размера, конгруэнтного 448 по модулю 512. Т. е., размер сообщения устанавливается таким, чтобы после добавления 64 битов размер был кратен 512. Заполнение производится во всех случаях, даже если размер исходного сообщения конгруэнтен 448 по модулю 512.
Заполнение происходит следующим образом: сначала в конце сообщения добавляется один бит, имеющий значение "1", а потом добавляются биты, имеющие значение "0" до размера, конгруэнтного 448 по модулю 512. В любом случае число добавляемых битов не может быть меньше 1 м больше 512.
3.2 Этап 2. Добавление размера сообщения
64-битовое представление b (размер исходного сообщения в битах) добавляется в конец результата предыдущего этапа. В редких случаях, когда b больше 2^64, используются только младшие 64 бита значения b. Биты добавляются в конце как два 32-битовых слова, в которых младший байт размещается в начале, как было условлено выше).
После этого размер полученного сообщения (исходное сообщение + заполнение + размер) будет кратен 512 битам. Следовательно,результирующее сообщение будет содержать целое число блоков по 16 слов (32 бита в каждом слове). Пусть M [0 ... N-1] обозначает слова полученного в результате сообщения; значение N кратно 16.
3.3 Этап 3. Инициализация буфера MD
Для расчета цифровой подписи используется буфер на 4 слова (A,B,C,D). каждое из слов A, B, C, D представляет собой 32-битовый регистр. Эти регистры инициализируются приведенными ниже значениями (шестнадцатеричное представление, сначала младший байт):
слово A слово B слово C слово D
01 23 45 67 89 ab cd ef fe dc ba 98 76 54 32 10
3.4 Этап 4. Обработка сообщения блоками по 16 слов
Сначала определим четыре дополнительных функции, каждая из которых принимает три 32-битовых слова в качестве аргументов и возвращает одно 32-битовое слово.
F(X,Y,Z) = XY v not(X) Z G(X,Y,Z) = XZ v Y not(Z) H(X,Y,Z) = X xor Y xor Z I(X,Y,Z) = Y xor (X v not(Z))
Для каждого бита функция F работает как условие – если X, то Y, иначе Z. Функцию F можно определить с использованием сложения (+) вместо операции ИЛИ (v), поскольку XY и not(X)Z никогда не будут давать 1 в одной битовой позиции. Интересно отметить, что при условии, когда биты X, Y и Z независимы и не образованы смещением (unbiased), каждый бит функции F (X,Y,Z) будет независимым и не будет образован смещением.
Функции G, H, I похожи на функцию F – фактически они действуют “параллельно по битам” для создания результатов по значениям X, Y, Z так, чтобы при независимых и не образованных смещением (unbiased) битах X, Y и Z каждый бит G(X,Y,Z), H (X,Y,Z) и I(X,Y,Z) также был независимым и не получался путем смещения. Отметим, что функция H представляет собой побитовую операцию “исключающее ИЛИ” (xor) или функцию “четности” (parity) переданных ей аргументов.
На этом этапе используется 64-элементная таблица T[1 ... 64], построенная с использованием синусоидальной функции (sine function). Пусть T[i] обозначает i-й элемент таблицы, который равен целой части произведения 4294967296 * abs(sin(i)), где i задано в радианах. Элементы таблицы приведены в приложении.
Ниже показана обработка блоков сообщения.
/* обработать каждый блок из 16 слов. */ For i = 0 to N/16-1 do
/* скопировать блок i в X. */ For j = 0 to 15 do
Set X[j] to M[i*16+j]. end /* цикл по j */
rfc.com.ru                                                                                     2                                                            rfc.com.ru
Перевод RFC 1321
/* сохранить A как AA, B как BB, C как CC, D как DD. */ AA = A BB = B CC = C DD = D
/* Круг 1. */
/* [abcd k s i] обозначает операцию a = b + ((a + F(b,c,d) + X[k] + T[i]) <<< s). */
/* Выполним следующие 16 операций. */
[ABCD
0
7
1]
[DABC
1
12
2]
[CDAB 2
17
3]
[BCDA 3
22
4]
[ABCD
4
7
5]
[DABC
5
12
6]
[CDAB 6
17
7]
[BCDA 7
22
8]
[ABCD
8
7
9]
[DABC
9
12
10]
[CDAB 10
17
11]
[BCDA 11
22
12]
[ABCD
12
7
13]
[DABC
13
12
14]
[CDAB 14
17
15]
[BCDA 15
22
16]
/* Круг 2. */
/* [abcd k s i] обозначает операцию a = b + ((a + G(b,c,d) + X[k] + T[i]) <<< s). */
/* Выполним следующие 16 операций. */
[ABCD
1
5
17]
[DABC
6
9
18]
[CDAB 11
14
19]
[BCDA
0
20
20]
[ABCD
5
5
21]
[DABC
10
9
22]
[CDAB 15
14
23]
[BCDA
4
20
24]
[ABCD
9
5
25]
[DABC
14
9
26]
[CDAB 3
14
27]
[BCDA
8
20
28]
[ABCD
13
5
29]
[DABC
2
9
30]
[CDAB 7
14
31]
[BCDA
12
20
32]
/* Круг 3. */
/* [abcd k s t] обозначает операцию a = b + ((a + H(b,c,d) + X[k] + T[i]) <<< s). */
/* Выполним следующие 16 операций. */
[ABCD
5
4
33]
[DABC
8
11
34]
[CDAB
11
16
35]
[ABCD
1
4
37]
[DABC
4
11
38]
[CDAB
7
16
39]
[ABCD
13
4
41]
[DABC
0
11
42]
[CDAB
3
16
43]
[ABCD
9
4
45]
[DABC
12
11
46]
[CDAB
15
16
47]
[BCDA 14 23 36] [BCDA 10 23 40] [BCDA 6 23 44] [BCDA 2 23 48]
/* Круг 4. */
/* [abcd k s t] обозначает операцию a = b + ((a + I(b,c,d) + X[k] + T[i]) <<< s). */
/* Выполним следующие 16 операций. */
[ABCD
0
6
49]
[DABC
7
10
50]
[CDAB
14
15
51]
[ABCD
12
6
53]
[DABC
3
10
54]
[CDAB
10
15
55]
[ABCD
8
6
57]
[DABC
15
10
58]
[CDAB
6
15
59]
[ABCD
4
6
61]
[DABC
11
10
62]
[CDAB
2
15
63]
[BCDA 5 21 52] [BCDA 1 21 56] [BCDA 13 21 60] [BCDA 9 21 64]
/* После этого добавим к каждому из 4 регистров значение, которое этот регистр имел до
начала выполнения этого блока. */ A = A + AA B = B + BB C = C + CC D = D + DD end /* цикл по i */
3.5 Этап 5. Вывод
Сигнатура сообщения выводится как A, B, C, D (т. е., мы начинаем вывод с младшего байта A и закачиваем старшим байтом D). На этом описание алгоритма MD5 завершается. Пример реализации на языке C дан в приложении.
4. Заключение
Алгоритм цифровых подписей MD5 прост в реализации и создает “отпечатки” (fingerprint) или цифровые подписи для сообщений произвольной длины. Предполагается, что для создания двух сообщений с одинаковыми сигнатурами потребуется порядка 2^64 операций, а для подбора сообщения по имеющейся сигнатуре – порядка 2^128 операция. Алгоритм MD5 был тщательно исследован на предмет поиска слабых мест. Однако алгоритм является достаточно новым и требуется дополнительный анализ, как и для всех новинок этого типа.
5. Различия между MD4 и MD5
Ниже перечисляются отличия алгоритмами MD5 от MD4.
1.   Добавлен “Круг 4”.
2.   На каждом этапе используется уникальная аддитивная константа.
3.   Функция G в круге 2 была изменена с (XY v XZ v YZ) на (XZ v Y not(Z)), чтобы уменьшить симметрию G.
4.   На каждом этапе добавляется результат предыдущего этапа. Это обеспечивает более быстрое возникновение “лавинного эффекта”.
5.   Изменен порядок доступа к входным словам для кругов 2 и 3, чтобы сделать результаты менее похожими.
6.   Оптимизировано количество сдвигов на каждом круге для достижения более быстрого “лавинного эффекта”. Смещения на каждом круге отличаются.
rfc.com.ru                                                                          3                                                                        rfc.com.ru
Перевод RFC 1321
Литература
[1] Rivest, R., "The MD4 Message Digest Algorithm", RFC 13202, MIT and RSA Data Security, Inc., April 1992.
[2] Rivest, R., "The MD4 message digest algorithm", in A.J. Menezes and S.A. Vanstone, editors, Advances in Cryptology - CRYPTO '90 Proceedings, pages 303-311, Springer-Verlag, 1991.
[3] CCITT Recommendation X.509 (1988), "The Directory - Authentication Framework."
Приложение A – Пример реализации
В этом приложении содержатся файлы, заимствованные из RSAREF: A Cryptographic Toolkit for Privacy-Enhanced Mail.
global.h – общий файл заголовков md5.h - файл заголовков для MD5 md5c.c – исходный код MD5
Для получения дополнительной информации об RSAREF пишите по адресу <rsaref@rsa.com>. В приложение включен также файл
mddriver.c – драйвер для тестирования MD2, MD4 и MD5
Драйвер по умолчанию компилируется для проверки MD5 и может быть скомпилирован для проверки MD2 или MD4, если в командной строке компилятора C задать для MD значение 2 или 4, соответственно.
Реализация переносима и должна работать на разных платформах. Однако ее несложно оптимизировать для конкретной платформы (оставим это в качестве упражнения для читателей). Например, для платформ типа "little-endian", где байт с наименьшим адресом в 32-битовом слове является наименее значимым и нет ограничений по выравниванию, вызов Decode в MD5Transform можно заменить преобразованием типа (typecast).
A.1 global.h
/* GLOBAL.H – типы и константы RSAREF */
/* Для PROTOTYPES следует использовать значение 1 тогда и только тогда, когда компилятор поддерживает прототипы аргументов в функциях. Приведенный ниже код устанавливает для PROTOTYPES по умолчанию значение 0, если этот параметр уже не задан флагами компилятора C.
*/ #ifndef PROTOTYPES #define PROTOTYPES 0 #endif
/* POINTER определяет базовый тип указателя */ typedef unsigned char *POINTER;
/* UINT2 определяет 2-байтовое слово */ typedef unsigned short int UINT2;
/* UINT4 определяет 4-байтовое слово */ typedef unsigned long int UINT4;
/* PROTO_LIST определяется в зависимости от определенного ранее значения PROTOTYPES.
При использовании PROTOTYPES список PROTO_LIST будет возвращать прототипы, иначе будет пустым.
*/ #if PROTOTYPES
#define PROTO_LIST(list) list #else
#define PROTO_LIST(list) () #endif