本文正在参加「金石计划 . 分割6万现金大奖」

hello,我们好,我是张张,「架构精进之路」公号作者。

一旦提到加密算法,常常有人会有这样的疑问:MD5 究竟是不是一种加密算法呢?

在答复这个问题之前,我们需要先弄清楚两点:

  • 什么是加密算法?

  • 什么是 MD5?

1、什么是加密算法?

数据加密的基本进程就是对本来为明文的文件或数据按某种算法进行处理,使其成为不可读的一段代码为“密文”,使其只能在输入相应的密钥之后才能显示出原容,经过这样的途径来达到维护数据不被非法人窃取、阅览的目的。 该进程的逆进程为解密,即将该编码信息转化为其本来数据的进程。

— 来自《百度百科》

运用密码学能够达到以下三个目的:

  • 数据保密性:避免用户的数据被窃取或走漏;

  • 数据完好性:避免用户传输的数据被篡改;

  • 身份验证:确保数据来源与合法的用户。

加密算法分类

常见的加密算法大体能够分为两大类:对称加密和非对称加密。

  • 对称加密

对称加密算法就是用一个秘钥进行加密和解密。

  • 非对称加密

与对称加密算法不同的是,进行加密与解密运用的是不同的秘钥,有一个公钥-私钥对,秘钥正确才能够正常的进行加解密。

2、什么是MD5?

MD5算法:MD5全称Message Digest Algorithm 5,即音讯摘要算法第5版。

MD5 以 512位分组来处理输入的信息,且每一分组又被划分为16个32位子分组,经过了一系列的处理后,算法的输出由四个32位分组组成,将这四个32位分组级联后将生成一个128位散列值。

MD5算法的主要特点:

  • 长度固定

MD5加密后值固定长度是128位,运用32个16进制数字进行表示。

  • 单向性

假如告诉原始音讯,算法是MD5,迭代次数=1的情况下,我们相同能够得到一摸相同的音讯摘要,可是反过来却不行。

  • 不可逆

在不知道原始音讯的前提下,是无法凭仗16个字节的音讯摘要(Message Digest),还原出原始的音讯的。

下面这个音讯摘要,你知道他的原始信息是什么吗?

Message Digest = '454e2624461c206380f9f088b1e55fae'

其实,原始信息是以下长长的字符串:

93eyHv2Iw5kbn1dqfBw1BuTE29V2FJKicJSu8iEOpfoafwJISXmz1wnnWL3V/0NxTulfWsXug
OoLfv0ZIBP1xH9kmf22jjQ2JiHhQZP7ZDsreRrOeIQ/c4yR8IQvMLfC0WKQqrHu5ZzXTH4NO3
CwGWSlTY74kE91zXB5mwWAx1jig+UXYc2w4RkVhy0//lOmVya/PEepuuTTI4+UJwC7qbVlh5z
fhj8oTNUXgN0AOc+Q0/WFPl1aw5VV/VrO8FCoB15lFVlpKaQ1Yh+DVU8ke+rt9Th0BCHXe0uZ
OEmH0nOnH/0onD
  • 稳定性

假如依照以上示例的原始信息,我们与我核算出来的音讯摘要不相同,那肯定你是运用了一个假的 MD5 工具,哈哈哈。

当原始音讯恒守时,每次运转MD5发生的音讯摘要都是稳定不变的,不管是谁来核算,结果都应该是相同的。

  • 不可预测性

让我们再来测验一次,「不可逆」中应用到的原始音讯的最后一个字母’D’,修改成’E’,如下所示:

93eyHv2Iw5kbn1dqfBw1BuTE29V2FJKicJSu8iEOpfoafwJISXmz1wnnWL3V/0NxTulfWsXug
OoLfv0ZIBP1xH9kmf22jjQ2JiHhQZP7ZDsreRrOeIQ/c4yR8IQvMLfC0WKQqrHu5ZzXTH4NO3
CwGWSlTY74kE91zXB5mwWAx1jig+UXYc2w4RkVhy0//lOmVya/PEepuuTTI4+UJwC7qbVlh5z
fhj8oTNUXgN0AOc+Q0/WFPl1aw5VV/VrO8FCoB15lFVlpKaQ1Yh+DVU8ke+rt9Th0BCHXe0uZ
OEmH0nOnH/0onE

那经 MD5 后发生的音讯摘要,是不是和 ‘454e2624461c206380f9f088b1e55fae’ 很类似呢?

让我们绝望了,发生的音讯摘要没有一丝一毫的关联性,新的音讯摘要如下所示:

Message Digest = '8796ed5412b84ff5c4769d080b4a89a2'

聊到这里,忽然想到一个有意思的问题:

MD5是32位的,理论上是有限的,而世界上的数据是无限的,那会不会生成重复的MD5值?

是不是也有同学发生类似的疑问呢?

理论上来讲,当然会生成重复的MD5值。

共享一个经典的比如:

  • 数据源1:

    d131dd02c5e6eec4693d9a0698aff95c2fcab58712467eab4004583eb8fb7f89
    55ad340609f4b30283e488832571415a085125e8f7cdc99fd91dbdf280373c5b
    d8823e3156348f5bae6dacd436c919c6dd53e2b487da03fd02396306d248cda0
    e99f33420f577ee8ce54b67080a80d1ec69821bcb6a8839396f9652b6ff72a70

  • 数据源2:

    d131dd02c5e6eec4693d9a0698aff95c2fcab50712467eab4004583eb8fb7f89
    55ad340609f4b30283e4888325f1415a085125e8f7cdc99fd91dbd7280373c5b
    d8823e3156348f5bae6dacd436c919c6dd53e23487da03fd02396306d248cda0
    e99f33420f577ee8ce54b67080280d1ec69821bcb6a8839396f965ab6ff72a70

它们居然有着共同的MD5值(☞ 留意看,数据源1、2是存在许多细节不同的):

79054025255fb1a26e4bc422aef54eb4

3、MD5是加密算法吗?

MD5核算,对原始音讯(Message)做有损的紧缩核算,不管音讯(输入值)的长度字节是多少,是1亿字节还是1个字节,都会生成一个固定长度(128位/16字节)的音讯摘要(输出值)。

也就是说,MD5 算法和加密算法都能够将信息转换为别的一种内容,可是,MD5 算法比照 加密算法 缺少了解密进程。

好比一头山羊,被层层加工制作成一包包风干羊肉,这个就是一次MD5操作。这种加工进程,势必将羊身体N多部位有损失,故无法经过羊肉干再恢复出一头山羊…

运用 加密算法 加密后的音讯是完好的,而且基于解密算法后,能够恢恢复始数据。而 MD5 算法 得到的音讯是不完好的,而且经过摘要的数据也无法得到原始数据。

所以严格意义上来讲,MD5 称为摘要/散列算法更合适,而不是加密算法

那现实的问题来了,MD5究竟有什么用?

欢迎各位留言补充~

·················· END ··················

希望今天的讲解对我们有所帮助,谢谢!

Thanks for reading!

作者:架构精进之路,十年研制风雨路,大厂架构师,CSDN 博客专家,专心架构技术沉积学习及共享,工作与认知升级,坚持共享接地气儿的干货文章,期待与你一同成长。
关注并私信我回复“01”,送你一份程序员成长进阶大礼包,欢迎勾搭。