常见加密算法

GPT摘要

文章主要介绍了非可逆加密算法和可逆加密算法的原理和应用。在非可逆加密算法部分，介绍了MD5和SHA系列算法，以及它们在密码保存、文件完整性校验等方面的应用。同时提到了MAC和HMAC-SHA-256在确认消息完整性和身份认证中的作用。在可逆加密算法部分，介绍了凯撒密码和enigma机的原理，以及对称加密算法AES和非对称加密算法RSA的基本原理和应用场景。文章还简要讨论了密码攻击方法和SSL/TLS中非对称加密的应用。

引入

非可逆加密（hash function）：密码保存、文件完整性正确性校验、文件秒上传
- hash
- md5（Message Digest Algorithm 5） 128bit
- SHA（Secure Hash Algorithm）
可逆加密
- 对称加密
  - DES (Data Encryption Standard) 不安全
  - AES (Advanced Encryption Standard)
- 非对称加密
  - RSA（Rivest-Shamir-Adleman）

可逆加密是从传统意义上的加密，而非可逆加密通常用于签名

非可逆加密算法

并不是真正意义上的加密，通常被称作hash算法（加密）或者摘要digest算法
- 非加密哈希函数：用于散列（Hash）数据，速度快；hash表、长链转短链：MurmurHash
- 加密哈希函数：并具有一些特性，如抗碰撞性（即难以找到两个不同的输入，它们的哈希值相同）、困难性（难以计算出满足特定条件的输入，例如找到一个特定哈希值的输入），以及提供杂凑（Hash）的伪随机性。
主要用一个较短的字符串（数字指纹）代表原来的信息，不可逆

密码保存、文件完整性正确性校验、文件秒上传（该文件MD5存在，说明大概率上传过）

MD5

将任意长度消息转为 32个16进制数（16B），4个幻数（信息是减少的，不可逆）

补齐到512bit（64B）整数，并且最后64位存放原始长度
每512bit为一个块，再拆分成4B一小块（16块）X[i]，更新幻数64次；更新函数每次更新第一个数
重复N轮512bit，最后4个幻数就是结果

攻击

原像攻击：给出一个MD5，如何得到生成该MD5的消息
第二原像攻击：给出消息，如何得到生成MD5相同的消息
扛碰撞性：找出两个MD相同的消息
- 王小云2004年已经被打破，消息内容是乱码
- MarcStevens：
  - 相同前缀碰撞：从内容生成两个内容不同但MD5相同的数据（前缀保留图片或程序但后缀不同）；
  - 选择前缀碰撞：前缀不一样（一个正常程序一个死循环）然后构造后缀使得MD5相同
- 至此签名并不安全：攻击者可以创造出两个内容不同但签名相同的支票；文件校验从用户端是正常的，但如果用MD5检测软件，会导致正常版本通过检测，然后替换异常版本上架软件商店

SHA系列：

SHA-1：产生160位的哈希值，比MD5更安全，但它也已被发现有安全弱点。
SHA-2：包含多个版本（如SHA-224, SHA-256, SHA-384, 和SHA-512），相比于SHA-1提供了更高的安全性。
SHA-3：最新的SHA版本，使用不同的哈希算法（Keccak），提供了与SHA-2不同的安全性和效率。

MAC

message authentication code：确认完整性并进行身份认证，密钥+hash

HMAC：Hash-based

非可逆加密可以验证文件的完整性，例如从官网下载文件，但前提是官网提供了正确文件的md5
a、b之间通信，如果a发送的消息被替换了，单纯使用hash b并不知道消息是否被替换，因为hash也能同时被替换
如果ab之间提前约定了一个密钥，基于该密钥生成HMAC，别人就无法生成替换后的hash值，这就实现了签名。因此想要实现数据不被篡改，需要提前约定一个密钥
在ssl/tls握手时，CA就会用私钥对内容进行签名，用户用公钥解密并对比来查看内容是否被篡改
https中，除了生成一个密钥用于加密通信以外，还可以生成一个密钥用于生成HMAC确认消息防止被篡改（其实就算被篡改了，由于中间人不知道加密密钥，篡改的内容也是无意义的）

HMAC-SHA-256

JWT中用的，hash(密钥1+hash(密钥2+消息))

密钥只有服务器知道，因此只有服务器能够生成 token，并验证token是否有效

密码攻击

黑客知道盐s，hash值，算法f(p,s) = hash，但不知道原密码p
他的目的是通过hash值，盐s和算法f，求得密码p，使f(p,s) = hash

暴力破解：也就是原像攻击，暴力找原密码，不可能

方法一：遍历原文为 12345678，meiyoumuma，iloveyou这样的常见密码字典，使用盐和密码作为参数调用算法得到 hash，在数据库中查找 hash 相同的用户，那么他的密码就被知道了。但是如果每个用户盐值不一样，就需要每个用户生成一个字典去攻击，该方法失效
查表攻击（空间大）：事先计算出所有常见密码字典(明文)的hash结果(密文)，然后将其存入数据库中，通过建立索引等方式，当我们拿到一个密文(hash)时，我们去数据库通过索引将其快速查出对应的明文，如果数据库中不存在，则破解失败。加盐后简单密码就变成了123456+salt复杂密码，不在常见密码中，失效；
彩虹表：彩虹表 rainbow-tables - 知乎 (zhihu.com)

实践：强hash函数（SHA-256） + 盐 + 循环hash

现在主流密码处理方式的算法是PBKDF2，流程简述起来是随机生成一个高熵（意思是真的随机而且复杂）Salt，把你的密码和这个Salt连接在一起当作一个整体做一次哈希运算，哈希算法为安全的SHA-256，可以避免哈希碰撞，得到的这个哈希值和你的密码连接在一起再做一次哈希运算，以此类推，重复非常多次，次数越多越安全，但是服务器负担也就越重，一般在10万次以上。最后服务器存储Salt和最后一次得出的哈希值，这样服务器不知道你的密码，但是可以验证你输入的密码是否正确，即使被拖库也不用担心密码被暴力破解，因为随机Salt的引入让彩虹表攻击失效，单独针对你的密码暴力破解要付出遍历密码空间（比如说4位纯数字密码的密码空间是10000，指所有可能的密码组合的个数）所需时间的10万倍以上，比普通的算法要安全许多。在安全性更高的服务器上甚至还会结合硬件密钥来进一步增强安全性，那就是在以上的基础上得出的最后一次哈希值再和硬件密钥作为PBKDF2算法的输入，最终只存储Salt和结合了硬件密钥的最终哈希值，这样子就不给一点暴力攻击的机会了，因为硬件密钥永远不会脱离安全硬件，把相应的硬件断电就一点办法也没有了

可逆加密算法

凯撒密码

移位替换

公元前1世纪，移位替换

随机替换

用统计的方法就可以破解，出现最多的e倍替换成了l

多替换表

增加字母替换表，轮换使用替换表进行加密，加密表越多，统计特征慢慢消失

麻烦，enigma就是自动实现了字母表的替换

enigma

1926年开始，德国升级了加密系统，enigma机

字母替换的加密方法，输入o，输出c；再次输入时，输出会不同
解密时直接输入密码可以得到原文，也就是自反的

内部结构

一个转子相当于一个替换表，内部的接线是出厂固定的，但是按下后会转动转动，转动后替换表变了 26*26*26个
反射板将信号反射回去（两两连接），使得型号可以自反 + 排己
解密时转轮的初始位置需要一样，这个相当于是密钥（德军每天更新），也就是破解必须要密钥+同一批次机器
最后是接线板，可以实现交换两个字母如果12对有一千多亿种

破解

密钥+同一批次机器+接线板 机器可以被缴获，密钥每天都更新

德军加密方法：随机密钥SCA，统一密钥DAB

先用统一密钥加密随机密钥两次，放到开头，再用随机密钥加密内容
解密时用统一密钥解密开头，获取随机密钥，再用随机密钥解密内容

大量的内容都是用不同的密钥加密的（减少重复），少量的无意义信息是用统一密钥加密的

前六个字符是破译的关键！重复输入的随机密钥相当于漏洞

破解初始密钥

又因为自反性，D(A(F)) = G 把DA（EB、FG）看成一个整体函数，使得F->G

当天的密文有很多，可以把3个函数的26个字母的映射关系都列出

这些映射存在环
环的数量集合就是一个**特征(指纹)**，代表着转子的初始位子
特征集合很少重复，如果构造了特征目录，就可以得到转子的初始位置

构造目录表

一对函数的映射存在环，一次循环的数量2x代表一对环特征x,x

循环测定仪

现在想构建AAA的特征

设置AAA，另一个设置为AAD（相差3）用于输出DA函数的特征
- 随便从一个开始
- 循环后结束，点亮的数量2x就是当前两个环的数量和，也就是特征为x,x
- 电亮没有亮过的开关，又得到一组特征y, y 循环执行
设置AAB，另一个设置为AAE 用于输出EB函数特征
设置AAC，另一个设置为AAF 用于输出FC函数特征
结合三个特征，组合成AAA转子的特征

目录表数量

三个随机排列：26*26*26 * A33 大概10w，构造需要1年
五个随机选择3个：10年！
要用机器打败机器，Bomba！

社会工程学

基于 crib（一些常用特殊的词汇，例如每天早上的天气预报、生日快乐、甚至是故意的陷阱）
bombe machine
https://www.bilibili.com/video/BV1PL4y1H77Z

对称加密AES

对称加密用一个相同的密钥进行加密解密，适合1对1的加密方式，但浏览器和服务器之间不能单纯使用同一个密钥，否者大家都一样用户之间相当于没有加密。（握手后随机生成一个传输也不行，因为会被中间人窃取）
因此双方确定密钥过程是关键
预先共享密钥：面对面交换、安全信封或安全通信渠道
密钥分发中心（Key Distribution Center，KDC）：KDC是一个可信的第三方实体，负责生成和分发密钥。发送方和接收方可以向KDC请求密钥，KDC会安全地将密钥发送给它们。这种方法需要发送方和接收方信任KDC的安全性。
通过公钥密码体系配送共享密钥 https
Diffie-Hellman密钥交换协议 详情见ECDHE中

非对称加密RSA

公钥加密只能私钥解密
私钥加密只能公钥解密
计算复杂度高

选择两个大质数p和q：这两个质数需要足够大，以确保其乘积n的位数可以满足安全需求。通常，p和q的位数应该在100位以上。
**计算n和φ(n)**：n是p和q的乘积，φ(n)是n的欧拉函数，对于n=pq，φ(n)=(p-1)(q-1)。
选择公钥e：e需要满足1 < e < φ(n)，且e和φ(n)互质。通常，e可以选择为65537（这是一个常用的公钥，因为它有很好的性质，如二进制表示中只有两个1，计算效率高）。
计算私钥d：d是e关于φ(n)的模逆元，即满足ed ≡ 1 (mod φ(n))。这个可以通过扩展欧几里得算法来计算。
输出公钥和私钥：公钥是(n, e)，私钥是(n, d)。

n的因数分解（即找出p和q）是一个已知的困难问题，这就是所谓的”大数因数分解问题”，保证RSA的安全性

ssl/tls

有了非对称加密，就可以使得浏览器和服务器终极那的通信安全。非对称+对称加密

服务器发公钥给浏览器，浏览器随机数（传输密钥）加密后传给服务器，服务器再私钥解密得到传输密钥（非对称+对称加密 、如果只非对称加密，服务器的数据会被窃取）
问题：如果中间人用窃取公钥并拦截，并生成自己的公钥发给浏览器，作为中间商，就会出问题
如何确定浏览器收到的公钥是服务器给的：（域名、第三方机构、服务器公钥）给CA，CA添加数字签名（内容->hash->私钥加密）后给浏览器。浏览器解密（CA的公钥浏览器中保存了，浏览器信任的CA机构）看是否和明文hash一致

握手过程

Client Hello：TLS 版本号、支持的密码套件列表，以及生成的随机数
Server Hello：确认TLS版本，发送证书（包含公钥），随机数，密码套件（密钥交换、签名RSA；AES通信加密）
随机数（传输密钥）通过公钥加密后传给服务器（不考虑后续验证的化，其实这里可以携带加密数据，但RFC 标准不允许）
Finishd：私钥解密获得传说密钥，最后对握手数据进行摘要并且加密，用于验证加密是否可用以及是否被篡改

ECDHE握手

RSA不具备前向安全！

Diffie-Hellman密钥交换协议

根据私钥生成的方式，DH 算法分为两种实现：

static DH 算法，这个是已经被废弃了；可能被暴力破解, 不具备前向安全性
DHE 算法，现在常用的；

ECDHE

DHE 算法由于计算性能不佳，因为需要做大量的乘法，为了提升 DHE 算法的性能，所以就出现了现在广泛用于密钥交换算法 —— ECDHE 算法。

小红和小明使用 ECDHE 密钥交换算法的过程：

双方事先确定好使用哪种椭圆曲线，和曲线上的基点 G，这两个参数都是公开的；
双方各自随机生成一个随机数作为私钥d，并与基点 G相乘得到公钥Q（Q = dG），此时小红的公私钥为 Q1 和 d1，小明的公私钥为 Q2 和 d2；
双方交换各自的公钥，最后小红计算点（x1，y1） = d1Q2，小明计算点（x2，y2） = d2Q1，由于椭圆曲线上是可以满足乘法交换和结合律，所以 d1Q2 = d1d2G = d2d1G = d2Q1 ，因此双方的 x 坐标是一样的，所以它是共享密钥，也就是会话密钥。

Client Hello:客户端使用的 TLS 版本号、支持的密码套件列表，以及生成的随机数（Client Random）。
Server Hello: 随机数（Server Random）密码套件（密钥协商ECDHE + 签名RSA+通信AES）、证书、选择椭圆曲线基点 G ，生成本地私钥d1，G*d1=Q1 发送公钥 Q1 给客户端
生成本地私钥d2，G*d2=Q2 发送公钥Q2给服务器；会话密钥为d2Q1；本次通信携带加密数据
最终验证一下

参考

计算机基础

#计算机网络 #加密

从FD到socketFD再到epoll原理上一篇

考试压测及瓶颈排查下一篇