这种转换是一种压缩映射,也就是,输出(散列值)的空间通常远小于输入的空间,但不同的输入可能会散列成相同的输出,而散列值相同不代表着输入值相同,所以不能从散列值来确定唯一的输入值。简单的说哈希就是一种将不固定长度的值压缩到某一固定长度的值的函数/算法。
(一)哈希的特点
1.确定性:如果两个散列值不相同,那么散列的原始数据也不同;
2.碰撞性:两个散列的原始数据不同,但是计算得出的散列值有可能相同;
3.不可逆:无法通过散列值推导出散列原始数据;
4.混淆性:就好比,原始数据A通过计算得到散列值A,然后通过计算原始数据A的部分内容后得到散列值B,但散列值A和散列值B的差异很大。
通常情况下,只要原始信息更改了哪怕一个字节,哈希计算的结果都会完全不同,也就意味着,要找到同一哈希值的两个不同源数据,在计算上来说是基本不可能的。所以数据的哈希值一般会被用来检验数据的完整性。
(二)哈希函数和区块链的关系
哈希函数可以理解为区块链技术的基石。在区块链世界里,区块是与哈希一一对应的,每个区块的Hash都是针对“区块头”(Head)计算的,Hash=SHA256(区块头),然后得出某个区块的哈希值,用这个哈希值可以唯一确定某一个区块,相当于给区块设定了一个身份证号。
而区块头包含上一个区块和当前区块体的Hash等信息,如果当前的区块被改变,或者上一个区块的Hash变了,一定会引起当前区块的Hash改变。换句话说,如果有人修改了某个区块,那该区块的Hash就变了。为了让后面的区块还能连到它,后面所有的区块必须全部同时修改,否则被改之后的区块就会全部脱离原来的区块链。
不过Hash的计算需要耗费大量的时间,所以几乎是不可能同时修改多个区块,除非有人掌握了全网51%以上的计算能力。因此,区块链的可靠性也就得到了保证,数据一旦写入,就无法被篡改。