汉明码是Richard Hamming于1950年提出的。是目前广泛采用的一种有效的校验码,其中,主存的ECC(Error Correcting Code)采用的就是类似的校验码。
基本原理
将有效的信息按某种规律分成若干组,每组安排一个校验位,做奇偶测试,就能提供多位检错信息,以指出最大可能是哪位出错,从而将其纠正。实质上,汉明校验码是一种多重校验。
----摘自百度百科
这个分组的思想有点不是很理解。
在有效信息位种中加入几个校验位形成汉明码,使码距比较均匀的增大,并把汉明码的每一个二进制位分配到几个奇偶校验组中。
以下使用P代表校验位,H代表汉明码,D代表原始信息位,N位信息位的位数,K位校验位的位数。
则N与K的关系为2^(K-1) >=N+K+1
,如下表:
N | K |
---|---|
1~3 | 4 |
4~10 | 5 |
11~25 | 6 |
26~56 | 7 |
57~119 | 8 |
分组原则
- 信息位和校验位之和为m,每个校验位Pi在汉明码中被分到位号为2^(i-1)的位置上,其余各位为信息位
- 汉明码每一位Hi有多个校验位校验,其关系是被校验的每一位位号等于校验它的各校验位的位号之和,即汉明码的实质是参与校验的各校验位权之和。 这句话理解起来有点别扭,看下面例子。
- 在增大码距时,应使所有编码的码距尽量均匀地增大,以保证对所有代码的检测能力平衡的提高
例子
编码
假设原始数据信息位的位数为8,那么他需要的K值位5,即需要有5个校验位,组成的汉明码的位数为13.再根据校验位的分配原则,组成的汉明码如下:
|位|13| 12| 11 |10| 9| 8| 7 |6| 5| 4| 3| 2| 1|
|-|-|-|-|-|-|-|-|-|-|-|-|-|
|汉明码|P5| D8| D7| D6 | D5| P4| D4| D3| D2| P3| D1| P2| P1|
P5本来应该是放在第16位的,但是由于生成的汉明码位数为13所以它就被挪到的第13位了。
那么怎么确定校验呢?最初也困扰我许久。
先看一个表格:
其中H的下标代表在汉明码中的位置,也是P4P3P2P1组成的-十进制数
P5 | P4 | P3 | P2 | P1 | H | |
---|---|---|---|---|---|---|
0 | 0 | 0 | 1 | H1 | P1 | |
0 | 0 | 1 | 0 | H2 | P2 | |
0 | 0 | 1 | 1 | H3 | D1 | |
0 | 1 | 0 | 0 | H4 | P3 | |
0 | 1 | 0 | 1 | H5 | D2 | |
0 | 1 | 1 | 0 | H6 | D3 | |
0 | 1 | 1 | 1 | H7 | D4 | |
1 | 0 | 0 | 0 | H8 | P4 | |
1 | 0 | 0 | 1 | H9 | D5 | |
1 | 0 | 1 | 0 | H10 | D6 | |
1 | 0 | 1 | 1 | H11 | D7 | |
1 | 1 | 0 | 0 | H12 | D8 | |
1 | 1 | 0 | 1 | H13 | P5 |
校验位Pi的偶校验结果就是:
P1 = D1 ^ D2 ^ D4 ^ D5 ^ D7
P2 = D1 ^ D3 ^ D4 ^ D6 ^ D7
P3 = D2 ^ D3 ^ D4 ^ D8
P4 = D5 ^ D6 ^ D7 ^D8
如果是奇校验的话上面的结果取反就是了。
那么还有P5呢?上面的结果中,D4,D7出现了3次,而D1,D2,D3,D5,D6,D8仅出现了2次,为了使其各个信息位在校验中均匀的出现校验,从而定义P5 = D1 ^ D2 ^ D3 ^ D5 ^ D6 ^D8
,这样,每一位信息位都均匀的出现在3个Pi值得形成关系中,当任意一位信息位变化的时候都会引起3个P值得变化,即合法汉明码的码距为4 (前面都懂,这个码距为4有点想不明白)
这就是编码了。
现在再来看看这句话
汉明码每一位Hi有多个校验位校验,其关系是被校验的每一位位号等于校验它的各校验位的位号之和,即汉明码的实质是参与校验的各校验位权之和。
P1,P2,P3,P4,P5的位数分别为1,2,4,8,13
D1的汉明码位数为3,3 = 2 + 1所以D1会被P1,P2两个校验位所校验。
汉明码的信息位 | 汉明码的位数 | 被校验位 | 说明 |
---|---|---|---|
D1 | 3 = 1 + 2 | P1,P2 | D1信息位会被校验位P1,P2所校验。 |
D2 | 5 = 1 + 4 | P1,P3 | |
D3 | 6 = 2 + 4 | P2,P3 | |
D4 | 7 = 1 + 2 +4 | P1,P2,P3 | |
D5 | 9 = 1+ 8 | P1,P4 | |
D6 | 10 = 2 + 8 | P2,P4 | |
D7 | 11 = 1 + 2 +8 | P1,P2,P4 | |
D8 | 12 = 4 + 8 | P3,P4 |
根据偶校验结果以及上应该就清楚了。
校验
将收到的汉明码进行偶校验(当然也可以进行奇校验,前提是前面编码的时候使用的是奇校验)
S1 = P1 ^ D1 ^ D2 ^ D4 ^ D5 ^ D7
S2 = P2 ^ D1 ^ D3 ^ D4 ^ D6 ^ D7
S3 = P3 ^ D2 ^ D3 ^ D4 ^ D8
S4 = P4 ^ D5 ^ D6 ^ D7 ^D8
S5 = P5 ^ D1 ^ D2 ^ D3 ^ D5 ^ D6 ^D8
汉明码出错情况:
记录 S = S5 S4 S3 S2 S1
- S为00000时代表无错
- 有一位不为0,表明某一校验位出错或者三位汉明码(信息位和校验位)同时出错
- 两位不为0,表明两位汉明码同时出错,此时只能发现错误无法确定错误的位置
- 3位不为0,表明一位信息位出错或者3位校验位同时出错
- 4/5位不为0,表明出错情况严重,系统可能出现故障,应检查系统硬件的正确性
以上结果分析基于偶校验。
|汉明码||P5| D8| D7| D6 | D5| P4| D4| D3| D2| P3| D1| P2| P1|
|:-:|:-:|:-:|:-:|:-:|:-:|:-:|:-:|:-:|:-:|:-:|:-:|:-:|:-:|:-:|:-:|
|出错位号||H13| H12| H11 |H10|H9| H8| H7 |H6| H5| H4| H3| H2|H1|
||S5|1|1|0|1|1|0|0|1|1|0|1|0|0|
||S4|0|1|1|1|1|1|0|0|0|0|0|0|0|
||S3|0|1|0|0|0|0|1|1|1|1|0|0|0|
||S2|0|0|1|1|0|0|1|1|0|0|1|1|0|
||S1|0|0|1|0|1|0|1|0|1|0|1|0|1|