您现在的位置：程式師世界 >> 編程語言 > >> 更多編程語言 >> Python

循環碼、卷積碼及其python實現

編輯：Python

摘要：本文介紹了循環碼和卷積碼兩種編碼方式，並且，作者給出了兩種編碼方式的編碼譯碼的python實現

關鍵字：循環碼，系統編碼，卷積碼，python，Viterbi算法

循環碼的編碼譯碼

設 \(C\) 是一個 \(q\) 元 \([n,n-r]\) 循環碼，其生成多項式為\(g(x), \text{deg}(g(x))=r\)。顯然，\(C\) 有 \(n-r\) 個信息位，\(r\) 個校驗位。我們用 \(C\) 對信息源 \(V(n-r,q)\) 中的向量進行表示。

對任意信息源向量 \(a_0a_1\cdots a_{n-r-1}\in V(n-r,q)\)，循環碼有兩種編碼思路：

非系統的編碼方法

構造信息多項式

\[a(x) = a_0+a_1x+\cdots+a_{n-r-1}x^{n-r-1} \]

該信息源的多項式對應於循環碼 \(C\) 的一個碼字

\[c(x)=a(x)g(x) \]

系統編碼

構造信息多項式

\[\bar{a}(x)=a_0x^{n-1}+a_1x^{n-2}+\cdots+a_{n-r-1}x^r \]

顯然當 \(a_0,a_1,\cdots,a_{n-r-1}\) 不全為零時。\(r\lt\text{deg}(\bar{a}(x))=n-1\)。用 \(g(x)\) 去除 \(\bar{a}(x)\)，得到

\[\bar{a}(x)=q(x)g(x)+r(x) \]

其中 \(\text{deg}(r(x))\lt\text{deg}(g(x))=r\)，信息源多項式被編碼為C中的碼字

\[c(x)=q(x)g(x)+r(x)=\bar{a}(x)-r(x) \]

可以看到，\(\bar{a}(x)\) 和 \(r(x)\) ，沒有相同的項，所以這種編碼方式為系統編碼。也即，如果將 \(c(x)\) 中的 \(x\) 的項按生降次排序，則碼字前 \(n-r\) 位就是信息位，後 \(r\) 位是校驗位。

例子：二元（7,4）循環碼

已知 \(C\) 是一個二元 \((7,4)\) 循環碼，生成多項式為 \(g(x)=x^3+x+1\)。

\(0101\in V(4，2)\) 是代編碼的信息向量

非系統編碼（升冪排序，信息向量為 \(x+x^3\)）

\[\begin{aligned} c(x)&=a(x)g(x) \\ &=(x+x^3)(1+x+x^3) \\ &=x+x^2+x^3+x^6 \end{aligned} \]

也即，\(0101\in V(4，2)\) 被編碼為\(0111001\in V(7,2)\)

系統編碼（降冪排序，信息向量為 \(x^5+x^3\)）

\[\begin{aligned} &\bar{a}(x)=x^5+x^3=x^2(x^3+x+1)=x^2 \\ \end{aligned} \]

\[\begin{aligned} c(x)&=\bar{a}(x)-r(x) \\ &=(x^5+x^3)-x^2 \\ &=x^5+x^3+x^2 \end{aligned} \]

也就是，\(0101\in V(4，2)\) 被編碼為\(0101100\in V(7,2)\)

一般而言，系統碼解碼速度相比非系統編碼更快。接下來我們對上述例子進一步探索。

系統碼的生成矩陣

考慮 \(F_2[x]/\langle x^7-1\rangle\) 中階數大於3的基。

\[f_1(x)=x^6=(x^3+x+1)(x^3+x+1)+x^2+1 \]

也即，\(1000\in V(4，2)\) 被編碼為\(1000101\in V(7,2)\)。

\[f_2(x)=x^5=(x^2+1)(x^3+x+1)+x^2+x+1 \]

也即，\(0100\in V(4，2)\) 被編碼為\(0100111\in V(7,2)\)。

\[f_3(x)=x^4=x(x^3+x+1)+x^2+x \]

也即，\(0010\in V(4，2)\) 被編碼為\(0010110\in V(7,2)\)。

\[f_4(X)=x^3=(x^3+x+1)+x+1 \]

也即，\(0001\in V(4，2)\) 被編碼為\(0001011\in V(7,2)\)。

所以生成多項式為 \(g(x)=x^3+x+1\) 的 \((7,4)\) 循環碼C的生成矩陣為

\[G= \begin{bmatrix} 1 & 0 & 0 & 0 & \vdots &1&0&1 \\ 0 & 1 & 0 & 0 & \vdots &1&1&1 \\ 0 & 0 & 1 & 0 & \vdots &1&1&0 \\ 0 & 0 & 0 & 1 & \vdots &0&1&1 \\ \end{bmatrix} \]

循環碼的譯碼

首先我們不加證明的引入循環矩陣的校驗多項式核校驗矩陣的知識。

定義設 \(C\subset R_n\) 是一個 \(q\) 元 \([n,n-r]\) 循環碼，其生成多項式為 \(g(x)\)，校驗多項式定義為

\[h(x)\triangleq(x^n-1)/g(x) \]

定理設 \(C\subset R_n\) 是一個 \(q\) 元 \([n,n-r]\) 循環碼，其生成多項式為 \(g(x)\)，校驗多項式為 \(h(x)\)，則對任意 \(c(x)\in R_n(x)\)，\(c(x)\) 是 \(C\) 的一個碼字當且僅當 \(c(x)h(x)=0\)。

定理設\(C\subset R_n\) 是一個 \(q\) 元 \([n,n-r]\) 循環碼，其生成多項式為 \(g(x)\)，校驗多項式記為

\[h(x)=(x^n-1)/g(x)\triangleq h_{n-r}x^{n-r}+\cdots+h_1x+h_0 \]

且其校驗矩陣為

\[H= \begin{pmatrix} h_{n-r} & h_{n-r-1} & h_{n-r-2} & \cdots & h_0 & 0 & 0 & \cdots & 0 \\ 0 & h_{n-r} & h_{n-r-1} & h_{n-r-2} & \cdots & h_0 & 0 & \cdots & 0 \\ 0 & 0 & h_{n-r} & h_{n-r-1} & h_{n-r-2} & \cdots & h_0 & \cdots & 0 \\ \vdots & \vdots & \vdots & & \vdots & \vdots & \vdots & & \vdots \\ 0 & 0 & 0 & \cdots & h_{n-r} & h_{n-r-1} & h_{n-r-2} & \cdots &h_0\\ \end{pmatrix} \]

所以可得，對於已知 \(C\) 是一個二元 \((7，4)\) 循環碼，生成多項式為 \(g(x)=x^3+x+1\)，校驗多項式為 \(h(x)=x^4+x^3+x^2+1\)，校驗矩陣為

\[H= \begin{pmatrix} 1 & 1 & 1 & 0 & 1 & 0 & 0 \\ 0 & 1 & 1 & 1 & 0 & 1 & 0 \\ 0 & 0 & 1 & 1 & 1 & 0 & 1 \\ \end{pmatrix} \]

因為是系統編碼，所以，如果將 \(c(x)\) 中的 \(x\) 的項按降冪次排序，則碼字前 \(n-r\) 位就是信息位，後 \(r\) 位是校驗位。也就是，如果不出錯，則接受的的碼字的前 4 個''字母''（信息比特）就是對方傳輸的信息。

但是考慮到一般情形，二元循環碼解碼流程如下

根據碼字 \(C\) 及其生成多項式，構造校驗多項式，進一步得到校驗矩陣 \(H\)
接收到向量 \(y\)，計算其伴隨 \(S(y)=yH^{T}\)
若 \(S(y)\) 等於零，我們則認為傳輸過程沒有發生錯誤，\(y\) 就是發送碼字
若 \(S(y)\) 不等於零，則 \(S(y)\) 可表示為 \(b(H_i)^T\)，其中 \(0\ne b\in GF(q),1\le i\le n\)。這時我們認為 \(y\) 中的第 \(i\) 個分量發生錯誤，\(y\) 被譯為碼字 \(y-\alpha_i\)，其中 \(\alpha_i\) 中的第 \(i\) 個分量為 \(b\)，其余分量為零。

對於上述碼字，若接收到 \(y=0110010\)，\(S(y)=yH^T=011=1*H_4\)，所以發送碼字為 \(0111010\)，也即代表信息源 \(0111\)。

對於上述循環碼，python程序實現如下

# (7,4)二元循環碼
# 生成多項式 g(x)= x^3+x+1
import numpy as np
# 生成矩陣
G = np.array([
[1,0,0,0,1,0,1],
[0,1,0,0,1,1,1],
[0,0,1,0,1,1,0],
[0,0,0,1,0,1,1]
])
# 校驗矩陣
H = np.array([
[1,1,1,0,1,0,0],
[0,1,1,1,0,1,0],
[0,0,1,1,1,0,1]
])
# 編碼
def encode_cyclic(x):
if not len(x) == 4:
print("請輸入4位信息比特")
return
y = np.dot(x,G)
print(x,"編碼為：",y)
return y
# 譯碼，過程與漢明碼一致
def decode_cyclic(y):
if not len(y) == 7:
print("請輸入7位信息比特")
return
x_tmp = np.dot(y,H.T)%2
if (x_tmp!=0).any():
for i in range(H.shape[1]):
if (x_tmp==H[:,i]).all():
y[i] = (y[i]-1)%2
break
x = y[0:4]
print(y,"解碼為：",x)
return x
# 測試
if __name__ == '__main__':
y = [1,0,0,0,1,0,1]
decode_cyclic(y)
x=[1,0,0,0]
encode_cyclic(x)

卷積碼

卷積碼是信道編碼技術的一種，屬於一種糾錯碼。最早由1955年Elias最早提出，目的是為了減少在信源消息在信道傳輸過程中產生的差錯，增加接收端譯碼的准確性。

卷積碼的生成方式是將待傳輸的信息序列通過線性有限狀態移位寄存器，也就是在卷積碼的編碼過程中，需要輸入消息源與編碼器中的沖激響應做卷積。具體說來，在任意時段，編碼器的 \(n\) 個輸出不僅與此時段的 \(k\) 個輸入有關，還與寄存器中前 \(m\) 個輸入有關。卷積碼的糾錯能力隨著 \(m\) 的增加而增大，同時差錯率隨著 \(m\) 的增加而成指數下降。

參數 \((n,k,m)\) 解釋如下：

\(m\) ：約束長度，即位移寄存器的級數（個數），每級（每個）包含 \(k\) 個參數（\(k\) 個輸入）。
\(k\) ：信息碼位的數目，是卷積編碼器的每級輸入的比特數目
\(n\) ：k位信息碼對應編碼後的輸出比特數，它與 \(mk\) 個輸入比特相關
編碼速率： \(R_c=k/n\)

由此看來，卷積碼編碼的結果與之前的輸入有關，編碼具有記憶性，是非分組碼。而分組碼的編碼只於當前輸入有關，編碼不具有記憶性。

1967年Viterbi提出基於動態規劃的最大似然Viterbi譯碼法。

卷積碼編碼

如下圖為：（2，1，2）卷積碼的編碼示意圖

1位輸入，2位輸出，2個位移寄存器
兩路生成多項式為 \(x^2+x+1, x^2+1\)（分別對應 \(c_{1j}\) 和 \(c_{2j}\) ）

其中，\(j\) 表示時序，

\[\begin{aligned} c_{1j} &= u_j+D_1+D_2 = u_j+u_{j-1}+u_{j-2} \\ c_{2j} &= u_j + D_2 = u_j + u_{j-2} \end{aligned} \]

為了後續說明卷積碼中重要的“狀態”概念，現引入記號（僅以2個輸出為例，\(n\) 個輸出可以此類推）：

\(s_j=(u_j,u_{j-1})\) 表示為卷積碼在 \(j\) 時刻的到達狀態
\(s_{j-1}=(u_{j-1},u_{j-2})\) 表示為卷積碼在 \(j\) 時刻的出發狀態

所以不難看出（2，1，2）卷積碼由 4 種可能的狀態，為 \((00),(01),(10),(11)\)。

對於狀態我們有如下引理

引理

給定出發狀態 \(s_{j-1}\) 和當前的輸入 \(u_j\)，可以確定出到達狀態 \(s_j\) 以及當前輸出 \(c_{1_j}c_{2j}\)
給定狀態的變化序列 \(s_0s_1s_2\cdots\)，將能確定出輸入序列 \(u_0u_1u_2\cdots\) 以及輸出序列\(c_{10}c{20}c_{11}c_{21}\cdots\)

注：我們默認初始狀態\(s_{-1}=0\)

從上述描述中，不難看出，卷積碼的全部信息都包含在狀態變化序列中。

紅線代表輸入信息為0，藍線表示輸入信息為1。線旁的數字表示對應狀態時候的機器的輸出
從每個狀態出發，可達到兩個不同狀態。每個到達狀態都有兩個出發狀態
輸入的信息比特一定等於到達狀態的第1位

下圖為“格圖”，

格圖結構更加緊湊，代表著時間的移動，也即，信息比特在不斷輸入。

從上圖中，我們可得出，若輸入序列是 \(10110\)，則輸出序列為 \(11 10 00 01 01\)。

代碼示例如下

# (2,1,2)卷積碼
# 卷積編碼
def encode_conv(x):
# 存儲編碼信息
y = []
# 兩個寄存器u_1 u_2初始化為0
u_2 = 0
u_1 = 0
for j in x:
c_1 = (j + u_1 + u_2)%2
c_2 = (j+u_2)%2
y.append(c_1)
y.append(c_2)
# 更新寄存器
u_2 = u_1
u_1 = j
print(x,"編碼為：",y)
return y
# 測試代碼
if __name__ == '__main__':
encode_conv([1,0,1,1,0])

卷積碼的譯碼

我們注意到

任何一個編碼器輸出序列，都對應著樹圖（格圖）上唯一的一條路徑
譯碼器要根據接收序列，找出這條路徑
按照最大似然（Maximum Likelihood ）譯碼原則，譯碼器應該在圖的所有路徑中找出這樣一條，其編碼輸出序列與譯碼器接收的序列之間碼距最小。

分支度量（以（2，1，2）卷積碼為例）

設 \(j\) 時刻接受的比特是 \(y_{1j}y_{2j}\)

網格圖在 \(j\ge2\) 時刻有8種不同的分支（相同分支：出發狀態和到達狀態相同），每個分支對應兩個比特編碼輸出 \(c_{1j}c_{2j}\)
這兩個比特編碼輸出與接收比特之間的漢明距離稱為該分支的分支度量

例如從第 \(i\) 步到第 \((i+1)\) 步接收的比特位 \(01\)

累計度量

從起始狀態到 \(j\) 時刻的某個狀態路徑是由各個樹枝連成的，這些樹枝的分支度量之和稱為該路徑的累積度量
在上述定義下，某個路徑的累積度量實際是該路徑與接收序列的漢明距離
最大似然（Maximum Likelihood，ML）譯碼就是要尋找到 \(j\) 時刻累積度量最小的路徑。

如下為輸入比特：01 11 01 的格圖。

其中 \(A(i)\) 表示從開始時刻到當前時刻的累積度量為 \(i\)

Viterbi譯碼

最大似然序列譯碼要求序列有限，因此對於卷積碼來說，要求能截尾。基於最大似然譯碼（ML譯碼）准則，尋找從起點到終點的極大似然路徑，即從起點到終點累計度量最小的路徑。
截尾：在信息序列輸入完成以後，利用輸入一些特定的比特，使 \(M\) 個狀態的各殘留路徑可以到達某一已知狀態（一般是全零狀態）。這樣就變成只有一條殘留路徑，這就是最大似然序列。
Viterrbi譯碼核心思想：進行累加-比較-選擇，基於計算，並產生新的幸存路徑。

對於接收序列為：01 11 01 11 00

通過上述路徑分析圖可得，經過最大似然譯碼分析後，譯碼序列為：11000

Viterbi譯碼python實現如下：

def decode_conv(y):
# shape = (4,len(y)/2)
# 初始化
score_list = np.array([[ float('inf') for i in range(int(len(y)/2)+1)] for i in range(4)])
for i in range(4):
score_list[i][0]=0
# 記錄回溯路徑
trace_back_list = []
# 每個階段的回溯塊
trace_block = []
# 4種狀態 0-3分別對應['00','01','10','11']
states = ['00','01','10','11']
# 根據不同 狀態 和 輸入 編碼信息
def encode_with_state(x,state):
# 編碼後的輸出
y = []
u_1 = 0 if state<=1 else 1
u_2 = state%2
c_1 = (x + u_1 + u_2)%2
c_2 = (x + u_2)%2
y.append(c_1)
y.append(c_2)
return y
# 計算漢明距離
def hamming_dist(y1,y2):
dist = (y1[0]-y2[0])%2 + (y1[1]-y2[1])%2
return dist
# 根據當前狀態now_state和輸入信息比特input，算出下一個狀態
def state_transfer(input,now_state):
u_1 = int(states[now_state][0])
next_state = f'{input}{u_1}'
return states.index(next_state)
# 根據不同初始時刻更新參數
# 也即指定狀態為 state 時的參數更新
# y_block 為 y 的一部分， shape=(2,)
# pre_state 表示當前要處理的狀態
# index 指定需要處理的時刻
def update_with_state(y_block,pre_state,index):
# 輸入的是 0
encode_0 = encode_with_state(0,pre_state)
next_state_0 = state_transfer(0,pre_state)
score_0 = hamming_dist(y_block,encode_0)
# 輸入為0，且需要更新
if score_list[pre_state][index]+score_0<score_list[next_state_0][index+1]:
score_list[next_state_0][index+1] = score_list[pre_state][index]+score_0
trace_block[next_state_0][0] = pre_state
trace_block[next_state_0][1] = 0
# 輸入的是 1
encode_1 = encode_with_state(1,pre_state)
next_state_1 = state_transfer(1,pre_state)
score_1 = hamming_dist(y_block,encode_1)
# 輸入為1，且需要更新
if score_list[pre_state][index]+score_1<score_list[next_state_1][index+1]:
score_list[next_state_1][index+1] = score_list[pre_state][index]+score_1
trace_block[next_state_1][0] = pre_state
trace_block[next_state_1][1] = 1
if pre_state==3 or index ==0:
trace_back_list.append(trace_block)
# 默認寄存器初始為 00。也即，開始時刻，默認狀態為00
# 開始第一個 y_block 的更新
y_block = y[0:2]
trace_block = [[-1,-1] for i in range(4)]
update_with_state(y_block=y_block,pre_state=0,index=0)
# 開始之後的 y_block 更新
for index in range(2,int(len(y)),2):
y_block = y[index:index+2]
for state in range(len(states)):
if state == 0:
trace_block = [[-1,-1] for i in range(4)]
update_with_state(y_block=y_block,pre_state=state,index=int(index/2))
# 完成前向過程，開始回溯
# state_trace_index 表示 開始回溯的狀態是啥
state_trace_index = np.argmin(score_list[:,-1])
# 記錄原編碼信息
x = []
for trace in range(len(trace_back_list)-1,-1,-1):
x.append(trace_back_list[trace][state_trace_index][1])
state_trace_index = trace_back_list[trace][state_trace_index][0]
x = list(reversed(x))
print(y,"解碼為：",x)
return x
# 測試代碼
if __name__ == '__main__':
# 對應 1 1 0 0 0
decode_conv([0,1,1,1,0,1,1,1,0,0])