1.一種基于雙重語義的跨頁表格判別方法,其特征在于,包括:
2.如權(quán)利要求1所述的一種基于雙重語義的跨頁表格判別方法,其特征在于,表頭判別模型的訓(xùn)練過程,包括:
3.如權(quán)利要求1所述的一種基于雙重語義的跨頁表格判別方法,其特征在于,上下文前綴文本判別模型的訓(xùn)練過程包括:
4.如權(quán)利要求3所述的一種基于雙重語義的跨頁表格判別方法,其特征在于,在步驟s34中,上下文表格的位置特征由以下方式獲取:
5.如權(quán)利要求3所述的一種基于雙重語義的跨頁表格判別方法,其特征在于,在步驟s35之后,還包括:
6.如權(quán)利要求5所述的一種基于雙重語義的跨頁表格判別方法,其特征在于,所述完整融合表格特征的第i行信息的注意權(quán)重αi的計(jì)算公式為:
7.如權(quán)利要求3所述的一種基于雙重語義的跨頁表格判別方法,其特征在于,所述上下文前綴文本判別模型的訓(xùn)練過程,在步驟s34之前,還包括:
8.如權(quán)利要求5所述的一種基于雙重語義的跨頁表格判別方法,其特征在于,所述上下文前綴文本判別模型的訓(xùn)練過程,在步驟s36之后,還包括:
9.如權(quán)利要求8所述的一種基于雙重語義的跨頁表格判別方法,其特征在于,上下文表格跨頁的判別概率pc的計(jì)算公式為:
10.如權(quán)利要求8所述的一種基于雙重語義的跨頁表格判別方法,其特征在于,利用反向傳播和梯度下降法,對(duì)上下文前綴文本判別模型進(jìn)行訓(xùn)練,上下文前綴文本判別模型的損失函數(shù)lc為: