一種最佳內(nèi)容重構(gòu)的無障礙快速閱讀方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及無障礙快速閱讀方法的技術(shù)領(lǐng)域,特別是最佳內(nèi)容重構(gòu)的無障礙 Skimming快速閱讀方法。
【背景技術(shù)】
[0002] 世界上約有盲人3000萬人左右,中國約有500萬盲人,占世界總數(shù)的18%,隨著互 聯(lián)網(wǎng)的高度普及和互聯(lián)網(wǎng)在日常生活中重要性的不斷上升,盲人上網(wǎng)問題將成為無障礙建 設(shè)中的重要問題。盲人由于無法通過視力接受信息,所以其上網(wǎng)問題特別突出。當(dāng)前視力障 礙人士使用讀屏軟件獲取網(wǎng)頁文章信息主要存在兩大問題。一方面讀屏軟件朗讀正文時(shí)逐 字逐行的讀取,這使得視力障礙人士獲取信息的效率明顯下降,另一方面視力障礙人士獲 取消息的信道狹窄,他們只能通過聽覺獲取信息,這時(shí)大量的語音朗讀很容易給他們帶來 信息過載的問題。
[0003] 針對視力障礙人士使用讀屏軟件獲取信息時(shí)所面對的效率低與視障人士遭受的 信息過載問題,讀屏軟件的快速閱讀功能被提出。讀屏軟件快速閱讀需要解決以下兩個(gè)問 題:(1)視障人士使用讀屏軟件效率低的問題??焖匍喿x解決效率問題提出應(yīng)該首先給視障 人士一個(gè)文章的摘要,這樣視障人士可以很快的了解文章的內(nèi)容并根據(jù)自己的興趣決定是 否繼續(xù)閱讀文章,這是通過文章選擇性閱讀提高視障人士的閱讀效率。(2)視障人士使用讀 屏軟件的信息過載問題。摘要也是解決視障人士信息過載問題的一種解決方案。針對視障 人士獲取信息的信道窄的問題,我們應(yīng)該提供他們高質(zhì)量的閱讀內(nèi)容。文章摘要可以通過 極少的句子或者詞語表達(dá)清楚原文的意思,這樣我們就可以解決讀屏軟件給視障人士帶來 的信息過載問題。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明要克服現(xiàn)有技術(shù)的上述缺點(diǎn),提出一種基于最佳內(nèi)容重構(gòu)的無障礙 Skimming快速閱讀方法,以幫助視力障礙人士快速的獲取網(wǎng)上的信息解決。
[0005] -種基于最佳內(nèi)容重構(gòu)的無障礙快速閱讀方法,從互聯(lián)網(wǎng)抓取網(wǎng)頁后,針對每個(gè) 網(wǎng)頁進(jìn)行以下操作:
[0006] 1)提取網(wǎng)頁中的文章二,其中D為文章的句子向量集合, 為句子向量表不文章 d的第i個(gè)句子;
[0007] 2)利用詞性標(biāo)注的方法對集合D中的句子進(jìn)行名詞,介詞的抽取得到句子部分集 合戶=...灸,...1]%其中句子部分1為句子向量;抽取名詞、介詞所得,然后 將任意的句子部分&表不成TF向量,則句子部分P可以表不為TF矩陣 S' :S.2,* * .,i.' · * * ;
[0008] 3)使用最佳內(nèi)容重構(gòu)的方法根據(jù)TF矩陣S從P選取k個(gè)句子部分組成集合 X = ?,…朶,…叉Γ作為文章的摘要,其中篇是選取出的第i個(gè)句子部分,X是P的真 子集。
[0009] 4)根據(jù)Skimming快速閱讀框架要求將k個(gè)句子部分中的名詞與介詞按照原文中出 現(xiàn)的順序排列作為摘要文本;通過讀屏軟件自由切換摘要與原文的功能實(shí)現(xiàn)視力障礙人士 快速閱讀。
[0010] 所述的步驟2)中所述的句子向量1描述如下:假設(shè)文章 D在抽取名詞,介詞后得到 的句子部分集合P包含η個(gè)不同的詞匯m個(gè)句子,按照字典序建立字典diet向量,字典為η X 1 的向量;那么第i個(gè)TF句子向量;^的第j個(gè)值表示字典diet中的第j個(gè)詞在第i句子的詞頻, 則;^為η X 1的向量。S為m X η的矩陣,Dij為字典diet中的第j個(gè)詞在第i句的詞頻。
[0011 ] 所述的步驟3)中使用最佳內(nèi)容重構(gòu)的方法為DSDR方法,DSDR方法可以從P中選取k 個(gè)句子部分進(jìn)行原文最佳重構(gòu),選取的k個(gè)句子部分組成摘要X。假設(shè)摘要為 X = [?, ?,…I... ,x對應(yīng)的 TF矩陣為 T = [II...... ~ 分I對應(yīng)的TF向量;可以用X對應(yīng)的TF矩陣T重構(gòu)即spfideti)其中乜為重構(gòu)函數(shù),T為η Xk的TF矩陣,ai為kXl權(quán)重向量,那么任意TF向量^重構(gòu)的損失函數(shù)為L(Si,T,ai)= | |Si- fi(T,ai) I 12;對S中的所有句子重構(gòu)的損失函數(shù)1]1$2^|5) -/^2;0^|進(jìn)行最小化可以找到 最佳的k個(gè)句子進(jìn)行原文最佳重構(gòu)即X。
[0012] 所述的步驟4)的具體做法是:
[0013] 1)首先將基于最佳內(nèi)容重構(gòu)的方法得到的k個(gè)摘要句子按照原文出現(xiàn)的順序排 序;
[0014] 2)對排序好的摘要中的名詞,介詞分別一一映射到原文中去。若對于摘要中一個(gè) 名詞Μ原文中有多個(gè)映射及,那么選擇及中的第一個(gè)詞作為Μ的映射,這樣可以保證不會丟 失?目息;
[0015] 3)視力障礙人士使用基于最佳內(nèi)容重構(gòu)的無障礙Skimming快速閱讀方法閱讀時(shí), 首先播放摘要文本,用戶根據(jù)摘要文本的信息自由的選擇摘要文本與原文跳讀,快速閱讀。 [0016]本發(fā)明提出了基于最佳內(nèi)容重構(gòu)的無障礙Skimming快速閱讀方法,其優(yōu)點(diǎn)在于: 對文章進(jìn)行自動摘要,一方面提供文章摘要給視力障礙人士可以加速他們理解文章大意減 少信息過載,另一方面Skimming的原文與摘要之間跳讀可以幫助視力障礙人士獲取更多的 文章細(xì)節(jié)。
【附圖說明】
[0017]圖1是本發(fā)明的方法流程圖。
【具體實(shí)施方式】
[0018] 參照附圖,進(jìn)一步說明本發(fā)明:
[0019] 1、一種基于最佳內(nèi)容重構(gòu)的無障礙快速閱讀方法,從互聯(lián)網(wǎng)抓取網(wǎng)頁后,針對每 個(gè)網(wǎng)頁進(jìn)行以下操作:
[0020] 1)提取網(wǎng)頁中的文章汐=,其中D為文章的句子向量集合, _Fl.為句子向量表不文章 d的第i個(gè)句子;
[0021] 2)利用詞性標(biāo)注的方法對集合D中的句子進(jìn)行名詞,介詞的抽取得到句子部分集 合P = >其中句子部分A為句子向量工抽取名詞、介詞所得,然后 將任意的句子部分&表不成T F向量$,ι則句子部分P可以表不為T F矩陣 S- = i'S'l··, S'Zy - * . Sif., . . I;
[0022] 3)使用最佳內(nèi)容重構(gòu)的方法根據(jù)TF矩陣S從P選取k個(gè)句子部分組成集合 X = [$,5,...... 乍為文章的摘要,其中S是選取出的第i個(gè)句子部分,X是p的 真子集。
[0023] 4)根據(jù)Skimmin