欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于用戶眼球的單詞查詢方法

文檔序號(hào):8543670閱讀:211來源:國知局
一種基于用戶眼球的單詞查詢方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明設(shè)及屬于模式分類、計(jì)算機(jī)視覺領(lǐng)域,具體設(shè)及一種基于用戶眼球的單詞 查詢方法。
【背景技術(shù)】
[0002] 當(dāng)今社會(huì)信息化發(fā)展的今天,人們?cè)陔娔X上閱讀的習(xí)慣也越來越普遍。而我們閱 讀的內(nèi)容的多樣化的同時(shí)也產(chǎn)生了很多需求,比如一個(gè)非英語作為其母語的學(xué)生在閱讀英 文類的書籍是難免會(huì)發(fā)生不認(rèn)識(shí)的單詞的情況。對(duì)于該樣一種情形,在互聯(lián)網(wǎng)發(fā)達(dá)的今天 已經(jīng)有了很多的電子詞典軟件輔助我們查閱陌生單詞提高我們的效率。就我們目前的情況 而言,已經(jīng)成熟并大量投入使用的詞典有金山詞霸,有道詞典,靈格斯詞霸等等。它們目前 的查詢方式有W下幾個(gè);通過鍵盤輸入單詞查詢方式,通過鼠標(biāo)指針移動(dòng)取詞查詢方式。其 中第二種查找方式為用戶的查詢提供了很大的便捷性,備受廣大用戶喜愛。但是該種方式 也有其缺點(diǎn),第一當(dāng)我們發(fā)現(xiàn)又不認(rèn)識(shí)的單詞時(shí),必須將鼠標(biāo)指針移動(dòng)到該單詞的位置,該 還是比較麻煩;第二當(dāng)我們的鼠標(biāo)指針不小屯、落到一個(gè)認(rèn)識(shí)的單詞上時(shí),它也會(huì)出現(xiàn)該單 詞的釋義,從而擋住了其他單詞的位置,使我們?cè)陂喿x時(shí)不得不把鼠標(biāo)的位置擺放到一個(gè) 特定的區(qū)域,W免影響到我們閱讀的連貫性。

【發(fā)明內(nèi)容】

[0003] 本發(fā)明的目的在于克服上述現(xiàn)有技術(shù)中存在的缺點(diǎn),提供一種基于用戶眼球的單 詞查詢方法,具有方便快捷的優(yōu)點(diǎn)。
[0004] 為實(shí)現(xiàn)上述目的,本發(fā)明采用W下技術(shù)方案;包括W下步驟:
[0005] 1)判斷用戶初始詞匯量;
[0006] 2)計(jì)算用戶眼球區(qū)域時(shí)間;
[0007] 3)根據(jù)用戶眼球在該區(qū)域停留的時(shí)間和用戶的詞匯量判斷用戶不認(rèn)識(shí)的單詞并 列表;
[000引 4)用戶閱讀完后,對(duì)列表中的單詞進(jìn)行篩選,選出陌生單詞并更新分類器。
[0009] 所述的1)判斷用戶初始詞匯量的具體方法為:
[0010] (1-1)通過錄入若干相關(guān)度高的英語文章,統(tǒng)計(jì)每個(gè)常用單詞的詞頻;
[0011] (1-。對(duì)統(tǒng)計(jì)出來的詞頻進(jìn)行排序;
[001引 (1-扣將出現(xiàn)頻率高的詞庫錄入詞典中;
[0013] (1-4)對(duì)每個(gè)詞庫我們隨機(jī)抽取單詞作為該詞庫的樣本單詞;
[0014] (l-W根據(jù)用戶填寫自己的個(gè)人信息后,我們將對(duì)應(yīng)詞庫的樣本單詞給用戶,讓其 進(jìn)行判斷,根據(jù)其答題情況,通過決策樹算法判斷出用戶的詞匯量;
[0015] (1-6)判斷出用戶詞匯量后,將用戶的正確率統(tǒng)計(jì)出來,通過第二步的單詞頻率, 推斷出用戶在該詞匯量下對(duì)單詞的掌握程度。
[0016] 所述的2)計(jì)算用戶眼球區(qū)域時(shí)間的具體方法為:
[0017] (2-1)定義電腦屏幕分為m*n個(gè)區(qū)域,每個(gè)區(qū)域Area;用(Xbi,Ybi,Xei,Yei)表示;
[001引 (2-。用電腦攝像頭拍攝用戶臉部,通過Viola人臉檢測(cè)器檢測(cè)出人臉位置;
[0019] (2-3)對(duì)人臉位置區(qū)域進(jìn)行圖像去噪預(yù)處理操作;
[0020] (2-4)利用AAM人臉模型找到人眼球中屯、坐標(biāo),通過坐標(biāo)映射算法算出人眼注視 在屏幕的區(qū)域(Area,)和當(dāng)前注視的時(shí)刻t;
[0021] (2-5)通過在一個(gè)區(qū)域Area,內(nèi)計(jì)算當(dāng)前注視時(shí)刻的最大值和最小值算眼球在該 區(qū)域內(nèi)的注視時(shí)間。
[0022] 所述3)根據(jù)用戶眼球在該區(qū)域停留的時(shí)間判斷用戶不認(rèn)識(shí)的單詞并列表的方式 為;當(dāng)用戶該注視時(shí)間大于設(shè)定的闊值時(shí)提取該區(qū)域內(nèi)的單詞。
[0023] 所述選4)選出陌生單詞的方法為:
[0024] (4-1)通過上一步所知道的用戶的區(qū)域我們將該區(qū)域內(nèi)所有的單詞提取出來;
[0025] (4-2)依靠用戶的詞匯量,利用我們之前訓(xùn)練好的一個(gè)分類模型將該區(qū)域內(nèi)所有 的單詞進(jìn)行分類;
[0026] (4-3)對(duì)分類的結(jié)果為陌生詞的單詞進(jìn)行詞典查找為用戶列出該單詞的釋義列 表。
[0027] 所述4)中選出陌生單詞的方法為;分類用戶的陌生詞和已知詞選取的特征為單 詞的詞頻和其長度還有單詞之間的相似度作為特征,訓(xùn)練SVM分類器判斷用戶所注視區(qū)域 內(nèi)的所有單詞是否有用戶的陌生詞。
[002引所述訓(xùn)練SVM分類器的訓(xùn)練步驟為:
[0029] (5-1)通過logistic函數(shù)將特征值歸一化
[0030]
【主權(quán)項(xiàng)】
1. 一種基于用戶眼球的單詞查詢方法,其特征在于:包括以下步驟: 1) 判斷用戶初始詞匯量; 2) 計(jì)算用戶眼球區(qū)域時(shí)間; 3) 根據(jù)用戶眼球在該區(qū)域停留的時(shí)間和用戶的詞匯量判斷用戶不認(rèn)識(shí)的單詞并列 表; 4) 用戶閱讀完后,對(duì)列表中的單詞進(jìn)行篩選,選出陌生單詞并更新分類器。
2. 根據(jù)權(quán)利要求1所述的一種基于用戶眼球的單詞查詢方法,其特征在于:所述的1) 判斷用戶初始詞匯量的具體方法為: (1-1)通過錄入若干相關(guān)度高的英語文章,統(tǒng)計(jì)每個(gè)常用單詞的詞頻; (1-2)對(duì)統(tǒng)計(jì)出來的詞頻進(jìn)行排序; (1-3)將出現(xiàn)頻率高的詞庫錄入詞典中; (1-4)對(duì)每個(gè)詞庫我們隨機(jī)抽取單詞作為該詞庫的樣本單詞; (1-5)根據(jù)用戶填寫自己的個(gè)人信息后,我們將對(duì)應(yīng)詞庫的樣本單詞給用戶,讓其進(jìn)行 判斷,根據(jù)其答題情況,通過決策樹算法判斷出用戶的詞匯量; (1-6)判斷出用戶詞匯量后,將用戶的正確率統(tǒng)計(jì)出來,通過(1-2)的單詞頻率,推斷 出用戶在該詞匯量下對(duì)單詞的掌握程度。
3. 根據(jù)權(quán)利要求1所述的一種基于用戶眼球的單詞查詢方法,其特征在于:所述的2) 計(jì)算用戶眼球區(qū)域時(shí)間的具體方法為: (2-1)定義電腦屏幕分為m*n個(gè)區(qū)域,每個(gè)區(qū)域八^81用(XbDYbDX e^YeJ表示; (2-2)用電腦攝像頭拍攝用戶臉部,通過Viola人臉檢測(cè)器檢測(cè)出人臉位置; (2-3)對(duì)人臉位置區(qū)域進(jìn)行圖像去噪預(yù)處理操作; (2-4)利用AAM人臉模型找到人眼球中心坐標(biāo),通過坐標(biāo)映射算法算出人眼注視在屏 幕的區(qū)域(Areai)和當(dāng)前注視的時(shí)刻t ; (2-5)通過在一個(gè)區(qū)域Areai內(nèi)計(jì)算當(dāng)前注視時(shí)刻的最大值和最小值算眼球在該區(qū)域 內(nèi)的注視時(shí)間。
4. 根據(jù)權(quán)利要求1所述的一種基于用戶眼球的單詞查詢方法,其特征在于:所述3)根 據(jù)用戶眼球在該區(qū)域停留的時(shí)間判斷用戶不認(rèn)識(shí)的單詞并列表的方式為:當(dāng)用戶該注視時(shí) 間大于設(shè)定的閾值時(shí)提取該區(qū)域內(nèi)的單詞。
5. 根據(jù)權(quán)利要求1所述的一種基于用戶眼球的單詞查詢方法,其特征在于:所述選4) 選出陌生單詞的方法為: (4-1)通過上一步所知道的用戶的區(qū)域我們將該區(qū)域內(nèi)所有的單詞提取出來; (4-2)依靠用戶的詞匯量,利用我們之前訓(xùn)練好的一個(gè)分類模型將該區(qū)域內(nèi)所有的單 詞進(jìn)行分類; (4-3)對(duì)分類的結(jié)果為陌生詞的單詞進(jìn)行詞典查找為用戶列出該單詞的釋義列表。
6. 根據(jù)權(quán)利要求1所述的一種基于用戶眼球的單詞查詢方法,其特征在于:所述4)中 選出陌生單詞的方法為:分類用戶的陌生詞和已知詞選取的特征為單詞的詞頻和其長度還 有單詞之間的相似度作為特征,訓(xùn)練SVM分類器判斷用戶所注視區(qū)域內(nèi)的所有單詞是否有 用戶的陌生詞。
7. 根據(jù)權(quán)利要求6所述的一種基于用戶眼球的單詞查詢方法,其特征在于:所述訓(xùn)練 SVM分類器的訓(xùn)練步驟為: (5-1)通過logistic函數(shù)將特征值歸一化
(5-5)選擇真陽性率(true positive rate, TPR)從而確定向量機(jī)參數(shù)進(jìn)行訓(xùn)練; (5-6)將用戶所注視區(qū)域的單詞輸入訓(xùn)練模型進(jìn)行計(jì)算,將所得結(jié)果與模型的參數(shù)進(jìn) 行比較,當(dāng)誤差值小于定義的誤差時(shí),則判定該單詞為陌生詞,否則為已知詞。
8.根據(jù)權(quán)利要求1所述的一種基于用戶眼球的單詞查詢方法,其特征在于:所述4)完 成后,用于對(duì)用戶將該列表中認(rèn)識(shí)的單詞打鉤,然后提交;系統(tǒng)根據(jù)該列表的內(nèi)容,生成新 的訓(xùn)練數(shù)據(jù)對(duì)我們的分類模型進(jìn)一步的訓(xùn)練;更新分類器以供用戶的下一次使用。
【專利摘要】本發(fā)明涉及一種基于用戶眼球的單詞查詢方法,包括以下步驟:1)判斷用戶初始詞匯量;2)計(jì)算用戶眼球區(qū)域時(shí)間;3)根據(jù)用戶眼球在該區(qū)域停留的時(shí)間和用戶的詞匯量判斷用戶不認(rèn)識(shí)的單詞并列表;4)用戶閱讀完后,對(duì)列表中的單詞進(jìn)行篩選,選出陌生單詞并分類。通過眼睛定位屏幕區(qū)域的時(shí)間來推測(cè)用戶是否在該屏幕區(qū)域中有陌生詞,不需要通過鼠標(biāo)移動(dòng)到該區(qū)域來,以方便用戶閱讀的連貫性和便捷性。
【IPC分類】G06K9-62, G06F17-27
【公開號(hào)】CN104866470
【申請(qǐng)?zhí)枴緾N201510283624
【發(fā)明人】惠維, 張哲 , 蔣志平, 韓勁松, 魏堯, 趙季中
【申請(qǐng)人】西安交通大學(xué)
【公開日】2015年8月26日
【申請(qǐng)日】2015年5月28日
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
格尔木市| 罗田县| 张家口市| 黄龙县| 南城县| 望奎县| 岳普湖县| 佳木斯市| 雅江县| 封丘县| 库伦旗| 博白县| 邹城市| 大同市| 南丹县| 阆中市| 鲜城| 忻城县| 凌海市| 安达市| 繁峙县| 耒阳市| 平遥县| 衡阳县| 大化| 太和县| 合川市| 二手房| 嘉义市| 伊吾县| 张家川| 隆安县| 宁远县| 南昌市| 含山县| 鱼台县| 崇仁县| 三门县| 长丰县| 那曲县| 湘潭市|