欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種匹配關(guān)鍵詞的方法及裝置的制作方法

文檔序號:6597880閱讀:152來源:國知局
專利名稱:一種匹配關(guān)鍵詞的方法及裝置的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及計(jì)算機(jī)及互聯(lián)網(wǎng)領(lǐng)域,特別是涉及一種匹配關(guān)鍵詞的方法及裝置。
背景技術(shù)
在檢查互聯(lián)網(wǎng)信息或文本文件的過程中,通常要分析頁面內(nèi)容。現(xiàn)有的做法是搜 索頁面中包含的一個(gè)或多個(gè)關(guān)鍵字。即用關(guān)鍵詞對頁面內(nèi)容進(jìn)行匹配,以尋找關(guān)鍵詞在頁 面中的位置。但是,關(guān)鍵詞是作為一個(gè)整體參與匹配的,例如“互聯(lián)網(wǎng)”,這種技術(shù)不能對漢字 和非漢字字符夾雜情況下的關(guān)鍵詞進(jìn)行檢索,并且不能檢索到目標(biāo)關(guān)鍵詞的近似詞匯。

發(fā)明內(nèi)容
本發(fā)明提供了一種匹配關(guān)鍵詞的方法及裝置,用以解決現(xiàn)有技術(shù)不能對漢字和非 漢字字符夾雜情況下的關(guān)鍵詞進(jìn)行檢索,并且不能檢索到目標(biāo)關(guān)鍵詞的近似詞匯的問題。本發(fā)明的匹配關(guān)鍵詞的方法,包括下列步驟生成關(guān)鍵碼的步驟將關(guān)鍵詞中的 漢字逐一用漢語拼音編碼,生成關(guān)鍵碼;生成待檢索碼流的步驟將待檢索頁面中的漢字 逐一用漢語拼音編碼,生成待檢索碼流;匹配的步驟以關(guān)鍵碼對待檢索碼流進(jìn)行匹配,得 出匹配結(jié)果。本發(fā)明的匹配關(guān)鍵詞的裝置,包括第一編碼模塊,用于將關(guān)鍵詞中的漢字逐一用 漢語拼音編碼,生成關(guān)鍵碼;第二編碼模塊,用于將待檢索頁面中的漢字逐一用漢語拼音編 碼,生成待檢索碼流;匹配模塊,用于以所述關(guān)鍵碼對待檢索碼流進(jìn)行匹配,得出匹配結(jié)果。本發(fā)明有益效果如下本發(fā)明可對漢字和非漢字字符夾雜情況下的關(guān)鍵詞進(jìn)行檢索,并且可檢索到目標(biāo) 關(guān)鍵詞的近似詞匯。


圖1為本發(fā)明實(shí)施例中的方法步驟流程圖;圖2為本發(fā)明實(shí)施例中的裝置結(jié)構(gòu)示意圖。
具體實(shí)施例方式為了完善現(xiàn)有關(guān)鍵詞檢索技術(shù)不能對漢字和非漢字字符夾雜情況下的關(guān)鍵詞進(jìn) 行檢索的缺陷,以及不能檢索到目標(biāo)關(guān)鍵詞的近似詞匯的缺陷,本發(fā)明提出了一種匹配關(guān) 鍵詞的方法及裝置,以下通過若干實(shí)施例具體說明。參見圖1所示,本發(fā)明實(shí)施例中的方法包括下列主要步驟Si、將關(guān)鍵詞中的漢字逐一用漢語拼音編碼,生成關(guān)鍵碼。S2、將待檢索頁面中的漢字逐一用漢語拼音編碼,生成待檢索碼流。
S3、以關(guān)鍵碼對待檢索碼流進(jìn)行匹配,得出匹配結(jié)果。更為具體的在步驟Sl和S2中,關(guān)鍵詞中若包含英文字符,則在編碼過程中該英 文字符作為關(guān)鍵碼的一部分予以保留,并且其在關(guān)鍵碼中的位置與在原關(guān)鍵詞中的位置相 同。待檢索頁面中若包含英文字符,則在編碼過程中該英文字符同理作為待檢索碼流的一 部分予以保留,并且其在待檢索碼流中的位置與在原待檢索頁面中的位置相同。更為具體的在步驟S2和S3中,對待檢索頁面內(nèi)容的編碼和關(guān)鍵字的關(guān)鍵碼匹配 是同時(shí)進(jìn)行的。即在將待檢索頁面中的漢字逐一用漢語拼音編碼,生成待檢索碼流的過程 中,以關(guān)鍵碼實(shí)時(shí)跟蹤匹配,當(dāng)匹配到相同的編碼時(shí),將當(dāng)前待檢索碼流尾部與關(guān)鍵碼相匹 配的編碼對應(yīng)的文字呈現(xiàn)給用戶。具體流程為在生成關(guān)鍵碼后,按順序從待檢索頁面中獲 取一個(gè)字符,該字符可為漢字也可為英文字符,若為漢字,則對該漢字用漢語拼音編碼,得 到一串英文字符,若為英文字符,則直接將其作為待檢索碼流的一部分。在得到當(dāng)前字符的 編碼后,實(shí)時(shí)與關(guān)鍵碼進(jìn)行匹配,若關(guān)鍵詞為一個(gè)字,則可能完整匹配,若關(guān)鍵詞為多個(gè)字 或是中英夾雜,則可能按照關(guān)鍵碼從左到右的順序匹配到關(guān)鍵碼的片段,之后在下一字符 編碼后,繼續(xù)進(jìn)行匹配操作,若經(jīng)過若干個(gè)字符編碼后,可得到連續(xù)的關(guān)鍵碼片段并可組成 完整的關(guān)鍵碼,則判定匹配到一個(gè)關(guān)鍵碼;之后可將待檢索頁面中對應(yīng)的文字實(shí)時(shí)以高亮 方式或其它方式呈現(xiàn)給用戶。如此循環(huán),直至將待檢索頁面的內(nèi)容全部匹配完畢。在具體實(shí)現(xiàn)中,例如關(guān)鍵詞為“互聯(lián)網(wǎng)hternet”。待檢索頁面中的文字內(nèi)容為 “隨著時(shí)代的發(fā)展,互聯(lián)網(wǎng)hternet已成為人們生活中必不可少的元素”。對關(guān)鍵詞用漢語拼音編碼后得到的關(guān)鍵碼為“hulianwanglnternet”。之后按順序 從待檢索頁面中逐一獲取字符,在得到當(dāng)前字符的編碼后,實(shí)時(shí)與關(guān)鍵碼進(jìn)行匹配。直至獲 取當(dāng)前字符“互”,對其編碼后得到“hu”,實(shí)時(shí)與關(guān)鍵碼“hulianwanglnternet”進(jìn)行匹配, 則可按照關(guān)鍵碼從左到右的順序匹配到關(guān)鍵碼的片段“hu”,之后在下一字符“聯(lián)”編碼后, 繼續(xù)進(jìn)行匹配操作,其后獲取到英文字符“I”時(shí)直接將其作為待檢索碼流的一部分,并進(jìn)行 匹配操作。經(jīng)過對待檢索頁面中的文字“互聯(lián)網(wǎng)hternet”編碼和實(shí)時(shí)匹配后,可匹配到連 續(xù)的關(guān)鍵碼片段并可組成完整的關(guān)鍵碼,這時(shí)判定匹配到一個(gè)關(guān)鍵碼。之后可將待檢索頁 面中的文字“互聯(lián)網(wǎng)hternet”實(shí)時(shí)以高亮方式或其它方式呈現(xiàn)給用戶。如此循環(huán),直至將 待檢索頁面的內(nèi)容全部匹配完畢。參見圖2所示,本實(shí)施中的匹配關(guān)鍵詞的裝置,包括第一編碼模塊、第二編碼模 塊和匹配模塊。其中,第一編碼模塊,用于將關(guān)鍵詞中的漢字逐一用漢語拼音編碼,生成關(guān)鍵碼。 關(guān)鍵詞中若包含英文字符,則在編碼過程中該英文字符作為關(guān)鍵碼的一部分予以保留,并 且其在關(guān)鍵碼中的位置與在原關(guān)鍵詞中的位置相同。第二編碼模塊,用于將待檢索頁面中的漢字逐一用漢語拼音編碼,生成待檢索碼 流。待檢索頁面中若包含英文字符,則在編碼過程中該英文字符同理作為待檢索碼流的一 部分予以保留,并且其在待檢索碼流中的位置與在原待檢索頁面中的位置相同。匹配模塊,用于以關(guān)鍵碼對待檢索碼流進(jìn)行匹配,得出匹配結(jié)果。更為具體的,第二編碼模塊對待檢索頁面內(nèi)容的編碼和匹配模塊的匹配操作是同 時(shí)進(jìn)行的。即第二編碼模塊在將待檢索頁面中的漢字逐一用漢語拼音編碼,生成待檢索碼 流的過程中,匹配模塊以第一編碼模塊輸出的關(guān)鍵碼實(shí)時(shí)跟蹤匹配,當(dāng)匹配到相同的編碼時(shí),將當(dāng)前待檢索碼流尾部與關(guān)鍵碼相匹配的編碼對應(yīng)的文字呈現(xiàn)給用戶。具體流程為在 第一編碼模塊生成關(guān)鍵碼后,第二編碼模塊按順序從待檢索頁面中獲取一個(gè)字符,該字符 可為漢字也可為英文字符,若為漢字,則對該漢字用漢語拼音編碼,得到一串英文字符,若 為英文字符,則直接將其作為待檢索碼流的一部分。在得到當(dāng)前字符的編碼后,匹配模塊實(shí) 時(shí)與關(guān)鍵碼進(jìn)行匹配,若關(guān)鍵詞為一個(gè)字,則可能完整匹配,若關(guān)鍵詞為多個(gè)字或是中英夾 雜,則可能按照關(guān)鍵碼從左到右的順序匹配到關(guān)鍵碼的片段,之后第二編碼模塊在對下一 字符編碼后,匹配模塊繼續(xù)進(jìn)行匹配操作,若經(jīng)過若干個(gè)字符編碼后,可得到連續(xù)的關(guān)鍵碼 片段并可組成完整的關(guān)鍵碼,則匹配模塊判定匹配到一個(gè)關(guān)鍵碼;之后可將待檢索頁面中 對應(yīng)的文字實(shí)時(shí)以高亮方式或其它方式呈現(xiàn)給用戶。如此循環(huán),直至將待檢索頁面的內(nèi)容 全部匹配完畢??梢?,本發(fā)明實(shí)施例可實(shí)現(xiàn)漢字和非漢字字符夾雜情況下的關(guān)鍵詞檢索。并且,由于本發(fā)明實(shí)施例中采用了將漢字用漢語拼音編碼的技術(shù),所以關(guān)鍵詞及 與其同音詞匯的編碼是相同的,進(jìn)而可匹配到與關(guān)鍵詞同音的詞匯,擴(kuò)大了檢索結(jié)果的范 圍。如果用戶輸入的關(guān)鍵詞不是正確的關(guān)鍵詞,但是是同音詞匯,則利用本發(fā)明實(shí)施例同樣 可得到用戶想要的匹配結(jié)果,例如用戶輸入的關(guān)鍵詞為“互連網(wǎng)”,則基于上述實(shí)例可匹配 到“互聯(lián)網(wǎng)”,而不會像現(xiàn)有技術(shù)那樣檢索不到任何結(jié)果,因此本發(fā)明實(shí)施例可給用戶帶來 更好的用戶感受。顯然,本領(lǐng)域的技術(shù)人員可以對本發(fā)明進(jìn)行各種改動(dòng)和變型而不脫離本發(fā)明的精 神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其等同技術(shù)的范圍 之內(nèi),則本發(fā)明也意圖包含這些改動(dòng)和變型在內(nèi)。
權(quán)利要求
1.一種匹配關(guān)鍵詞的方法,其特征在于,包括下列步驟生成關(guān)鍵碼的步驟將關(guān)鍵詞中的漢字逐一用漢語拼音編碼,生成關(guān)鍵碼; 生成待檢索碼流的步驟將待檢索頁面中的漢字逐一用漢語拼音編碼,生成待檢索碼流;匹配的步驟以所述關(guān)鍵碼對待檢索碼流進(jìn)行匹配,得出匹配結(jié)果。
2.如權(quán)利要求1所述匹配關(guān)鍵詞的方法,其特征在于,生成待檢索碼流的步驟和匹配 的步驟中具體包括在將待檢索頁面中的漢字逐一用漢語拼音編碼,生成待檢索碼流的過程中,以所述關(guān) 鍵碼實(shí)時(shí)跟蹤匹配;當(dāng)匹配到相同的編碼時(shí),將當(dāng)前待檢索碼流尾部與關(guān)鍵碼相匹配的編碼對應(yīng)的文字呈 現(xiàn)給用戶。
3.如權(quán)利要求1所述匹配關(guān)鍵詞的方法,其特征在于,生成關(guān)鍵碼的步驟中,關(guān)鍵詞中 的英文字符在編碼過程中作為關(guān)鍵碼的一部分。
4.如權(quán)利要求1或2所述匹配關(guān)鍵詞的方法,其特征在于,生成待檢索碼流的步驟中, 待檢索頁面中的英文字符在編碼過程中作為待檢索碼流的一部分。
5.一種匹配關(guān)鍵詞的裝置,其特征在于,包括第一編碼模塊,用于將關(guān)鍵詞中的漢字逐一用漢語拼音編碼,生成關(guān)鍵碼; 第二編碼模塊,用于將待檢索頁面中的漢字逐一用漢語拼音編碼,生成待檢索碼流; 匹配模塊,用于以所述關(guān)鍵碼對待檢索碼流進(jìn)行匹配,得出匹配結(jié)果。
6.如權(quán)利要求5所述匹配關(guān)鍵詞的裝置,其特征在于,第二編碼模塊在將待檢索頁面 中的漢字逐一用漢語拼音編碼,生成待檢索碼流的過程中,匹配模塊以第一編碼模塊輸出 的關(guān)鍵碼實(shí)時(shí)跟蹤匹配;匹配模塊判定匹配到相同的編碼,則將當(dāng)前待檢索碼流尾部與關(guān)鍵碼相匹配的編碼 對應(yīng)的文字呈現(xiàn)給用戶。
7.如權(quán)利要求5所述匹配關(guān)鍵詞的裝置,其特征在于,第一編碼模塊將關(guān)鍵詞中的英 文字符作為關(guān)鍵碼的一部分。
8.如權(quán)利要求5或6所述匹配關(guān)鍵詞的裝置,其特征在于,第二編碼模塊將待檢索頁面 中的英文字符作為待檢索碼流的一部分。
全文摘要
本發(fā)明公開了一種匹配關(guān)鍵詞的方法及裝置,涉及計(jì)算機(jī)及互聯(lián)網(wǎng)領(lǐng)域,用以解決現(xiàn)有技術(shù)不能對漢字和非漢字字符夾雜情況下的關(guān)鍵詞進(jìn)行檢索,并且不能檢索到目標(biāo)關(guān)鍵詞的近似詞匯的問題。方法包括將關(guān)鍵詞中的漢字逐一用漢語拼音編碼,生成關(guān)鍵碼;將待檢索頁面中的漢字逐一用漢語拼音編碼,生成待檢索碼流;以關(guān)鍵碼對待檢索碼流進(jìn)行匹配,得出匹配結(jié)果。裝置包括第一編碼模塊,第二編碼模塊和匹配模塊。本發(fā)明可對漢字和非漢字字符夾雜情況下的關(guān)鍵詞進(jìn)行檢索,并且可檢索到目標(biāo)關(guān)鍵詞的近似詞匯。
文檔編號G06F17/30GK102081638SQ20101010494
公開日2011年6月1日 申請日期2010年1月29日 優(yōu)先權(quán)日2010年1月29日
發(fā)明者柯宗慶, 柯宗貴 申請人:藍(lán)盾信息安全技術(shù)股份有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
曲松县| 水富县| 竹北市| 揭阳市| 湾仔区| 阜南县| 湘乡市| 清远市| 区。| 五原县| 嫩江县| 阳信县| 益阳市| 营山县| 固镇县| 库伦旗| 崇义县| 伊通| 红原县| 克拉玛依市| 景东| 吉林省| 海林市| 迁西县| 怀远县| 台中市| 万源市| 额敏县| 肇源县| 拉孜县| 保亭| 桦川县| 信阳市| 南京市| 名山县| 临猗县| 萝北县| 武城县| 东台市| 蒙山县| 临海市|