欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種具有容錯(cuò)功能的搜索方法

文檔序號:6352758閱讀:192來源:國知局
專利名稱:一種具有容錯(cuò)功能的搜索方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種數(shù)據(jù)搜索技術(shù),尤其是一種具有容錯(cuò)功能的搜索方法。
背景技術(shù)
目前,公知的搜索技術(shù)是將用戶輸入的詞語按固定長度的方式進(jìn)行分詞,然后對 分詞的結(jié)果進(jìn)行搜索匹配。這種搜索方法對于處理傳統(tǒng)的信息搜索沒有問題,但是在一些 特定搜索領(lǐng)域,例如對地名、企業(yè)名稱等進(jìn)行搜索就可能出現(xiàn)問題。首先,企業(yè)名稱各種各 樣,大、小、新企業(yè)不斷產(chǎn)生,數(shù)據(jù)庫及時(shí)更新這些企業(yè)名稱幾乎是不可能的事情,由于數(shù)據(jù) 庫不準(zhǔn)確,必然導(dǎo)致分詞不準(zhǔn)確,從而嚴(yán)重影響搜索結(jié)果。其次,用戶可能無法準(zhǔn)確的記住 企業(yè)名稱,在輸入企業(yè)名稱的時(shí)候很可能會(huì)出現(xiàn)少字、錯(cuò)字、多字等情況,這種情況也會(huì)導(dǎo) 致分詞錯(cuò)誤,從而影響搜索結(jié)果。

發(fā)明內(nèi)容
本發(fā)明的目的在于克服現(xiàn)有技術(shù)的不足,提供了一種具有容錯(cuò)功能的搜索方法, 該搜索方法可以解決如地名、企業(yè)名稱等特定搜索領(lǐng)域的搜索容錯(cuò)問題,具有極高的容錯(cuò) 性。本發(fā)明解決其技術(shù)問題是采取以下技術(shù)方案實(shí)現(xiàn)的一種具有容錯(cuò)功能的搜索方法,包括索引和數(shù)據(jù)查詢搜索方法,其采用的方法步 驟如下(1)索引部分搜索采用對每一個(gè)漢字或單詞進(jìn)行索引,實(shí)現(xiàn)單字搜索的功能;(2)數(shù)據(jù)查詢部分搜索對用戶輸入的詞語按照其長度計(jì)算該詞語的變元長度; 設(shè)置切分步進(jìn)值;按照變元長度及切分步進(jìn)值對輸入的詞語進(jìn)行切分;將分詞結(jié)果使用過 濾詞典進(jìn)行過濾;對過濾后的每一個(gè)詞進(jìn)行短句搜后得到正確的檢索結(jié)果。而且,所述的變元長度的計(jì)算方法為將詞語的長度開平方,然后取整數(shù)便得到變 元長度。而且,所述的切分步進(jìn)值為1 5。本發(fā)明的優(yōu)點(diǎn)和積極效果是1、本搜索方法是一種具有容錯(cuò)能力的搜索技術(shù),其對于用戶輸入的詞語按照該詞 語的長度計(jì)算變元長度,并將變元長度與切分步進(jìn)值配合對輸入的詞語進(jìn)行分詞,然后進(jìn) 行檢索,對于搜索用戶輸入的詞語具有非常強(qiáng)的容錯(cuò)性,提高了檢索的準(zhǔn)確性。2、本搜索方法可以調(diào)整變元長度與切分步進(jìn)值的關(guān)系以達(dá)到搜索質(zhì)量和搜索效 率的平衡,即使在搜索用戶輸入出現(xiàn)錯(cuò)字、少字、多字等錯(cuò)誤的時(shí)候仍然能夠搜索到所要的 信息,同時(shí)也能夠適應(yīng)未能及時(shí)更新詞庫的情況。3、本發(fā)明設(shè)計(jì)合理,其采用變元長度方法結(jié)合切分步進(jìn)值進(jìn)行分詞檢索,具有容 錯(cuò)性強(qiáng)、準(zhǔn)確性高的特點(diǎn),特別適用于一些特定的搜索領(lǐng)域,比如地名、企業(yè)名稱等搜索領(lǐng) 域具有特別的意義。
具體實(shí)施例方式以下對本發(fā)明實(shí)施例做進(jìn)一步詳述。一種具有容錯(cuò)功能的搜索方法,包括索引和數(shù)據(jù)查詢搜索方法,其采用的方法步 驟如下(1)索引部分搜索采用對每一個(gè)漢字或單詞進(jìn)行索引,實(shí)現(xiàn)單字搜索的功能;(2)數(shù)據(jù)查詢部分搜索對用戶輸入的詞語按照其長度計(jì)算該詞語的變元長度,其計(jì)算方法為將詞語的 長度開平方,然后取整數(shù)便得到變元長度;設(shè)置切分步進(jìn)值,該切分步進(jìn)值可以設(shè)置為1 5 ;按照變元長度及切分步進(jìn)值對輸入的詞語進(jìn)行切分;將分詞結(jié)果使用過濾詞典進(jìn)行過濾;對過濾后的每一個(gè)詞進(jìn)行短句搜索即可檢索出正確的結(jié)果。實(shí)施例用戶輸入“一度搜索網(wǎng)絡(luò)科技公司”,該詞語的長度為10,然后按照規(guī)則來計(jì)算可 變元長度,將詞語的長度10開方后取整,則得到變元長度3 ;將切分步進(jìn)值設(shè)置為1 (當(dāng)然, 步進(jìn)值還可以設(shè)置為其他值,以提高搜速的速度);然后根據(jù)變元長度及切分步進(jìn)值來切 分用戶輸入的“一度搜索網(wǎng)絡(luò)科技公司”,切分為“一度搜、度搜索、搜索網(wǎng)、索網(wǎng)絡(luò)、網(wǎng)絡(luò)科、 絡(luò)科技、科技公、技公司”作為可選項(xiàng),將這個(gè)分詞結(jié)果用過濾詞典來過濾;最后對過濾后分 詞結(jié)果的每一個(gè)“詞”進(jìn)行短句搜索,就可以查出匹配“一度搜索網(wǎng)絡(luò)科技公司”的結(jié)果了。 當(dāng)然這個(gè)分詞結(jié)果可能太多,會(huì)影響搜索效率??梢赃m當(dāng)?shù)母淖冏冊L度的計(jì)算方法和切 分步進(jìn)值的大小,在搜索質(zhì)量和搜索效率中取得平衡。這種采用可變長度的取詞方式不依 賴于傳統(tǒng)詞庫,故不存在詞庫更新問題,即使用戶輸入出現(xiàn)錯(cuò)字或者少字,分詞的結(jié)果仍然 能保證大部分分詞結(jié)果的正確性,故仍然能夠搜索到正確結(jié)果。需要強(qiáng)調(diào)的是,本發(fā)明所述的實(shí)施例是說明性的,而不是限定性的,因此本發(fā)明并 不限于具體實(shí)施方式
中所述的實(shí)施例,凡是由本領(lǐng)域技術(shù)人員根據(jù)本發(fā)明的技術(shù)方案得出 的其他實(shí)施方式,同樣屬于本發(fā)明保護(hù)的范圍。
權(quán)利要求
一種具有容錯(cuò)功能的搜索方法,其特征在于包括索引和數(shù)據(jù)查詢搜索方法,其采用的方法步驟如下(1)索引部分搜索采用對每一個(gè)漢字或單詞進(jìn)行索引,實(shí)現(xiàn)單字搜索的功能;(2)數(shù)據(jù)查詢部分搜索對用戶輸入的詞語按照其長度計(jì)算該詞語的變元長度;設(shè)置切分步進(jìn)值;按照變元長度及切分步進(jìn)值對輸入的詞語進(jìn)行切分;將分詞結(jié)果使用過濾詞典進(jìn)行過濾;對過濾后的每一個(gè)詞進(jìn)行短句搜后得到正確的檢索結(jié)果。
2.根據(jù)權(quán)利要求1所述的一種具有容錯(cuò)功能的搜索方法,其特征在于所述的變元長 度的計(jì)算方法為將詞語的長度開平方,然后取整數(shù)便得到變元長度。
3.根據(jù)權(quán)利要求1所述的一種具有容錯(cuò)功能的搜索方法,其特征在于所述的切分步 進(jìn)值為1 5。
全文摘要
本發(fā)明涉及一種具有容錯(cuò)功能的搜索方法,其采用的方法步驟如下(1)索引部分搜索采用對每一個(gè)漢字或單詞進(jìn)行索引,實(shí)現(xiàn)單字搜索的功能;(2)數(shù)據(jù)查詢部分搜索對用戶輸入的詞語按照其長度計(jì)算該詞語的變元長度;設(shè)置切分步進(jìn)值;按照變元長度及切分步進(jìn)值對輸入的詞語進(jìn)行切分;將分詞結(jié)果使用過濾詞典進(jìn)行過濾;對過濾后的每一個(gè)詞進(jìn)行短句搜后得到正確的檢索結(jié)果。本發(fā)明設(shè)計(jì)合理,其采用變元長度方法結(jié)合切分步進(jìn)值進(jìn)行分詞檢索,具有容錯(cuò)性強(qiáng)、準(zhǔn)確性高的特點(diǎn),特別適用于一些特定的搜索領(lǐng)域,比如地名、企業(yè)名稱等搜索領(lǐng)域具有特別的意義。
文檔編號G06F17/30GK101937434SQ20091006947
公開日2011年1月5日 申請日期2009年6月29日 優(yōu)先權(quán)日2009年6月29日
發(fā)明者徐純芳, 趙鵬 申請人:天津一度搜索網(wǎng)絡(luò)科技有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊!
1
贵南县| 石棉县| 博爱县| 海门市| 沾化县| 菏泽市| 永平县| 万盛区| 仙游县| 宁南县| 彰武县| 徐州市| 宝兴县| 汝阳县| 资源县| 得荣县| 湟源县| 拉萨市| 巴林右旗| 徐州市| 无锡市| 宁晋县| 长汀县| 龙泉市| 舞阳县| 芒康县| 新竹市| 包头市| 肇州县| 辛集市| 东方市| 竹溪县| 铜川市| 广汉市| 社会| 大足县| 昌都县| 鱼台县| 云南省| 兴城市| 思茅市|