欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種擴(kuò)展檢索詞的方法和系統(tǒng)的制作方法

文檔序號(hào):6504153閱讀:725來源:國(guó)知局
一種擴(kuò)展檢索詞的方法和系統(tǒng)的制作方法
【專利摘要】本發(fā)明提供了一種擴(kuò)展檢索詞的方法和系統(tǒng),該方法包括給每個(gè)普通詞匯設(shè)置不少于一個(gè)的標(biāo)簽詞,形成標(biāo)簽詞詞典;根據(jù)第一普通詞匯周邊的第二普通詞匯之間的關(guān)系,給每個(gè)第二普通詞匯所屬的每個(gè)標(biāo)簽詞進(jìn)行加權(quán),并進(jìn)行排序;從第二普通詞匯所屬的全部標(biāo)簽詞中,抽取預(yù)設(shè)數(shù)量的高權(quán)值標(biāo)簽詞,作為第一普通詞匯的擴(kuò)展范圍;輸入第一普通詞匯作為檢索詞時(shí),將位于第一普通詞匯擴(kuò)展范圍內(nèi)的標(biāo)簽詞對(duì)應(yīng)的普通詞匯展現(xiàn)出來;從擴(kuò)展范圍內(nèi)的標(biāo)簽詞對(duì)應(yīng)的普通詞匯中,選擇需要的普通詞匯,作為檢索詞的擴(kuò)展檢索詞。本發(fā)明技術(shù)方案能夠幫助用戶獲取符合信息檢索目標(biāo)的檢索詞,從而提高信息檢索效率。
【專利說明】一種擴(kuò)展檢索詞的方法和系統(tǒng)

【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及信息檢索【技術(shù)領(lǐng)域】,尤其涉及一種擴(kuò)展檢索詞的方法和系統(tǒng)。

【背景技術(shù)】
[0002]隨著信息時(shí)代的到來,人們進(jìn)入了信息的海洋。在海量的信息面前,人們反而無所適從,很難在短時(shí)間內(nèi)找到自己所需的信息。然而計(jì)算機(jī)技術(shù)和網(wǎng)絡(luò)技術(shù)的發(fā)展,給信息檢索領(lǐng)域提供了某種程度上的幫助,人們可以構(gòu)建自己所需的檢索策略,并利用計(jì)算機(jī)技術(shù)和網(wǎng)絡(luò)技術(shù),來獲取正確的信息。
[0003]所謂檢索策略,就是在分析檢索提問的基礎(chǔ)上,確定檢索的數(shù)據(jù)源、檢索的用詞,并明確檢索詞之間的邏輯關(guān)系和查找步驟的科學(xué)安排。檢索公式(即檢索用詞與各運(yùn)算符的組配成的表達(dá)式)就是狹義上的檢索策略。
[0004]檢索過程中的首要環(huán)節(jié),就是要明確檢索需求,第一步如果搞錯(cuò)了,就談不上最后檢索結(jié)果的正確性。由于用戶對(duì)自己的需求,特別是潛在的、模糊的需求并不總是非常明確,因此需要進(jìn)行分析,以求得一個(gè)完整而明確的表達(dá)。
[0005]在構(gòu)造一個(gè)完整而明確的檢索公式過程中,用戶首先需要找到合適的檢索詞,然而用戶在檢索之前,對(duì)需要獲取的信息領(lǐng)域,往往只是掌握一些皮毛,了解一些概念,如何通過這些初步的概念去準(zhǔn)確構(gòu)建檢索公式,對(duì)于用戶來說,是非常困難的。


【發(fā)明內(nèi)容】

[0006]本發(fā)明的目的在于克服現(xiàn)有技術(shù)的缺點(diǎn)和不足,提供一種擴(kuò)展檢索詞的方法和系統(tǒng),能夠幫助用戶獲取符合信息檢索目標(biāo)的檢索詞,從而提高信息檢索效率。
[0007]本發(fā)明的一個(gè)實(shí)施例提供了一種擴(kuò)展檢索詞的方法,包括以下步驟:
[0008]給每個(gè)普通詞匯設(shè)置不少于一個(gè)的標(biāo)簽詞,形成標(biāo)簽詞詞典;
[0009]根據(jù)第一普通詞匯周邊的第二普通詞匯之間的關(guān)系,給每個(gè)第二普通詞匯所屬的每個(gè)標(biāo)簽詞進(jìn)行加權(quán);
[0010]將所述第二普通詞匯所屬的全部標(biāo)簽詞按照每個(gè)標(biāo)簽詞的權(quán)值進(jìn)行排序;
[0011]從所述第二普通詞匯所屬的全部標(biāo)簽詞中,抽取預(yù)設(shè)數(shù)量的高權(quán)值標(biāo)簽詞,作為所述第一普通詞匯的擴(kuò)展范圍;
[0012]輸入第一普通詞匯作為檢索詞時(shí),將位于所述第一普通詞匯擴(kuò)展范圍內(nèi)的標(biāo)簽詞對(duì)應(yīng)的普通詞匯展現(xiàn)出來;
[0013]從所述擴(kuò)展范圍內(nèi)的標(biāo)簽詞對(duì)應(yīng)的普通詞匯中,選擇需要的普通詞匯,作為檢索詞的擴(kuò)展檢索詞。
[0014]優(yōu)選地,還包括以下步驟:
[0015]根據(jù)第一普通詞匯周邊的第二普通詞匯之間的關(guān)系,給每個(gè)第二普通詞匯進(jìn)行加權(quán);
[0016]位于所述第一普通詞匯擴(kuò)展范圍內(nèi)的每個(gè)標(biāo)簽詞對(duì)應(yīng)的普通詞匯按照普通詞匯的權(quán)值順序進(jìn)行排列。
[0017]優(yōu)選地,根據(jù)第一普通詞匯周邊的第二普通詞匯出現(xiàn)的頻率和/或距離,給每個(gè)第二普通詞匯以及每個(gè)第二普通詞匯所屬的每個(gè)標(biāo)簽詞進(jìn)行加權(quán)。
[0018]優(yōu)選地,所述標(biāo)簽詞詞典采用人機(jī)交互方式生成。
[0019]優(yōu)選地,還包括以下步驟:
[0020]將所述擴(kuò)展范圍內(nèi)的標(biāo)簽詞對(duì)應(yīng)的普通詞匯所在的源文件信息展現(xiàn)出來,根據(jù)所述源文件信息選擇需要的普通詞匯,作為檢索詞的擴(kuò)展檢索詞。
[0021]優(yōu)選地,檢索的源文件包括不少于一個(gè)數(shù)據(jù)源。
[0022]優(yōu)選地,所述數(shù)據(jù)源是新聞、論壇和/或微博。
[0023]優(yōu)選地,所述數(shù)據(jù)源是不同【技術(shù)領(lǐng)域】或者不同業(yè)務(wù)領(lǐng)域的數(shù)據(jù)。
[0024]本發(fā)明的另一個(gè)實(shí)施例還提供了一種擴(kuò)展檢索詞的系統(tǒng),包括標(biāo)簽單元、標(biāo)簽詞詞典單元、加權(quán)單元、排序單元、輸入單元和選擇單元,其中,
[0025]標(biāo)簽單元用于給每個(gè)普通詞匯設(shè)置不少于一個(gè)的標(biāo)簽詞;
[0026]標(biāo)簽詞詞典單元用于存儲(chǔ)普通詞匯及對(duì)應(yīng)的標(biāo)簽詞;
[0027]加權(quán)單元用于根據(jù)第一普通詞匯周邊的第二普通詞匯之間的關(guān)系,給每個(gè)第二普通詞匯以及每個(gè)第二普通詞匯所屬的每個(gè)標(biāo)簽詞進(jìn)行加權(quán);
[0028]排序單元用于將所述第二普通詞匯所屬的全部標(biāo)簽詞按照每個(gè)標(biāo)簽詞的權(quán)值進(jìn)行排序,從所述第二普通詞匯所屬的全部標(biāo)簽詞中,抽取預(yù)設(shè)數(shù)量的高權(quán)值標(biāo)簽詞,作為所述第一普通詞匯的擴(kuò)展范圍,用于將位于所述第一普通詞匯擴(kuò)展范圍內(nèi)的每個(gè)標(biāo)簽詞對(duì)應(yīng)的普通詞匯按照普通詞匯的權(quán)值順序進(jìn)行排列;
[0029]輸入單元用于輸入第一普通詞匯作為檢索詞;
[0030]選擇單元用于從所述擴(kuò)展范圍內(nèi)的標(biāo)簽詞對(duì)應(yīng)的普通詞匯中,選擇需要的普通詞匯,作為檢索詞的擴(kuò)展檢索詞。
[0031]優(yōu)選地,還包括源文件存儲(chǔ)單元,所述源文件存儲(chǔ)單元用于存儲(chǔ)所述擴(kuò)展范圍內(nèi)的標(biāo)簽詞對(duì)應(yīng)的普通詞匯所在的源文件信息;
[0032]所述選擇單元用于根據(jù)所述源文件信息選擇需要的普通詞匯,作為檢索詞的擴(kuò)展檢索詞。
[0033]采用了本發(fā)明技術(shù)方案,由于能夠從少數(shù)檢索詞,擴(kuò)展出與之密切相關(guān)的檢索詞,從而幫助用戶構(gòu)建完整準(zhǔn)確的檢索公式,提高信息檢索效率。

【專利附圖】

【附圖說明】
[0034]圖1為本發(fā)明實(shí)施例提供的擴(kuò)展檢索詞的流程圖;
[0035]圖2為本發(fā)明實(shí)施例提供的擴(kuò)展檢索詞系統(tǒng)的結(jié)構(gòu)示意圖。

【具體實(shí)施方式】
[0036]下面結(jié)合附圖對(duì)本發(fā)明的【具體實(shí)施方式】進(jìn)行詳細(xì)描述。但本發(fā)明的實(shí)施方式不限于此。
[0037]本發(fā)明技術(shù)方案的主要思想就是對(duì)一個(gè)詞匯,從不同方面找出與之有關(guān)聯(lián)的詞匯,用戶在構(gòu)建信息檢索公式時(shí),可以從這些找出的關(guān)聯(lián)詞匯,選擇自己需要的詞匯作為擴(kuò)展檢索詞。在這里,這些詞匯可以稱之為普通詞匯,而不同方面所對(duì)應(yīng)的詞匯,可以稱之為標(biāo)簽詞。
[0038]圖1為本發(fā)明實(shí)施例提供的擴(kuò)展檢索詞的流程圖。如圖1所示,該擴(kuò)展檢索詞的流程包括以下步驟:
[0039]步驟101、給每個(gè)普通詞匯設(shè)置一個(gè)或者多個(gè)的標(biāo)簽詞,形成標(biāo)簽詞詞典。
[0040]在這個(gè)標(biāo)簽詞詞典中,一方面收集了海量的詞匯,這些詞匯來自于各種數(shù)據(jù)源,包括新聞、論壇和/或微博等,或者是不同【技術(shù)領(lǐng)域】或者不同業(yè)務(wù)領(lǐng)域的數(shù)據(jù)。這些詞匯從數(shù)據(jù)源切分出來后,就成為普通詞匯,另一方面,根據(jù)普通詞匯的性質(zhì),規(guī)范出若干個(gè)用于表示普通詞匯屬性的詞匯,這些詞匯就是標(biāo)簽詞。對(duì)于每個(gè)普通詞匯,都賦予一個(gè)或者多個(gè)與之對(duì)應(yīng)的標(biāo)簽詞,就形成了標(biāo)簽詞詞典。該標(biāo)簽詞詞典可以采用人機(jī)交互方式生成。
[0041]例如“技術(shù)”這一普通詞匯就可以打上“產(chǎn)品資料”和“許可”這兩個(gè)標(biāo)簽詞;“教程”這一普通詞匯可以打上“產(chǎn)品資料”和“教學(xué)”這兩個(gè)標(biāo)簽詞;“西門子”這一普通詞匯可以打上“工控品牌”和“公司名稱”這兩個(gè)標(biāo)簽詞。
[0042]通過上述例子,可以看出一個(gè)普通詞匯可以對(duì)應(yīng)一個(gè)或者多個(gè)標(biāo)簽詞,反過來一個(gè)標(biāo)簽詞可以對(duì)應(yīng)一個(gè)或者多個(gè)普通詞匯。
[0043]步驟102、根據(jù)第一普通詞匯周邊的第二普通詞匯之間的關(guān)系,給每個(gè)第二普通詞匯以及每個(gè)第二普通詞匯所屬的每個(gè)標(biāo)簽詞進(jìn)行加權(quán)。
[0044]本步驟是用于找出與一個(gè)普通詞匯相關(guān)的詞匯,并對(duì)兩者之間相關(guān)的程度進(jìn)行量化。
[0045]這里的第一普通詞匯是指數(shù)據(jù)源中的任一普通詞匯,而第二普通詞匯則是指在數(shù)據(jù)源中出現(xiàn)在前述普通詞匯周邊的其他詞匯,包括出現(xiàn)在前邊的詞匯,也包括在后邊的詞匯。
[0046]第一普通詞匯周邊的第二普通詞匯之間的關(guān)系可以通過多種方式確定,比如在數(shù)據(jù)源中,某個(gè)第二普通詞匯在第一普通詞匯周邊出現(xiàn)的位置(距離),以及某個(gè)第二普通詞匯出現(xiàn)在第一普通詞匯周邊的頻率,等等。
[0047]通過統(tǒng)計(jì)在數(shù)據(jù)源中的這些量化指標(biāo),就可以給數(shù)據(jù)源中的每個(gè)第二普通詞匯加權(quán),同樣可以對(duì)每個(gè)第二普通詞匯所屬的每個(gè)標(biāo)簽詞進(jìn)行加權(quán),獲得他們的權(quán)值。
[0048]例如在數(shù)據(jù)源中,出現(xiàn)“西門子技術(shù)”、“西門子教程”,通過統(tǒng)計(jì)第二普通詞匯“技術(shù)”、“教程”位于第一普通詞匯“西門子”周邊的位置和/或出現(xiàn)的頻率,就可以給“技術(shù)”、“教程”這兩個(gè)第二普通詞匯進(jìn)行加權(quán)。同時(shí)可以給“技術(shù)”對(duì)應(yīng)的“產(chǎn)品資料”和“許可”這兩個(gè)標(biāo)簽詞進(jìn)行加權(quán),可以給“教程”對(duì)應(yīng)的“產(chǎn)品資料”和“教學(xué)”這兩個(gè)標(biāo)簽詞進(jìn)行加權(quán),而且由于“技術(shù)”和“教程”都對(duì)應(yīng)“產(chǎn)品資料”這個(gè)標(biāo)簽詞,所以“產(chǎn)品資料”的權(quán)值來自“技術(shù)”和“教程”與“西門子”的關(guān)系。
[0049]步驟103、將第二普通詞匯所屬的全部標(biāo)簽詞按照每個(gè)標(biāo)簽詞的權(quán)值進(jìn)行排序。
[0050]對(duì)于上述例子,就是將“產(chǎn)品資料”、“許可”和“教學(xué)”按照其得到的權(quán)值進(jìn)行排序。
[0051]步驟104、從該第二普通詞匯所屬的全部標(biāo)簽詞中,抽取預(yù)設(shè)數(shù)量的高權(quán)值標(biāo)簽詞,作為第一普通詞匯的擴(kuò)展范圍。
[0052]由于在數(shù)據(jù)源中,出現(xiàn)在第一普通詞匯周邊的第二普通詞匯數(shù)量眾多,而每個(gè)第二普通詞匯又對(duì)應(yīng)一個(gè)或者多個(gè)標(biāo)簽詞,所以第一普通詞匯對(duì)應(yīng)的標(biāo)簽詞數(shù)量眾多,從可行的角度,只選擇一定數(shù)量的標(biāo)簽詞,比如10個(gè)、20個(gè)標(biāo)簽詞,作為第一普通詞匯的擴(kuò)展范圍,這些標(biāo)簽詞是最能體現(xiàn)第一普通詞匯性質(zhì)的。
[0053]比如,對(duì)于“西門子”這個(gè)第一普通詞匯,則從三個(gè)標(biāo)簽詞“產(chǎn)品資料”、“許可”和“教學(xué)”中,選擇“產(chǎn)品資料”和“教學(xué)”這兩個(gè)詞匯作為擴(kuò)展范圍。
[0054]步驟105、位于第一普通詞匯擴(kuò)展范圍內(nèi)的每個(gè)標(biāo)簽詞對(duì)應(yīng)的普通詞匯按照普通詞匯的權(quán)值順序進(jìn)行排列。
[0055]正如上面所述,一個(gè)普通詞匯可以對(duì)應(yīng)一個(gè)或者多個(gè)標(biāo)簽詞,反過來一個(gè)標(biāo)簽詞可以對(duì)應(yīng)一個(gè)或者多個(gè)普通詞匯,位于第一普通詞匯擴(kuò)展范圍內(nèi)的每個(gè)標(biāo)簽詞同樣對(duì)應(yīng)多個(gè)普通詞匯。比如“產(chǎn)品資料”這個(gè)標(biāo)簽詞就對(duì)應(yīng)了 “技術(shù)”和“教程”這兩個(gè)普通詞匯,那么就可以根據(jù)“技術(shù)”和“教程”的權(quán)值進(jìn)行排序,權(quán)值高的普通詞匯比權(quán)值低的普通詞匯,更能反映第一普通詞匯在這個(gè)標(biāo)簽詞方面的性質(zhì)。
[0056]步驟106、當(dāng)輸入第一普通詞匯作為檢索詞時(shí),將位于第一普通詞匯擴(kuò)展范圍內(nèi)的標(biāo)簽詞對(duì)應(yīng)的普通詞匯展現(xiàn)出來。在展現(xiàn)的時(shí)候,首先按照標(biāo)簽詞的權(quán)值順序進(jìn)行排列,然后各個(gè)標(biāo)簽詞中對(duì)應(yīng)的普通詞匯再按照各自的權(quán)值進(jìn)行排列。
[0057]步驟107、從該擴(kuò)展范圍內(nèi)的標(biāo)簽詞對(duì)應(yīng)的普通詞匯中,選擇需要的普通詞匯,作為檢索詞的擴(kuò)展檢索詞。
[0058]例如某個(gè)用戶希望學(xué)習(xí)西門子的技術(shù),而該用戶對(duì)西門子的技術(shù)一點(diǎn)也不了解,則可以先確定數(shù)據(jù)源,比如從論壇數(shù)據(jù)中檢索,然后輸入“西門子”作為檢索詞,則可以獲取與“西門子”最有關(guān)聯(lián)性的若干方面對(duì)應(yīng)的詞匯,比如“產(chǎn)品資料”的標(biāo)簽詞中包括了“技術(shù)”和“教程”,“教學(xué)”的標(biāo)簽詞中包括了 “教程”,用戶根據(jù)自己的需要,就可以增加“教程”作為擴(kuò)展檢索詞。
[0059]如果用戶擔(dān)心這些擴(kuò)展檢索詞可能與最初的檢索詞無關(guān),而發(fā)生錯(cuò)誤時(shí),可以將擴(kuò)展范圍內(nèi)的標(biāo)簽詞對(duì)應(yīng)的普通詞匯所在的源文件信息展現(xiàn)出來,用戶就能夠根據(jù)這些源文件信息判斷這些擴(kuò)展詞是否與最初的檢索詞有關(guān),而選擇需要的普通詞匯,作為檢索詞的擴(kuò)展檢索詞。
[0060]為了實(shí)現(xiàn)上述流程,本發(fā)明的另一個(gè)實(shí)施例還提供了一種擴(kuò)展檢索詞的系統(tǒng),如圖2所示,該系統(tǒng)包括標(biāo)簽單元201、標(biāo)簽詞詞典單元202、加權(quán)單元203、排序單元204、輸入單元205、選擇單元206和源文件存儲(chǔ)單元207。
[0061]其中,標(biāo)簽單元給每個(gè)普通詞匯設(shè)置一個(gè)或者多個(gè)的標(biāo)簽詞。
[0062]標(biāo)簽詞詞典單元存儲(chǔ)普通詞匯及對(duì)應(yīng)的標(biāo)簽詞。
[0063]加權(quán)單元根據(jù)第一普通詞匯周邊的第二普通詞匯之間的關(guān)系,給每個(gè)第二普通詞匯以及每個(gè)第二普通詞匯所屬的每個(gè)標(biāo)簽詞進(jìn)行加權(quán)。
[0064]排序單元將該第二普通詞匯所屬的全部標(biāo)簽詞按照每個(gè)標(biāo)簽詞的權(quán)值進(jìn)行排序,從該第二普通詞匯所屬的全部標(biāo)簽詞中,抽取預(yù)設(shè)數(shù)量的高權(quán)值標(biāo)簽詞,作為該第一普通詞匯的擴(kuò)展范圍,并將位于該第一普通詞匯擴(kuò)展范圍內(nèi)的每個(gè)標(biāo)簽詞對(duì)應(yīng)的普通詞匯按照普通詞匯的權(quán)值順序進(jìn)行排列。
[0065]輸入單元輸入第一普通詞匯作為檢索詞。
[0066]源文件存儲(chǔ)單元存儲(chǔ)該擴(kuò)展范圍內(nèi)的標(biāo)簽詞對(duì)應(yīng)的普通詞匯所在的源文件信息。
[0067]選擇單元從該擴(kuò)展范圍內(nèi)的標(biāo)簽詞對(duì)應(yīng)的普通詞匯中,選擇需要的普通詞匯,作為檢索詞的擴(kuò)展檢索詞;或者進(jìn)一步根據(jù)該源文件信息選擇需要的普通詞匯,作為檢索詞的擴(kuò)展檢索詞。
[0068]采用了本發(fā)明技術(shù)方案,通過對(duì)詞匯之間的關(guān)系進(jìn)行權(quán)值量化,能夠從少數(shù)檢索詞,擴(kuò)展出與之密切相關(guān)的檢索詞,從而幫助用戶構(gòu)建完整準(zhǔn)確的檢索公式,提高信息檢索效率。
[0069]上述實(shí)施例為本發(fā)明較佳的實(shí)施方式,但本發(fā)明的實(shí)施方式并不受上述實(shí)施例的限制,其他的任何未背離本發(fā)明的精神實(shí)質(zhì)與原理下所作的改變、修飾、替代、組合、簡(jiǎn)化,均應(yīng)為等效的置換方式,都包含在本發(fā)明的保護(hù)范圍之內(nèi)。
【權(quán)利要求】
1.一種擴(kuò)展檢索詞的方法,其特征在于,包括以下步驟: 給每個(gè)普通詞匯設(shè)置不少于一個(gè)的標(biāo)簽詞,形成標(biāo)簽詞詞典; 根據(jù)第一普通詞匯周邊的第二普通詞匯之間的關(guān)系,給每個(gè)第二普通詞匯所屬的每個(gè)標(biāo)簽詞進(jìn)行加權(quán); 將所述第二普通詞匯所屬的全部標(biāo)簽詞按照每個(gè)標(biāo)簽詞的權(quán)值進(jìn)行排序; 從所述第二普通詞匯所屬的全部標(biāo)簽詞中,抽取預(yù)設(shè)數(shù)量的高權(quán)值標(biāo)簽詞,作為所述第一普通詞匯的擴(kuò)展范圍; 輸入第一普通詞匯作為檢索詞時(shí),將位于所述第一普通詞匯擴(kuò)展范圍內(nèi)的標(biāo)簽詞對(duì)應(yīng)的普通詞匯展現(xiàn)出來; 從所述擴(kuò)展范圍內(nèi)的標(biāo)簽詞對(duì)應(yīng)的普通詞匯中,選擇需要的普通詞匯,作為檢索詞的擴(kuò)展檢索詞。
2.根據(jù)權(quán)利要求1所述的一種擴(kuò)展檢索詞的方法,其特征在于,還包括以下步驟: 根據(jù)第一普通詞匯周邊的第二普通詞匯之間的關(guān)系,給每個(gè)第二普通詞匯進(jìn)行加權(quán); 位于所述第一普通詞匯擴(kuò)展范圍內(nèi)的每個(gè)標(biāo)簽詞對(duì)應(yīng)的普通詞匯按照普通詞匯的權(quán)值順序進(jìn)行排列。
3.根據(jù)權(quán)利要求2所述的一種擴(kuò)展檢索詞的方法,其特征在于,根據(jù)第一普通詞匯周邊的第二普通詞匯出現(xiàn)的頻率和/或距離,給每個(gè)第二普通詞匯以及每個(gè)第二普通詞匯所屬的每個(gè)標(biāo)簽詞進(jìn)行加權(quán)。
4.根據(jù)權(quán)利要求1所述的一種擴(kuò)展檢索詞的方法,其特征在于,所述標(biāo)簽詞詞典采用人機(jī)交互方式生成。
5.根據(jù)權(quán)利要求1所述的一種擴(kuò)展檢索詞的方法,其特征在于,還包括以下步驟: 將所述擴(kuò)展范圍內(nèi)的標(biāo)簽詞對(duì)應(yīng)的普通詞匯所在的源文件信息展現(xiàn)出來,根據(jù)所述源文件信息選擇需要的普通詞匯,作為檢索詞的擴(kuò)展檢索詞。
6.根據(jù)權(quán)利要求1或者5所述的一種擴(kuò)展檢索詞的方法,其特征在于,檢索的源文件包括不少于一個(gè)數(shù)據(jù)源。
7.根據(jù)權(quán)利要求6所述的一種擴(kuò)展檢索詞的方法,其特征在于,所述數(shù)據(jù)源是新聞、論壇和/或微博。
8.根據(jù)權(quán)利要求6所述的一種擴(kuò)展檢索詞的方法,其特征在于,所述數(shù)據(jù)源是不同【技術(shù)領(lǐng)域】或者不同業(yè)務(wù)領(lǐng)域的數(shù)據(jù)。
9.一種擴(kuò)展檢索詞的系統(tǒng),其特征在于,包括標(biāo)簽單元、標(biāo)簽詞詞典單元、加權(quán)單元、排序單元、輸入單元和選擇單元,其中, 標(biāo)簽單元用于給每個(gè)普通詞匯設(shè)置不少于一個(gè)的標(biāo)簽詞; 標(biāo)簽詞詞典單元用于存儲(chǔ)普通詞匯及對(duì)應(yīng)的標(biāo)簽詞; 加權(quán)單元用于根據(jù)第一普通詞匯周邊的第二普通詞匯之間的關(guān)系,給每個(gè)第二普通詞匯以及每個(gè)第二普通詞匯所屬的每個(gè)標(biāo)簽詞進(jìn)行加權(quán); 排序單元用于將所述第二普通詞匯所屬的全部標(biāo)簽詞按照每個(gè)標(biāo)簽詞的權(quán)值進(jìn)行排序,從所述第二普通詞匯所屬的全部標(biāo)簽詞中,抽取預(yù)設(shè)數(shù)量的高權(quán)值標(biāo)簽詞,作為所述第一普通詞匯的擴(kuò)展范圍,用于將位于所述第一普通詞匯擴(kuò)展范圍內(nèi)的每個(gè)標(biāo)簽詞對(duì)應(yīng)的普通詞匯按照普通詞匯的權(quán)值順序進(jìn)行排列; 輸入單元用于輸入第一普通詞匯作為檢索詞; 選擇單元用于從所述擴(kuò)展范圍內(nèi)的標(biāo)簽詞對(duì)應(yīng)的普通詞匯中,選擇需要的普通詞匯,作為檢索詞的擴(kuò)展檢索詞。
10.根據(jù)權(quán)利要求9所述的一種擴(kuò)展檢索詞的系統(tǒng),其特征在于,還包括源文件存儲(chǔ)單元,所述源文件存儲(chǔ)單元用于存儲(chǔ)所述擴(kuò)展范圍內(nèi)的標(biāo)簽詞對(duì)應(yīng)的普通詞匯所在的源文件信息; 所述選擇單元用于根據(jù)所述源文件信息選擇需要的普通詞匯,作為檢索詞的擴(kuò)展檢索1-rJ ο
【文檔編號(hào)】G06F17/30GK104239314SQ201310231653
【公開日】2014年12月24日 申請(qǐng)日期:2013年6月9日 優(yōu)先權(quán)日:2013年6月9日
【發(fā)明者】郝璽龍, 丁海星, 牛合慶, 陳金玉 申請(qǐng)人:天津海量信息技術(shù)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
长武县| 夏津县| 汶川县| 故城县| 民县| 铁岭市| 慈利县| 景谷| 桓台县| 建昌县| 武功县| 莱阳市| 临邑县| 辽阳县| 龙胜| 西宁市| 越西县| 福安市| 巴林左旗| 依安县| 敦化市| 宾阳县| 綦江县| 申扎县| 玉田县| 元氏县| 高清| 汤原县| 阳高县| 金乡县| 衢州市| 新安县| 安丘市| 偃师市| 城固县| 二连浩特市| 怀化市| 黔西县| 龙岩市| 体育| 神农架林区|