欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

主題詞分類(lèi)號(hào)的確定方法和確定裝置與流程

文檔序號(hào):11276528閱讀:861來(lái)源:國(guó)知局
主題詞分類(lèi)號(hào)的確定方法和確定裝置與流程
本發(fā)明涉及計(jì)算機(jī)領(lǐng)域,具體而言,本發(fā)明涉及一種主題詞分類(lèi)號(hào)的確定方法和一種主題詞分類(lèi)號(hào)的確定裝置。
背景技術(shù)
:隨著信息技術(shù)的發(fā)展,大量信息也越來(lái)越多地涌入人們的視線(xiàn),特別是各種各樣的海量文獻(xiàn)信息;為了便于人們利用和整理這些海量文獻(xiàn)信息,出版或發(fā)表的文獻(xiàn)信息都需要通過(guò)分類(lèi)號(hào)對(duì)該文獻(xiàn)信息進(jìn)行分類(lèi)。近年來(lái),為了更加方便人們利用和整理海量文獻(xiàn)信息,不僅對(duì)文獻(xiàn)信息的主體信息通過(guò)分類(lèi)號(hào)進(jìn)行分類(lèi),還進(jìn)一步對(duì)文獻(xiàn)信息的主題詞進(jìn)行分類(lèi)。在現(xiàn)有技術(shù)中,通常通過(guò)人工查找的方式或者人工測(cè)評(píng)的方式來(lái)確定文獻(xiàn)信息的主題詞的分類(lèi)號(hào);人工查找的方式是從人工建立的主題分類(lèi)詞表中,查找與文獻(xiàn)信息的主題詞相符合的分類(lèi)號(hào);而人工測(cè)評(píng)的方式是由具有經(jīng)驗(yàn)豐富的主題詞分類(lèi)專(zhuān)家對(duì)文獻(xiàn)信息的主題詞分類(lèi)號(hào)進(jìn)行商討并作出判斷,從而確定文獻(xiàn)信息的主題詞的分類(lèi)號(hào)。上述現(xiàn)有技術(shù)中確定主題詞的分類(lèi)號(hào)的方式不但無(wú)法保證主題詞分類(lèi)號(hào)的客觀(guān)性,同時(shí)還會(huì)耗費(fèi)大量的人力成本,且效率低下;故如何自動(dòng)化地、客觀(guān)地確定主題詞的分類(lèi)號(hào),是解決上述問(wèn)題的關(guān)鍵。技術(shù)實(shí)現(xiàn)要素:為克服上述技術(shù)問(wèn)題或者至少部分地解決上述技術(shù)問(wèn)題,特提出以下技術(shù)方案:本發(fā)明的一個(gè)實(shí)施例提出了一種主題詞分類(lèi)號(hào)的確定方法,包括:獲取任一領(lǐng)域內(nèi)包括文獻(xiàn)分類(lèi)號(hào)的多個(gè)文獻(xiàn),以建立任一領(lǐng)域的文獻(xiàn)數(shù)據(jù)庫(kù);獲取與任一領(lǐng)域中預(yù)置主題詞相對(duì)應(yīng)的同義詞;基于預(yù)置主題詞及該預(yù)置主題詞的同義詞,通過(guò)任一領(lǐng)域的文獻(xiàn)數(shù)據(jù)庫(kù)來(lái)確定屬于預(yù)置主題詞的文獻(xiàn)集合;基于文獻(xiàn)集合中的每個(gè)文獻(xiàn)的文獻(xiàn)分類(lèi)號(hào),確定預(yù)置主題詞的分類(lèi)號(hào)。其中,獲取到的包括文獻(xiàn)分類(lèi)號(hào)的多個(gè)文獻(xiàn),還包括:文獻(xiàn)標(biāo)題、文獻(xiàn)關(guān)鍵詞以及文獻(xiàn)摘要。優(yōu)選地,獲取與任一領(lǐng)域中預(yù)置主題詞相對(duì)應(yīng)的同義詞的步驟,包括:通過(guò)查詢(xún)預(yù)置主題詞表,來(lái)確定與任一領(lǐng)域中預(yù)置主題詞相對(duì)應(yīng)的同義詞;其中,預(yù)置主題詞表包括任一領(lǐng)域的預(yù)置主題詞與該預(yù)置主題詞的同義詞。優(yōu)選地,基于預(yù)置主題詞及該預(yù)置主題詞的同義詞,通過(guò)任一領(lǐng)域的文獻(xiàn)數(shù)據(jù)庫(kù)來(lái)確定屬于預(yù)置主題詞的文獻(xiàn)集合的步驟,包括:基于預(yù)置檢索條件生成規(guī)則,生成包括任一預(yù)置主題詞和/或該預(yù)置主題詞的同義詞的檢索條件;從任一領(lǐng)域的文獻(xiàn)數(shù)據(jù)庫(kù)中查詢(xún)并確定與檢索條件相符合的文獻(xiàn);基于獲取到的文獻(xiàn),確定屬于預(yù)置主題詞的文獻(xiàn)集合。優(yōu)選地,基于預(yù)置主題詞的文獻(xiàn)集合中的每個(gè)文獻(xiàn)的文獻(xiàn)分類(lèi)號(hào),確定預(yù)置主題詞的分類(lèi)號(hào)的步驟,包括:統(tǒng)計(jì)預(yù)置主題詞的文獻(xiàn)集合中的每個(gè)文獻(xiàn)的文獻(xiàn)分類(lèi)號(hào)的出現(xiàn)頻次;基于出現(xiàn)頻次,將文獻(xiàn)分類(lèi)號(hào)由高至低進(jìn)行排序;按照由高至低的順序選取預(yù)置數(shù)量的文獻(xiàn)分類(lèi)號(hào);將選取到的文獻(xiàn)分類(lèi)號(hào)確定為該主題詞的分類(lèi)號(hào)。其中,當(dāng)預(yù)置數(shù)量大于文獻(xiàn)分類(lèi)號(hào)的數(shù)量時(shí),該方法還包括:將所有的文獻(xiàn)分類(lèi)號(hào)確定為該預(yù)置主題詞的分類(lèi)號(hào)。本發(fā)明的另一個(gè)實(shí)施例提出了一種主題詞分類(lèi)號(hào)的確定裝置,包括:獲取模塊,用于獲取任一領(lǐng)域內(nèi)包括文獻(xiàn)分類(lèi)號(hào)的多個(gè)文獻(xiàn),以建立任一領(lǐng)域的文獻(xiàn)數(shù)據(jù)庫(kù);第一確定模塊,用于獲取與任一領(lǐng)域中預(yù)置主題詞相對(duì)應(yīng)的同義詞;第二確定模塊,用于基于預(yù)置主題詞及該預(yù)置主題詞的同義詞,通過(guò)任一領(lǐng)域的文獻(xiàn)數(shù)據(jù)庫(kù)來(lái)確定屬于預(yù)置主題詞的文獻(xiàn)集合;第三確定模塊,用于基于文獻(xiàn)集合中的每個(gè)文獻(xiàn)的文獻(xiàn)分類(lèi)號(hào),確定預(yù)置主題詞的分類(lèi)號(hào)。其中,獲取到的包括文獻(xiàn)分類(lèi)號(hào)的多個(gè)文獻(xiàn),還包括:文獻(xiàn)標(biāo)題、文獻(xiàn)關(guān)鍵詞以及文獻(xiàn)摘要。優(yōu)選地,第一確定模塊,用于通過(guò)查詢(xún)預(yù)置主題詞表,來(lái)確定與任一領(lǐng)域中預(yù)置主題詞相對(duì)應(yīng)的同義詞;其中,預(yù)置主題詞表包括任一領(lǐng)域的預(yù)置主題詞與該預(yù)置主題詞的同義詞。優(yōu)選地,第二確定模塊包括:生成單元,用于基于預(yù)置檢索條件生成規(guī)則,生成包括任一預(yù)置主題詞和/或該預(yù)置主題詞的同義詞的檢索條件;查詢(xún)單元,用于從任一領(lǐng)域的文獻(xiàn)數(shù)據(jù)庫(kù)中查詢(xún)并確定與檢索條件相符合的文獻(xiàn);第一確定單元,用于基于獲取到的文獻(xiàn),確定屬于預(yù)置主題詞的文獻(xiàn)集合。優(yōu)選地,第三確定模塊包括:統(tǒng)計(jì)單元,用于統(tǒng)計(jì)預(yù)置主題詞的文獻(xiàn)集合中的每個(gè)文獻(xiàn)的文獻(xiàn)分類(lèi)號(hào)的出現(xiàn)頻次;排序單元,用于基于出現(xiàn)頻次,將文獻(xiàn)分類(lèi)號(hào)由高至低進(jìn)行排序;選取單元,用于按照由高至低的順序選取預(yù)置數(shù)量的文獻(xiàn)分類(lèi)號(hào);第二確定單元,用于將選取到的文獻(xiàn)分類(lèi)號(hào)確定為該預(yù)置主題詞的分類(lèi)號(hào)。當(dāng)預(yù)置數(shù)量大于文獻(xiàn)分類(lèi)號(hào)的數(shù)量時(shí),該裝置還包括:第四確定模塊,用于將所有的文獻(xiàn)分類(lèi)號(hào)確定為該預(yù)置主題詞的分類(lèi)號(hào)。本發(fā)明的技術(shù)方案中,獲取任一領(lǐng)域內(nèi)包括文獻(xiàn)分類(lèi)號(hào)的多個(gè)文獻(xiàn),以建立任一領(lǐng)域的文獻(xiàn)數(shù)據(jù)庫(kù);獲取與任一領(lǐng)域中預(yù)置主題詞相對(duì)應(yīng)的同義詞;基于預(yù)置主題詞及該預(yù)置主題詞的同義詞,通過(guò)任一領(lǐng)域的文獻(xiàn)數(shù)據(jù)庫(kù)來(lái)確定屬于預(yù)置主題詞的文獻(xiàn)集合;基于文獻(xiàn)集合中的每個(gè)文獻(xiàn)的文獻(xiàn)分類(lèi)號(hào),確定預(yù)置主題詞的分類(lèi)號(hào);以實(shí)現(xiàn)自動(dòng)化的方式來(lái)確定主題詞的分類(lèi)號(hào),不僅能夠快速且客觀(guān)地確定主題詞的分類(lèi)號(hào),還能避免新創(chuàng)建的主題詞無(wú)法通過(guò)人工方式進(jìn)行查找的情況;同時(shí)節(jié)省了大量時(shí)間、人力資源、物力資源乃至財(cái)力資源,為人們更加方便地整理和利用海量文獻(xiàn)信息資源提供了幫助。本發(fā)明附加的方面和優(yōu)點(diǎn)將在下面的描述中部分給出,這些將從下面的描述中變得明顯,或通過(guò)本發(fā)明的實(shí)踐了解到。附圖說(shuō)明本發(fā)明上述的和/或附加的方面和優(yōu)點(diǎn)從下面結(jié)合附圖對(duì)實(shí)施例的描述中將變得明顯和容易理解,其中:圖1為本發(fā)明一個(gè)實(shí)施例的主題詞分類(lèi)號(hào)的確定方法的流程示意圖;圖2為本發(fā)明中的一個(gè)優(yōu)選實(shí)施例的確定屬于主題詞的文獻(xiàn)集合的步驟的流程示意圖;圖3為本發(fā)明中的另一個(gè)優(yōu)選實(shí)施例的確定主題詞的分類(lèi)號(hào)步驟的流程示意圖;圖4為本發(fā)明中的另一個(gè)實(shí)施例的主題詞分類(lèi)號(hào)的確定裝置的結(jié)構(gòu)框架示意圖;圖5為本發(fā)明中的一個(gè)優(yōu)選實(shí)施例的第二確定模塊的結(jié)構(gòu)框架示意圖;圖6為本發(fā)明中的另一個(gè)優(yōu)選實(shí)施例的第三確定模塊的結(jié)構(gòu)框架示意圖。具體實(shí)施方式下面詳細(xì)描述本發(fā)明的實(shí)施例,所述實(shí)施例的示例在附圖中示出,其中自始至終相同或類(lèi)似的標(biāo)號(hào)表示相同或類(lèi)似的元件或具有相同或類(lèi)似功能的元件。下面通過(guò)參考附圖描述的實(shí)施例是示例性的,僅用于解釋本發(fā)明,而不能解釋為對(duì)本發(fā)明的限制。本
技術(shù)領(lǐng)域
技術(shù)人員可以理解,除非特意聲明,這里使用的單數(shù)形式“一”、“一個(gè)”、“所述”和“該”也可包括復(fù)數(shù)形式。應(yīng)該進(jìn)一步理解的是,本發(fā)明的說(shuō)明書(shū)中使用的措辭“包括”是指存在所述特征、整數(shù)、步驟、操作、元件和/或組件,但是并不排除存在或添加一個(gè)或多個(gè)其他特征、整數(shù)、步驟、操作、元件、組件和/或它們的組。應(yīng)該理解,當(dāng)我們稱(chēng)元件被“連接”或“耦接”到另一元件時(shí),它可以直接連接或耦接到其他元件,或者也可以存在中間元件。此外,這里使用的“連接”或“耦接”可以包括無(wú)線(xiàn)連接或無(wú)線(xiàn)耦接。這里使用的措辭“和/或”包括一個(gè)或更多個(gè)相關(guān)聯(lián)的列出項(xiàng)的全部或任一單元和全部組合。本
技術(shù)領(lǐng)域
技術(shù)人員可以理解,除非另外定義,這里使用的所有術(shù)語(yǔ)(包括技術(shù)術(shù)語(yǔ)和科學(xué)術(shù)語(yǔ)),具有與本發(fā)明所屬領(lǐng)域中的普通技術(shù)人員的一般理解相同的意義。還應(yīng)該理解的是,諸如通用字典中定義的那些術(shù)語(yǔ),應(yīng)該被理解為具有與現(xiàn)有技術(shù)的上下文中的意義一致的意義,并且除非像這里一樣被特定定義,否則不會(huì)用理想化或過(guò)于正式的含義來(lái)解釋。圖1為本發(fā)明一個(gè)實(shí)施例的主題詞分類(lèi)號(hào)的確定方法的流程示意圖。步驟s101:獲取任一領(lǐng)域的包括文獻(xiàn)分類(lèi)號(hào)的多個(gè)文獻(xiàn),以建立任一領(lǐng)域的文獻(xiàn)數(shù)據(jù)庫(kù);步驟s102:獲取與任一領(lǐng)域中預(yù)置主題詞相對(duì)應(yīng)的同義詞;步驟s103:基于主題詞及確定出的該主題詞的同義詞,通過(guò)任一領(lǐng)域的文獻(xiàn)數(shù)據(jù)庫(kù)來(lái)確定屬于主題詞的文獻(xiàn)集合;步驟s104:基于文獻(xiàn)集合中的每個(gè)文獻(xiàn)的文獻(xiàn)分類(lèi)號(hào),確定主題詞的分類(lèi)號(hào)。本發(fā)明的技術(shù)方案中,獲取任一領(lǐng)域內(nèi)包括文獻(xiàn)分類(lèi)號(hào)的多個(gè)文獻(xiàn),以建立任一領(lǐng)域的文獻(xiàn)數(shù)據(jù)庫(kù);獲取與任一領(lǐng)域中預(yù)置主題詞相對(duì)應(yīng)的同義詞;基于預(yù)置主題詞及該預(yù)置主題詞的同義詞,通過(guò)任一領(lǐng)域的文獻(xiàn)數(shù)據(jù)庫(kù)來(lái)確定屬于預(yù)置主題詞的文獻(xiàn)集合;基于文獻(xiàn)集合中的每個(gè)文獻(xiàn)的文獻(xiàn)分類(lèi)號(hào),確定預(yù)置主題詞的分類(lèi)號(hào);以實(shí)現(xiàn)自動(dòng)化的方式來(lái)確定主題詞的分類(lèi)號(hào),不僅能夠快速且客觀(guān)地確定主題詞的分類(lèi)號(hào),還能避免新創(chuàng)建的主題詞無(wú)法通過(guò)人工方式進(jìn)行查找的情況;同時(shí)節(jié)省了大量時(shí)間、人力資源、物力資源乃至財(cái)力資源,為人們更加方便地整理和利用海量文獻(xiàn)信息資源提供了幫助。以下針對(duì)各個(gè)步驟的具體實(shí)現(xiàn)做進(jìn)一步的說(shuō)明:步驟s101:獲取任一領(lǐng)域內(nèi)包括文獻(xiàn)分類(lèi)號(hào)的多個(gè)文獻(xiàn),以建立任一領(lǐng)域的文獻(xiàn)數(shù)據(jù)庫(kù)。其中,分類(lèi)號(hào)包括但不限于中國(guó)圖書(shū)館分類(lèi)法的分類(lèi)號(hào)、國(guó)際專(zhuān)利分類(lèi)表internationalpatentclassification分類(lèi)號(hào),簡(jiǎn)稱(chēng)ipc分類(lèi)號(hào)。具體地,獲取任一領(lǐng)域內(nèi)包括文獻(xiàn)分類(lèi)號(hào)的多個(gè)文獻(xiàn)的方式包括但不限于:從預(yù)置的文獻(xiàn)數(shù)據(jù)庫(kù)中獲取任一領(lǐng)域內(nèi)包括文獻(xiàn)分類(lèi)號(hào)的多個(gè)文獻(xiàn);或者利用爬蟲(chóng)技術(shù)從互聯(lián)網(wǎng)的網(wǎng)絡(luò)數(shù)據(jù)平臺(tái)中抓取任一領(lǐng)域內(nèi)包括文獻(xiàn)分類(lèi)號(hào)的多個(gè)文獻(xiàn)。其中,預(yù)置的文獻(xiàn)數(shù)據(jù)庫(kù)可以是專(zhuān)業(yè)領(lǐng)域的文獻(xiàn)數(shù)據(jù)庫(kù),例如:電力電器領(lǐng)域、化工專(zhuān)業(yè)領(lǐng)域、冶金專(zhuān)業(yè)領(lǐng)域、材料專(zhuān)業(yè)領(lǐng)域等專(zhuān)業(yè)領(lǐng)域的文獻(xiàn)數(shù)據(jù)庫(kù),也可以是綜合專(zhuān)業(yè)領(lǐng)域的文獻(xiàn)數(shù)據(jù)庫(kù),例如:萬(wàn)方數(shù)據(jù)庫(kù)、中國(guó)知網(wǎng)數(shù)據(jù)庫(kù)、國(guó)家知識(shí)產(chǎn)權(quán)局專(zhuān)利數(shù)據(jù)庫(kù)等。其中,獲取到的包括文獻(xiàn)分類(lèi)號(hào)的多個(gè)文獻(xiàn),還包括:文獻(xiàn)標(biāo)題、文獻(xiàn)關(guān)鍵詞以及文獻(xiàn)摘要。例如,根據(jù)預(yù)置主題詞或概念知識(shí)圖譜建設(shè)的需求,確定需要獲取的文獻(xiàn)所屬的領(lǐng)域,例如,電力電器領(lǐng)域,則基于獲取任一領(lǐng)域內(nèi)包括文獻(xiàn)分類(lèi)號(hào)的多個(gè)文獻(xiàn)的方式,從國(guó)家知識(shí)產(chǎn)權(quán)局專(zhuān)利數(shù)據(jù)庫(kù)中獲取電力電器領(lǐng)域的包括文獻(xiàn)分類(lèi)號(hào)的多個(gè)文獻(xiàn),基于獲取到的多個(gè)文獻(xiàn)來(lái)建立電力電器領(lǐng)域的文獻(xiàn)數(shù)據(jù)庫(kù)。需要說(shuō)明的是,其它形式的分類(lèi)號(hào)也可以作為文獻(xiàn)分類(lèi)號(hào);獲取到的包括文獻(xiàn)分類(lèi)號(hào)的多個(gè)文獻(xiàn)也還可以包括文獻(xiàn)主體。步驟s102:獲取與任一領(lǐng)域中預(yù)置主題詞相對(duì)應(yīng)的同義詞。具體地,通過(guò)查詢(xún)預(yù)置主題詞表,來(lái)獲取與任一領(lǐng)域中預(yù)置主題詞相對(duì)應(yīng)的同義詞。其中,預(yù)置主題詞表包括任一領(lǐng)域的預(yù)置主題詞與該預(yù)置主題詞的同義詞。例如,基于下述表1的預(yù)置主題詞表,查詢(xún)與電力電器領(lǐng)域中的預(yù)置主題詞相對(duì)應(yīng)的同義詞,如電力電器領(lǐng)域中的預(yù)置主題詞“無(wú)觸點(diǎn)低壓器”相對(duì)應(yīng)的同義詞“可控硅低壓器、半導(dǎo)體低壓器”;預(yù)置主題詞“滅弧室”相對(duì)應(yīng)的同義詞“吹弧室、滅弧罩”;……預(yù)置主題詞“極限電流”相對(duì)應(yīng)的同義詞“容許電流、允通電流”。表1主題詞主題詞相對(duì)應(yīng)的同義詞通信通訊…………無(wú)觸點(diǎn)低壓器可控硅低壓器、半導(dǎo)體低壓器滅弧室吹弧室、滅弧罩…………極限電流容許電流、允通電流…………需要說(shuō)明的是,本實(shí)施例中的預(yù)置主題詞表是綜合各個(gè)領(lǐng)域的主題詞表;在本實(shí)施例中還可以直接通過(guò)遍歷預(yù)置的電力電器領(lǐng)域的主題詞表,直接讀取該電力電器領(lǐng)域的主題詞表中的各個(gè)預(yù)置主題詞以及該預(yù)置主題詞的同義詞。步驟s103:基于預(yù)置主題詞及該預(yù)置主題詞的同義詞,通過(guò)任一領(lǐng)域的文獻(xiàn)數(shù)據(jù)庫(kù)來(lái)確定屬于預(yù)置主題詞的文獻(xiàn)集合。具體地,基于預(yù)置主題詞及該預(yù)置主題詞的同義詞,通過(guò)任一領(lǐng)域的文獻(xiàn)數(shù)據(jù)庫(kù)來(lái)確定屬于預(yù)置主題詞的文獻(xiàn)集合的步驟,如圖2所示,包括:步驟s201:基于預(yù)置檢索條件生成規(guī)則,生成包括任一預(yù)置主題詞和/或該預(yù)置主題詞的同義詞的檢索條件;步驟s202:從任一領(lǐng)域的文獻(xiàn)數(shù)據(jù)庫(kù)中查詢(xún)并確定與檢索條件相符合的文獻(xiàn);步驟s203:基于獲取到的文獻(xiàn),確定屬于預(yù)置主題詞的文獻(xiàn)集合。其中,預(yù)置檢索條件生成規(guī)則是運(yùn)用至少一項(xiàng)符號(hào),使用任一預(yù)置主題詞和/或該預(yù)置主題詞的同義詞生成邏輯表達(dá)式;該符號(hào)包括但不限于邏輯運(yùn)算符、位置運(yùn)算符、字段限制符等。例如,基于邏輯運(yùn)算符“or”,使得電力電器領(lǐng)域的預(yù)置主題詞“極限電流”和“極限電流”的同義詞“容許電流、允通電流”生成邏輯表達(dá)式,即檢索條件,為“極限電流or容許電流or允通電流”;從已建立的電力電器領(lǐng)域的文獻(xiàn)數(shù)據(jù)庫(kù)中查詢(xún)與該檢索條件“極限電流or容許電流or允通電流”相符合的文獻(xiàn),如表2所示:表2則確定屬于該預(yù)置主題詞“極限電流”的文獻(xiàn)集合即為表2所示的文獻(xiàn)集合。步驟s104:基于文獻(xiàn)集合中的每個(gè)文獻(xiàn)的文獻(xiàn)分類(lèi)號(hào),確定預(yù)置主題詞的分類(lèi)號(hào)。具體地,基于預(yù)置主題詞的文獻(xiàn)集合中的每個(gè)文獻(xiàn)的文獻(xiàn)分類(lèi)號(hào),確定預(yù)置主題詞的分類(lèi)號(hào)的步驟,如圖3所示,包括:步驟s301:統(tǒng)計(jì)預(yù)置主題詞的文獻(xiàn)集合中的每個(gè)文獻(xiàn)的文獻(xiàn)分類(lèi)號(hào)的出現(xiàn)頻次;步驟s302:基于出現(xiàn)頻次,將文獻(xiàn)分類(lèi)號(hào)由高至低進(jìn)行排序;步驟s303:按照由高至低的順序選取預(yù)置數(shù)量的文獻(xiàn)分類(lèi)號(hào);步驟s304:將選取到的文獻(xiàn)分類(lèi)號(hào)確定為該預(yù)置主題詞的分類(lèi)號(hào)。例如,統(tǒng)計(jì)上述表2中的每個(gè)文獻(xiàn)的文獻(xiàn)分類(lèi)號(hào)的出現(xiàn)頻次,并基于出現(xiàn)頻次,將文獻(xiàn)分類(lèi)號(hào)由高至低進(jìn)行排序;如表3所示:表3g01n27/26(2006.01)i2次g01n27/407(2006.01)i2次g01n27/00(2006.01)i1次g01r19/00(2006.01)i1次h01r4/181次h01r43/161次b60l11/18(2006.01)i1次f02d41/14(2006.01)i1次g01n27/406(2006.01)i1次即分類(lèi)號(hào)g01n27/26(2006.01)i,出現(xiàn)頻次“2次”;分類(lèi)號(hào)g01n27/407(2006.01)i,出現(xiàn)頻次“2次”;分類(lèi)號(hào)g01n27/00(2006.01)i,出現(xiàn)頻次“1次”;分類(lèi)號(hào)g01r19/00(2006.01)i,出現(xiàn)頻次“1次”;分類(lèi)號(hào)h01r4/18,出現(xiàn)頻次“1次”;分類(lèi)號(hào)h01r43/16,出現(xiàn)頻次“1次”;分類(lèi)號(hào)b60l11/18(2006.01)i,出現(xiàn)頻次“1次”;分類(lèi)號(hào)f02d41/14(2006.01)i,出現(xiàn)頻次“1次”;分類(lèi)號(hào)g01n27/406(2006.01)i,出現(xiàn)頻次“1次”;當(dāng)預(yù)置數(shù)量為2個(gè)時(shí),按照由高至低的順序選取2個(gè)文獻(xiàn)分類(lèi)號(hào):分類(lèi)號(hào)g01n27/26(2006.01)i和分類(lèi)號(hào)g01n27/407(2006.01)i;則確定預(yù)置主題詞“極限電流”的分類(lèi)號(hào)為:g01n27/26(2006.01)i、g01n27/407(2006.01)i。需要說(shuō)明的是,根據(jù)需求還可以只選擇文獻(xiàn)分類(lèi)號(hào)的部分等級(jí)作為該文獻(xiàn)分類(lèi)號(hào),即并非必須選擇文獻(xiàn)分類(lèi)號(hào)的全部等級(jí)作為文獻(xiàn)分類(lèi)號(hào),如根據(jù)需求選擇上述文獻(xiàn)分類(lèi)號(hào)的以下至少一個(gè)等級(jí)作為文獻(xiàn)分類(lèi)號(hào):部、大類(lèi)、小類(lèi)、大組、小組等;如,上述文獻(xiàn)分類(lèi)號(hào)包括的等級(jí)為:部、大類(lèi)和小類(lèi),如表4所示:表4即分類(lèi)號(hào)g01n,出現(xiàn)頻次“6次”;分類(lèi)號(hào)h01r,出現(xiàn)頻次“2次”;分類(lèi)號(hào)g01r,出現(xiàn)頻次“1次”;分類(lèi)號(hào)b60l,出現(xiàn)頻次“1次”;分類(lèi)號(hào)f02d,出現(xiàn)頻次“1次”;當(dāng)預(yù)置數(shù)量為2個(gè)時(shí),按照由高至低的順序選取2個(gè)文獻(xiàn)分類(lèi)號(hào):分類(lèi)號(hào)g01n和分類(lèi)號(hào)h01r;則確定預(yù)置主題詞“極限電流”的分類(lèi)號(hào)為:g01n、h01r。根據(jù)需求還可以選擇上述文獻(xiàn)分類(lèi)號(hào)包括的等級(jí)為:部和類(lèi);部、類(lèi)、小類(lèi)和大組等其他等級(jí)組合方式。具體地,基于上述表3或表4,當(dāng)預(yù)置數(shù)量大于統(tǒng)計(jì)生成的文獻(xiàn)分類(lèi)號(hào)的數(shù)量時(shí),該方法還包括:將所有的文獻(xiàn)分類(lèi)號(hào)確定為該預(yù)置主題詞的分類(lèi)號(hào)。例如,基于上述表3,當(dāng)預(yù)置數(shù)量為10個(gè)分類(lèi)號(hào)時(shí),大于文獻(xiàn)分類(lèi)號(hào)的數(shù)量9個(gè)時(shí),則該預(yù)置主題詞“極限電流”的分類(lèi)號(hào)直接可確定為這9個(gè)文獻(xiàn)分類(lèi)號(hào):g01n27/26(2006.01)i、g01n27/407(2006.01)i、g01n27/00(2006.01)i、g01r19/00(2006.01)i、h01r4/18、h01r43/16、b60l11/18(2006.01)i、f02d41/14(2006.01)i、g01n27/406(2006.01)i?;谏鲜霰?,當(dāng)預(yù)置數(shù)量為10個(gè)分類(lèi)號(hào)時(shí),大于文獻(xiàn)分類(lèi)號(hào)的數(shù)量5個(gè)時(shí),則該預(yù)置主題詞“極限電流”的分類(lèi)號(hào)直接可確定為這5個(gè)文獻(xiàn)分類(lèi)號(hào):g01n、h01r、g01r、b60l、f02d。本發(fā)明的實(shí)施例為每一個(gè)主題詞確定多個(gè)分類(lèi)號(hào),實(shí)現(xiàn)了主題詞與多個(gè)分類(lèi)號(hào)的關(guān)聯(lián),滿(mǎn)足了人們對(duì)多領(lǐng)域關(guān)聯(lián)檢索的需求;同時(shí)基于本發(fā)明的方法確定的主題詞的分類(lèi)號(hào)比人工方式確定的主題詞的分類(lèi)號(hào)更加客觀(guān),實(shí)用性更好。圖4為本發(fā)明中的另一個(gè)實(shí)施例的主題詞分類(lèi)號(hào)的確定裝置的結(jié)構(gòu)框架示意圖。獲取模塊,獲取任一領(lǐng)域內(nèi)包括文獻(xiàn)分類(lèi)號(hào)的多個(gè)文獻(xiàn),以建立任一領(lǐng)域的文獻(xiàn)數(shù)據(jù)庫(kù);第一確定模塊,獲取與任一領(lǐng)域中預(yù)置主題詞相對(duì)應(yīng)的同義詞;第二確定模塊,基于預(yù)置主題詞及該預(yù)置主題詞的同義詞,通過(guò)任一領(lǐng)域的文獻(xiàn)數(shù)據(jù)庫(kù)來(lái)確定屬于預(yù)置主題詞的文獻(xiàn)集合;第三確定模塊,基于文獻(xiàn)集合中的每個(gè)文獻(xiàn)的文獻(xiàn)分類(lèi)號(hào),確定預(yù)置主題詞的分類(lèi)號(hào)。以下針對(duì)各個(gè)模塊的具體實(shí)現(xiàn)做進(jìn)一步的說(shuō)明:獲取模塊,獲取任一領(lǐng)域內(nèi)包括文獻(xiàn)分類(lèi)號(hào)的多個(gè)文獻(xiàn),以建立任一領(lǐng)域的文獻(xiàn)數(shù)據(jù)庫(kù)。其中,分類(lèi)號(hào)包括但不限于中國(guó)圖書(shū)館分類(lèi)法的分類(lèi)號(hào)、國(guó)際專(zhuān)利分類(lèi)表internationalpatentclassification分類(lèi)號(hào),簡(jiǎn)稱(chēng)ipc分類(lèi)號(hào)。具體地,獲取任一領(lǐng)域內(nèi)包括文獻(xiàn)分類(lèi)號(hào)的多個(gè)文獻(xiàn)的方式包括但不限于:從預(yù)置的文獻(xiàn)數(shù)據(jù)庫(kù)中獲取任一領(lǐng)域內(nèi)包括文獻(xiàn)分類(lèi)號(hào)的多個(gè)文獻(xiàn);或者利用爬蟲(chóng)技術(shù)從互聯(lián)網(wǎng)的網(wǎng)絡(luò)數(shù)據(jù)平臺(tái)中抓取任一領(lǐng)域內(nèi)包括文獻(xiàn)分類(lèi)號(hào)的多個(gè)文獻(xiàn)。其中,預(yù)置的文獻(xiàn)數(shù)據(jù)庫(kù)可以是專(zhuān)業(yè)領(lǐng)域的文獻(xiàn)數(shù)據(jù)庫(kù),例如:電力電器領(lǐng)域、化工專(zhuān)業(yè)領(lǐng)域、冶金專(zhuān)業(yè)領(lǐng)域、材料專(zhuān)業(yè)領(lǐng)域等專(zhuān)業(yè)領(lǐng)域的文獻(xiàn)數(shù)據(jù)庫(kù),也可以是綜合專(zhuān)業(yè)領(lǐng)域的文獻(xiàn)數(shù)據(jù)庫(kù),例如:萬(wàn)方數(shù)據(jù)庫(kù)、中國(guó)知網(wǎng)數(shù)據(jù)庫(kù)、國(guó)家知識(shí)產(chǎn)權(quán)局專(zhuān)利數(shù)據(jù)庫(kù)等。其中,獲取到的包括文獻(xiàn)分類(lèi)號(hào)的多個(gè)文獻(xiàn),還包括:文獻(xiàn)標(biāo)題、文獻(xiàn)關(guān)鍵詞以及文獻(xiàn)摘要。例如,根據(jù)預(yù)置主題詞或概念知識(shí)圖譜建設(shè)的需求,確定需要獲取的文獻(xiàn)所屬的領(lǐng)域,例如,電力電器領(lǐng)域,則基于獲取模塊的獲取任一領(lǐng)域內(nèi)包括文獻(xiàn)分類(lèi)號(hào)的多個(gè)文獻(xiàn)的方式,從國(guó)家知識(shí)產(chǎn)權(quán)局專(zhuān)利數(shù)據(jù)庫(kù)中獲取電力電器領(lǐng)域的包括文獻(xiàn)分類(lèi)號(hào)的多個(gè)文獻(xiàn),基于獲取到的多個(gè)文獻(xiàn)來(lái)建立電力電器領(lǐng)域的文獻(xiàn)數(shù)據(jù)庫(kù)。需要說(shuō)明的是,其它形式的分類(lèi)號(hào)也可以作為文獻(xiàn)分類(lèi)號(hào);獲取到的包括文獻(xiàn)分類(lèi)號(hào)的多個(gè)文獻(xiàn)也可以還包括文獻(xiàn)主體。第一確定模塊,獲取與任一領(lǐng)域中預(yù)置主題詞相對(duì)應(yīng)的同義詞。具體地,第一確定模塊,通過(guò)查詢(xún)預(yù)置主題詞表,來(lái)獲取與任一領(lǐng)域中預(yù)置主題詞相對(duì)應(yīng)的同義詞。其中,預(yù)置主題詞表包括任一領(lǐng)域的預(yù)置主題詞與該預(yù)置主題詞的同義詞。例如,基于下述表1的預(yù)置主題詞表,第一確定模塊查詢(xún)與電力電器領(lǐng)域中的預(yù)置主題詞相對(duì)應(yīng)的同義詞,如電力電器領(lǐng)域中的預(yù)置主題詞“無(wú)觸點(diǎn)低壓器”相對(duì)應(yīng)的同義詞“可控硅低壓器、半導(dǎo)體低壓器”;預(yù)置主題詞“滅弧室”相對(duì)應(yīng)的同義詞“吹弧室、滅弧罩”;……預(yù)置主題詞“極限電流”相對(duì)應(yīng)的同義詞“容許電流、允通電流”。表1主題詞主題詞相對(duì)應(yīng)的同義詞通信通訊…………無(wú)觸點(diǎn)低壓器可控硅低壓器、半導(dǎo)體低壓器滅弧室吹弧室、滅弧罩…………極限電流容許電流、允通電流…………需要說(shuō)明的是,本實(shí)施例中的預(yù)置主題詞表是綜合各個(gè)領(lǐng)域的主題詞表;在本實(shí)施例中還可以直接通過(guò)第一確定模塊遍歷預(yù)置的電力電器領(lǐng)域的主題詞表,直接讀取該電力電器領(lǐng)域的主題詞表中的各個(gè)預(yù)置主題詞以及該預(yù)置主題詞的同義詞。第二確定模塊,基于預(yù)置主題詞及該主題詞的同義詞,通過(guò)任一領(lǐng)域的文獻(xiàn)數(shù)據(jù)庫(kù)來(lái)確定屬于預(yù)置主題詞的文獻(xiàn)集合。具體地,如圖5所示,第二確定模塊包括:生成單元,基于預(yù)置檢索條件生成規(guī)則,生成包括任一預(yù)置主題詞和/或該預(yù)置主題詞的同義詞的檢索條件;查詢(xún)單元,從任一領(lǐng)域的文獻(xiàn)數(shù)據(jù)庫(kù)中查詢(xún)并確定與檢索條件相符合的文獻(xiàn);第一確定單元,基于獲取到的文獻(xiàn),確定屬于預(yù)置主題詞的文獻(xiàn)集合。其中,預(yù)置檢索條件生成規(guī)則是運(yùn)用至少一項(xiàng)符號(hào),使用任一預(yù)置主題詞和/或該預(yù)置主題詞的同義詞生成邏輯表達(dá)式;該符號(hào)包括但不限于邏輯運(yùn)算符、位置運(yùn)算符、字段限制符等。例如,生成單元基于邏輯運(yùn)算符“or”,使用電力電器領(lǐng)域的預(yù)置主題詞“極限電流”和“極限電流”的同義詞“容許電流、允通電流”生成邏輯表達(dá)式,即檢索條件,為“極限電流or容許電流or允通電流”;查詢(xún)單元從已建立的電力電器領(lǐng)域的文獻(xiàn)數(shù)據(jù)庫(kù)中查詢(xún)與該檢索條件“極限電流or容許電流or允通電流”,相符合的文獻(xiàn),如表2所示:表2則第一確定單元確定屬于該預(yù)置主題詞“極限電流”的文獻(xiàn)集合即為表2所示的文獻(xiàn)集合。第三確定模塊,基于文獻(xiàn)集合中的每個(gè)文獻(xiàn)的文獻(xiàn)分類(lèi)號(hào),確定預(yù)置主題詞的分類(lèi)號(hào)。具體地,如圖6所示,第三確定模塊包括:統(tǒng)計(jì)單元,統(tǒng)計(jì)預(yù)置主題詞的文獻(xiàn)集合中的每個(gè)文獻(xiàn)的文獻(xiàn)分類(lèi)號(hào)的出現(xiàn)頻次;排序單元,基于出現(xiàn)頻次,將文獻(xiàn)分類(lèi)號(hào)由高至低進(jìn)行排序;選取單元,按照由高至低的順序選取預(yù)置數(shù)量的文獻(xiàn)分類(lèi)號(hào);第二確定單元,將選取到的文獻(xiàn)分類(lèi)號(hào)確定為該預(yù)置主題詞的分類(lèi)號(hào)。例如,統(tǒng)計(jì)單元統(tǒng)計(jì)上述表2中的每個(gè)文獻(xiàn)的文獻(xiàn)分類(lèi)號(hào)的出現(xiàn)頻次;排序單元基于出現(xiàn)頻率,將文獻(xiàn)分類(lèi)號(hào)由高至低進(jìn)行排序;如表3所示:表3g01n27/26(2006.01)i2次g01n27/407(2006.01)i2次g01n27/00(2006.01)i1次g01r19/00(2006.01)i1次h01r4/181次h01r43/161次b60l11/18(2006.01)i1次f02d41/14(2006.01)i1次g01n27/406(2006.01)i1次即分類(lèi)號(hào)g01n27/26(2006.01)i,出現(xiàn)頻次“2次”;分類(lèi)號(hào)g01n27/407(2006.01)i,出現(xiàn)頻次“2次”;分類(lèi)號(hào)g01n27/00(2006.01)i,出現(xiàn)頻次“1次”;分類(lèi)號(hào)g01r19/00(2006.01)i,出現(xiàn)頻次“1次”;分類(lèi)號(hào)h01r4/18,出現(xiàn)頻次“1次”;分類(lèi)號(hào)h01r43/16,出現(xiàn)頻次“1次”;分類(lèi)號(hào)b60l11/18(2006.01)i,出現(xiàn)頻次“1次”;分類(lèi)號(hào)f02d41/14(2006.01)i,出現(xiàn)頻次“1次”;分類(lèi)號(hào)g01n27/406(2006.01)i,出現(xiàn)頻次“1次”;當(dāng)預(yù)置數(shù)量為2個(gè)時(shí),選取單元按照由高至低的順序選取2個(gè)文獻(xiàn)分類(lèi)號(hào):分類(lèi)號(hào)g01n27/26(2006.01)i和分類(lèi)號(hào)g01n27/407(2006.01)i;則第二確定單元確定預(yù)置主題詞“極限電流”的分類(lèi)號(hào)為:g01n27/26(2006.01)i、g01n27/407(2006.01)i。需要說(shuō)明的是,根據(jù)需求還可以只選擇文獻(xiàn)分類(lèi)號(hào)的部分等級(jí)作為該文獻(xiàn)分類(lèi)號(hào),即并非必須選擇文獻(xiàn)分類(lèi)號(hào)的全部等級(jí)作為文獻(xiàn)分類(lèi)號(hào),如根據(jù)需求選擇上述文獻(xiàn)分類(lèi)號(hào)的以下至少一個(gè)等級(jí)作為文獻(xiàn)分類(lèi)號(hào):部、大類(lèi)、小類(lèi)、大組、小組等;如,上述文獻(xiàn)分類(lèi)號(hào)包括的等級(jí)為:部、大類(lèi)和小類(lèi),如表4所示:表4g01n6次h01r2次g01r1次b60l1次f02d1次即分類(lèi)號(hào)g01n,出現(xiàn)頻次“6次”;分類(lèi)號(hào)h01r,出現(xiàn)頻次“2次”;分類(lèi)號(hào)g01r,出現(xiàn)頻次“1次”;分類(lèi)號(hào)b60l,出現(xiàn)頻次“1次”;分類(lèi)號(hào)f02d,出現(xiàn)頻次“1次”;當(dāng)預(yù)置數(shù)量為2個(gè)時(shí),按照由高至低的順序選取2個(gè)文獻(xiàn)分類(lèi)號(hào):分類(lèi)號(hào)g01n和分類(lèi)號(hào)h01r;則確定預(yù)置主題詞“極限電流”的分類(lèi)號(hào)為:g01n、h01r。根據(jù)需求還可以選擇上述文獻(xiàn)分類(lèi)號(hào)包括的等級(jí)為:部和類(lèi);部、類(lèi)、小類(lèi)和大組等其他等級(jí)組合方式。具體地,基于上述表3或表4,當(dāng)預(yù)置數(shù)量大于統(tǒng)計(jì)生成的文獻(xiàn)分類(lèi)號(hào)的數(shù)量時(shí),該裝置還包括:第四確定模塊,將所有的文獻(xiàn)分類(lèi)號(hào)確定為該預(yù)置主題詞的分類(lèi)號(hào)。例如,基于上述表3,當(dāng)預(yù)置數(shù)量為10個(gè)分類(lèi)號(hào)時(shí),大于文獻(xiàn)分類(lèi)號(hào)的數(shù)量9個(gè)時(shí),則該預(yù)置主題詞“極限電流”的分類(lèi)號(hào)直接可確定為這9個(gè)文獻(xiàn)分類(lèi)號(hào):g01n27/26(2006.01)i、g01n27/407(2006.01)i、g01n27/00(2006.01)i、g01r19/00(2006.01)i、h01r4/18、h01r43/16、b60l11/18(2006.01)i、f02d41/14(2006.01)i、g01n27/406(2006.01)i?;谏鲜霰?,當(dāng)預(yù)置數(shù)量為10個(gè)分類(lèi)號(hào)時(shí),大于文獻(xiàn)分類(lèi)號(hào)的數(shù)量5個(gè)時(shí),則該預(yù)置主題詞“極限電流”的分類(lèi)號(hào)直接可確定為這5個(gè)文獻(xiàn)分類(lèi)號(hào):g01n、h01r、g01r、b60l、f02d。本
技術(shù)領(lǐng)域
技術(shù)人員可以理解,本發(fā)明包括涉及用于執(zhí)行本申請(qǐng)中所述操作中的一項(xiàng)或多項(xiàng)的設(shè)備。這些設(shè)備可以為所需的目的而專(zhuān)門(mén)設(shè)計(jì)和制造,或者也可以包括通用計(jì)算機(jī)中的已知設(shè)備。這些設(shè)備具有存儲(chǔ)在其內(nèi)的計(jì)算機(jī)程序,這些計(jì)算機(jī)程序選擇性地激活或重構(gòu)。這樣的計(jì)算機(jī)程序可以被存儲(chǔ)在設(shè)備(例如,計(jì)算機(jī))可讀介質(zhì)中或者存儲(chǔ)在適于存儲(chǔ)電子指令并分別耦聯(lián)到總線(xiàn)的任何類(lèi)型的介質(zhì)中,所述計(jì)算機(jī)可讀介質(zhì)包括但不限于任何類(lèi)型的盤(pán)(包括軟盤(pán)、硬盤(pán)、光盤(pán)、cd-rom、和磁光盤(pán))、rom(read-onlymemory,只讀存儲(chǔ)器)、ram(randomaccessmemory,隨即存儲(chǔ)器)、eprom(erasableprogrammableread-onlymemory,可擦寫(xiě)可編程只讀存儲(chǔ)器)、eeprom(electricallyerasableprogrammableread-onlymemory,電可擦可編程只讀存儲(chǔ)器)、閃存、磁性卡片或光線(xiàn)卡片。也就是,可讀介質(zhì)包括由設(shè)備(例如,計(jì)算機(jī))以能夠讀的形式存儲(chǔ)或傳輸信息的任何介質(zhì)。本
技術(shù)領(lǐng)域
技術(shù)人員可以理解,可以用計(jì)算機(jī)程序指令來(lái)實(shí)現(xiàn)這些結(jié)構(gòu)圖和/或框圖和/或流圖中的每個(gè)框以及這些結(jié)構(gòu)圖和/或框圖和/或流圖中的框的組合。本
技術(shù)領(lǐng)域
技術(shù)人員可以理解,可以將這些計(jì)算機(jī)程序指令提供給通用計(jì)算機(jī)、專(zhuān)業(yè)計(jì)算機(jī)或其他可編程數(shù)據(jù)處理方法的處理器來(lái)實(shí)現(xiàn),從而通過(guò)計(jì)算機(jī)或其他可編程數(shù)據(jù)處理方法的處理器來(lái)執(zhí)行本發(fā)明公開(kāi)的結(jié)構(gòu)圖和/或框圖和/或流圖的框或多個(gè)框中指定的方案。本
技術(shù)領(lǐng)域
技術(shù)人員可以理解,本發(fā)明中已經(jīng)討論過(guò)的各種操作、方法、流程中的步驟、措施、方案可以被交替、更改、組合或刪除。進(jìn)一步地,具有本發(fā)明中已經(jīng)討論過(guò)的各種操作、方法、流程中的其他步驟、措施、方案也可以被交替、更改、重排、分解、組合或刪除。進(jìn)一步地,現(xiàn)有技術(shù)中的具有與本發(fā)明中公開(kāi)的各種操作、方法、流程中的步驟、措施、方案也可以被交替、更改、重排、分解、組合或刪除。以上所述僅是本發(fā)明的部分實(shí)施方式,應(yīng)當(dāng)指出,對(duì)于本
技術(shù)領(lǐng)域
的普通技術(shù)人員來(lái)說(shuō),在不脫離本發(fā)明原理的前提下,還可以做出若干改進(jìn)和潤(rùn)飾,這些改進(jìn)和潤(rùn)飾也應(yīng)視為本發(fā)明的保護(hù)范圍。當(dāng)前第1頁(yè)12
當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
波密县| 永州市| 泾源县| 永春县| 松阳县| 内丘县| 榆树市| 同心县| 嘉祥县| 且末县| 东明县| 福建省| 京山县| 邳州市| 乐安县| 博爱县| 神木县| 巴林左旗| 湄潭县| 旅游| 孙吴县| 济阳县| 贵定县| 阿拉善右旗| 泰顺县| 襄垣县| 丰顺县| 锦屏县| 密云县| 扶沟县| 讷河市| 奉节县| 阜平县| 和田县| 同仁县| 芦山县| 红安县| 华池县| 远安县| 拉萨市| 葫芦岛市|