欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于文本的農(nóng)業(yè)視頻智能分類方法及裝置的制造方法_3

文檔序號:8282382閱讀:來源:國知局
置中標(biāo)注模塊13的在另一實施例中的內(nèi)部結(jié)構(gòu),來體現(xiàn)依據(jù)標(biāo)注模塊13實現(xiàn)的另一實施例的細節(jié)。標(biāo)注模塊13,進一步包括劃分單元、提取單元以及標(biāo)注單元;
[0101]所述的劃分單元,用于將所述文本信息劃分為屬性標(biāo)簽和數(shù)據(jù)元素;
[0102]所述的提取單元,用于提取所述數(shù)據(jù)元素的至少一個關(guān)鍵詞;
[0103]所述的標(biāo)注單元,用于根據(jù)所述數(shù)據(jù)元素的至少一個關(guān)鍵詞對該數(shù)據(jù)元素進行標(biāo)注。
[0104]為了進一步體現(xiàn)發(fā)明的優(yōu)越性,如下進一步揭示本發(fā)明基于文本的農(nóng)業(yè)視頻智能分類裝置中比對分類模塊15的在另一實施例中的內(nèi)部結(jié)構(gòu),來體現(xiàn)依據(jù)比對分類模塊15實現(xiàn)的另一實施例的細節(jié)。比對分類模塊15,進一步包括解析單元、比對單元以及類別確定單元;
[0105]所述的解析單元,用于解析所述待分類的視頻的特征信息,得到所述待分類的視頻的數(shù)據(jù)元素的至少一個關(guān)鍵詞;
[0106]所述的比對單元,用于將所述至少一個關(guān)鍵詞與所述農(nóng)業(yè)相關(guān)信息的本體庫中的與農(nóng)業(yè)相關(guān)的特征詞進行比對;
[0107]所述的類別確定單元,用于如果所述農(nóng)業(yè)相關(guān)信息的本體庫中存在與所述至少一個關(guān)鍵詞相同或滿足預(yù)設(shè)相似度閾值的特征詞,則根據(jù)所述特征詞為所述待分類的視頻添加一個類別標(biāo)簽。
[0108]綜上所述,本發(fā)明依托農(nóng)業(yè)視頻文本信息的特性,針對農(nóng)業(yè)視頻文本信息的分詞、專有名詞等,根據(jù)互聯(lián)網(wǎng)涉農(nóng)網(wǎng)站數(shù)據(jù)構(gòu)建互聯(lián)網(wǎng)涉農(nóng)中文本體庫,以本體庫為依據(jù),采用標(biāo)注的方式提取信息,實現(xiàn)農(nóng)業(yè)視頻的分類,從而方便用戶快速預(yù)覽視頻內(nèi)容,定位其感興趣的信息,提高了用戶瀏覽和搜索的效率。
[0109]通過以上的實施方式的描述,本領(lǐng)域的技術(shù)人員可以清楚地了解到本發(fā)明可以通過硬件實現(xiàn),也可以借助軟件加必要的通用硬件平臺的方式來實現(xiàn)?;谶@樣的理解,本發(fā)明的技術(shù)方案可以以軟件產(chǎn)品的形式體現(xiàn)出來,該軟件產(chǎn)品可以存儲在一個非易失性存儲介質(zhì)(可以是CD-ROM,U盤,移動硬盤等)中,包括若干指令用以使得一臺計算機設(shè)備(可以是個人計算機,服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個實施例所述的方法。
[0110]本領(lǐng)域技術(shù)人員可以理解附圖只是一個優(yōu)選實施例的示意圖,附圖中的模塊或流程并不一定是實施本發(fā)明所必須的。
[0111]本領(lǐng)域技術(shù)人員可以理解實施例中的裝置中的模塊可以按照實施例描述進行分布于實施例的裝置中,也可以進行相應(yīng)變化位于不同于本實施例的一個或多個裝置中。上述實施例的模塊可以合并為一個模塊,也可以進一步拆分成多個子模塊。
[0112]以上公開的僅為本發(fā)明的幾個具體實施例,但是,本發(fā)明并非局限于此,任何本領(lǐng)域的技術(shù)人員能思之的變化都應(yīng)落入本發(fā)明的保護范圍。
【主權(quán)項】
1.一種基于文本的農(nóng)業(yè)視頻智能分類方法,其特征在于,所述方法包括: 構(gòu)建農(nóng)業(yè)相關(guān)信息的本體庫; 獲取待分類的視頻的文本信息; 將所述文本信息劃分為屬性標(biāo)簽和數(shù)據(jù)元素,并對所述數(shù)據(jù)元素進行標(biāo)注; 將標(biāo)注后的數(shù)據(jù)元素進行打包,生成所述待分類的視頻的特征信息; 利用所述農(nóng)業(yè)相關(guān)信息的本體庫與所述待分類的視頻的特征信息進行比對,根據(jù)比對結(jié)果對所述待分類的視頻進行分類。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述構(gòu)建農(nóng)業(yè)相關(guān)信息的本體庫,具體包括: 從互聯(lián)網(wǎng)數(shù)據(jù)中抓取涉農(nóng)網(wǎng)站的初始URL ; 根據(jù)所述初始URL,采用爬蟲引擎處理技術(shù)搜索所述初始URL對應(yīng)的網(wǎng)頁上的所有鏈接,下載搜索到的鏈接對應(yīng)的URL得到網(wǎng)址集合; 利用責(zé)任鏈模式,對所述網(wǎng)址集合中的URL進行過濾,得到與農(nóng)業(yè)相關(guān)的網(wǎng)站對應(yīng)的URL ; 解析所述過濾得到的URL對應(yīng)的農(nóng)業(yè)相關(guān)網(wǎng)站,得到與農(nóng)業(yè)相關(guān)的特征詞; 根據(jù)所述與農(nóng)業(yè)相關(guān)的特征詞構(gòu)建農(nóng)業(yè)相關(guān)信息的本體庫。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,采用爬蟲引擎處理技術(shù)搜索所述初始URL對應(yīng)的網(wǎng)頁上的所有鏈接,具體包括: 將所述初始URL交付網(wǎng)頁爬蟲算法; 所述網(wǎng)頁爬蟲算法以廣度優(yōu)先的方式不斷爬行,搜索所述初始URL對應(yīng)的網(wǎng)頁上的所有鏈接。
4.根據(jù)權(quán)利要求1-3任一項所述的方法,其特征在于,所述將所述文本信息劃分為屬性標(biāo)簽和數(shù)據(jù)元素,并對所述數(shù)據(jù)元素進行標(biāo)注,具體包括: 將所述文本信息劃分為屬性標(biāo)簽和數(shù)據(jù)元素; 提取所述數(shù)據(jù)元素的至少一個關(guān)鍵詞; 根據(jù)所述數(shù)據(jù)元素的至少一個關(guān)鍵詞對該數(shù)據(jù)元素進行標(biāo)注。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述利用所述農(nóng)業(yè)相關(guān)信息的本體庫與所述待分類的視頻的特征信息進行比對,根據(jù)比對結(jié)果對所述待分類的視頻進行分類,具體包括: 解析所述待分類的視頻的特征信息,得到所述待分類的視頻的數(shù)據(jù)元素的至少一個關(guān)鍵詞; 將所述至少一個關(guān)鍵詞與所述農(nóng)業(yè)相關(guān)信息的本體庫中的與農(nóng)業(yè)相關(guān)的特征詞進行比對; 如果所述農(nóng)業(yè)相關(guān)信息的本體庫中存在與所述至少一個關(guān)鍵詞相同或滿足預(yù)設(shè)相似度閾值的特征詞,則根據(jù)所述特征詞為所述待分類的視頻添加一個類別標(biāo)簽。
6.一種基于文本的農(nóng)業(yè)視頻智能分類裝置,其特征在于,所述裝置包括: 本體庫構(gòu)建模塊,用于構(gòu)建農(nóng)業(yè)相關(guān)信息的本體庫; 文本信息獲取模塊,用于獲取待分類的視頻的文本信息; 標(biāo)注模塊,用于將所述文本信息劃分為屬性標(biāo)簽和數(shù)據(jù)元素,并對所述數(shù)據(jù)元素進行標(biāo)注; 特征信息生成模塊,用于將標(biāo)注后的數(shù)據(jù)元素進行打包,生成所述待分類的視頻的特征信息; 比對分類模塊,用于利用所述農(nóng)業(yè)相關(guān)信息的本體庫與所述待分類的視頻的特征信息進行比對,根據(jù)比對結(jié)果對所述待分類的視頻進行分類。
7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述本體庫構(gòu)建模塊,具體包括: URL抓取單元,用于從互聯(lián)網(wǎng)數(shù)據(jù)中抓取涉農(nóng)網(wǎng)站的初始URL ; URL搜索單元,用于根據(jù)所述初始URL,采用爬蟲引擎處理技術(shù)搜索所述初始URL對應(yīng)的網(wǎng)頁上的所有鏈接,下載搜索到的鏈接對應(yīng)的URL得到網(wǎng)址集合; URL過濾單元,用于利用責(zé)任鏈模式,對所述網(wǎng)址集合中的URL進行過濾,得到與農(nóng)業(yè)相關(guān)的網(wǎng)站對應(yīng)的URL ; 數(shù)據(jù)解析單元,用于解析所述過濾得到的URL對應(yīng)的農(nóng)業(yè)相關(guān)網(wǎng)站,得到與農(nóng)業(yè)相關(guān)的特征詞; 本體庫構(gòu)建單元,用于根據(jù)所述與農(nóng)業(yè)相關(guān)的特征詞構(gòu)建農(nóng)業(yè)相關(guān)信息的本體庫。
8.根據(jù)權(quán)利要求6或7所述的裝置,其特征在于,所述標(biāo)注模塊,具體包括: 劃分單元,用于將所述文本信息劃分為屬性標(biāo)簽和數(shù)據(jù)元素; 提取單元,用于提取所述數(shù)據(jù)元素的至少一個關(guān)鍵詞; 標(biāo)注單元,用于根據(jù)所述數(shù)據(jù)元素的至少一個關(guān)鍵詞對該數(shù)據(jù)元素進行標(biāo)注。
9.根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述比對分類模塊,具體包括: 解析單元,用于解析所述待分類的視頻的特征信息,得到所述待分類的視頻的數(shù)據(jù)元素的至少一個關(guān)鍵詞; 比對單元,用于將所述至少一個關(guān)鍵詞與所述農(nóng)業(yè)相關(guān)信息的本體庫中的與農(nóng)業(yè)相關(guān)的特征詞進行比對; 類別確定單元,用于如果所述農(nóng)業(yè)相關(guān)信息的本體庫中存在與所述至少一個關(guān)鍵詞相同或滿足預(yù)設(shè)相似度閾值的特征詞,則根據(jù)所述特征詞為所述待分類的視頻添加一個類別標(biāo)簽。
【專利摘要】本發(fā)明提供了一種基于文本的農(nóng)業(yè)視頻智能分類方法及裝置,該方法包括:構(gòu)建農(nóng)業(yè)相關(guān)信息的本體庫;獲取待分類的視頻的文本信息;將所述文本信息劃分為屬性標(biāo)簽和數(shù)據(jù)元素,并對所述數(shù)據(jù)元素進行標(biāo)注;將標(biāo)注后的數(shù)據(jù)元素進行打包,生成所述待分類的視頻的特征信息;利用所述農(nóng)業(yè)相關(guān)信息的本體庫與所述待分類的視頻的特征信息進行比對,根據(jù)比對結(jié)果對所述待分類的視頻進行分類。本發(fā)明能夠?qū)崿F(xiàn)農(nóng)業(yè)視頻的分類,從而方便用戶快速預(yù)覽視頻內(nèi)容,定位其感興趣的信息,提高了用戶瀏覽和搜索的效率。
【IPC分類】G06F17-30
【公開號】CN104598561
【申請?zhí)枴緾N201510005964
【發(fā)明人】高萬林, 胡慧, 張港紅, 鄭立華, 陳雪瑞
【申請人】中國農(nóng)業(yè)大學(xué)
【公開日】2015年5月6日
【申請日】2015年1月7日
當(dāng)前第3頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
丹凤县| 九寨沟县| 张家港市| 阳山县| 玉田县| 福建省| 报价| 浏阳市| 津市市| 泾阳县| 乐安县| 迁西县| 远安县| 嘉定区| 惠水县| 盐津县| 阆中市| 东平县| 达州市| 河池市| 合肥市| 鄂尔多斯市| 黔南| 内丘县| 合川市| 天气| 庄浪县| 民乐县| 石屏县| 海安县| 南宁市| 平陆县| 建瓯市| 大石桥市| 通榆县| 喀喇沁旗| 永寿县| 陆河县| 随州市| 大安市| 天门市|