欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于文本的農(nóng)業(yè)視頻智能分類方法及裝置的制造方法

文檔序號:8282382閱讀:195來源:國知局
一種基于文本的農(nóng)業(yè)視頻智能分類方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及農(nóng)業(yè)視頻分類技術(shù)領(lǐng)域,尤其涉及一種基于文本的農(nóng)業(yè)視頻智能分類方法及裝置。
【背景技術(shù)】
[0002]近年來,隨著計算機(jī)網(wǎng)絡(luò)和多媒體技術(shù)的高速發(fā)展,各種多媒體信息蜂擁而至。視頻作為一種常見的多媒體形式,是聲音、圖像和文字等信息的載體,成為廣大網(wǎng)絡(luò)用戶喜愛的交流媒介,與人類的日常生活息息相關(guān)。由于其種類和數(shù)量與日俱增,所以如何對這些海量的視頻進(jìn)行分類整理并且從中找到人們感興趣的內(nèi)容已經(jīng)成為一個重要的課題。為此,視頻的自動分析系統(tǒng)便應(yīng)運(yùn)而生。視頻的自動分類檢測算法研宄也成為一個熱點(diǎn)。
[0003]常見的基于視覺特性的視頻分類方法,不僅耗時長、效率低且代價昂貴,而文本信息常常見于用戶對視頻信息的描述、評論、以及所提供的個性化標(biāo)簽數(shù)據(jù)中,成為一種應(yīng)用廣泛的媒介。加之文本處理技術(shù)相對成熟、高效,因此與視頻相關(guān)的文本信息成為對視頻數(shù)據(jù)分類中最直接,最可行且最有效的特征。
[0004]農(nóng)業(yè)視頻具有其特殊性,其文本信息中含有農(nóng)業(yè)相關(guān)專有名詞的信息。這些專有名詞既包括普通的專有名詞,又涵蓋農(nóng)業(yè)領(lǐng)域的專業(yè)術(shù)語。農(nóng)業(yè)視頻的文本信息是一種非正式的簡短文本,往往不能提供很好的上下文信息,且存在各式拼寫錯誤和多種表達(dá)方式,這為農(nóng)業(yè)視頻分類提出了較大挑戰(zhàn),如何對海量農(nóng)業(yè)視頻數(shù)據(jù)進(jìn)行自動分類成為了極具挑戰(zhàn)性的前沿課題。

【發(fā)明內(nèi)容】

[0005]鑒于上述問題,提出了本發(fā)明以便提供一種克服上述問題或者至少部分地解決或者減緩上述問題的基于文本的農(nóng)業(yè)視頻智能分類方法及相應(yīng)的基于文本的農(nóng)業(yè)視頻智能分類裝置。
[0006]根據(jù)本發(fā)明的一個方面,提供了一種基于文本的農(nóng)業(yè)視頻智能分類方法,該方法包括:
[0007]構(gòu)建農(nóng)業(yè)相關(guān)信息的本體庫;
[0008]獲取待分類的視頻的文本信息;
[0009]將所述文本信息劃分為屬性標(biāo)簽和數(shù)據(jù)元素,并對所述數(shù)據(jù)元素進(jìn)行標(biāo)注;
[0010]將標(biāo)注后的數(shù)據(jù)元素進(jìn)行打包,生成所述待分類的視頻的特征信息;
[0011]利用所述農(nóng)業(yè)相關(guān)信息的本體庫與所述待分類的視頻的特征信息進(jìn)行比對,根據(jù)比對結(jié)果對所述待分類的視頻進(jìn)行分類。
[0012]優(yōu)選地,所述構(gòu)建農(nóng)業(yè)相關(guān)信息的本體庫,具體包括:
[0013]從互聯(lián)網(wǎng)數(shù)據(jù)中抓取涉農(nóng)網(wǎng)站的初始URL ;
[0014]根據(jù)所述初始URL,采用爬蟲引擎處理技術(shù)搜索所述初始URL對應(yīng)的網(wǎng)頁上的所有鏈接,下載搜索到的鏈接對應(yīng)的URL得到網(wǎng)址集合;
[0015]利用責(zé)任鏈模式,對所述網(wǎng)址集合中的URL進(jìn)行過濾,得到與農(nóng)業(yè)相關(guān)的網(wǎng)站對應(yīng)的URL ;
[0016]解析所述過濾得到的URL對應(yīng)的農(nóng)業(yè)相關(guān)網(wǎng)站,得到與農(nóng)業(yè)相關(guān)的特征詞;
[0017]根據(jù)所述與農(nóng)業(yè)相關(guān)的特征詞構(gòu)建農(nóng)業(yè)相關(guān)信息的本體庫。
[0018]優(yōu)選地,采用爬蟲引擎處理技術(shù)搜索所述初始URL對應(yīng)的網(wǎng)頁上的所有鏈接,具體包括:
[0019]將所述初始URL交付網(wǎng)頁爬蟲算法;
[0020]所述網(wǎng)頁爬蟲算法以廣度優(yōu)先的方式不斷爬行,搜索所述初始URL對應(yīng)的網(wǎng)頁上的所有鏈接。
[0021]優(yōu)選地,所述將所述文本信息劃分為屬性標(biāo)簽和數(shù)據(jù)元素,并對所述數(shù)據(jù)元素進(jìn)行標(biāo)注,具體包括:
[0022]將所述文本信息劃分為屬性標(biāo)簽和數(shù)據(jù)元素;
[0023]提取所述數(shù)據(jù)元素的至少一個關(guān)鍵詞;
[0024]根據(jù)所述數(shù)據(jù)元素的至少一個關(guān)鍵詞對該數(shù)據(jù)元素進(jìn)行標(biāo)注。
[0025]優(yōu)選地,所述利用所述農(nóng)業(yè)相關(guān)信息的本體庫與所述待分類的視頻的特征信息進(jìn)行比對,根據(jù)比對結(jié)果對所述待分類的視頻進(jìn)行分類,具體包括:
[0026]解析所述待分類的視頻的特征信息,得到所述待分類的視頻的數(shù)據(jù)元素的至少一個關(guān)鍵詞;
[0027]將所述至少一個關(guān)鍵詞與所述農(nóng)業(yè)相關(guān)信息的本體庫中的與農(nóng)業(yè)相關(guān)的特征詞進(jìn)行比對;
[0028]如果所述農(nóng)業(yè)相關(guān)信息的本體庫中存在與所述至少一個關(guān)鍵詞相同或滿足預(yù)設(shè)相似度閾值的特征詞,則根據(jù)所述特征詞為所述待分類的視頻添加一個類別標(biāo)簽。
[0029]根據(jù)本發(fā)明的另一個方面,提供了一種基于文本的農(nóng)業(yè)視頻智能分類裝置,該裝置包括:
[0030]本體庫構(gòu)建模塊,用于構(gòu)建農(nóng)業(yè)相關(guān)信息的本體庫;
[0031]文本信息獲取模塊,用于獲取待分類的視頻的文本信息;
[0032]標(biāo)注模塊,用于將所述文本信息劃分為屬性標(biāo)簽和數(shù)據(jù)元素,并對所述數(shù)據(jù)元素進(jìn)行標(biāo)注;
[0033]特征信息生成模塊,用于將標(biāo)注后的數(shù)據(jù)元素進(jìn)行打包,生成所述待分類的視頻的特征信息;
[0034]比對分類模塊,用于利用所述農(nóng)業(yè)相關(guān)信息的本體庫與所述待分類的視頻的特征信息進(jìn)行比對,根據(jù)比對結(jié)果對所述待分類的視頻進(jìn)行分類。
[0035]優(yōu)選地,所述本體庫構(gòu)建模塊,具體包括:
[0036]URL抓取單元,用于從互聯(lián)網(wǎng)數(shù)據(jù)中抓取涉農(nóng)網(wǎng)站的初始URL ;
[0037]URL搜索單元,用于根據(jù)所述初始URL,采用爬蟲引擎處理技術(shù)搜索所述初始URL對應(yīng)的網(wǎng)頁上的所有鏈接,下載搜索到的鏈接對應(yīng)的URL得到網(wǎng)址集合;
[0038]URL過濾單元,用于利用責(zé)任鏈模式,對所述網(wǎng)址集合中的URL進(jìn)行過濾,得到與農(nóng)業(yè)相關(guān)的網(wǎng)站對應(yīng)的URL ;
[0039]數(shù)據(jù)解析單元,用于解析所述過濾得到的URL對應(yīng)的農(nóng)業(yè)相關(guān)網(wǎng)站,得到與農(nóng)業(yè)相關(guān)的特征詞;
[0040]本體庫構(gòu)建單元,用于根據(jù)所述與農(nóng)業(yè)相關(guān)的特征詞構(gòu)建農(nóng)業(yè)相關(guān)信息的本體庫。
[0041]優(yōu)選地,所述標(biāo)注模塊,具體包括:
[0042]劃分單元,用于將所述文本信息劃分為屬性標(biāo)簽和數(shù)據(jù)元素;
[0043]提取單元,用于提取所述數(shù)據(jù)元素的至少一個關(guān)鍵詞;
[0044]標(biāo)注單元,用于根據(jù)所述數(shù)據(jù)元素的至少一個關(guān)鍵詞對該數(shù)據(jù)元素進(jìn)行標(biāo)注。
[0045]優(yōu)選地,所述比對分類模塊,具體包括:
[0046]解析單元,用于解析所述待分類的視頻的特征信息,得到所述待分類的視頻的數(shù)據(jù)元素的至少一個關(guān)鍵詞;
[0047]比對單元,用于將所述至少一個關(guān)鍵詞與所述農(nóng)業(yè)相關(guān)信息的本體庫中的與農(nóng)業(yè)相關(guān)的特征詞進(jìn)行比對;
[0048]類別確定單元,用于如果所述農(nóng)業(yè)相關(guān)信息的本體庫中存在與所述至少一個關(guān)鍵詞相同或滿足預(yù)設(shè)相似度閾值的特征詞,則根據(jù)所述特征詞為所述待分類的視頻添加一個類別標(biāo)簽。
[0049]本發(fā)明的有益效果為:
[0050]本發(fā)明依托農(nóng)業(yè)視頻文本信息的特性,針對農(nóng)業(yè)視頻文本信息的分詞、專有名詞等,根據(jù)互聯(lián)網(wǎng)涉農(nóng)網(wǎng)站數(shù)據(jù)構(gòu)建互聯(lián)網(wǎng)涉農(nóng)中文本體庫,以本體庫為依據(jù),采用標(biāo)注的方式提取信息,實(shí)現(xiàn)農(nóng)業(yè)視頻的分類,從而方便用戶快速預(yù)覽視頻內(nèi)容,定位其感興趣的信息,提高了用戶瀏覽和搜索的效率。
[0051]上述說明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段,而可依照說明書的內(nèi)容予以實(shí)施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點(diǎn)能夠更明顯易懂,以下特舉本發(fā)明的【具體實(shí)施方式】。
【附圖說明】
[0052]通過閱讀下文優(yōu)選實(shí)施方式的詳細(xì)描述,各種其他的優(yōu)點(diǎn)和益處對于本領(lǐng)域普通技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實(shí)施方式的目的,而并不認(rèn)為是對本發(fā)明的限制。而且在整個附圖中,用相同的參考符號表示相同的部件。在附圖中:
[0053]圖1示意性示出了本發(fā)明一個實(shí)施例的基于文本的農(nóng)業(yè)視頻智能分類方法的流程圖;以及
[0054]圖2示意性示出了本發(fā)明一個實(shí)施例的基于文本的農(nóng)業(yè)視頻智能分類裝置的結(jié)構(gòu)框圖。
【具體實(shí)施方式】
[0055]下面詳細(xì)描述本發(fā)明的實(shí)施例,所述實(shí)施例的示例在附圖中示出,其中自始至終相同或類
當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
会同县| 福安市| 报价| 光山县| 淮安市| 福海县| 天等县| 合作市| 新宁县| 庆阳市| 淮滨县| 曲阳县| 阜宁县| 合江县| 呈贡县| 德江县| 汾西县| 永康市| 仙桃市| 大悟县| 永安市| 元朗区| 杂多县| 桂阳县| 华池县| 平定县| 万山特区| 大庆市| 卓尼县| 尚义县| 抚顺市| 化州市| 昭平县| 南乐县| 佛冈县| 鄂尔多斯市| 宁蒗| 阳春市| 新河县| 通渭县| 右玉县|