欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

信息處理方法和裝置的制作方法

文檔序號:6334368閱讀:158來源:國知局
專利名稱:信息處理方法和裝置的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及網(wǎng)絡(luò)技術(shù),尤其涉及一種信息處理方法和裝置。
背景技術(shù)
互聯(lián)網(wǎng)技術(shù)當(dāng)前已經(jīng)進入了海量信息時代,為了使互聯(lián)網(wǎng)用戶能夠從海量信息中 快速準(zhǔn)確地獲取所需的信息,網(wǎng)絡(luò)設(shè)備采用智能化方式向用戶提供信息。作為智能化提供 信息的基礎(chǔ),網(wǎng)絡(luò)設(shè)備需要預(yù)先采用信息處理方法獲取信息的內(nèi)涵。目前,網(wǎng)絡(luò)設(shè)備采用的信息處理方法是,對信息的標(biāo)題和/或內(nèi)容進行切詞,獲得 該信息的標(biāo)題和/或內(nèi)容中的詞語,以該信息的標(biāo)題和/或內(nèi)容中的詞語作為該信息的內(nèi) 涵。例如,信息為一條關(guān)于合格的境外機構(gòu)投資者(Qualified Foreign Institutional hvestors,簡稱QFII)的新聞,具體為“證監(jiān)會上半年3家外資機構(gòu)獲得Q FII資格”, 通過對該信息進行切詞,獲得以下6個詞語“證監(jiān)會”、“上半年”、“外資”、“機構(gòu)”、“QFII”、 “資格”,網(wǎng)絡(luò)設(shè)備獲取到的該信息的內(nèi)涵以字符串形式表示,該字符串為“證監(jiān)會” “上半 年,,“外資” “機構(gòu)” "QFII" “資格”。采用現(xiàn)有的信息處理方法,網(wǎng)絡(luò)設(shè)備獲取的內(nèi)涵只能包括該信息的標(biāo)題和/或內(nèi) 容中出現(xiàn)的詞語,而信息內(nèi)涵中除了該信息的標(biāo)題和/或內(nèi)容中出現(xiàn)的詞語以外,還有可 能包括與上述詞語相近或相關(guān)的其它詞語,采用現(xiàn)有的信息處理方法則無法獲取這些與標(biāo) 題和/或內(nèi)容中詞語相近或相關(guān)的其它詞語,因而使得大量內(nèi)涵被遺漏。仍以信息為“證監(jiān) 會上半年3家外資機構(gòu)獲得QFII資格”為例,與該信息相關(guān)的內(nèi)涵除了通過對該信息進 行切詞獲得的“證監(jiān)會”、“上半年”、“外資”、“機構(gòu)”、“QFII”、“資格”以外,還可以包括“證 券”、“金融”、“經(jīng)濟機構(gòu)”、“國際資產(chǎn)組合投資”等相關(guān)或相近的詞語。因此,采用現(xiàn)有的信 息處理方法,網(wǎng)絡(luò)設(shè)備無法全面地獲取到信息的完整內(nèi)涵,獲取到的信息內(nèi)涵的準(zhǔn)確度低。

發(fā)明內(nèi)容
本發(fā)明實施例提供一種信息處理方法,用以解決現(xiàn)有技術(shù)中的缺陷,準(zhǔn)全完整地 獲取信息內(nèi)涵。本發(fā)明實施例還提供一種信息處理裝置,用以解決現(xiàn)有技術(shù)中的缺陷,準(zhǔn)確完整 地獲取信息內(nèi)涵。本發(fā)明實施例提供一種信息處理方法,包括獲取目標(biāo)信息;對所述目標(biāo)信息進行切詞,獲取一個以上切詞結(jié)果數(shù)據(jù);在預(yù)先存儲的詞語語義庫中查詢所述一個以上切詞結(jié)果數(shù)據(jù),獲取每個切詞結(jié)果 數(shù)據(jù)對應(yīng)的一個以上類別標(biāo)識;根據(jù)所述目標(biāo)信息和所述一個以上切詞結(jié)果數(shù)據(jù)對應(yīng)的一個以上類別標(biāo)識,生成 信息內(nèi)涵字符串。如上所述的信息處理方法,其中,所述在預(yù)先存儲的詞語語義庫中查詢所述一個以上切詞結(jié)果數(shù)據(jù)之前還包括通過獲取并分析一個以上參考信息,獲取并存儲詞語語義庫。如上所述的信息處理方法,其中,所述通過獲取并分析一個以上參考信息,獲取并 存儲詞語語義庫包括采用爬蟲技術(shù)從互聯(lián)網(wǎng)獲取一個以上參考信息;根據(jù)所述一個以上參考信息生成 一個以上標(biāo)準(zhǔn)化數(shù)據(jù);對所述一個以上標(biāo)準(zhǔn)化數(shù)據(jù)進行切詞,獲取對應(yīng)的一個以上標(biāo)準(zhǔn)化 切詞結(jié)果數(shù)據(jù);對所述一個以上標(biāo)準(zhǔn)化切詞結(jié)果數(shù)據(jù)進行聚類分析;根據(jù)聚類分析結(jié)果, 分類存儲所述一個以上標(biāo)準(zhǔn)化切詞結(jié)果數(shù)據(jù),生成詞語語義庫。如上所述的信息處理方法,其中,所述獲取每個切詞結(jié)果數(shù)據(jù)對應(yīng)的一個以上類 別標(biāo)識之后還包括獲取目標(biāo)信息的屬性標(biāo)識;所述根據(jù)所述目標(biāo)信息和所述一個以上切詞結(jié)果數(shù)據(jù) 對應(yīng)的一個以上類別標(biāo)識,生成信息內(nèi)涵字符串包括將所述一個以上切詞結(jié)果數(shù)據(jù)對應(yīng) 的一個以上類別標(biāo)識和所述目標(biāo)信息的屬性標(biāo)識附加在所述目標(biāo)信息之后,生成信息內(nèi)涵
字符串。如上所述的信息處理方法,其中,所述在預(yù)先存儲的詞語語義庫中查詢所述一個 以上切詞結(jié)果數(shù)據(jù),獲取每個切詞結(jié)果數(shù)據(jù)對應(yīng)的一個以上類別標(biāo)識包括根據(jù)每個切詞結(jié)果數(shù)據(jù),遍歷所述詞語語義庫中的類別,查詢并獲取該切詞結(jié)果 數(shù)據(jù)的一個以上匹配項;根據(jù)所述一個以上匹配項在所述詞語語義庫中所屬的類別,標(biāo)識 該切詞結(jié)果數(shù)據(jù)。本發(fā)明實施例還提供一種信息處理裝置,包括信息獲取單元,用于獲取目標(biāo)信息;切詞單元,用于對所述目標(biāo)信息進行切詞,獲取一個以上切詞結(jié)果數(shù)據(jù);詞語語義庫單元,用于存儲詞語語義庫;類別標(biāo)識單元,用于在存儲的詞語語義庫中查詢所述一個以上切詞結(jié)果數(shù)據(jù),獲 取每個切詞結(jié)果數(shù)據(jù)對應(yīng)的一個以上類別標(biāo)識;內(nèi)涵字符串生成單元,用于根據(jù)所述目標(biāo)信息和所述一個以上切詞結(jié)果數(shù)據(jù)對應(yīng) 的一個以上類別標(biāo)識,生成信息內(nèi)涵字符串。如上所述的信息處理裝置,其中,所述信息獲取單元還用于獲取一個以上參考信 息;所述詞語語義庫單元還用于通過分析所述一個以上參考信息,獲取詞語語義庫。如上所述的信息處理裝置,其中,所述詞語語義庫單元包括格式處理子單元,用于根據(jù)所述一個以上參考信息生成一個以上標(biāo)準(zhǔn)化數(shù)據(jù);聚 類分析子單元,用于對所述一個以上標(biāo)準(zhǔn)化切詞結(jié)果數(shù)據(jù)進行聚類分析;詞語語義庫生成 子單元,用于根據(jù)聚類分析結(jié)果,分類存儲所述一個以上標(biāo)準(zhǔn)化切詞結(jié)果數(shù)據(jù),生成詞語語 義庫;所述切詞單元還用于對所述一個以上標(biāo)準(zhǔn)化數(shù)據(jù)進行切詞,獲取對應(yīng)的一個以上標(biāo) 準(zhǔn)化切詞結(jié)果數(shù)據(jù)。如上所述的信息處理裝置,其中,還包括屬性標(biāo)識單元,用于獲取目標(biāo)信息的屬 性標(biāo)識;所述內(nèi)涵字符串生成單元,用于將所述一個以上切詞結(jié)果數(shù)據(jù)對應(yīng)的一個以上類 別標(biāo)識和所述目標(biāo)信息的屬性標(biāo)識附加在所述目標(biāo)信息之后,生成信息內(nèi)涵字符串。如上所述的信息處理裝置,其中,
所述類別標(biāo)識單元具體用于根據(jù)每個切詞結(jié)果數(shù)據(jù),遍歷所述詞語語義庫中的類 別,查詢并獲取該切詞結(jié)果數(shù)據(jù)的一個以上匹配項,根據(jù)所述一個以上匹配項在所述詞語 語義庫中所屬的類別,標(biāo)識該切詞結(jié)果數(shù)據(jù)。由上述技術(shù)方案可知,在對目標(biāo)信息進行切詞之后,通過在預(yù)先存儲的詞語語義 庫中查找切詞結(jié)果數(shù)據(jù)來獲取切詞結(jié)果數(shù)據(jù)所屬的類別標(biāo)識,根據(jù)該類別標(biāo)識和目標(biāo)信息 生成信息內(nèi)涵字符串,從而使得信息內(nèi)涵字符串中,不僅包括該目標(biāo)信息,而且還包括與該 目標(biāo)信息中的詞語相關(guān)的類別,因此網(wǎng)絡(luò)設(shè)備能夠準(zhǔn)確完整地獲得目標(biāo)信息的內(nèi)涵。


為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn) 有技術(shù)描述中所需要使用的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā) 明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根 據(jù)這些附圖獲得其他的附圖。圖1為本發(fā)明實施例一提供的信息處理方法的流程圖;圖2為本發(fā)明實施例二提供的信息處理方法的流程圖;圖3為本發(fā)明實施例三提供的信息處理裝置的結(jié)構(gòu)示意圖。
具體實施例方式為使本發(fā)明實施例的目的、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合本發(fā)明實施例 中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例是 本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員 在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。圖1為本發(fā)明實施例一提供的信息處理方法的流程圖。如圖1所示,該方法至少 包括以下過程。步驟101 獲取目標(biāo)信息。步驟102 對上述目標(biāo)信息進行切詞,獲取一個以上切詞結(jié)果數(shù)據(jù)。步驟103 在預(yù)先存儲的詞語語義庫中查詢上述一個以上切詞結(jié)果數(shù)據(jù),獲取每 個切詞結(jié)果數(shù)據(jù)對應(yīng)的一個以上類別標(biāo)識。步驟104 根據(jù)上述目標(biāo)信息和上述一個以上切詞結(jié)果數(shù)據(jù)對應(yīng)的一個以上類別 標(biāo)識,生成信息內(nèi)涵字符串。在本發(fā)明實施例一中,在對目標(biāo)信息進行切詞之后,通過在詞語語義庫中查找切 詞結(jié)果數(shù)據(jù)來獲取切詞結(jié)果數(shù)據(jù)所屬的類別標(biāo)識,根據(jù)該類別標(biāo)識和目標(biāo)信息生成信息內(nèi) 涵字符串,從而使得網(wǎng)絡(luò)設(shè)備所獲得的信息內(nèi)涵字符串中,不僅包括現(xiàn)有信息處理方法得 到的該目標(biāo)信息的標(biāo)題和/或內(nèi)容中的詞語,而且還包括與該目標(biāo)信息中的詞語相關(guān)的類 別,從而準(zhǔn)確完整地獲得目標(biāo)信息的內(nèi)涵。圖2為本發(fā)明實施例二提供的信息處理方法的流程圖。如圖2所示,該方法包括 以下過程。步驟201 通過獲取并分析一個以上參考信息,獲取并存儲詞語語義庫。在此步驟中,通過獲取并分析一個以上參考信息獲取并存儲詞語語義庫的具體方法不受限制,現(xiàn)有的獲取詞語語義庫的方法均可適用。以下僅以一個較佳實施例說明此步 驟的具體過程。首先,采用爬蟲技術(shù)從互聯(lián)網(wǎng)獲取一個以上參考信息;然后,根據(jù)上述一個 以上參考信息生成一個以上標(biāo)準(zhǔn)化數(shù)據(jù);然后,對上述一個以上標(biāo)準(zhǔn)化數(shù)據(jù)進行切詞,獲取 對應(yīng)的一個以上標(biāo)準(zhǔn)化切詞結(jié)果數(shù)據(jù);然后,對上述一個以上標(biāo)準(zhǔn)化切詞結(jié)果數(shù)據(jù)進行聚 類分析,具體可以采用K均值聚類(K-Means)方法或科赫嫩(Kohonen)神經(jīng)網(wǎng)絡(luò)聚類方法, 或者上述兩種聚類方法結(jié)合使用;最后,根據(jù)聚類分析結(jié)果,分類存儲上述一個以上標(biāo)準(zhǔn)化 切詞結(jié)果數(shù)據(jù),生成詞語語義庫。步驟202 獲取目標(biāo)信息。在本步驟中,獲取目標(biāo)信息的具體方式不受限制,現(xiàn)有的獲取信息的方法均可適 用。一種較佳的實施方式是,采用爬蟲技術(shù)從互聯(lián)網(wǎng)上獲取目標(biāo)信息。步驟203 對上述目標(biāo)信息進行切詞,獲取一個以上切詞結(jié)果數(shù)據(jù)。在本步驟中,仍以目標(biāo)信息為“證監(jiān)會上半年3家外資機構(gòu)獲得QFII資格”為例, 對該目標(biāo)信息進行切詞,獲取到的一個以上切詞結(jié)果數(shù)據(jù)包括“證監(jiān)會”、“上半年”、“外 資”、“機構(gòu)”、“QFII”、“資格”。 上述步驟201可以在步驟202和步驟203之前執(zhí)行,也可以在步驟202和步驟203 的執(zhí)行過程中同時執(zhí)行。步驟204 在預(yù)先存儲的詞語語義庫中查詢上述一個以上切詞結(jié)果數(shù)據(jù),獲取每 個切詞結(jié)果數(shù)據(jù)對應(yīng)的一個以上類別標(biāo)識。具體地,在此步驟中,根據(jù)每個切詞結(jié)果數(shù)據(jù),遍歷所述詞語語義庫中的類別,查 詢并獲取該切詞結(jié)果數(shù)據(jù)的一個以上匹配項,根據(jù)上述一個以上匹配項在上述詞語語義庫 中所屬的類別標(biāo)識該切詞結(jié)果數(shù)據(jù)。仍以目標(biāo)信息為“證監(jiān)會上半年3家外資機構(gòu)獲得 QFII資格”為例,針對切詞獲得的每一個切詞結(jié)果數(shù)據(jù),均遍歷查詢詞語語義庫中的類別。 其中,以切詞結(jié)果數(shù)據(jù)為“證監(jiān)會”為例,遍歷詞語語義庫中的所有類別,查詢與“證監(jiān)會”相 匹配的匹配項,則在詞語語義庫中的名稱分別為“證券”、“金融”和“經(jīng)濟機構(gòu)”的三個類別 中均查找到詞語“證監(jiān)會”,則以包含了詞語“證監(jiān)會”的上述三個類別對切詞結(jié)果數(shù)據(jù)“證 監(jiān)會”進行標(biāo)識,獲取到的切詞結(jié)果數(shù)據(jù)“證監(jiān)會”對應(yīng)的一個以上類別標(biāo)識包括“證券”、 “金融”、“經(jīng)濟機構(gòu)”、“經(jīng)濟學(xué)”、“投資”等。對該目標(biāo)信息的所有切詞結(jié)果數(shù)據(jù),均采用上述 同樣的方法,獲取每一個切詞結(jié)果數(shù)據(jù)對應(yīng)的一個以上類別標(biāo)識。例如,獲取到“外資”對 應(yīng)的類別標(biāo)識包括“資本”、“國際金融”、“貿(mào)易”等;獲取到“QFII”對應(yīng)的類別標(biāo)識包括 “國際資產(chǎn)組合投資”、“組織”、“經(jīng)濟機構(gòu)”等。步驟205 獲取目標(biāo)信息的屬性標(biāo)識。在本步驟中,目標(biāo)信息的屬性可以包括該信息出現(xiàn)的時間、該信息出現(xiàn)的媒體、 該信息的作者、文體等等。具體地,網(wǎng)絡(luò)設(shè)備可以通過從網(wǎng)頁中提取來獲取目標(biāo)信息的屬性 標(biāo)識,一種較佳的實施方式是,仍采用爬蟲技術(shù)從互聯(lián)網(wǎng)的網(wǎng)頁中獲取目標(biāo)信息的屬性標(biāo) 識。并且,步驟205可以在執(zhí)行步驟201至步驟204的過程中的任意時刻執(zhí)行,一種較佳的 實施方式是,在獲取目標(biāo)信息的同時獲取該目標(biāo)信息的屬性標(biāo)識。例如,上述內(nèi)容為“證監(jiān) 會上半年3家外資機構(gòu)獲得QFII資格”的目標(biāo)信息出現(xiàn)在2010年7月7日的新浪網(wǎng)新 聞版網(wǎng)頁上,則通過提取該網(wǎng)頁,獲取到該目標(biāo)信息的屬性標(biāo)識包括“新浪網(wǎng)”、“新聞”。步驟206 根據(jù)上述目標(biāo)信息和上述一個以上切詞結(jié)果數(shù)據(jù)對應(yīng)的一個以上類別標(biāo)識,生成信息內(nèi)涵字符串。具體地,在此步驟中,將上述一個以上切詞結(jié)果數(shù)據(jù)對應(yīng)的一個以上類別標(biāo)識和 上述目標(biāo)信息的屬性標(biāo)識附加在上述目標(biāo)信息之后,生成信息內(nèi)涵字符串。仍以上述目 標(biāo)信息為例,最終生成的信息內(nèi)涵字符串為“證監(jiān)會上半年3家外資機構(gòu)獲得QFII資 格” “證券” “金融” “理財” “政府機構(gòu)” “經(jīng)濟機構(gòu)” “資本” “組織” “經(jīng)濟學(xué)” “國際金 融” “投資” “貿(mào)易” “國際資產(chǎn)組合投資” “2010年7月7日” “新浪” “新聞”。在本發(fā)明實施例二中,通過獲取并分析參考信息來生成用于查詢的詞語語義庫, 并且在獲取到切詞結(jié)果數(shù)據(jù)所屬的類別標(biāo)識之后,進一步獲取目標(biāo)信息的屬性標(biāo)識,根據(jù) 目標(biāo)信息、該類別標(biāo)識和該屬性標(biāo)識生成信息內(nèi)涵字符串,從而使得信息內(nèi)涵字符串在包 括了目標(biāo)信息和與該目標(biāo)信息中的詞語相關(guān)的類別標(biāo)識的基礎(chǔ)上,還包括該目標(biāo)信息出現(xiàn) 的時間、媒體等屬性標(biāo)識,進一步豐富了目標(biāo)信息的內(nèi)涵,使得網(wǎng)絡(luò)設(shè)備獲取的目標(biāo)信息的 內(nèi)涵更加準(zhǔn)確、完整。圖3為本發(fā)明實施例三提供的信息處理裝置的結(jié)構(gòu)示意圖。該信息處理裝置可以 設(shè)置于網(wǎng)絡(luò)設(shè)備中,也可以作為一個獨立的裝置設(shè)置在網(wǎng)絡(luò)設(shè)備外。如圖3所示,該信息處 理裝置至少包括信息獲取單元31、切詞單元32、詞語語義庫單元33、類別標(biāo)識單元34和 內(nèi)涵字符串生成單元35。其中,信息獲取單元31獲取目標(biāo)信息并傳送給切詞單元32和內(nèi)涵字符串生成單 元35。具體地,信息獲取單元31可以采用爬蟲技術(shù)獲取目標(biāo)信息。進一步地,信息獲取單 元31還采用爬蟲技術(shù)從互聯(lián)網(wǎng)獲取一個以上參考信息并傳送給詞語語義庫單元33。切詞單元32對目標(biāo)信息進行切詞,獲取一個以上切詞結(jié)果數(shù)據(jù)并傳送給類別標(biāo) 識單元34。進一步地,切詞單元32還接收來自詞語語義庫單元33的一個以上標(biāo)準(zhǔn)化數(shù)據(jù), 對上述一個以上標(biāo)準(zhǔn)化數(shù)據(jù)進行切詞,獲取對應(yīng)的一個以上標(biāo)準(zhǔn)化切詞結(jié)果數(shù)據(jù)并傳送給 詞語語義庫單元33。詞語語義庫單元33存儲詞語語義庫。進一步地,詞語語義庫單元33還通過獲取 并分析一個以上參考信息,獲取詞語語義庫。具體地,詞語語義庫單元33包括格式處理子 單元331、聚類分析子單元332和詞語語義庫生成子單元333。其中,格式處理子單元331 接收來自信息獲取單元31的一個以上參考信息,根據(jù)上述一個以上參考信息生成一個以 上標(biāo)準(zhǔn)化數(shù)據(jù),并傳送給切詞單元32。聚類分析子單元332接收來自切詞單元32的一個 以上標(biāo)準(zhǔn)化切詞結(jié)果數(shù)據(jù),對上述一個以上標(biāo)準(zhǔn)化切詞結(jié)果數(shù)據(jù)進行聚類分析,并將聚類 分析結(jié)果發(fā)送給詞語語義庫生成子單元333。詞語語義庫生成子單元333根據(jù)聚類分析結(jié) 果,分類存儲上述一個以上標(biāo)準(zhǔn)化切詞結(jié)果數(shù)據(jù),生成詞語語義庫。類別標(biāo)識單元34接收來自切詞單元32的一個以上切詞結(jié)果數(shù)據(jù),在詞語語義庫 單元33存儲的詞語語義庫中查詢上述一個以上切詞結(jié)果數(shù)據(jù),獲取每個切詞結(jié)果數(shù)據(jù)對 應(yīng)的一個以上類別標(biāo)識并發(fā)送給內(nèi)涵字符串生成單元35。具體地,類別標(biāo)識單元34根據(jù)每 個切詞結(jié)果數(shù)據(jù),遍歷上述詞語語義庫中的類別,查詢并獲取該切詞結(jié)果數(shù)據(jù)的一個以上 匹配項,根據(jù)上述一個以上匹配項在上述詞語語義庫中所屬的類別,標(biāo)識該切詞結(jié)果數(shù)據(jù)。內(nèi)涵字符串生成單元35接收來自信息獲取單元31的目標(biāo)信息和來自類別標(biāo)識單 元34的一個以上切詞結(jié)果數(shù)據(jù)對應(yīng)的一個以上類別標(biāo)識,根據(jù)上述目標(biāo)信息和上述一個 以上切詞結(jié)果數(shù)據(jù)對應(yīng)的一個以上類別標(biāo)識,生成信息內(nèi)涵字符串。
在包括上述信息獲取單元31、切詞單元32、詞語語義庫單元33、類別標(biāo)識單元34 和內(nèi)涵字符串生成單元35的基礎(chǔ)上,該信息處理裝置還可以包括屬性標(biāo)識單元36。屬性 標(biāo)識單元36接收來自信息獲取單元31的目標(biāo)信息,獲取目標(biāo)信息的屬性標(biāo)識并發(fā)送給內(nèi) 涵字符串生成單元35。在信息處理裝置包括屬性標(biāo)識單元36的情況下,則內(nèi)涵字符串生成 單元35將上述一個以上切詞結(jié)果數(shù)據(jù)對應(yīng)的一個以上類別標(biāo)識和上述目標(biāo)信息的屬性標(biāo) 識附加在上述目標(biāo)信息之后,生成信息內(nèi)涵字符串。在本發(fā)明實施例三中,詞語語義庫單元33存儲詞語語義庫,類別標(biāo)識單元34通過 查找詞語語義庫來獲取切詞結(jié)果數(shù)據(jù)所屬的類別標(biāo)識,內(nèi)涵字符串生成單元35根據(jù)目標(biāo) 信息和切詞結(jié)果數(shù)據(jù)所屬的類別標(biāo)識生成內(nèi)涵字符串。進一步地,屬性標(biāo)識單元36獲取目 標(biāo)信息的屬性標(biāo)識,內(nèi)涵字符串生成單元35根據(jù)目標(biāo)信息、切詞結(jié)果數(shù)據(jù)所屬的類別標(biāo)識 和目標(biāo)信息的屬性標(biāo)識生成內(nèi)涵字符串。采用該信息處理裝置獲取的目標(biāo)信息的內(nèi)涵中包 括切詞結(jié)果數(shù)據(jù)所屬的類別標(biāo)識和目標(biāo)信息的屬性標(biāo)識,從而使得網(wǎng)絡(luò)設(shè)備準(zhǔn)確完整地獲 取到目標(biāo)信息的內(nèi)涵。需要說明的是對于前述的各方法實施例,為了簡單描述,故將其都表述為一系列 的動作組合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本發(fā)明并不受所描述的動作順序的限制,因為 依據(jù)本發(fā)明,某些步驟可以采用其他順序或者同時進行。其次,本領(lǐng)域技術(shù)人員也應(yīng)該知 悉,說明書中所描述的實施例均屬于優(yōu)選實施例,所涉及的動作和模塊并不一定是本發(fā)明 所必須的。在上述實施例中,對各個實施例的描述都各有側(cè)重,某個實施例中沒有詳述的部 分,可以參見其他實施例的相關(guān)描述。本領(lǐng)域普通技術(shù)人員可以理解實現(xiàn)上述方法實施例的全部或部分步驟可以通過 程序指令相關(guān)的硬件來完成,前述的程序可以存儲于一計算機可讀取存儲介質(zhì)中,該程序 在執(zhí)行時,執(zhí)行包括上述方法實施例的步驟;而前述的存儲介質(zhì)包括R0M、RAM、磁碟或者 光盤等各種可以存儲程序代碼的介質(zhì)。最后應(yīng)說明的是以上實施例僅用以說明本發(fā)明的技術(shù)方案,而非對其限制;盡 管參照前述實施例對本發(fā)明進行了詳細(xì)的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解其依然 可以對前述各實施例所記載的技術(shù)方案進行修改,或者對其中部分技術(shù)特征進行等同替 換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實施例技術(shù)方案的精 神和范圍。
權(quán)利要求
1.一種信息處理方法,其特征在于,包括 獲取目標(biāo)信息;對所述目標(biāo)信息進行切詞,獲取一個以上切詞結(jié)果數(shù)據(jù);在預(yù)先存儲的詞語語義庫中查詢所述一個以上切詞結(jié)果數(shù)據(jù),獲取每個切詞結(jié)果數(shù)據(jù) 對應(yīng)的一個以上類別標(biāo)識;根據(jù)所述目標(biāo)信息和所述一個以上切詞結(jié)果數(shù)據(jù)對應(yīng)的一個以上類別標(biāo)識,生成信息 內(nèi)涵字符串。
2.根據(jù)權(quán)利要求1所述的信息處理方法,其特征在于,所述在預(yù)先存儲的詞語語義庫 中查詢所述一個以上切詞結(jié)果數(shù)據(jù)之前還包括通過獲取并分析一個以上參考信息,獲取并存儲詞語語義庫。
3.根據(jù)權(quán)利要求2所述的信息處理方法,其特征在于,所述通過獲取并分析一個以上 參考信息,獲取并存儲詞語語義庫包括采用爬蟲技術(shù)從互聯(lián)網(wǎng)獲取一個以上參考信息; 根據(jù)所述一個以上參考信息生成一個以上標(biāo)準(zhǔn)化數(shù)據(jù);對所述一個以上標(biāo)準(zhǔn)化數(shù)據(jù)進行切詞,獲取對應(yīng)的一個以上標(biāo)準(zhǔn)化切詞結(jié)果數(shù)據(jù); 對所述一個以上標(biāo)準(zhǔn)化切詞結(jié)果數(shù)據(jù)進行聚類分析;根據(jù)聚類分析結(jié)果,分類存儲所述一個以上標(biāo)準(zhǔn)化切詞結(jié)果數(shù)據(jù),生成詞語語義庫。
4.根據(jù)權(quán)利要求1所述的信息處理方法,其特征在于,所述獲取每個切詞結(jié)果數(shù)據(jù)對應(yīng)的一個以上類別標(biāo)識之后還包括獲取目標(biāo)信息的屬 性標(biāo)識;所述根據(jù)所述目標(biāo)信息和所述一個以上切詞結(jié)果數(shù)據(jù)對應(yīng)的一個以上類別標(biāo)識,生成 信息內(nèi)涵字符串包括將所述一個以上切詞結(jié)果數(shù)據(jù)對應(yīng)的一個以上類別標(biāo)識和所述目標(biāo) 信息的屬性標(biāo)識附加在所述目標(biāo)信息之后,生成信息內(nèi)涵字符串。
5.根據(jù)權(quán)利要求1至4中任意一項所述的信息處理方法,其特征在于,所述在預(yù)先存儲 的詞語語義庫中查詢所述一個以上切詞結(jié)果數(shù)據(jù),獲取每個切詞結(jié)果數(shù)據(jù)對應(yīng)的一個以上 類別標(biāo)識包括根據(jù)每個切詞結(jié)果數(shù)據(jù),遍歷所述詞語語義庫中的類別,查詢并獲取該切詞結(jié)果數(shù)據(jù) 的一個以上匹配項;根據(jù)所述一個以上匹配項在所述詞語語義庫中所屬的類別,標(biāo)識該切詞結(jié)果數(shù)據(jù)。
6.一種信息處理裝置,其特征在于,包括 信息獲取單元,用于獲取目標(biāo)信息;切詞單元,用于對所述目標(biāo)信息進行切詞,獲取一個以上切詞結(jié)果數(shù)據(jù); 詞語語義庫單元,用于存儲詞語語義庫;類別標(biāo)識單元,用于在存儲的詞語語義庫中查詢所述一個以上切詞結(jié)果數(shù)據(jù),獲取每 個切詞結(jié)果數(shù)據(jù)對應(yīng)的一個以上類別標(biāo)識;內(nèi)涵字符串生成單元,用于根據(jù)所述目標(biāo)信息和所述一個以上切詞結(jié)果數(shù)據(jù)對應(yīng)的一 個以上類別標(biāo)識,生成信息內(nèi)涵字符串。
7.根據(jù)權(quán)利要求6所述的信息處理裝置,其特征在于, 所述信息獲取單元還用于獲取一個以上參考信息;所述詞語語義庫單元還用于通過分析所述一個以上參考信息,獲取詞語語義庫。
8.根據(jù)權(quán)利要求7所述的信息處理裝置,其特征在于,所述詞語語義庫單元包括 格式處理子單元,用于根據(jù)所述一個以上參考信息生成一個以上標(biāo)準(zhǔn)化數(shù)據(jù); 聚類分析子單元,用于對所述一個以上標(biāo)準(zhǔn)化切詞結(jié)果數(shù)據(jù)進行聚類分析;詞語語義庫生成子單元,用于根據(jù)聚類分析結(jié)果,分類存儲所述一個以上標(biāo)準(zhǔn)化切詞 結(jié)果數(shù)據(jù),生成詞語語義庫;所述切詞單元還用于對所述一個以上標(biāo)準(zhǔn)化數(shù)據(jù)進行切詞,獲取對應(yīng)的一個以上標(biāo)準(zhǔn) 化切詞結(jié)果數(shù)據(jù)。
9.根據(jù)權(quán)利要求6所述的信息處理裝置,其特征在于, 還包括屬性標(biāo)識單元,用于獲取目標(biāo)信息的屬性標(biāo)識;所述內(nèi)涵字符串生成單元,用于將所述一個以上切詞結(jié)果數(shù)據(jù)對應(yīng)的一個以上類別標(biāo) 識和所述目標(biāo)信息的屬性標(biāo)識附加在所述目標(biāo)信息之后,生成信息內(nèi)涵字符串。
10.根據(jù)權(quán)利要求6至9中任意一項所述的信息處理裝置,其特征在于,所述類別標(biāo)識單元具體用于根據(jù)每個切詞結(jié)果數(shù)據(jù),遍歷所述詞語語義庫中的類別, 查詢并獲取該切詞結(jié)果數(shù)據(jù)的一個以上匹配項,根據(jù)所述一個以上匹配項在所述詞語語義 庫中所屬的類別,標(biāo)識該切詞結(jié)果數(shù)據(jù)。
全文摘要
本發(fā)明提供一種信息處理方法,通過對目標(biāo)信息進行切詞獲取一個以上切詞結(jié)果數(shù)據(jù),在預(yù)先存儲的詞語語義庫中查詢一個以上切詞結(jié)果數(shù)據(jù),獲取每個切詞結(jié)果數(shù)據(jù)對應(yīng)的一個以上類別標(biāo)識,根據(jù)目標(biāo)信息和一個以上切詞結(jié)果數(shù)據(jù)對應(yīng)的一個以上類別標(biāo)識生成信息內(nèi)涵字符串。本發(fā)明還提供一種信息處理裝置。采用本發(fā)明提供的信息處理方法和裝置,獲取的信息內(nèi)涵字符串中不僅包括目標(biāo)信息,而且還包括與該目標(biāo)信息中的詞語相關(guān)的類別,因此能夠準(zhǔn)確完整地獲得目標(biāo)信息的內(nèi)涵。
文檔編號G06F17/30GK102063460SQ20101051892
公開日2011年5月18日 申請日期2010年10月19日 優(yōu)先權(quán)日2010年10月19日
發(fā)明者龐然, 蔡亮華, 郭曉丹 申請人:蔡亮華
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
沐川县| 恩施市| 石家庄市| 枣强县| 英超| 徐闻县| 津市市| 益阳市| 尉犁县| 长治市| 元阳县| 子长县| 新竹市| 靖远县| 杭州市| 沅陵县| 象山县| 积石山| 乡城县| 宝应县| 静安区| 潮州市| 杭锦旗| 平度市| 台北市| 二手房| 阿克陶县| 始兴县| 苗栗县| 逊克县| 松阳县| 政和县| 鲁山县| 德化县| 昌乐县| 阿拉尔市| 深泽县| 绵竹市| 登封市| 澄城县| 轮台县|