欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

漢語數(shù)據(jù)智能分類系統(tǒng)及方法

文檔序號:6428252閱讀:151來源:國知局
專利名稱:漢語數(shù)據(jù)智能分類系統(tǒng)及方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種與漢語異構(gòu)數(shù)據(jù)集成技術(shù)相關(guān)的網(wǎng)絡(luò)數(shù)據(jù)分類技術(shù)領(lǐng)域,更具體地涉及一種漢語數(shù)據(jù)智能分類系統(tǒng)及方法。
背景技術(shù)
隨著中國政府大力推進(jìn)信息化建設(shè),各行業(yè)、各企業(yè)建設(shè)了內(nèi)部信息系統(tǒng),在發(fā)展過程中積累了大量數(shù)據(jù)。但是在數(shù)據(jù)信息共享過程中發(fā)現(xiàn),各數(shù)據(jù)源中漢語數(shù)據(jù)分類體系沒有標(biāo)準(zhǔn)可依,各自為政,體現(xiàn)在數(shù)據(jù)分類標(biāo)準(zhǔn)、分類層次等方面存在差異,影響異構(gòu)數(shù)據(jù)集成,導(dǎo)致數(shù)據(jù)間無法實(shí)現(xiàn)互聯(lián)互通。
在政府統(tǒng)計(jì)系統(tǒng)、預(yù)警系統(tǒng)、及企業(yè)集團(tuán)內(nèi)部處理異構(gòu)數(shù)據(jù)集成時,各數(shù)據(jù)源中數(shù)據(jù)分類不統(tǒng)一。目前大多采用的解決方案是將全部數(shù)據(jù)匯集到數(shù)據(jù)中心,然后統(tǒng)一分類處理,導(dǎo)致數(shù)據(jù)交換網(wǎng)絡(luò)流量大、數(shù)據(jù)重復(fù)存儲、數(shù)據(jù)中心建設(shè)成本高等問題,嚴(yán)重制約政府與企業(yè),及企業(yè)內(nèi)部數(shù)據(jù)信息共享與系統(tǒng)互聯(lián)。
本發(fā)明是北京慧訊信息技術(shù)有限公司已授權(quán)的專利“自主智能異構(gòu)數(shù)據(jù)集成系統(tǒng)及方法”和已申請專利“漢語語意數(shù)據(jù)智能識別系統(tǒng)及方法”的后續(xù)技術(shù),它們可以共同完成在異構(gòu)數(shù)據(jù)集成過程中的數(shù)據(jù)采集、數(shù)據(jù)識別及數(shù)據(jù)分類。當(dāng)前,國際上數(shù)據(jù)分類方面的研究專利成果主要應(yīng)用在對文本數(shù)據(jù)、及本地?cái)?shù)據(jù)庫數(shù)據(jù)的分類分檢查詢方面,還沒有應(yīng)用在分布式異構(gòu)數(shù)據(jù)庫數(shù)據(jù)集成領(lǐng)域的先例,原因是數(shù)據(jù)庫數(shù)據(jù)集成領(lǐng)域中數(shù)據(jù)庫中漢語數(shù)據(jù)分類沒有標(biāo)準(zhǔn)、統(tǒng)一分類難度大。

發(fā)明內(nèi)容
本發(fā)明提供一種適用于企業(yè)、政府、行業(yè)、以及電子商務(wù)所迫切需要的高效、低成本、可行的,處理異構(gòu)數(shù)據(jù)庫環(huán)境下的漢語數(shù)據(jù)智能分類系統(tǒng)及方法。
本發(fā)明是這樣實(shí)現(xiàn)的一種漢語數(shù)據(jù)智能分類系統(tǒng),該系統(tǒng)是一種在互聯(lián)網(wǎng)、局域網(wǎng)和廣域網(wǎng)環(huán)境中,具有開放性、自主化和智能化的漢語數(shù)據(jù)分類能力的跨網(wǎng)絡(luò)、跨平臺、跨數(shù)據(jù)庫的漢語數(shù)據(jù)分類系統(tǒng),該系統(tǒng)包括一個服務(wù)器和一個客戶端構(gòu)成的系統(tǒng)體系構(gòu)架,該服務(wù)器管理數(shù)據(jù)分類方案的制訂和數(shù)據(jù)分類方案的分發(fā),該客戶端實(shí)施分類方案在線維護(hù)和對外部漢語數(shù)據(jù)分類,該服務(wù)器與該客戶端通過網(wǎng)絡(luò)實(shí)現(xiàn)數(shù)據(jù)交換;該系統(tǒng)還包括一個實(shí)現(xiàn)了服務(wù)器過程管理和數(shù)據(jù)流管理的服務(wù)器基礎(chǔ)內(nèi)核,該服務(wù)器基礎(chǔ)內(nèi)核提供服務(wù)器在漢語數(shù)據(jù)分類方案制訂及分發(fā)方面的規(guī)則、模型、底層調(diào)用和設(shè)備管理;一個連接到上述服務(wù)器基礎(chǔ)內(nèi)核的方案器,該方案器實(shí)現(xiàn)漢語數(shù)據(jù)分類規(guī)則及方案的制訂,維護(hù),輸出及日志管理;一個連接到上述服務(wù)器基礎(chǔ)內(nèi)核的發(fā)布器,該發(fā)布器實(shí)現(xiàn)漢語數(shù)據(jù)分類方案的分發(fā),及客戶端身份認(rèn)證管理;一個實(shí)現(xiàn)了客戶端過程管理和數(shù)據(jù)流管理的客戶端基礎(chǔ)內(nèi)核,該客戶端基礎(chǔ)內(nèi)核提供客戶端系統(tǒng)在漢語數(shù)據(jù)分類方案接收及執(zhí)行方面的規(guī)則、模型、底層調(diào)用和設(shè)備管理;一個連接到上述客戶端基礎(chǔ)內(nèi)核的接收器,該接收器實(shí)現(xiàn)自動通過網(wǎng)絡(luò)向服務(wù)器提出請求,自動對比服務(wù)器與客戶端上的分類方案列表,自動下載新分類方案,更新原有分類方案,及終止原有分類方案;一個連接到上述客戶端基礎(chǔ)內(nèi)核的分類器,該分類器實(shí)現(xiàn)從外部數(shù)據(jù)源中讀取漢語數(shù)據(jù),根據(jù)分類方案對漢語數(shù)據(jù)進(jìn)行分類標(biāo)注,最后將分類數(shù)據(jù)反饋給外部數(shù)據(jù)源,達(dá)到漢語數(shù)據(jù)統(tǒng)一分類目的;在上述服務(wù)器中預(yù)置獨(dú)立的關(guān)鍵詞字典,關(guān)鍵詞字典是構(gòu)建在漢語字典基礎(chǔ)上的專業(yè)字典,收集行業(yè)數(shù)據(jù)中語意表達(dá)及各種縮寫及方言,是制訂分類方案的主要依據(jù)。
所述的方案器、發(fā)布器之間通過服務(wù)器數(shù)據(jù)存儲器連接,接收器、分類器之間通過客戶端數(shù)據(jù)存儲器連接,以實(shí)現(xiàn)數(shù)據(jù)內(nèi)部傳輸、消息交換和數(shù)據(jù)堆棧訪問。
一種漢語數(shù)據(jù)智能分類方法,該方法是一種在互聯(lián)網(wǎng)、局域網(wǎng)和廣域網(wǎng)環(huán)境中的異構(gòu)數(shù)據(jù)集成時,在分類方案與數(shù)據(jù)源之間采用關(guān)鍵詞中間語意表述層,通過漢語數(shù)據(jù)分類方案制訂、分類方案分發(fā)、分類方案接收及漢語數(shù)據(jù)分類標(biāo)注的跨數(shù)據(jù)庫的漢語數(shù)據(jù)分類方法,該方法包括下列步驟利用服務(wù)器管理數(shù)據(jù)分類方案的制訂;利用服務(wù)器實(shí)現(xiàn)數(shù)據(jù)分類方案的分發(fā);利用服務(wù)器基礎(chǔ)內(nèi)核進(jìn)行漢語數(shù)據(jù)分類方案的管理,包括分類方案制定及分類方案分發(fā)兩個步驟,服務(wù)器基礎(chǔ)內(nèi)核分別啟動方案器和發(fā)布器;基于上述步驟,利用方案器創(chuàng)建、修改、終止分類方案,將服務(wù)器數(shù)據(jù)存儲器中的關(guān)鍵詞字典導(dǎo)入系統(tǒng),建立關(guān)鍵詞與分類方案的映射關(guān)系,最后輸出分類方案;基于上述步驟,利用發(fā)布器對分類方案進(jìn)行客戶端身份認(rèn)定后的分類方案網(wǎng)絡(luò)分發(fā);利用客戶端實(shí)施分類方案在線維護(hù);利用客戶端實(shí)現(xiàn)對外部漢語數(shù)據(jù)分類;利用客戶端基礎(chǔ)內(nèi)核進(jìn)行漢語數(shù)據(jù)分類過程管理,包括分類方案接收、外部數(shù)據(jù)讀取、漢語數(shù)據(jù)分類標(biāo)注、分類結(jié)果數(shù)據(jù)反饋四個步驟,客戶端基礎(chǔ)內(nèi)核分別啟動接收器和分類器;基于上述步驟,利用接收器向服務(wù)器發(fā)出請求,自動下載、更新、終止分類方案;基于上述步驟,利用分類器讀取外部數(shù)據(jù),根據(jù)分類方案自動映射漢語數(shù)據(jù)并進(jìn)行分類標(biāo)注,將已分類數(shù)據(jù)反饋給外部數(shù)據(jù)源,完成整個數(shù)據(jù)分類過程。
所述的關(guān)鍵詞中間語意表述層實(shí)現(xiàn)數(shù)據(jù)分類方案與現(xiàn)實(shí)中異構(gòu)數(shù)據(jù)源中各種漢語數(shù)據(jù)之間的無縫連接。
所述的方案器步驟中還包括將所有對分類方案的操作記錄于方案器日志文件的步驟。
所述的接收器步驟中還包括分類方案注冊表的處理步驟。
所述的分類器步驟中還包括對同一數(shù)據(jù)源漢語數(shù)據(jù)進(jìn)行多種分類方案分類標(biāo)注的步驟。
與現(xiàn)有技術(shù)比較,本發(fā)明具備如下優(yōu)點(diǎn)開放的體系結(jié)構(gòu),可以適用于不同行業(yè);設(shè)立關(guān)鍵詞中間語意表述層,分類方案制訂靈活快捷;漢語數(shù)據(jù)分類自動化程度高,處理速度快;支持對眾多分散的異構(gòu)數(shù)據(jù)源進(jìn)行端前漢語數(shù)據(jù)分類;支持對數(shù)據(jù)源的多分類方案并行,以滿足不同需求;支持各類數(shù)據(jù)庫中異構(gòu)數(shù)據(jù)的智能數(shù)據(jù)分類,可以應(yīng)用在分布式異構(gòu)數(shù)據(jù)庫數(shù)據(jù)集成領(lǐng)域,實(shí)現(xiàn)數(shù)據(jù)庫數(shù)據(jù)集成領(lǐng)域中數(shù)據(jù)庫中漢語數(shù)據(jù)分類標(biāo)準(zhǔn)制訂,實(shí)現(xiàn)統(tǒng)一分類。


根據(jù)下面附圖及最佳實(shí)施例的描述,本發(fā)明的特性和優(yōu)點(diǎn)將會更加易于理解。
圖1是本發(fā)明漢語數(shù)據(jù)智能分類系統(tǒng)的總體方框圖;圖2為圖1中的服務(wù)器基礎(chǔ)內(nèi)核的內(nèi)部模塊結(jié)構(gòu)示意圖;圖3為圖1中方案器的內(nèi)部模塊結(jié)構(gòu)示意圖;圖4為圖1中發(fā)布器的內(nèi)部模塊結(jié)構(gòu)示意圖;圖5為圖1中的客戶端基礎(chǔ)內(nèi)核的內(nèi)部模塊結(jié)構(gòu)示意圖;圖6為圖1中接收器的內(nèi)部模塊結(jié)構(gòu)示意圖;圖7為圖1中分類器的內(nèi)部模塊結(jié)構(gòu)示意圖;圖8為本發(fā)明漢語數(shù)據(jù)智能分類方法的總體步驟流程圖;
圖9為圖8中分類方案制定的詳細(xì)步驟流程圖;圖10為圖8中漢語數(shù)據(jù)分類的詳細(xì)步驟流程圖。
具體實(shí)施例方式
圖1是本發(fā)明漢語數(shù)據(jù)智能分類系統(tǒng)的總體方框圖,在圖1中,本發(fā)明包括服務(wù)器1和客戶端2;其中服務(wù)器1包括服務(wù)器基礎(chǔ)內(nèi)核10,和通過服務(wù)器基礎(chǔ)內(nèi)核10連接的方案器11和發(fā)布器13;客戶端2包括客戶端基礎(chǔ)內(nèi)核20,和通過客戶端基礎(chǔ)內(nèi)核20連接的接收器21和分類器23。
服務(wù)器基礎(chǔ)內(nèi)核10提供底層計(jì)算和服務(wù)基礎(chǔ),包括實(shí)現(xiàn)一個數(shù)據(jù)接口,一個網(wǎng)絡(luò)協(xié)議引擎,一個消息隊(duì)列管理器和一個XML引擎;與服務(wù)器基礎(chǔ)內(nèi)核10連接的方案器11主要實(shí)現(xiàn)漢語數(shù)據(jù)分類方案管理及方案制訂,其算法依據(jù)存放于系統(tǒng)內(nèi)部設(shè)置的關(guān)鍵詞字典14中;與服務(wù)器基礎(chǔ)內(nèi)核10連接的發(fā)布器13主要實(shí)現(xiàn)分類方案結(jié)果集向客戶端分發(fā)。
客戶端基礎(chǔ)內(nèi)核20提供底層計(jì)算和服務(wù)基礎(chǔ);與客戶端基礎(chǔ)內(nèi)核20連接的接收器21實(shí)現(xiàn)自動請求、方案對比并下載、更新、終止分類方案;與客戶端基礎(chǔ)內(nèi)核20連接分類器23主要實(shí)現(xiàn)漢語數(shù)據(jù)分類標(biāo)注及與外部數(shù)據(jù)的輸入輸出操作。
方案器11、發(fā)布器13之間通過服務(wù)器數(shù)據(jù)存儲器12連接,接收器21、分類器23之間通過客戶端數(shù)據(jù)存儲器22連接,以實(shí)現(xiàn)數(shù)據(jù)內(nèi)部傳輸、消息交換和數(shù)據(jù)堆棧訪問;發(fā)布器13、接收器21之間通過互聯(lián)網(wǎng)、局域網(wǎng)或廣域網(wǎng)達(dá)成數(shù)據(jù)的發(fā)布與接收。
圖2更詳細(xì)地圖示了服務(wù)器基礎(chǔ)內(nèi)核10的內(nèi)部模塊結(jié)構(gòu)。
服務(wù)器基礎(chǔ)內(nèi)核10包括事務(wù)服務(wù)引擎101、公共類接口102、數(shù)據(jù)接口103、網(wǎng)絡(luò)協(xié)議引擎104、XML引擎105和消息隊(duì)列管理器106,各部件組成系統(tǒng)核心。在服務(wù)器基礎(chǔ)內(nèi)核10中的事務(wù)服務(wù)引擎101提供服務(wù)器端的事務(wù)管理及調(diào)度;在服務(wù)器基礎(chǔ)內(nèi)核10中的數(shù)據(jù)接口103提供系統(tǒng)與外部數(shù)據(jù)的信息交換接口功能;在服務(wù)器基礎(chǔ)內(nèi)核10中的公共類接口102實(shí)現(xiàn)基礎(chǔ)內(nèi)核與系統(tǒng)外部的指令信息交換功能,與公共類接口102連接的XML引擎104實(shí)現(xiàn)系統(tǒng)內(nèi)部數(shù)據(jù)交換服務(wù),網(wǎng)絡(luò)協(xié)議引擎105實(shí)現(xiàn)系統(tǒng)分類方案分發(fā)過程中的網(wǎng)絡(luò)通訊協(xié)議管理,消息隊(duì)列管理器106實(shí)現(xiàn)系統(tǒng)內(nèi)部各模塊間的進(jìn)程管理。
圖3更詳細(xì)地圖示了方案器11的內(nèi)部模塊結(jié)構(gòu)。
方案器11包括方案管理模塊111、方案制訂模塊112,方案輸出模塊113,和北京慧訊信息技術(shù)有限公司開發(fā)的關(guān)鍵詞字典14,各模塊間通過內(nèi)部管道相連接,處理數(shù)據(jù)的輸入輸出,結(jié)果分類方案集存儲在服務(wù)器數(shù)據(jù)存儲器12中。方案器11中的方案管理模塊111實(shí)現(xiàn)對漢語數(shù)據(jù)分類方案的創(chuàng)建、修改、刪除等維護(hù)功能;方案器11中的方案制訂模塊112實(shí)現(xiàn)對一指定分類方案的操作,包括創(chuàng)建及修改分類樹,導(dǎo)入關(guān)鍵詞字典,建立及修改關(guān)鍵詞與分類樹之間的映射關(guān)系,方案制定過程中數(shù)據(jù)存放在服務(wù)器數(shù)據(jù)存儲器12中;方案器11中的方案輸出模塊113實(shí)現(xiàn)將完成后的方案輸出為XML格式文件,供發(fā)布器13使用。系統(tǒng)內(nèi)部預(yù)設(shè)的關(guān)鍵詞字典14是集合北京慧訊信息技術(shù)有限公司按統(tǒng)計(jì)學(xué)原理整理出的專業(yè)化的漢語關(guān)鍵詞集。
圖4更詳細(xì)地圖示了發(fā)布器13的內(nèi)部模塊結(jié)構(gòu)。
發(fā)布器13包括身份認(rèn)定模塊131和方案分發(fā)模塊132,各模塊間通過內(nèi)部管道相連接,處理數(shù)據(jù)的輸入輸出,分類方案集存儲在服務(wù)器數(shù)據(jù)存儲器12中。發(fā)布器13中的身份認(rèn)定模塊131實(shí)現(xiàn)系統(tǒng)中客戶端的身份認(rèn)證,根據(jù)服務(wù)器與客戶端對話時,檢查客戶端的硬件序列號,來判定該客戶端請求是否合法;發(fā)布器13中的方案分發(fā)模塊132實(shí)現(xiàn)將存儲在服務(wù)器數(shù)據(jù)存儲器12中的分類方案集按需求定向分發(fā),即只向與各分類方案相關(guān)的客戶端集廣播分類方案指令通知。
圖5更詳細(xì)地圖示了客戶端基礎(chǔ)內(nèi)核20的內(nèi)部模塊結(jié)構(gòu)。
客戶端基礎(chǔ)內(nèi)核20包括事務(wù)服務(wù)引擎201、公共類接口202、數(shù)據(jù)接口203、網(wǎng)絡(luò)協(xié)議引擎204、XML引擎205和消息隊(duì)列管理器206,各部件組成系統(tǒng)核心。在基礎(chǔ)內(nèi)核20中的事務(wù)服務(wù)引擎201提供客戶端的事務(wù)管理及調(diào)度;在基礎(chǔ)內(nèi)核20中的數(shù)據(jù)接口203提供系統(tǒng)與外部數(shù)據(jù)的信息交換接口功能,包括與外部數(shù)據(jù)源之間的對話接口;在基礎(chǔ)內(nèi)核20中的公共類接口202實(shí)現(xiàn)基礎(chǔ)內(nèi)核與各模塊間的指令信息交換功能,與公共類接口202連接的XML引擎204實(shí)現(xiàn)系統(tǒng)內(nèi)部數(shù)據(jù)交換服務(wù),網(wǎng)絡(luò)協(xié)議引擎205實(shí)現(xiàn)系統(tǒng)分類方案接收過程中的網(wǎng)絡(luò)通訊協(xié)議管理,消息隊(duì)列管理器206實(shí)現(xiàn)系統(tǒng)內(nèi)部各模塊間的進(jìn)程管理。
圖6更詳細(xì)地圖示了接收器21的內(nèi)部模塊結(jié)構(gòu)。
接收器21包括網(wǎng)絡(luò)連接模塊211,方案對比模塊212,方案下載模塊213,方案更新模塊214,和方案終止模塊215,各模塊間通過內(nèi)部管道相連接,處理數(shù)據(jù)輸入輸出,客戶端分類方案集存儲在客戶端數(shù)據(jù)存儲器22中。接收器21中的網(wǎng)絡(luò)連接模塊211實(shí)現(xiàn)通過網(wǎng)絡(luò)向服務(wù)器提出對話請求,通過身份認(rèn)定建立對話通道;接收器21中的方案對比模塊212實(shí)現(xiàn)根據(jù)客戶端權(quán)限讀取服務(wù)器發(fā)布器上的相關(guān)分類方案集的屬性,對比客戶端本地存儲的分類方案集,判斷是否有新的方案或需要更新的方案存在于服務(wù)器發(fā)布器上;接收器21中的方案下載模塊213實(shí)現(xiàn)將新的分類方案下載到客戶端,并在分類方案注冊中注冊;接收器21中的方案更新模塊214實(shí)現(xiàn)用更新分類方案刷新原分類方案,并調(diào)整分類方案注冊表;接收器21中的方案終止模塊215實(shí)現(xiàn)將需求終止的分類方案從分類方案注冊表中刪除。
圖7更詳細(xì)地圖示了分類器23的內(nèi)部模塊結(jié)構(gòu)。
分類器23包括數(shù)據(jù)讀寫模塊231和分類標(biāo)注模塊232,各模塊間通過內(nèi)部管道相連接,處理數(shù)據(jù)輸入輸出,客戶端分類方案集存儲在客戶端數(shù)據(jù)存儲器22中。分類器23中的數(shù)據(jù)讀寫模塊231實(shí)現(xiàn)分類標(biāo)注前,將北京慧訊信息技術(shù)有限公司開發(fā)的語意識別器(參見北京慧訊信息技術(shù)有限公司專利“漢語語意數(shù)據(jù)智能識別系統(tǒng)及方法”)語意識別后的外部漢語數(shù)據(jù)導(dǎo)入分類標(biāo)注模塊232,及最后將分類標(biāo)注模塊232處理后生成的已分類漢語數(shù)據(jù)反饋給外部異構(gòu)數(shù)據(jù)源;分類器23中的分類標(biāo)注模塊231實(shí)現(xiàn)分類方案與待分類數(shù)據(jù)之間的映射,在匹配成功的漢語數(shù)據(jù)后標(biāo)注分類代碼,最終生成漢語數(shù)據(jù)分類XML文件,提交給數(shù)據(jù)讀寫模塊231。
圖8說明了本發(fā)明漢語語意數(shù)據(jù)智能分類方法的全過程步驟順序。
在步驟30中,由方案器11進(jìn)行創(chuàng)建指定數(shù)據(jù)分類需求的分類樹;導(dǎo)入關(guān)鍵詞字典,進(jìn)行關(guān)鍵詞與分類樹之間的映射;輸出分類字典表文件;進(jìn)行語意分類方案管理,包括創(chuàng)建、修改及刪除。
在步驟30輸出分類方案文件的基礎(chǔ)上,在步驟31中,由發(fā)布器13對客戶端請求進(jìn)行身份認(rèn)定;根據(jù)客戶端的身份定向分發(fā)分類方案指令,包括下載,更新,終止等。
在步驟32中,由接收器21周期性連接網(wǎng)絡(luò),并向服務(wù)器1發(fā)出客戶端請求;對比服務(wù)器分類方案與本地客戶端分類方案,接收維護(hù)指令;下載新分類方案,或更新原有分類方案,或終止刪除原有分類方案。
在上述步驟32的基礎(chǔ)上,在步驟33中,由分類器23讀取外部語意識別后的數(shù)據(jù);導(dǎo)入分類方案;根據(jù)分類字典表對語意數(shù)據(jù)進(jìn)行分類標(biāo)注;輸出漢語數(shù)據(jù)分類結(jié)果文件;將漢語分類結(jié)果文件反饋給外部數(shù)據(jù)源。
圖9更深入地說明了方案器11中各個模塊組件處理分類方案制定的全過程。在步驟301中,方案器11啟動;在步驟302中,方案器11從服務(wù)器數(shù)據(jù)存儲器12中導(dǎo)入分類方案列表;在步驟303中,方案器11提供三種分類方案管理指令,分別是創(chuàng)建新分類方案,修改指定分類方案和終止指定分類方案。
步驟304至步驟307為創(chuàng)建新分類方案的步驟,其中在步驟304中,方案器11創(chuàng)建分類方案中的分類樹;在步驟305中,方案器11從服務(wù)器數(shù)據(jù)存儲器12中復(fù)制一套關(guān)鍵詞字典并將關(guān)鍵詞表導(dǎo)入分類方案界面;在步驟306中,創(chuàng)建關(guān)鍵詞表與分類樹的映射關(guān)系;在步驟307中,將分類方案,包括分類樹及分類字典表輸出為XML文件。
步驟308至步驟311為修改指定分類方案的步驟,其中在步驟308中,導(dǎo)入指定的分類方案;在步驟309中,修改其分類樹結(jié)構(gòu)及各分類層級名稱,包括增加新層級,移動調(diào)整原分類樹層級,修改層級名稱,刪除原有層次等;在步驟310中,根據(jù)分類樹調(diào)整結(jié)果,改變關(guān)鍵詞表與分類樹的映射關(guān)系;在步驟311中,將更改后的分類方案,包括分類樹及分類字典表輸出為XML文件。
步驟312為刪除分類方案的步驟,選擇要刪除的分類方案,并將其方案從分類方案列表中刪除。
步驟314是最后一個步驟,實(shí)現(xiàn)填寫方案器11的日志文件。
圖10更深入地說明了分類器23中各個模塊組件處理漢語數(shù)據(jù)分類的全過程。在步驟331中,分類器23啟動;在步驟332中,分類器23從客戶端數(shù)據(jù)存儲器22中導(dǎo)入分類方案列表;在步驟333中,分類器23逐一遍歷所有分類方案(客戶端可能存在多個分類方案,應(yīng)對不同的數(shù)據(jù)分類需求);在步驟334中,將當(dāng)前的分類方案導(dǎo)入系統(tǒng);在步驟335中,分類器23通過數(shù)據(jù)讀寫模塊讀取外部待分類的漢語數(shù)據(jù);在步驟336中,將待分類漢語數(shù)據(jù)與分類方案中的分類字典映射,對漢語數(shù)據(jù)進(jìn)行分類標(biāo)注,即將分類代碼追加到漢語數(shù)據(jù)的相關(guān)字段中;在步驟337中,將全部分類完畢的漢語數(shù)據(jù)輸出為XML文件,反饋給外部數(shù)據(jù)源;在步驟338中,判斷分類方案遍歷是否結(jié)束,如否,則返回步驟333繼續(xù)遍歷,如是,則結(jié)束。
應(yīng)當(dāng)理解前面只是圖解本發(fā)明的原理,本領(lǐng)域的技術(shù)人員在不脫離本發(fā)明的范圍和本質(zhì)的情況下可以進(jìn)行各種修改。
權(quán)利要求
1.一種漢語數(shù)據(jù)智能分類系統(tǒng),該系統(tǒng)是一種在互聯(lián)網(wǎng)、局域網(wǎng)和廣域網(wǎng)環(huán)境中,具有開放性、自主化和智能化的漢語數(shù)據(jù)分類能力的跨網(wǎng)絡(luò)、跨平臺、跨數(shù)據(jù)庫的漢語數(shù)據(jù)分類系統(tǒng),其特征在于,該系統(tǒng)包括一個服務(wù)器和一個客戶端構(gòu)成的系統(tǒng)體系構(gòu)架,其中,該服務(wù)器管理數(shù)據(jù)分類方案的制訂和數(shù)據(jù)分類方案的分發(fā),該客戶端實(shí)施分類方案在線維護(hù)和對外部漢語數(shù)據(jù)分類,該服務(wù)器與該客戶端通過網(wǎng)絡(luò)實(shí)現(xiàn)數(shù)據(jù)交換;該系統(tǒng)還包括一個實(shí)現(xiàn)了服務(wù)器過程管理和數(shù)據(jù)流管理的服務(wù)器基礎(chǔ)內(nèi)核,該服務(wù)器基礎(chǔ)內(nèi)核提供服務(wù)器在漢語數(shù)據(jù)分類方案制訂及分發(fā)方面的規(guī)則、模型、底層調(diào)用和設(shè)備管理;一個連接到上述服務(wù)器基礎(chǔ)內(nèi)核的方案器,該方案器實(shí)現(xiàn)漢語數(shù)據(jù)分類規(guī)則及方案的制訂,維護(hù),輸出及日志管理;一個連接到上述服務(wù)器基礎(chǔ)內(nèi)核的發(fā)布器,該發(fā)布器實(shí)現(xiàn)漢語數(shù)據(jù)分類方案的分發(fā),及客戶端身份認(rèn)證管理;一個實(shí)現(xiàn)了客戶端過程管理和數(shù)據(jù)流管理的客戶端基礎(chǔ)內(nèi)核,該客戶端基礎(chǔ)內(nèi)核提供客戶端系統(tǒng)在漢語數(shù)據(jù)分類方案接收及執(zhí)行方面的規(guī)則、模型、底層調(diào)用和設(shè)備管理;一個連接到上述客戶端基礎(chǔ)內(nèi)核的接收器,該接收器實(shí)現(xiàn)自動通過網(wǎng)絡(luò)向服務(wù)器提出請求,自動對比服務(wù)器與客戶端上的分類方案列表,自動下載新分類方案,更新原有分類方案,及終止原有分類方案;一個連接到上述客戶端基礎(chǔ)內(nèi)核的分類器,該分類器實(shí)現(xiàn)從外部數(shù)據(jù)源中讀取漢語數(shù)據(jù),根據(jù)分類方案對漢語數(shù)據(jù)進(jìn)行分類標(biāo)注,最后將分類數(shù)據(jù)反饋給外部數(shù)據(jù)源,達(dá)到漢語數(shù)據(jù)統(tǒng)一分類目的;在上述服務(wù)器中預(yù)置獨(dú)立的關(guān)鍵詞字典,關(guān)鍵詞字典是構(gòu)建在漢語字典基礎(chǔ)上的專業(yè)字典,收集行業(yè)數(shù)據(jù)中語意表達(dá)及各種縮寫及方言,是制訂分類方案的主要依據(jù)。
2.根據(jù)權(quán)利要求1所述的漢語數(shù)據(jù)智能分類系統(tǒng),其特征在于,所述的方案器和發(fā)布器之間通過服務(wù)器數(shù)據(jù)存儲器連接,所述的接收器和分類器之間通過客戶端數(shù)據(jù)存儲器連接,以實(shí)現(xiàn)數(shù)據(jù)內(nèi)部傳輸、消息交換和數(shù)據(jù)堆棧訪問。
3.一種漢語數(shù)據(jù)智能分類方法,該方法是一種在互聯(lián)網(wǎng)、局域網(wǎng)和廣域網(wǎng)環(huán)境中的異構(gòu)數(shù)據(jù)集成時,在分類方案與數(shù)據(jù)源之間采用關(guān)鍵詞中間語意表述層,通過漢語數(shù)據(jù)分類方案制訂、分類方案分發(fā)、分類方案接收及漢語數(shù)據(jù)分類標(biāo)注的跨數(shù)據(jù)庫的漢語數(shù)據(jù)分類方法,其特征在于,該方法包括下列步驟利用服務(wù)器管理數(shù)據(jù)分類方案的制訂;利用服務(wù)器實(shí)現(xiàn)數(shù)據(jù)分類方案的分發(fā);利用服務(wù)器基礎(chǔ)內(nèi)核進(jìn)行漢語數(shù)據(jù)分類方案的管理,包括分類方案制定及分類方案分發(fā)兩個步驟,服務(wù)器基礎(chǔ)內(nèi)核分別啟動方案器和發(fā)布器;基于上述步驟,利用方案器創(chuàng)建、修改、終止分類方案,將服務(wù)器數(shù)據(jù)存儲器中的關(guān)鍵詞字典導(dǎo)入系統(tǒng),建立關(guān)鍵詞與分類方案的映射關(guān)系,最后輸出分類方案;基于上述步驟,利用發(fā)布器對分類方案進(jìn)行客戶端身份認(rèn)定后的分類方案網(wǎng)絡(luò)分發(fā);利用客戶端實(shí)施分類方案在線維護(hù);利用客戶端實(shí)現(xiàn)對外部漢語數(shù)據(jù)分類;利用客戶端基礎(chǔ)內(nèi)核進(jìn)行漢語數(shù)據(jù)分類過程管理,包括分類方案接收、外部數(shù)據(jù)讀取、漢語數(shù)據(jù)分類標(biāo)注、分類結(jié)果數(shù)據(jù)反饋四個步驟,客戶端基礎(chǔ)內(nèi)核分別啟動接收器和分類器;基于上述步驟,利用接收器向服務(wù)器發(fā)出請求,自動下載、更新、終止分類方案;基于上述步驟,利用分類器讀取外部數(shù)據(jù),根據(jù)分類方案自動映射漢語數(shù)據(jù)并進(jìn)行分類標(biāo)注,將已分類數(shù)據(jù)反饋給外部數(shù)據(jù)源,完成整個數(shù)據(jù)分類過程。
4.根據(jù)權(quán)利要求3所述的漢語數(shù)據(jù)智能分類方法,其特征在于,所述的關(guān)鍵詞中間語意表述層實(shí)現(xiàn)數(shù)據(jù)分類方案與現(xiàn)實(shí)中異構(gòu)數(shù)據(jù)源中各種漢語數(shù)據(jù)之間的無縫連接。
5.根據(jù)權(quán)利要求3所述的漢語數(shù)據(jù)智能分類方法,其特征在于,所述的方案器步驟中還包括將所有對分類方案的操作記錄于方案器日志文件的步驟。
6.根據(jù)權(quán)利要求3所述的漢語數(shù)據(jù)智能分類方法,其特征在于,所述的接收器步驟中還包括分類方案注冊表的處理步驟。
7.根據(jù)權(quán)利要求3所述的漢語數(shù)據(jù)智能分類方法,其特征在于,所述的分類器步驟中還包括對同一數(shù)據(jù)源漢語數(shù)據(jù)進(jìn)行多種分類方案分類標(biāo)注的步驟。
全文摘要
本發(fā)明公開一種漢語數(shù)據(jù)智能分類系統(tǒng)及方法,該發(fā)明采用服務(wù)器-客戶端系統(tǒng)結(jié)構(gòu),利用服務(wù)器基礎(chǔ)內(nèi)核管理服務(wù)器內(nèi)部各模塊間進(jìn)程及事務(wù)調(diào)度;利用方案器制訂漢語數(shù)據(jù)分類方案,并保存在服務(wù)器端數(shù)據(jù)存儲器中;利用發(fā)布器向客戶端分發(fā)分類方案;利用客戶端基礎(chǔ)內(nèi)核管理客戶端內(nèi)部各模塊間進(jìn)程及事務(wù)調(diào)度;利用接收器接收發(fā)布器公示的分類方案;利用分類器將外部漢語數(shù)據(jù)導(dǎo)入客戶端數(shù)據(jù)存儲器之后對數(shù)據(jù)進(jìn)行分類標(biāo)注。本發(fā)明提供一種適用于企業(yè)、政府、以及電子商務(wù)所迫切需要的高效、低成本、支持對眾多分散的異構(gòu)數(shù)據(jù)源進(jìn)行端前漢語數(shù)據(jù)分類,處理異構(gòu)數(shù)據(jù)源統(tǒng)一分類的漢語數(shù)據(jù)智能分類系統(tǒng)及方法。
文檔編號G06F17/00GK1588348SQ20041007810
公開日2005年3月2日 申請日期2004年9月16日 優(yōu)先權(quán)日2004年9月16日
發(fā)明者孫曉紅, 楊肖, 張世韻, 馮旭輝 申請人:北京慧訊信息技術(shù)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
临桂县| 镇康县| 翼城县| 北流市| 镇赉县| 新野县| 宜春市| 教育| 焦作市| 金平| 南涧| 卓资县| 张家界市| 尚志市| 铜陵市| 石狮市| 井陉县| 城固县| 阿合奇县| 新巴尔虎右旗| 石首市| 德阳市| 博野县| 海口市| 牙克石市| 隆安县| 壤塘县| 应用必备| 崇明县| 老河口市| 凭祥市| 土默特左旗| 铁岭市| 怀安县| 海丰县| 天镇县| 准格尔旗| 宝清县| 漳州市| 永清县| 江陵县|