欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種數(shù)據(jù)處理的方法及裝置的制造方法

文檔序號:9417469閱讀:248來源:國知局
一種數(shù)據(jù)處理的方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及計算機技術(shù)領(lǐng)域,特別涉及一種數(shù)據(jù)處理的方法及裝置。
【背景技術(shù)】
[0002]隨著信息通信技術(shù)快速發(fā)展,產(chǎn)生了海量的數(shù)據(jù)資源,這些數(shù)據(jù)資源被分別保存在不同的數(shù)據(jù)庫中,不同的數(shù)據(jù)資源之間,一般相互之間沒有關(guān)聯(lián)。為了充分利用這些數(shù)據(jù)資源,需要將不同的數(shù)據(jù)資源關(guān)聯(lián)起來。
[0003]現(xiàn)有技術(shù)中,為了建立數(shù)據(jù)資源之間的聯(lián)系,一般將數(shù)據(jù)資源存儲在同一個數(shù)據(jù)表中,通過同一個數(shù)據(jù)表來關(guān)聯(lián)該數(shù)據(jù)表中的數(shù)據(jù)資源。例如:通過數(shù)據(jù)表中的行列將數(shù)據(jù)資源進行分類。
[0004]通過上述描述可見,現(xiàn)有技術(shù)中,數(shù)據(jù)資源通過存儲在同一個數(shù)據(jù)表中來相關(guān)關(guān)聯(lián),但是,這種方式比較適合數(shù)據(jù)量較少的情況,當(dāng)數(shù)據(jù)量很多時,將這些數(shù)據(jù)資源存儲在同一個數(shù)據(jù)表中比較困難,而且不容易處理。另外,一張數(shù)據(jù)表中對數(shù)據(jù)資源的描述能力有限,只能對數(shù)據(jù)資源的少量特征進行關(guān)聯(lián),難以全面對數(shù)據(jù)資源的特征進行關(guān)聯(lián)??傊?,現(xiàn)有技術(shù)的方法關(guān)聯(lián)數(shù)據(jù)的效率較低。

【發(fā)明內(nèi)容】

[0005]有鑒于此,本發(fā)明提供了一種數(shù)據(jù)處理的方法及裝置,能夠提高關(guān)聯(lián)數(shù)據(jù)的效率。
[0006]—方面,本發(fā)明提供了一種數(shù)據(jù)處理的方法,包括:預(yù)先設(shè)置多個標簽,還包括:
[0007]S1:獲取待處理數(shù)據(jù)對應(yīng)的至少一個字符串;
[0008]S2:分別將每個字符串與所有標簽進行匹配,獲取每個字符串相匹配的匹配標簽;
[0009]S3:將所有匹配標簽作為所述待處理數(shù)據(jù)的標簽。
[0010]進一步地,包括:所述S2,包括:
[0011]S21:從當(dāng)前字符串中提取至少一個待標識字符串,其中,每個待標識字符串由當(dāng)前字符串中相鄰的字符組成;
[0012]S22:將每個待標識字符串與每個標簽進行匹配,獲取每個待標識字符串相匹配的匹配標簽;
[0013]S23:將每個待標識字符串相匹配的匹配標簽作為當(dāng)前字符串對應(yīng)的匹配標簽。
[0014]進一步地,所述S22,包括:
[0015]B1:將當(dāng)前待匹配字符串兩端中的任意一端作為刪減端;
[0016]B2:將當(dāng)前待標識字符串作為當(dāng)前待匹配字符串;
[0017]B3:判斷當(dāng)前待匹配字符串的字符數(shù)是否小于預(yù)設(shè)值,如果是,則結(jié)束當(dāng)前流程,否則,執(zhí)行步驟B4;
[0018]B4:將當(dāng)前待匹配字符串與所有標簽進行匹配,判斷是否有與當(dāng)前待匹配字符串相匹配的標簽,如果有,則將與當(dāng)前待匹配字符串相匹配的標簽作為當(dāng)前待標識字符串的匹配標簽,執(zhí)行步驟B5,否則,執(zhí)行步驟B5 ;
[0019]B5:將當(dāng)前待匹配字符串的刪減端的第一個字符去掉,得到刪減字符串,將所述刪減待標識字符串作為當(dāng)前待匹配字符串,返回步驟B3。
[0020]進一步地,包括:
[0021]X為所有標簽中字符個數(shù)最少的標簽的字符數(shù),Y為所有標簽中字符個數(shù)最多的標簽的字符數(shù);
[0022]所述預(yù)設(shè)值包括X ;
[0023]所述S21,包括:判斷當(dāng)前字符串的字符數(shù)是否大于Y,如果是,則從當(dāng)前字符串中提取出所有字符數(shù)為Y的待標識字符串,否則,將當(dāng)前字符串作為待標識字符串。
[0024]進一步地,還包括:
[0025]將每個標簽保存在對應(yīng)的標簽關(guān)聯(lián)表,所述標簽關(guān)聯(lián)表中包括:當(dāng)如標簽的上級標簽、當(dāng)前標簽的下級標簽、當(dāng)前標簽的關(guān)聯(lián)標簽;
[0026]和/或,所述待處理數(shù)據(jù)對應(yīng)的至少一個字符串,包括:存儲所述待處理數(shù)據(jù)的數(shù)據(jù)表中對應(yīng)的數(shù)據(jù)項名稱、所述待處理數(shù)據(jù)的屬性名稱、所述待處理數(shù)據(jù)中的字符串;
[0027]和/或,所述多個標簽,包括:存儲數(shù)據(jù)的數(shù)據(jù)表中的數(shù)據(jù)項名稱、標準詞庫中的詞、數(shù)據(jù)的屬性名稱;
[0028]和/或,所有標簽中包括多個維度的標簽,每個維度的所有標簽中包括描述當(dāng)前維度對應(yīng)的數(shù)據(jù)特征的所有標簽。
[0029]進一步地,在所述S3之后,進一步包括:將對應(yīng)相同標簽的各個待處理數(shù)據(jù),確定為相關(guān)聯(lián)的數(shù)據(jù)。
[0030]另一方面,本發(fā)明提供了一種數(shù)據(jù)處理的裝置,包括:
[0031]設(shè)置單元,用于設(shè)置多個標簽;
[0032]獲取單元,用于獲取待處理數(shù)據(jù)對應(yīng)的至少一個字符串;
[0033]匹配單元,用于分別將每個字符串與所有標簽進行匹配,獲取每個字符串相匹配的匹配標簽,將所有匹配標簽作為所述待處理數(shù)據(jù)的標簽。
[0034]進一步地,包括:所述匹配單元,在執(zhí)行所述分別將每個字符串與所有標簽進行匹配,獲取每個字符串相匹配的匹配標簽時,具體執(zhí)行:從當(dāng)前字符串中提取至少一個待標識字符串,其中,每個待標識字符串由當(dāng)前字符串中相鄰的字符組成,將每個待標識字符串與每個標簽進行匹配,獲取每個待標識字符串相匹配的匹配標簽,將每個待標識字符串相匹配的匹配標簽作為當(dāng)前字符串對應(yīng)的匹配標簽;
[0035]進一步地,還包括:關(guān)聯(lián)單元,用于將對應(yīng)相同標簽的各個待處理數(shù)據(jù),確定為相關(guān)聯(lián)的數(shù)據(jù)。
[0036]進一步地,所述匹配單元,在執(zhí)行所述將每個待標識字符串與每個標簽進行匹配,獲取每個待標識字符串相匹配的匹配標簽時,具體執(zhí)行:
[0037]B1:將當(dāng)前待匹配字符串兩端中的任意一端作為刪減端;
[0038]B2:將當(dāng)前待標識字符串作為當(dāng)前待匹配字符串;
[0039]B3:判斷當(dāng)前待匹配字符串的字符數(shù)是否小于預(yù)設(shè)值,如果是,則結(jié)束當(dāng)前流程,否則,執(zhí)行步驟B4;
[0040]B4:將當(dāng)前待匹配字符串與所有標簽進行匹配,判斷是否有與當(dāng)前待匹配字符串相匹配的標簽,如果有,則將與當(dāng)前待匹配字符串相匹配的標簽作為當(dāng)前待標識字符串的匹配標簽,執(zhí)行步驟B5,否則,執(zhí)行步驟B5 ;
[0041]B5:將當(dāng)前待匹配字符串的刪減端的第一個字符去掉,得到刪減字符串,將所述刪減待標識字符串作為當(dāng)前待匹配字符串,返回步驟B3。
[0042]進一步地,包括:
[0043]X為所有標簽中字符個數(shù)最少的標簽的字符數(shù),Y為所有標簽中字符個數(shù)最多的標簽的字符數(shù);
[0044]所述預(yù)設(shè)值包括X ;
[0045]所述匹配單元,在執(zhí)行所述從當(dāng)前字符串中提取至少一個待標識字符串時,具體執(zhí)行:判斷當(dāng)前字符串的字符數(shù)是否大于Y,如果是,則從當(dāng)前字符串中提取出所有字符數(shù)為Y的待標識字符串,否則,將當(dāng)前字符串作為待標識字符串。
[0046]本發(fā)明實施例提供的一種數(shù)據(jù)處理的方法及裝置,將待處理數(shù)據(jù)對應(yīng)的字符串與預(yù)設(shè)的標簽進行匹配,獲取每個字符串匹配的匹配標簽,將該匹配標簽作為待處理數(shù)據(jù)的標簽,通過這種方法,可以為不同的數(shù)據(jù)匹配對應(yīng)的標簽,當(dāng)兩個數(shù)據(jù)對應(yīng)的標簽相同時,可以確定這兩個數(shù)據(jù)是相關(guān)聯(lián)的。每個數(shù)據(jù)可能有多個對應(yīng)的標簽,而每個標簽可能對應(yīng)很多不同的數(shù)據(jù),可以認為具有相同標簽的數(shù)據(jù)是相關(guān)聯(lián)的,這樣通過標簽這個紐帶就可以建立大量數(shù)據(jù)之間的關(guān)聯(lián),提高了關(guān)聯(lián)數(shù)據(jù)的效率。
【附圖說明】
[0047]為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0048]圖1是本發(fā)明一實施例提供的一種數(shù)據(jù)處理的方法的流程圖;
[0049]圖2是本發(fā)明一實施例提供的另一種數(shù)據(jù)處理的方法的流程圖;
[0050]圖3是本發(fā)明一實施例提供的一種數(shù)據(jù)處理的裝置的示意圖;
[0051]圖4是本發(fā)明一實施例提供的另一種數(shù)據(jù)處理的裝置的示意圖。
【具體實施方式】
[0052]為使本發(fā)明實施例的目的、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例是本發(fā)明一部分實施例,而不是全部的實施例,基于本發(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動的前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
[0053]如圖1所示,本發(fā)明實施例提供了一種數(shù)據(jù)處理的方法,該方法可以包括以下步驟:
[0054]SO:預(yù)先設(shè)置多個標簽;
[0055]S1:獲取待處理數(shù)據(jù)對應(yīng)的至少一個字符串;
[0056]S2:分別將每個字符串與所有標簽進行匹配,獲取每個字符串相匹配的匹配標簽;
[0057]S3:將所有匹配標簽作為所述待處理
當(dāng)前第1頁1 2 3 4 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
台东县| 青河县| 常山县| 海宁市| 镇宁| 祁连县| 岳阳市| 许昌市| 肥东县| 太和县| 龙川县| 同仁县| 湘乡市| 石屏县| 永福县| 会昌县| 大兴区| 福泉市| 贡觉县| 长葛市| 石林| 静乐县| 龙川县| 哈尔滨市| 环江| 沁水县| 崇信县| 尉犁县| 泾阳县| 保定市| 朔州市| 蓬安县| 金堂县| 麻江县| 阳江市| 惠东县| 永州市| 文昌市| 禹城市| 星子县| 莱州市|