一種信息資源的自動(dòng)編目方法
【技術(shù)領(lǐng)域】
[0001 ]本發(fā)明涉及編目技術(shù)領(lǐng)域,尤其涉及一種信息資源的自動(dòng)編目方法。
【背景技術(shù)】
[0002] 在公共信息平臺(tái)信息組織管理中,資源目錄作為城市信息資源規(guī)劃與管理的組成 部分,主要的作用就是將交換共享數(shù)據(jù)庫(kù)或者其他業(yè)務(wù)系統(tǒng)的可以公開(kāi)的服務(wù)聚合至一個(gè) 統(tǒng)一的標(biāo)準(zhǔn)目錄下,并提供查詢檢索功能和共享的數(shù)據(jù)資源訂閱功能。為共享數(shù)據(jù)資源提 供更加高效,精確的服務(wù)。
[0003] 資源目錄的編目工作是建立目錄資源與數(shù)據(jù)之間相互關(guān)系的重要手段和方法,是 元數(shù)據(jù)信息進(jìn)行分類和歸檔的重要途徑。如果沒(méi)有編目工作,資源目錄就只剩下一個(gè)空空 的框架,沒(méi)有內(nèi)容來(lái)充實(shí)和支撐,而數(shù)據(jù)信息也被完全孤立,無(wú)法進(jìn)行檢索、分類和共享。
[0004] 目前,對(duì)城市信息資源的編目工作,一般是編目人員通過(guò)人工編目的方法進(jìn)行的。 隨著數(shù)據(jù)資源等信息的不斷增加,對(duì)于編目工作人員來(lái)說(shuō),編目任務(wù)越來(lái)越繁重而復(fù)雜,編 目人員一般要經(jīng)過(guò)分析探討才能對(duì)信息資源進(jìn)行正確的分類和編目,因此,不僅使得編目 工作變得越來(lái)越復(fù)雜,而且編目過(guò)程所花費(fèi)的時(shí)間也越來(lái)越多,效率越來(lái)越低,進(jìn)而導(dǎo)致編 目的質(zhì)量也受到一定的影響,所以,現(xiàn)有的編目方法已經(jīng)無(wú)法滿足編目任務(wù)的需要。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明的目的在于提供一種信息資源的自動(dòng)編目方法,從而解決現(xiàn)有技術(shù)中存在 的前述問(wèn)題。
[0006] 為了實(shí)現(xiàn)上述目的,本發(fā)明采用的技術(shù)方案如下:
[0007] -種信息資源的自動(dòng)編目方法,包括如下步驟:
[0008] S1,依據(jù)同一規(guī)范定義,分別創(chuàng)建信息資源標(biāo)識(shí)符編碼字典和資源目錄,所述信息 資源標(biāo)識(shí)符編碼字典包含標(biāo)識(shí)符和對(duì)應(yīng)的標(biāo)識(shí)符編碼,所述標(biāo)識(shí)符編碼與所述資源目錄的 各級(jí)編碼 對(duì)應(yīng);
[0009] S2,加載當(dāng)前信息資源,并獲取所述當(dāng)前信息資源的標(biāo)識(shí)符;
[0010] S3,對(duì)所述當(dāng)前信息資源的標(biāo)識(shí)符進(jìn)行拆分,獲得多個(gè)標(biāo)識(shí)符片段;
[0011] S4,對(duì)于每個(gè)標(biāo)識(shí)符片段,在所述信息資源標(biāo)識(shí)符編碼字典中查找是否存在所述 標(biāo)識(shí)符片段,如果存在,則執(zhí)行S5-S6,否則,結(jié)束;
[0012] S5,在所述信息資源標(biāo)識(shí)符編碼字典中,利用標(biāo)識(shí)符和對(duì)應(yīng)的標(biāo)識(shí)符編碼的對(duì)應(yīng) 關(guān)系,根據(jù)所述標(biāo)識(shí)符片段,獲取所述標(biāo)識(shí)符片段的編碼;
[0013] S6,將所述標(biāo)識(shí)符片段的編碼與所述資源目錄的各級(jí)編碼進(jìn)行比對(duì),獲取與所述 標(biāo)識(shí)符片段的編碼一致的各級(jí)資源目錄,根據(jù)所述各級(jí)資源目錄確定與所述信息資源匹配 的資源目錄項(xiàng),并將所述信息資源編目到所述資源目錄項(xiàng)上。
[0014]優(yōu)選地,Sl中,所述規(guī)范定義為:政務(wù)信息資源目錄體系對(duì)于信息資源標(biāo)識(shí)符編碼 的規(guī)范定義。
[0015] 優(yōu)選地,所述標(biāo)識(shí)符編碼的結(jié)構(gòu)包括:5位字母數(shù)字前段和不定長(zhǎng)的字符串后段, 所述前段和所述后段之間用7"隔開(kāi)。
[0016] 優(yōu)選地,所述前段用于標(biāo)明信息資源目錄的管理者,由GB18030-2000中規(guī)定的10 個(gè)阿拉伯?dāng)?shù)字和26個(gè)大寫(xiě)羅馬字符組成。
[0017] 優(yōu)選地,所述后段用于對(duì)同一信息資源目錄管理者所管理的目錄中的信息資源進(jìn) 行唯一標(biāo)識(shí),采用GB18030-2000中規(guī)定的字符組成。
[0018] 優(yōu)選地,Sl中,所述創(chuàng)建資源目錄,采用如下步驟進(jìn)行實(shí)施:
[0019] 在目錄表中增加標(biāo)識(shí)符編碼字段;
[0020] 在目錄創(chuàng)建界面的標(biāo)識(shí)符編碼輸入框中輸入標(biāo)識(shí)符編碼,并保存至所述標(biāo)識(shí)符編 碼字段。
[0021] 優(yōu)選地,S2中,所述獲取所述當(dāng)前信息資源的標(biāo)識(shí)符,采用如下步驟進(jìn)行實(shí)施:
[0022] 在所述信息資源對(duì)應(yīng)的元數(shù)據(jù)表中增加標(biāo)識(shí)符字段;
[0023] 在元數(shù)據(jù)創(chuàng)建界面的標(biāo)識(shí)符輸入框中輸入標(biāo)識(shí)符,并保存至所述標(biāo)識(shí)符字段。
[0024] 優(yōu)選地,S2和S3之間還包括步驟:采用ajax技術(shù)將所述信息資源的標(biāo)識(shí)符傳入業(yè) 務(wù)層,則S3在所述業(yè)務(wù)層中進(jìn)行。
[0025] 優(yōu)選地,S5具體為,在業(yè)務(wù)層中調(diào)用autoResourceCataloguing方法,利用標(biāo)識(shí)符 和對(duì)應(yīng)的標(biāo)識(shí)符編碼的對(duì)應(yīng)關(guān)系,根據(jù)所述標(biāo)識(shí)符片段,獲取所述標(biāo)識(shí)符片段的編碼。
[0026] 本發(fā)明的有益效果是:本發(fā)明實(shí)施例提供的信息資源的自動(dòng)編目方法,通過(guò)依據(jù) 同一規(guī)范定義創(chuàng)建信息資源標(biāo)識(shí)符字典和資源目錄,使標(biāo)識(shí)符編碼與所述資源目錄的各級(jí) 編碼一一對(duì)應(yīng),通過(guò)將信息資源標(biāo)識(shí)符解析成多個(gè)標(biāo)識(shí)符片段,并在所述信息資源標(biāo)識(shí)符 編碼字典中查找是否存在所述標(biāo)識(shí)符片段,如果存在,根據(jù)標(biāo)識(shí)符與編碼的對(duì)應(yīng)關(guān)系,獲取 每個(gè)標(biāo)識(shí)符片段的編碼,然后,利用標(biāo)識(shí)符編碼與所述資源目錄的各級(jí)編碼一一對(duì)應(yīng)的關(guān) 系,獲取資源目錄的各級(jí)目錄,最終確定完整的目錄項(xiàng),并將信息資源編目到該目錄項(xiàng)上。 從而實(shí)現(xiàn)了對(duì)信息資源的自動(dòng)編目,從而大大縮短了編目的時(shí)間,減少了編目人員的任務(wù) 工作量,并且提高了編目質(zhì)量。
【附圖說(shuō)明】
[0027] 圖1是本發(fā)明實(shí)施例提供的自動(dòng)編目方法流程示意圖;
[0028] 圖2是信息資源標(biāo)識(shí)符結(jié)構(gòu)示意圖;
[0029] 圖3是標(biāo)識(shí)符字典數(shù)據(jù)事例結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0030] 為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合附圖,對(duì)本發(fā)明進(jìn) 行進(jìn)一步詳細(xì)說(shuō)明。應(yīng)當(dāng)理解,此處所描述的【具體實(shí)施方式】?jī)H僅用以解釋本發(fā)明,并不用于 限定本發(fā)明。
[0031] 如圖1所示,本發(fā)明實(shí)施例提供了一種信息資源的自動(dòng)編目方法,包括如下步驟:
[0032] S1,依據(jù)同一規(guī)范定義,分別創(chuàng)建信息資源標(biāo)識(shí)符編碼字典和資源目錄,所述信息 資源標(biāo)識(shí)符編碼字典包含標(biāo)識(shí)符和對(duì)應(yīng)的標(biāo)識(shí)符編碼,所述標(biāo)識(shí)符編碼與所述資源目錄的 各級(jí)編碼 對(duì)應(yīng);
[0033] S2,加載當(dāng)前信息資源,并獲取所述當(dāng)前信息資源的標(biāo)識(shí)符;
[0034] S3,對(duì)所述當(dāng)前信息資源的標(biāo)識(shí)符進(jìn)行拆分,獲得多個(gè)標(biāo)識(shí)符片段;
[0035] S4,對(duì)于每個(gè)標(biāo)識(shí)符片段,在所述信息資源標(biāo)識(shí)符編碼字典中查找是否存在所述 標(biāo)識(shí)符片段,如果存在,則執(zhí)行S5-S6,否則,結(jié)束;
[0036] S5,在所述信息資源標(biāo)識(shí)符編碼字典中,利用標(biāo)識(shí)符和對(duì)應(yīng)的標(biāo)識(shí)符編碼的對(duì)應(yīng) 關(guān)系,根據(jù)所述標(biāo)識(shí)符片段,獲取所述標(biāo)識(shí)符片段的編碼;
[0037] S6,將所述標(biāo)識(shí)符片段的編碼與所述資源目錄的各級(jí)編碼進(jìn)行比對(duì),獲取與所述 標(biāo)識(shí)符片段的編碼一致的資源目錄的各級(jí),根據(jù)所述資源目錄的各級(jí)確定與所述信息資源 匹配的資源目錄項(xiàng),并將所述信息資源編目到所述資源目錄項(xiàng)上。
[0038] 本發(fā)明實(shí)施例提供的信息資源的自動(dòng)編目方法,在實(shí)際操作過(guò)程中,可以按照如 下步驟進(jìn)行實(shí)施:
[0039] 首先,創(chuàng)建標(biāo)識(shí)符字典表,TB_TYPEC0DE,字典表包含3個(gè)字段,分別為:
[0040] ID:字典表主鍵,INTEGER類型,非空且自增;
[0041 ] TYPEC0DE:標(biāo)識(shí)符碼,VARCHAR 類型,非空;
[0042] DESCRIPTION:標(biāo)識(shí)符碼說(shuō)明,VARCHAR類型,可空;
[0043] 然后,創(chuàng)建資源目錄,具體的方法可以為:在目錄表中增加標(biāo)識(shí)符編碼字段, RESC0DE,字段類型為VARCHAR,非空。在目錄創(chuàng)建的過(guò)程中,該字段為必填項(xiàng),系統(tǒng)獲取該字 段后通過(guò)正則表達(dá)式進(jìn)行驗(yàn)證,驗(yàn)證其是否與字典表中的TYPEC0DE類型一致,如果一致,則 繼續(xù),否則,重新填寫(xiě)目錄表中的標(biāo)識(shí)符字段;其中,通過(guò)正則表達(dá)式對(duì)標(biāo)識(shí)符編碼進(jìn)行驗(yàn) 證:
[0045]如果驗(yàn)證成功,