基于數(shù)據(jù)匹配的數(shù)據(jù)導(dǎo)入方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開了一種基于數(shù)據(jù)匹配的數(shù)據(jù)導(dǎo)入方法及系統(tǒng),涉及數(shù)據(jù)匹配【技術(shù)領(lǐng)域】,所述方法包括以下步驟:S1:獲取待導(dǎo)入的材料清單;S2:從所述待導(dǎo)入的材料清單中提取待導(dǎo)入的材料名稱及材料規(guī)格;S3:計算所述待導(dǎo)入材料名稱及材料規(guī)格與基礎(chǔ)庫中的每組數(shù)據(jù)之間的匹配率,所述基礎(chǔ)庫中的每組數(shù)據(jù)均包括:材料名稱及材料規(guī)格;S4:根據(jù)所述匹配率將所述待導(dǎo)入材料名稱及材料規(guī)格導(dǎo)入所述基礎(chǔ)庫中。本發(fā)明通過計算匹配率,并根據(jù)匹配率將所述待導(dǎo)入材料名稱及材料規(guī)格導(dǎo)入基礎(chǔ)庫中,提高了數(shù)據(jù)錄入效率,并降低了錯誤率。
【專利說明】基于數(shù)據(jù)匹配的數(shù)據(jù)導(dǎo)入方法及系統(tǒng)【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及數(shù)據(jù)匹配【技術(shù)領(lǐng)域】,特別涉及一種基于數(shù)據(jù)匹配的數(shù)據(jù)導(dǎo)入方法及系統(tǒng)。
【背景技術(shù)】
[0002]在電力工程項目的建設(shè)過程中,所涉及到的材料、工程量數(shù)不勝數(shù)。由于這些電力材料、工程量分類繁多,規(guī)格型號各異,同時由于人為因素,對同一型號的材料的叫法也不盡相同,如施工單位所拿到的中標(biāo)材料清單與施工圖材料清單以及與現(xiàn)場人員對其的叫法不一致等。所以在電力施工單位對其會感到困惑,在施工和采購時也會造成一定困難。
[0003]現(xiàn)有技術(shù)中,通常是由數(shù)據(jù)錄入人員將中標(biāo)清單、施工圖清單、現(xiàn)場清單分次錄入。由于不同角色對于物資的叫法不盡相同,數(shù)據(jù)錄入人員無法將各類清單進(jìn)行一一比對錄入,從而導(dǎo)致系統(tǒng)中物資命名混亂無法進(jìn)行有效合理分類,錄入效率低下,并且錯誤率非常聞。
【發(fā)明內(nèi)容】
[0004](一)要解決的技術(shù)問題
[0005]本發(fā)明要解決的技術(shù)問題是:如何提高數(shù)據(jù)錄入效率,并降低錯誤率。
[0006](二)技術(shù)方案
[0007]為解決上述技術(shù)問題,本發(fā)明提供了一種基于數(shù)據(jù)匹配的數(shù)據(jù)導(dǎo)入方法,所述方法包括以下步驟:`[0008]S1:獲取待導(dǎo)入的材料清單;
[0009]S2:從所述待導(dǎo)入的材料清單中提取待導(dǎo)入的材料名稱及材料規(guī)格;
[0010]S3:計算所述待導(dǎo)入材料名稱及材料規(guī)格與基礎(chǔ)庫中的每組數(shù)據(jù)之間的匹配率,所述基礎(chǔ)庫中的每組數(shù)據(jù)均包括:材料名稱及材料規(guī)格;
[0011]S4:根據(jù)所述匹配率將所述待導(dǎo)入材料名稱及材料規(guī)格導(dǎo)入所述基礎(chǔ)庫中。
[0012]其中,步驟SI之前包括:
[0013]SO:對所述基礎(chǔ)庫中每組數(shù)據(jù)均進(jìn)行分詞處理,并根據(jù)所述基礎(chǔ)庫中每組數(shù)據(jù)的分詞結(jié)果創(chuàng)建索引;
[0014]步驟S3包括:
[0015]S301:對所述待導(dǎo)入材料名稱及材料規(guī)格進(jìn)行分詞處理,并將所述待導(dǎo)入材料名稱及材料規(guī)格的分詞結(jié)果與所述基礎(chǔ)庫中每組數(shù)據(jù)的分詞結(jié)果根據(jù)索引進(jìn)行檢索,統(tǒng)計所述基礎(chǔ)庫中每組數(shù)據(jù)的分詞結(jié)果中與所述待導(dǎo)入材料名稱及材料規(guī)格的分詞結(jié)果匹配成功的分詞個數(shù);
[0016]S302:根據(jù)下式計算所述匹配率p,
[0017]P = W^a+Ws^b
[0018]其中,W1= Ii^n1 ;w2 = k2*n2 = A/11 ;n2 = A/i2 ;a+b = I ;a、b 均為權(quán)值、且O≤a≤1,0≤b≤I ;A為常數(shù)丸為所述待導(dǎo)入材料名稱的分詞結(jié)果與所述基礎(chǔ)庫中當(dāng)前組數(shù)據(jù)的材料名稱的分詞結(jié)果匹配成功的分詞個數(shù);k2為所述待導(dǎo)入材料規(guī)格的分詞結(jié)果與所述基礎(chǔ)庫中當(dāng)前組數(shù)據(jù)的材料規(guī)格的分詞結(jié)果匹配成功的分詞個數(shù)J1為所述基礎(chǔ)庫中當(dāng)前組數(shù)據(jù)的材料名稱的分詞個數(shù);i2為所述基礎(chǔ)庫中當(dāng)前組數(shù)據(jù)的材料規(guī)格的分詞個數(shù)。
[0019]其中,步驟S4包括:
[0020]S401:將所述匹配率依次與第一閾值及第二閾值比較,所述第一閾值大于所述第二閾值;
[0021]S402:若當(dāng)前匹配率不小于所述第一閾值,則將所述待導(dǎo)入的材料名稱及材料規(guī)格導(dǎo)入所述當(dāng)前匹配率所對應(yīng)的I組數(shù)據(jù)中,并結(jié)束流程;
[0022]若所述當(dāng)前匹配率不大于所述第二閾值,則將所述待導(dǎo)入的材料名稱及材料規(guī)格作為新數(shù)據(jù)導(dǎo)入所述基礎(chǔ)庫中,并結(jié)束流程;
[0023]若所述當(dāng)前匹配率小于所述第一閾值且大于所述第二閾值,則執(zhí)行步驟S403 ;
[0024]S403:將所有匹配率進(jìn)行從大到小排序,將前N個匹配率所對應(yīng)的N組數(shù)據(jù)進(jìn)行顯示,所述N為不小于I的整數(shù);
[0025]S404:將所述待導(dǎo)入的材料名稱及材料規(guī)格導(dǎo)入從顯示的N組數(shù)據(jù)中所選擇I組數(shù)據(jù)中,并結(jié)束流程;或,
[0026]將所述待導(dǎo)入的材料名稱及材料規(guī)格作為新數(shù)據(jù)導(dǎo)入所述基礎(chǔ)庫中,并結(jié)束流
程。
[0027]本發(fā)明還公開了一種基于數(shù)據(jù)匹配的數(shù)據(jù)導(dǎo)入系統(tǒng),所述系統(tǒng)包括:
[0028]清單獲取模塊,用于獲取待導(dǎo)入的材料清單;
[0029]提取模塊,用于從所述待導(dǎo)入的材料清單中提取待導(dǎo)入的材料名稱及材料規(guī)格;
[0030]匹配率計算模塊,用于計算所述待導(dǎo)入材料名稱及材料規(guī)格與基礎(chǔ)庫中的每組數(shù)據(jù)之間的匹配率,所述基礎(chǔ)庫中的每組數(shù)據(jù)均包括:材料名稱及材料規(guī)格;
[0031]導(dǎo)入模塊,用于根據(jù)所述匹配率將所述待導(dǎo)入材料名稱及材料規(guī)格導(dǎo)入所述基礎(chǔ)庫中。
[0032]其中,所述系統(tǒng)還包括:
[0033]索引創(chuàng)建模塊,用于對所述基礎(chǔ)庫中每組數(shù)據(jù)均進(jìn)行分詞處理,并根據(jù)所述基礎(chǔ)庫中每組數(shù)據(jù)的分詞結(jié)果創(chuàng)建索引;
[0034]所述匹配率計算模塊包括:
[0035]分詞統(tǒng)計子模塊,用于對所述待導(dǎo)入材料名稱及材料規(guī)格進(jìn)行分詞處理,并將所述待導(dǎo)入材料名稱及材料規(guī)格的分詞結(jié)果與所述基礎(chǔ)庫中每組數(shù)據(jù)的分詞結(jié)果根據(jù)索引進(jìn)行檢索,統(tǒng)計所述基礎(chǔ)庫中每組數(shù)據(jù)的分詞結(jié)果中與所述待導(dǎo)入材料名稱及材料規(guī)格的分詞結(jié)果匹配成功的分詞個數(shù);
[0036]計算子模塊,用于根據(jù)下式計算所述匹配率P,
[0037]P = W^a+Wa^b
[0038]其中,W1= Iifn1 ;w2 = k2*n2 = A/11 ;n2 = A/i2 ;a+b = I ;a、b 均為權(quán)值、且0≤a≤1,0≤b≤I ;A為常數(shù)丸為所述待導(dǎo)入材料名稱的分詞結(jié)果與所述基礎(chǔ)庫中當(dāng)前組數(shù)據(jù)的材料名稱的分詞結(jié)果匹配成功的分詞個數(shù);k2為所述待導(dǎo)入材料規(guī)格的分詞結(jié)果與所述基礎(chǔ)庫中當(dāng)前組數(shù)據(jù)的材料規(guī)格的分詞結(jié)果匹配成功的分詞個數(shù)為所述基礎(chǔ)庫中當(dāng)前組數(shù)據(jù)的材料名稱的分詞個數(shù);i2為所述基礎(chǔ)庫中當(dāng)前組數(shù)據(jù)的材料規(guī)格的分詞個數(shù)。
[0039]其中,所述導(dǎo)入模塊包括:
[0040]比較子模塊,用于將所述匹配率依次與第一閾值及第二閾值比較,所述第一閾值大于所述第二閾值;
[0041]判斷子模塊,用于若當(dāng)前匹配率不小于所述第一閾值,則將所述待導(dǎo)入的材料名稱及材料規(guī)格導(dǎo)入所述當(dāng)前匹配率所對應(yīng)的I組數(shù)據(jù)中;
[0042]若所述當(dāng)前匹配率不大于所述第二閾值,則將所述待導(dǎo)入的材料名稱及材料規(guī)格作為新數(shù)據(jù)導(dǎo)入所述基礎(chǔ)庫中;
[0043]若所述當(dāng)前匹配率小于所述第一閾值且大于所述第二閾值;
[0044]排序顯示子模塊,用于將所有匹配率進(jìn)行從大到小排序,將前N個匹配率所對應(yīng)的N組數(shù)據(jù)進(jìn)行顯示,所述N為不小于I的整數(shù);
[0045]數(shù)據(jù)導(dǎo)入子模塊,用于將所述待導(dǎo)入的材料名稱及材料規(guī)格導(dǎo)入從顯示的N組數(shù)據(jù)中所選擇I組數(shù)據(jù)中;或,
[0046]將所述待導(dǎo)入的材料名稱及材料規(guī)格作為新數(shù)據(jù)導(dǎo)入所述基礎(chǔ)庫中。
[0047](三)有益效果
[0048]本發(fā)明通過計算匹配率,并根據(jù)匹配率將所述待導(dǎo)入材料名稱及材料規(guī)格導(dǎo)入基礎(chǔ)庫中,提高了數(shù)據(jù)錄入效率,并降低了錯誤率。
【專利附圖】
【附圖說明】
[0049]圖1是本發(fā)明一種實施方式的基于數(shù)據(jù)匹配的數(shù)據(jù)導(dǎo)入方法的流程框圖;
[0050]圖2是本發(fā)明一種實施例的基于數(shù)據(jù)匹配的數(shù)據(jù)導(dǎo)入方法的流程框圖;
[0051]圖3是本發(fā)明一種實施方式的基于數(shù)據(jù)匹配的數(shù)據(jù)導(dǎo)入系統(tǒng)的結(jié)構(gòu)框圖。
【具體實施方式】
[0052]下面結(jié)合附圖和實施例,對本發(fā)明的【具體實施方式】作進(jìn)一步詳細(xì)描述。以下實施例用于說明本發(fā)明,但不用來限制本發(fā)明的范圍。
[0053]圖1是本發(fā)明一種實施方式的基于數(shù)據(jù)匹配的數(shù)據(jù)導(dǎo)入方法的流程框圖;參照圖1,所述方法包括以下步驟:
[0054]S1:獲取待導(dǎo)入的材料清單;
[0055]S2:從所述待導(dǎo)入的材料清單中提取待導(dǎo)入的材料名稱及材料規(guī)格;
[0056]S3:計算所述待導(dǎo)入材料名稱及材料規(guī)格與基礎(chǔ)庫中的每組數(shù)據(jù)之間的匹配率,所述基礎(chǔ)庫中的每組數(shù)據(jù)均包括:材料名稱及材料規(guī)格;
[0057]S4:根據(jù)所述匹配率將所述待導(dǎo)入材料名稱及材料規(guī)格導(dǎo)入所述基礎(chǔ)庫中。
[0058]為保證匹配率計算效率和正確率,優(yōu)選地,步驟SI之前包括:
[0059]SO:對所述基礎(chǔ)庫中每組數(shù)據(jù)均進(jìn)行分詞處理,并根據(jù)所述基礎(chǔ)庫中每組數(shù)據(jù)的分詞結(jié)果創(chuàng)建索引;
[0060]步驟S3包括:[0061]S301:對所述待導(dǎo)入材料名稱及材料規(guī)格進(jìn)行分詞處理,并將所述待導(dǎo)入材料名稱及材料規(guī)格的分詞結(jié)果與所述基礎(chǔ)庫中每組數(shù)據(jù)的分詞結(jié)果根據(jù)索引進(jìn)行檢索,統(tǒng)計所述基礎(chǔ)庫中每組數(shù)據(jù)的分詞結(jié)果中與所述待導(dǎo)入材料名稱及材料規(guī)格的分詞結(jié)果匹配成功的分詞個數(shù);
[0062]S302:根據(jù)下式計算所述匹配率p,
[0063]P = Wi*a+W2*b
[0064]其中,W1= Iifn1 ;w2 = k2*n2 = A/11 ;n2 = A/i2 ;a+b = I ;a、b 均為權(quán)值、且0≤a≤1,0≤b≤I ;A為常數(shù)丸為所述待導(dǎo)入材料名稱的分詞結(jié)果與所述基礎(chǔ)庫中當(dāng)前組數(shù)據(jù)的材料名稱的分詞結(jié)果匹配成功的分詞個數(shù);k2為所述待導(dǎo)入材料規(guī)格的分詞結(jié)果與所述基礎(chǔ)庫中當(dāng)前組數(shù)據(jù)的材料規(guī)格的分詞結(jié)果匹配成功的分詞個數(shù)J1為所述基礎(chǔ)庫中當(dāng)前組數(shù)據(jù)的材料名稱的分詞個數(shù);i2為所述基礎(chǔ)庫中當(dāng)前組數(shù)據(jù)的材料規(guī)格的分詞個數(shù)。
[0065]為保證導(dǎo)入數(shù)據(jù)的正確性,優(yōu)選地,步驟S4包括:
[0066]S401:將所述匹配率依次與第一閾值及第二閾值比較,所述第一閾值大于所述第二閾值;
[0067]S402:若當(dāng)前匹配率不小于所述第一閾值,則將所述待導(dǎo)入的材料名稱及材料規(guī)格導(dǎo)入所述當(dāng)前匹 配率所對應(yīng)的I組數(shù)據(jù)中,并結(jié)束流程;
[0068]若所述當(dāng)前匹配率不大于所述第二閾值,則將所述待導(dǎo)入的材料名稱及材料規(guī)格作為新數(shù)據(jù)導(dǎo)入所述基礎(chǔ)庫中,并結(jié)束流程;
[0069]若所述當(dāng)前匹配率小于所述第一閾值且大于所述第二閾值,則執(zhí)行步驟S403 ;
[0070]S403:將所有匹配率進(jìn)行從大到小排序,將前N個匹配率所對應(yīng)的N組數(shù)據(jù)進(jìn)行顯示,所述N為不小于I的整數(shù);
[0071]S404:將所述待導(dǎo)入的材料名稱及材料規(guī)格導(dǎo)入從顯示的N組數(shù)據(jù)中所選擇I組數(shù)據(jù)中,并結(jié)束流程;或,
[0072]將所述待導(dǎo)入的材料名稱及材料規(guī)格作為新數(shù)據(jù)導(dǎo)入所述基礎(chǔ)庫中,并結(jié)束流程。
[0073]實施例
[0074]下面以一個具體的實施例來說明本發(fā)明,但不限定本發(fā)明的保護(hù)范圍。參照圖2,本實施例的方法包括以下步驟:
[0075]步驟一:對所述基礎(chǔ)庫中每組數(shù)據(jù)均進(jìn)行分詞處理,并根據(jù)所述基礎(chǔ)庫中每組數(shù)據(jù)的分詞結(jié)果創(chuàng)建索引;
[0076]步驟二:獲取待導(dǎo)入的材料清單;
[0077]步驟三:從所述待導(dǎo)入的材料清單中提取待導(dǎo)入的材料名稱及材料規(guī)格,本實施例中,所述材料清單為固定格式的文件,只需從文件的固定位置提取出待導(dǎo)入的材料名稱及材料規(guī)格即可;
[0078]步驟四:對所述待導(dǎo)入材料名稱及材料規(guī)格進(jìn)行分詞處理(本實施例中,根據(jù)MMSEG4J算法實現(xiàn)分詞),并將所述待導(dǎo)入材料名稱及材料規(guī)格的分詞結(jié)果與所述基礎(chǔ)庫中每組數(shù)據(jù)的分詞結(jié)果根據(jù)索引進(jìn)行檢索,統(tǒng)計所述基礎(chǔ)庫中每組數(shù)據(jù)的分詞結(jié)果中與所述待導(dǎo)入材料名稱及材料規(guī)格的分詞結(jié)果匹配成功的分詞個數(shù);[0079]步驟五:根據(jù)下式計算所述匹配率p,
[0080]P = w1a+w2*h
[0081]其中,W1= Iifn1 ;w2 = k2*n2 = A/11 ;n2 = A/i2 ;a+b =1 ;a、b 均為權(quán)值、且0≤a≤1,0≤b≤1 ;A為常數(shù)丸為所述待導(dǎo)入材料名稱的分詞結(jié)果與所述基礎(chǔ)庫中當(dāng)前組數(shù)據(jù)的材料名稱的分詞結(jié)果匹配成功的分詞個數(shù);k2為所述待導(dǎo)入材料規(guī)格的分詞結(jié)果與所述基礎(chǔ)庫中當(dāng)前組數(shù)據(jù)的材料規(guī)格的分詞結(jié)果匹配成功的分詞個數(shù)J1為所述基礎(chǔ)庫中當(dāng)前組數(shù)據(jù)的材料名稱的分詞個數(shù);i2為所述基礎(chǔ)庫中當(dāng)前組數(shù)據(jù)的材料規(guī)格的分詞個數(shù),本實施例中,a=b=50%, A= 100% ;
[0082]步驟六:將所述匹配率P依次與第一閾值及第二閾值比較,本實施例中,第一閾值為90%,第二閾值為30% ;
[0083]步驟七:若當(dāng)前匹配率不小于所述第一閾值,則將所述待導(dǎo)入的材料名稱及材料規(guī)格導(dǎo)入所述當(dāng)前匹配率所對應(yīng)的1組數(shù)據(jù)中,并結(jié)束流程;
[0084]若所述當(dāng)前匹配率不大于所述第二閾值,則將所述待導(dǎo)入的材料名稱及材料規(guī)格作為新數(shù)據(jù)導(dǎo)入所述基礎(chǔ)庫中,并結(jié)束流程;
[0085]若所述當(dāng)前匹配率小于所述第一閾值且大于所述第二閾值,則執(zhí)行步驟八;
[0086]步驟八:將所有匹配率進(jìn)行從大到小排序,將前N個匹配率所對應(yīng)的N組數(shù)據(jù)進(jìn)行顯示,本實施例中,所述N=1O ;
[0087]步驟九:將所述待導(dǎo)入的材料名稱及材料規(guī)格導(dǎo)入從顯示的10組數(shù)據(jù)中所選擇I組數(shù)據(jù)中,并結(jié)束流程;或,
[0088]將所述待導(dǎo)入的材料名稱及材料規(guī)格作為新數(shù)據(jù)導(dǎo)入所述基礎(chǔ)庫中,并結(jié)束流程。
[0089]步驟九中,可根據(jù)需要來選擇10組數(shù)據(jù)中的I組數(shù)據(jù),并將所述待導(dǎo)入的材料名稱及材料規(guī)格導(dǎo)入選擇的I組數(shù)據(jù)中,也可根據(jù)需要將所述待導(dǎo)入的材料名稱及材料規(guī)格作為新數(shù)據(jù)導(dǎo)入所述基礎(chǔ)庫中。
[0090]本發(fā)明還公開了一種基于數(shù)據(jù)匹配的數(shù)據(jù)導(dǎo)入系統(tǒng),參照圖3,所述系統(tǒng)包括:
[0091]清單獲取模塊,用于獲取待導(dǎo)入的材料清單;
[0092]提取模塊,用于從所述待導(dǎo)入的材料清單中提取待導(dǎo)入的材料名稱及材料規(guī)格;
[0093]匹配率計算模塊,用于計算所述待導(dǎo)入材料名稱及材料規(guī)格與基礎(chǔ)庫中的每組數(shù)據(jù)之間的匹配率,所述基礎(chǔ)庫中的每組數(shù)據(jù)均包括:材料名稱及材料規(guī)格;
[0094]導(dǎo)入模塊,用于根據(jù)所述匹配率將所述待導(dǎo)入材料名稱及材料規(guī)格導(dǎo)入所述基礎(chǔ)庫中。
[0095]優(yōu)選地,所述系統(tǒng)還包括:
[0096]索引創(chuàng)建模塊,用于對所述基礎(chǔ)庫中每組數(shù)據(jù)均進(jìn)行分詞處理,并根據(jù)所述基礎(chǔ)庫中每組數(shù)據(jù)的分詞結(jié)果創(chuàng)建索引;
[0097]所述匹配率計算模塊包括:
[0098]分詞統(tǒng)計子模塊,用于對所述待導(dǎo)入材料名稱及材料規(guī)格進(jìn)行分詞處理,并將所述待導(dǎo)入材料名稱及材料規(guī)格的分詞結(jié)果與所述基礎(chǔ)庫中每組數(shù)據(jù)的分詞結(jié)果根據(jù)索引進(jìn)行檢索,統(tǒng)計所述基礎(chǔ)庫中每組數(shù)據(jù)的分詞結(jié)果中與所述待導(dǎo)入材料名稱及材料規(guī)格的分詞結(jié)果匹配成功的分詞個數(shù);[0099]計算子模塊,用于根據(jù)下式計算所述匹配率P,
[0100]P = w^a+w2^h
[0101]其中,W1= Iifn1 ;w2 = k2*n2 = A/11 ;n2 = A/i2 ;a+b = I ;a、b 均為權(quán)值、且0≤a≤1,0≤b≤I ;A為常數(shù)丸為所述待導(dǎo)入材料名稱的分詞結(jié)果與所述基礎(chǔ)庫中當(dāng)前組數(shù)據(jù)的材料名稱的分詞結(jié)果匹配成功的分詞個數(shù);k2為所述待導(dǎo)入材料規(guī)格的分詞結(jié)果與所述基礎(chǔ)庫中當(dāng)前組數(shù)據(jù)的材料規(guī)格的分詞結(jié)果匹配成功的分詞個數(shù)J1為所述基礎(chǔ)庫中當(dāng)前組數(shù)據(jù)的材料名稱的分詞個數(shù);i2為所述基礎(chǔ)庫中當(dāng)前組數(shù)據(jù)的材料規(guī)格的分詞個數(shù)。
[0102]優(yōu)選地,所述導(dǎo)入模塊包括:
[0103]比較子模塊,用于將所述匹配率依次與第一閾值及第二閾值比較,所述第一閾值大于所述第二閾值;
[0104]判斷子模塊,用于若當(dāng)前匹配率不小于所述第一閾值,則將所述待導(dǎo)入的材料名稱及材料規(guī)格導(dǎo)入所述當(dāng)前匹配率所對應(yīng)的I組數(shù)據(jù)中;
[0105]若所述當(dāng)前匹配率不大于所述第二閾值,則將所述待導(dǎo)入的材料名稱及材料規(guī)格作為新數(shù)據(jù)導(dǎo)入所述基礎(chǔ)庫中;
[0106]若所述當(dāng)前匹配率小于所述第一閾值且大于所述第二閾值;
[0107]排序顯示子模塊,用于將所有匹配率進(jìn)行從大到小排序,將前N個匹配率所對應(yīng)的N組數(shù)據(jù)進(jìn)行顯示,所述N為不小于I的整數(shù);
[0108]數(shù)據(jù)導(dǎo)入子模塊,用于將所述待導(dǎo)入的材料名稱及材料規(guī)格導(dǎo)入從顯示的N組數(shù)據(jù)中所選擇I組數(shù)據(jù)中;或,
[0109]將所述待導(dǎo)入的材料名稱及材料規(guī)格作為新數(shù)據(jù)導(dǎo)入所述基礎(chǔ)庫中。
[0110]以上實施方式僅用于說明本發(fā)明,而并非對本發(fā)明的限制,有關(guān)【技術(shù)領(lǐng)域】的普通技術(shù)人員,在不脫離本發(fā)明的精神和范圍的情況下,還可以做出各種變化和變型,因此所有等同的技術(shù)方案也屬于本發(fā)明的范疇,本發(fā)明的專利保護(hù)范圍應(yīng)由權(quán)利要求限定。
【權(quán)利要求】
1.一種基于數(shù)據(jù)匹配的數(shù)據(jù)導(dǎo)入方法,其特征在于,所述方法包括以下步驟: S1:獲取待導(dǎo)入的材料清單; 52:從所述待導(dǎo)入的材料清單中提取待導(dǎo)入的材料名稱及材料規(guī)格; 53:計算所述待導(dǎo)入材料名稱及材料規(guī)格與基礎(chǔ)庫中的每組數(shù)據(jù)之間的匹配率,所述基礎(chǔ)庫中的每組數(shù)據(jù)均包括:材料名稱及材料規(guī)格; 54:根據(jù)所述匹配率將所述待導(dǎo)入材料名稱及材料規(guī)格導(dǎo)入所述基礎(chǔ)庫中。
2.如權(quán)利要求1所述的方法,其特征在于,步驟SI之前包括: SO:對所述基礎(chǔ)庫中每組數(shù)據(jù)均進(jìn)行分詞處理,并根據(jù)所述基礎(chǔ)庫中每組數(shù)據(jù)的分詞結(jié)果創(chuàng)建索引; 步驟S3包括: 5301:對所述待導(dǎo)入材料名稱及材料規(guī)格進(jìn)行分詞處理,并將所述待導(dǎo)入材料名稱及材料規(guī)格的分詞結(jié)果與所述基礎(chǔ)庫中每組數(shù)據(jù)的分詞結(jié)果根據(jù)索引進(jìn)行檢索,統(tǒng)計所述基礎(chǔ)庫中每組數(shù)據(jù)的分詞結(jié)果中與所述待導(dǎo)入材料名稱及材料規(guī)格的分詞結(jié)果匹配成功的分詞個數(shù); 5302:根據(jù)下式計算所述匹配率P,
P = Wi*a+W2*b 其中,W1 = I^n1 ;w2 = k2*n2 = A/11 ;n2 = A/i2 ;a+b = I ;a、b均為權(quán)值、且0 < I,0 ^ b ^ I ;A為常數(shù)丸為所述待導(dǎo)入材料名稱的分詞結(jié)果與所述基礎(chǔ)庫中當(dāng)前組數(shù)據(jù)的材料名稱的分詞結(jié)果匹配成功的分詞`個數(shù);k2為所述待導(dǎo)入材料規(guī)格的分詞結(jié)果與所述基礎(chǔ)庫中當(dāng)前組數(shù)據(jù)的材料規(guī)格的分詞結(jié)果匹配成功的分詞個數(shù)J1為所述基礎(chǔ)庫中當(dāng)前組數(shù)據(jù)的材料名稱的分詞個數(shù);i2為所述基礎(chǔ)庫中當(dāng)前組數(shù)據(jù)的材料規(guī)格的分詞個數(shù)。
3.如權(quán)利要求1所述的方法,其特征在于,步驟S4包括: 5401:將所述匹配率依次與第一閾值及第二閾值比較,所述第一閾值大于所述第二閾值; 5402:若當(dāng)前匹配率不小于所述第一閾值,則將所述待導(dǎo)入的材料名稱及材料規(guī)格導(dǎo)入所述當(dāng)前匹配率所對應(yīng)的I組數(shù)據(jù)中,并結(jié)束流程; 若所述當(dāng)前匹配率不大于所述第二閾值,則將所述待導(dǎo)入的材料名稱及材料規(guī)格作為新數(shù)據(jù)導(dǎo)入所述基礎(chǔ)庫中,并結(jié)束流程; 若所述當(dāng)前匹配率小于所述第一閾值且大于所述第二閾值,則執(zhí)行步驟S403 ; 5403:將所有匹配率進(jìn)行從大到小排序,將前N個匹配率所對應(yīng)的N組數(shù)據(jù)進(jìn)行顯示,所述N為不小于I的整數(shù); 5404:將所述待導(dǎo)入的材料名稱及材料規(guī)格導(dǎo)入從顯示的N組數(shù)據(jù)中所選擇I組數(shù)據(jù)中,并結(jié)束流程;或, 將所述待導(dǎo)入的材料名稱及材料規(guī)格作為新數(shù)據(jù)導(dǎo)入所述基礎(chǔ)庫中,并結(jié)束流程。
4.一種基于數(shù)據(jù)匹配的數(shù)據(jù)導(dǎo)入系統(tǒng),其特征在于,所述系統(tǒng)包括: 清單獲取模塊,用于獲取待導(dǎo)入的材料清單; 提取模塊,用于從所述待導(dǎo)入的材料清單中提取待導(dǎo)入的材料名稱及材料規(guī)格; 匹配率計算模塊,用于計算所述待導(dǎo)入材料名稱及材料規(guī)格與基礎(chǔ)庫中的每組數(shù)據(jù)之間的匹配率,所述基礎(chǔ)庫中的每組數(shù)據(jù)均包括:材料名稱及材料規(guī)格;導(dǎo)入模塊,用于根據(jù)所述匹配率將所述待導(dǎo)入材料名稱及材料規(guī)格導(dǎo)入所述基礎(chǔ)庫中。
5.如權(quán)利要求4所述的系統(tǒng),其特征在于,所述系統(tǒng)還包括: 索引創(chuàng)建模塊,用于對所述基礎(chǔ)庫中每組數(shù)據(jù)均進(jìn)行分詞處理,并根據(jù)所述基礎(chǔ)庫中每組數(shù)據(jù)的分詞結(jié)果創(chuàng)建索引; 所述匹配率計算模塊包括: 分詞統(tǒng)計子模塊,用于對所述待導(dǎo)入材料名稱及材料規(guī)格進(jìn)行分詞處理,并將所述待導(dǎo)入材料名稱及材料規(guī)格的分詞結(jié)果與所述基礎(chǔ)庫中每組數(shù)據(jù)的分詞結(jié)果根據(jù)索引進(jìn)行檢索,統(tǒng)計所述基礎(chǔ)庫中每組數(shù)據(jù)的分詞結(jié)果中與所述待導(dǎo)入材料名稱及材料規(guī)格的分詞結(jié)果匹配成功的分詞個數(shù); 計算子模塊,用于根據(jù)下式計算所述匹配率P,
P = Wi*a+W2*b 其中,W1 = I^n1 ;w2 = k2*n2 = A/11 ;n2 = A/i2 ;a+b = I ;a、b均為權(quán)值、且O < I,O ^ b ^ I ;A為常數(shù)丸為所述待導(dǎo)入材料名稱的分詞結(jié)果與所述基礎(chǔ)庫中當(dāng)前組數(shù)據(jù)的材料名稱的分詞結(jié)果匹配成功的分詞個數(shù);k2為所述待導(dǎo)入材料規(guī)格的分詞結(jié)果與所述基礎(chǔ)庫中當(dāng)前組數(shù)據(jù)的材料規(guī)格的分詞結(jié)果匹配成功的分詞個數(shù)J1為所述基礎(chǔ)庫中當(dāng)前組數(shù)據(jù)的材料名稱的分詞個數(shù);i2為所述基礎(chǔ)庫中當(dāng)前組數(shù)據(jù)的材料規(guī)格的分詞個數(shù)。
6.如權(quán)利要求4所述的系統(tǒng),其特征在于,所述導(dǎo)入模塊包括: 比較子模塊,用于將所述匹配率依次與第一閾值及第二閾值比較,所述第一閾值大于所述第二閾值; 判斷子模塊,用于若當(dāng)前匹配率不小于所述第一閾值,則將所述待導(dǎo)入的材料名稱及材料規(guī)格導(dǎo)入所述當(dāng)前匹配率所對應(yīng)的I組數(shù)據(jù)中; 若所述當(dāng)前匹配率不大于所述第二閾值,則將所述待導(dǎo)入的材料名稱及材料規(guī)格作為新數(shù)據(jù)導(dǎo)入所述基礎(chǔ)庫中; 若所述當(dāng)前匹配率小于所述第一閾值且大于所述第二閾值; 排序顯示子模塊,用于將所有匹配率進(jìn)行從大到小排序,將前N個匹配率所對應(yīng)的N組數(shù)據(jù)進(jìn)行顯示,所述N為不小于I的整數(shù); 數(shù)據(jù)導(dǎo)入子模塊,用于將所述 待導(dǎo)入的材料名稱及材料規(guī)格導(dǎo)入從顯示的N組數(shù)據(jù)中所選擇I組數(shù)據(jù)中;或, 將所述待導(dǎo)入的材料名稱及材料規(guī)格作為新數(shù)據(jù)導(dǎo)入所述基礎(chǔ)庫中。
【文檔編號】G06F17/30GK103761249SQ201310723640
【公開日】2014年4月30日 申請日期:2013年12月24日 優(yōu)先權(quán)日:2013年12月24日
【發(fā)明者】江春華, 羅新偉, 方文, 胡寶良, 陳顯龍, 劉強 申請人:北京恒華偉業(yè)科技股份有限公司