欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種翻譯錯(cuò)誤的數(shù)據(jù)分析方法

文檔序號(hào):6524892閱讀:242來(lái)源:國(guó)知局
一種翻譯錯(cuò)誤的數(shù)據(jù)分析方法
【專利摘要】本發(fā)明公開(kāi)了一種翻譯錯(cuò)誤的數(shù)據(jù)分析方法,包括:將每篇已翻譯文檔的錯(cuò)誤信息數(shù)據(jù)及若干影響因素組合,得到數(shù)據(jù)項(xiàng),將所有所述數(shù)據(jù)項(xiàng)進(jìn)行合并處理,得到多個(gè)數(shù)據(jù)集,建立事務(wù)數(shù)據(jù)庫(kù);所述事務(wù)數(shù)據(jù)庫(kù)中的每一條記錄對(duì)應(yīng)一個(gè)所述數(shù)據(jù)集;根據(jù)所述事務(wù)數(shù)據(jù)庫(kù)中的每條記錄,進(jìn)行關(guān)聯(lián)計(jì)算,得到所述數(shù)據(jù)項(xiàng)與所述影響因素的關(guān)聯(lián)規(guī)則。本發(fā)明通過(guò)對(duì)翻譯錯(cuò)誤與影響因素進(jìn)行關(guān)聯(lián)計(jì)算,提高了翻譯錯(cuò)誤與相關(guān)影響因素關(guān)聯(lián)的準(zhǔn)確性。
【專利說(shuō)明】一種翻譯錯(cuò)誤的數(shù)據(jù)分析方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種翻譯【技術(shù)領(lǐng)域】,具體而言,涉及一種翻譯錯(cuò)誤的數(shù)據(jù)分析方法。
【背景技術(shù)】
[0002]對(duì)于翻譯服務(wù)企業(yè),影響翻譯質(zhì)量的因素很多,翻譯服務(wù)企業(yè)需要從業(yè)務(wù)接洽、譯前準(zhǔn)備、翻譯、審校、編輯、檢驗(yàn)、客戶反饋以及文檔管理、責(zé)任和保密等各個(gè)方面進(jìn)行進(jìn)行規(guī)范。其中對(duì)翻譯質(zhì)量影響最大的因素就是譯文在翻譯過(guò)程中出現(xiàn)的各種形式的翻譯錯(cuò)誤。這些不同等級(jí)、類型的錯(cuò)誤,往往跟譯員、譯文、翻譯過(guò)程、翻譯質(zhì)量等諸多因素相關(guān),這些因素之間往往互相關(guān)聯(lián)、互相牽制、互為因果,如果能找出某些錯(cuò)誤的產(chǎn)生與哪些因素的內(nèi)在關(guān)系,將對(duì)于預(yù)防錯(cuò)誤的產(chǎn)生,改進(jìn)翻譯生產(chǎn)流程以提高翻譯質(zhì)量,有著很大的幫助,因此,對(duì)于提高翻譯錯(cuò)誤關(guān)聯(lián)的因素的準(zhǔn)確性一直是研究的重點(diǎn)。

【發(fā)明內(nèi)容】

[0003]本發(fā)明旨在提供一種翻譯錯(cuò)誤的數(shù)據(jù)分析方法,解決了如何提高翻譯錯(cuò)誤關(guān)聯(lián)的因素的準(zhǔn)確性的問(wèn)題。
[0004]本發(fā)明公開(kāi)了一種翻譯錯(cuò)誤的數(shù)據(jù)分析方法,包括:
[0005]將每篇已翻譯文檔的錯(cuò)誤信息數(shù)據(jù)及若干影響因素組合,得到數(shù)據(jù)項(xiàng),將所有所述數(shù)據(jù)項(xiàng)進(jìn)行合并處理,得到多個(gè)數(shù)據(jù)集,建立事務(wù)數(shù)據(jù)庫(kù);所述事務(wù)數(shù)據(jù)庫(kù)中的每一條記錄對(duì)應(yīng)一個(gè)所述數(shù)據(jù)集;
[0006]根據(jù)所述事務(wù)數(shù)據(jù)庫(kù)中的每條記錄,進(jìn)行關(guān)聯(lián)計(jì)算,得到所述錯(cuò)誤信息數(shù)據(jù)與所述影響因素的關(guān)聯(lián)規(guī)則。
[0007]優(yōu)選地,所述數(shù)據(jù)通過(guò)所述已翻譯文檔的錯(cuò)誤等級(jí)和錯(cuò)誤類型組合得到。
[0008]優(yōu)選地,一個(gè)所述影響因素為以下之一:譯員ID、譯員性別、譯員專業(yè)、譯員翻譯能力、譯員是否簽約、譯員所屬供應(yīng)商、譯員所屬供應(yīng)商規(guī)模、譯員合作次數(shù)、已翻譯文檔的類型、已翻譯文檔的翻譯方向、已翻譯文檔的翻譯難度、使用的輔助翻譯工具、審校次數(shù)和審校級(jí)別。
[0009]優(yōu)選地,所述合并處理包括:
[0010]將同一個(gè)所述譯員ID的數(shù)據(jù)項(xiàng)進(jìn)行歸集,得到所述數(shù)據(jù)集。
[0011]優(yōu)選地,所述關(guān)聯(lián)計(jì)算包括:
[0012]根據(jù)所述事務(wù)數(shù)據(jù)庫(kù)中的記錄,遞推出頻繁k+Ι項(xiàng)集,并計(jì)算所有得到的頻繁項(xiàng)集中的任一真子集與其補(bǔ)集的關(guān)聯(lián)程度,結(jié)果滿足置信度閥值要求,輸出所述關(guān)聯(lián)規(guī)則。
[0013]優(yōu)選地,所述遞推出頻繁k+Ι項(xiàng)集的過(guò)程包括:
[0014]掃描事務(wù)數(shù)據(jù)庫(kù),根據(jù)事務(wù)數(shù)據(jù)庫(kù)中的記錄中所述數(shù)據(jù)項(xiàng),得到所述事務(wù)數(shù)據(jù)庫(kù)中所有的I項(xiàng)集;
[0015]計(jì)算每個(gè)所述I項(xiàng)集的支持度,得到支持度不小于最小支持度閥值的頻繁I項(xiàng)集;[0016]通過(guò)頻繁k項(xiàng)集與頻繁I項(xiàng)集進(jìn)行無(wú)重復(fù)合并,生成支持度不小于最小支持度閥值的頻繁k+Ι項(xiàng)集。
[0017]優(yōu)選地,還包括:
[0018]每個(gè)所述I項(xiàng)集對(duì)應(yīng)著有一布爾數(shù)組,該布爾數(shù)組長(zhǎng)度為事務(wù)數(shù)據(jù)庫(kù)的記錄總數(shù),所述布爾數(shù)組的各個(gè)數(shù)位按照所述事務(wù)數(shù)據(jù)庫(kù)中的記錄的順序一一與所述事務(wù)數(shù)據(jù)庫(kù)的記錄對(duì)應(yīng);
[0019]若事務(wù)數(shù)據(jù)庫(kù)中的某條記錄包含該I項(xiàng)集中的項(xiàng),則將與該記錄對(duì)應(yīng)的數(shù)位上的邏輯值記為I;否則,記為O;
[0020]計(jì)算所述所有I項(xiàng)集的支持度,剔除支持度小于最小支持度閥值的所述I項(xiàng)集,得到所述頻繁I項(xiàng)集;
[0021]其中,布爾數(shù)組中“I”的個(gè)數(shù)與布爾數(shù)組的數(shù)位長(zhǎng)度之比作為所述支持度。
[0022]優(yōu)選地,還包括:
[0023]所述k+Ι項(xiàng)集及其對(duì)應(yīng)的布爾數(shù)組由頻繁K項(xiàng)集及其布爾數(shù)組和頻繁I項(xiàng)集及其布爾數(shù)組進(jìn)行無(wú)重復(fù)合并得到;
[0024]在所述無(wú)重復(fù)合并的過(guò)程中,頻繁k項(xiàng)集的布爾數(shù)組與頻繁I項(xiàng)集的布爾數(shù)組上的相同數(shù)位上的邏輯值進(jìn)行邏輯與運(yùn)算,得到候選頻繁k+Ι項(xiàng)集的布爾數(shù)組;
[0025]計(jì)算所述所有候選頻繁k+Ι項(xiàng)集的支持度;剔除支持度小于最小支持度閥值的所述k+Ι項(xiàng)集,得到所述頻繁k+Ι項(xiàng)集。
[0026]本發(fā)明中的翻譯錯(cuò)誤的數(shù)據(jù)分析方法,具有以下優(yōu)點(diǎn):
[0027]1、通過(guò)對(duì)錯(cuò)誤信息數(shù)據(jù)和影響因素進(jìn)行關(guān)聯(lián)計(jì)算,提高了錯(cuò)誤信息數(shù)據(jù)關(guān)聯(lián)的準(zhǔn)確性;
[0028]2、本發(fā)明對(duì)頻繁項(xiàng)集搜索和檢出的方法,只需在生成I項(xiàng)集表時(shí)掃描I次事務(wù)數(shù)據(jù)庫(kù)D,相比大部分其他關(guān)聯(lián)規(guī)則算法的多次讀取事務(wù)數(shù)據(jù)庫(kù)而言,大為減少了由于讀取事務(wù)數(shù)據(jù)庫(kù)而產(chǎn)生的IO開(kāi)銷;生成頻繁項(xiàng)集時(shí)不用先產(chǎn)生候選項(xiàng),頻繁k項(xiàng)集由頻繁I項(xiàng)集和頻繁k-Ι項(xiàng)集直接生成,相較于同樣只需一次掃描事務(wù)數(shù)據(jù)庫(kù)但需將事務(wù)數(shù)據(jù)庫(kù)壓縮到頻繁模式樹(shù)的FP-growth方法而言,有更少的內(nèi)存消耗;
[0029]3、本方法中通過(guò)采用布爾數(shù)組來(lái)進(jìn)行頻繁項(xiàng)集的挖掘,最大的計(jì)算消耗為“邏輯與”運(yùn)算,符合計(jì)算機(jī)的最底層的計(jì)算處理模式,由此設(shè)計(jì)出的軟件不但運(yùn)算速度快,對(duì)于cpu和內(nèi)存的消耗也最為節(jié)省。
【專利附圖】

【附圖說(shuō)明】
[0030]此處所說(shuō)明的附圖用來(lái)提供對(duì)本發(fā)明的進(jìn)一步理解,構(gòu)成本申請(qǐng)的一部分,本發(fā)明的示意性實(shí)施例及其說(shuō)明用于解釋本發(fā)明,并不構(gòu)成對(duì)本發(fā)明的不當(dāng)限定。在附圖中:[0031 ] 圖1示出了實(shí)施例的流程圖。
【具體實(shí)施方式】
[0032]下面將參考附圖并結(jié)合實(shí)施例,來(lái)詳細(xì)說(shuō)明本發(fā)明。
[0033]本實(shí)施例中提供了一種翻譯錯(cuò)誤的數(shù)據(jù)分析方法,包括:
[0034]將每篇已翻譯文檔的錯(cuò)誤信息數(shù)據(jù)及若干影響因素組合,得到數(shù)據(jù)項(xiàng),將所有所述數(shù)據(jù)項(xiàng)進(jìn)行合并處理,得到多個(gè)數(shù)據(jù)集,建立事務(wù)數(shù)據(jù)庫(kù);所述事務(wù)數(shù)據(jù)庫(kù)中的每一條記錄對(duì)應(yīng)一個(gè)所述數(shù)據(jù)集;
[0035]根據(jù)所述事務(wù)數(shù)據(jù)庫(kù)中的每條記錄,進(jìn)行關(guān)聯(lián)計(jì)算,得到所述數(shù)據(jù)項(xiàng)與所述影響因素的關(guān)聯(lián)規(guī)則。
[0036]實(shí)施例中的錯(cuò)誤信息數(shù)據(jù)是通過(guò)將翻譯的錯(cuò)誤等級(jí)和錯(cuò)誤類型組合得到;
[0037]錯(cuò)誤等級(jí)根據(jù)翻譯錯(cuò)誤的嚴(yán)重程度,從低到高分為5檔,分別為errUerrfArrf、err4、err50
[0038]錯(cuò)誤類型包括:排版錯(cuò)誤(prn)、邏輯錯(cuò)誤(log)、語(yǔ)法錯(cuò)誤(gra)、
[0039]句法錯(cuò)誤(syn)、單詞或術(shù)語(yǔ)錯(cuò)誤(ter)、直譯錯(cuò)誤(I it)、知識(shí)性錯(cuò)誤(inf)、專業(yè)錯(cuò)誤(pro)和責(zé)任錯(cuò)誤(Iib);
[0040]錯(cuò)誤信息數(shù)據(jù)的表示,例如錯(cuò)誤等級(jí)為5檔,錯(cuò)誤類型為排版錯(cuò)誤,則錯(cuò)誤信息數(shù)據(jù)為 err5.prn ;
[0041]一個(gè)所述影響因素為以下之一:譯員ID、譯員性別、譯員專業(yè)、譯員翻譯能力、譯員是否簽約、譯員所屬供應(yīng)商、譯員所屬供應(yīng)商規(guī)模、譯員合作次數(shù)、已翻譯文檔的類型、已翻譯文檔的翻譯方向、已翻譯文檔的翻譯難度、使用的輔助翻譯工具、審校次數(shù)和審校級(jí)別。
[0042]影響因素的表示,例如如下:
[0043]譯員ID:ΙΡ(η),η為譯員序號(hào);
[0044]譯員性別:男:male;女:female ;
[0045]專業(yè):譯員所學(xué)的專業(yè),以pro (η)表示;η為專業(yè)的序號(hào)。
[0046]翻譯能力:譯員具備的語(yǔ)種和行業(yè)學(xué)科領(lǐng)域的專業(yè)能力,這是個(gè)多項(xiàng)集,每個(gè)譯員可能有多項(xiàng)能力,以集合形式表示{capl、cap2...}。
[0047]是否簽約:表不該譯貝是否是簽約譯貝,簽約為sign,未簽約為not_sign。
[0048]所屬供應(yīng)商:該譯員所屬的翻譯公司,以sup (η)表示,η為翻譯公司序號(hào)。
[0049]供應(yīng)商規(guī)模:按供應(yīng)商的規(guī)模大小,50個(gè)譯員以上為大;50?20為中;20以下為小。分別對(duì)應(yīng) scalel、scale2、scale3。
[0050]譯員合作次數(shù):以col (η)表示,η為合作次數(shù)。
[0051]譯文類別:譯文類別為該譯文所屬的行業(yè)或?qū)W科領(lǐng)域類別,與譯員的能力項(xiàng)相對(duì)應(yīng),表示形式為icap(n),η為譯員類別序號(hào)。
[0052]譯文方向:表示譯文為哪個(gè)翻譯方向,即其源語(yǔ)種和目標(biāo)翻譯語(yǔ)種,如中到英表示為CN-EN,其他的類同。
[0053]譯文難度:表示該譯文翻譯的難易程度,分為5檔,從難到易為levl、lev2、lev3、lev4>lev5。
[0054]使用何種輔助翻譯工具:CAT(n)表示,η為輔助翻譯工具的序號(hào),其中η為O表示沒(méi)有使用輔助翻譯工具。
[0055]審校次數(shù):以chk(n)表示,η表示該譯文審校的次數(shù);
[0056]審校級(jí)別:以rev (η)表示,η表示審校的級(jí)別。
[0057]優(yōu)選地,所述合并處理包括:
[0058]將同一個(gè)所述譯員ID的數(shù)據(jù)項(xiàng)進(jìn)行歸集,得到所述數(shù)據(jù)集。[0059]優(yōu)選地,所述關(guān)聯(lián)計(jì)算包括:
[0060]根據(jù)所述事務(wù)數(shù)據(jù)庫(kù)中的記錄,遞推出頻繁k+Ι項(xiàng)集,并計(jì)算所有得到的頻繁項(xiàng)集中的任一真子集與其補(bǔ)集的關(guān)聯(lián)程度,結(jié)果滿足置信度閥值要求,輸出所述關(guān)聯(lián)規(guī)則。
[0061]優(yōu)選地,所述遞推出頻繁k+Ι項(xiàng)集的過(guò)程包括:
[0062]掃描事務(wù)數(shù)據(jù)庫(kù),根據(jù)事務(wù)數(shù)據(jù)庫(kù)中的記錄中所述數(shù)據(jù)項(xiàng),得到所述事務(wù)數(shù)據(jù)庫(kù)中所有的I項(xiàng)集;
[0063]計(jì)算每個(gè)所述I項(xiàng)集的支持度,得到支持度不小于最小支持度閥值的頻繁I項(xiàng)集;
[0064]通過(guò)頻繁k項(xiàng)集與頻繁I項(xiàng)集進(jìn)行無(wú)重復(fù)合并,生成支持度不小于最小支持度閥值的頻繁k+Ι項(xiàng)集。
[0065]優(yōu)選地,還包括:
[0066]每個(gè)所述I項(xiàng)集對(duì)應(yīng)著有一布爾數(shù)組,該布爾數(shù)組長(zhǎng)度為事務(wù)數(shù)據(jù)庫(kù)的記錄總數(shù),所述布爾數(shù)組的各個(gè)數(shù)位按照所述事務(wù)數(shù)據(jù)庫(kù)中的記錄的順序一一與所述事務(wù)數(shù)據(jù)庫(kù)的記錄對(duì)應(yīng);
[0067]若事務(wù)數(shù)據(jù)庫(kù)中的某條記錄包含該I項(xiàng)集中的項(xiàng),則將與該記錄對(duì)應(yīng)的數(shù)位上的邏輯值記為I;否則,記為O;
[0068]計(jì)算所述所有I項(xiàng)集的支持度,剔除支持度小于最小支持度閥值的所述I項(xiàng)集,得到所述頻繁I項(xiàng)集;
[0069]其中,布爾數(shù)組中“I”的個(gè)數(shù)與布爾數(shù)組的數(shù)位長(zhǎng)度之比作為所述支持度。
[0070]優(yōu)選地,還包括:
[0071]所述k+Ι項(xiàng)集及其對(duì)應(yīng)的布爾數(shù)組由頻繁K項(xiàng)集及其布爾數(shù)組和頻繁I項(xiàng)集及其布爾數(shù)組進(jìn)行無(wú)重復(fù)合并得到;
[0072]在所述無(wú)重復(fù)合并的過(guò)程中,頻繁k項(xiàng)集的布爾數(shù)組與頻繁I項(xiàng)集的布爾數(shù)組上的相同數(shù)位上的邏輯值進(jìn)行邏輯與運(yùn)算,得到候選頻繁k+Ι項(xiàng)集的布爾數(shù)組;
[0073]計(jì)算所述所有候選頻繁k+Ι項(xiàng)集的支持度;剔除支持度小于最小支持度閥值的所述k+Ι項(xiàng)集,得到所述頻繁k+Ι項(xiàng)集。
[0074]進(jìn)一步的,還本方案還提供一個(gè)優(yōu)選的實(shí)施例:
[0075]數(shù)據(jù)采集:
[0076]在翻譯生產(chǎn)過(guò)程中,會(huì)產(chǎn)生各種形式的錯(cuò)誤,本方法采集潛在的與產(chǎn)生翻譯錯(cuò)誤有關(guān)因素的數(shù)據(jù)信息。包括錯(cuò)誤的等級(jí)、錯(cuò)誤的類型,具體包括:錯(cuò)誤級(jí)別、排版錯(cuò)誤、單詞或術(shù)語(yǔ)錯(cuò)誤、語(yǔ)法錯(cuò)誤、直譯錯(cuò)誤、知識(shí)性錯(cuò)誤、邏輯錯(cuò)誤、專業(yè)錯(cuò)誤、人為粗心錯(cuò)誤、責(zé)任錯(cuò)誤、不可抗錯(cuò)誤(原文錯(cuò)誤);影響翻譯錯(cuò)誤產(chǎn)生的因素包括:譯員、譯文、翻譯過(guò)程等,具體包括:譯員等級(jí)、譯員所屬公司、譯員翻譯數(shù)量、是否平臺(tái)簽約譯員、譯員性別、譯文長(zhǎng)度、譯文難度、錯(cuò)誤所在段落特征、錯(cuò)誤所在句子特征、譯文翻譯速度、審校等級(jí)、審校所屬公司
坐寸ο
[0077]數(shù)據(jù)預(yù)處理:
[0078]將錯(cuò)誤信息數(shù)據(jù)和影響因素進(jìn)行表述,例如實(shí)施例1中的表示;
[0079]得到若干數(shù)據(jù)項(xiàng);
[0080]將得到的數(shù)據(jù)項(xiàng)按照譯員ID進(jìn)行合并,得到數(shù)據(jù)集;[0081]建立事務(wù)數(shù)據(jù)庫(kù):
[0082]通過(guò)對(duì)產(chǎn)生翻譯錯(cuò)誤潛在因素的數(shù)據(jù)信息進(jìn)行上述處理后,得到如下形式的事務(wù)數(shù)據(jù)庫(kù)記錄,如表1:
[0083]表1如下:
【權(quán)利要求】
1.一種翻譯錯(cuò)誤的數(shù)據(jù)分析方法,其特征在于,包括: 將每篇已翻譯文檔的錯(cuò)誤信息數(shù)據(jù)及若干影響因素組合,得到數(shù)據(jù)項(xiàng),將所有所述數(shù)據(jù)項(xiàng)進(jìn)行合并處理,得到多個(gè)數(shù)據(jù)集,建立事務(wù)數(shù)據(jù)庫(kù);所述事務(wù)數(shù)據(jù)庫(kù)中的每一條記錄對(duì)應(yīng)一個(gè)所述數(shù)據(jù)集; 根據(jù)所述事務(wù)數(shù)據(jù)庫(kù)中的每條記錄,進(jìn)行關(guān)聯(lián)計(jì)算,得到所述錯(cuò)誤信息數(shù)據(jù)與所述影響因素的關(guān)聯(lián)規(guī)則。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述數(shù)據(jù)通過(guò)所述已翻譯文檔的錯(cuò)誤等級(jí)和錯(cuò)誤類型組合得到。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,一個(gè)所述影響因素為以下之一:譯員ID、譯員性別、譯員專業(yè)、譯員翻譯能力、譯員是否簽約、譯員所屬供應(yīng)商、譯員所屬供應(yīng)商規(guī)模、譯員合作次數(shù)、已翻譯文檔的類型、已翻譯文檔的翻譯方向、已翻譯文檔的翻譯難度、使用的輔助翻譯工具、審校次數(shù)和審校級(jí)別。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述合并處理包括: 將同一個(gè)所述譯員ID的數(shù)據(jù)項(xiàng)進(jìn)行歸集,得到所述數(shù)據(jù)集。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述關(guān)聯(lián)計(jì)算包括: 根據(jù)所述事務(wù)數(shù)據(jù)庫(kù)中的記錄,遞推出頻繁k+Ι項(xiàng)集,并計(jì)算所有得到的頻繁項(xiàng)集中的任一真子集與其補(bǔ)集的關(guān)聯(lián)程度,結(jié)果滿足置信度閥值要求,輸出所述關(guān)聯(lián)規(guī)則。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述遞推出頻繁k+Ι項(xiàng)集的過(guò)程包括: 掃描事務(wù)數(shù)據(jù)庫(kù),根據(jù)事務(wù)數(shù)據(jù)庫(kù)中的記錄中所述數(shù)據(jù)項(xiàng),得到所述事務(wù)數(shù)據(jù)庫(kù)中所有的I項(xiàng)集; 計(jì)算每個(gè)所述I項(xiàng)集的支持度,得到支持度不小于最小支持度閥值的頻繁I項(xiàng)集; 通過(guò)頻繁k項(xiàng)集與頻繁I項(xiàng)集進(jìn)行無(wú)重復(fù)合并,生成支持度不小于最小支持度閥值的頻繁k+Ι項(xiàng)集。
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,還包括: 每個(gè)所述I項(xiàng)集對(duì)應(yīng)著有一布爾數(shù)組,該布爾數(shù)組長(zhǎng)度為事務(wù)數(shù)據(jù)庫(kù)的記錄總數(shù),所述布爾數(shù)組的各個(gè)數(shù)位按照所述事務(wù)數(shù)據(jù)庫(kù)中的記錄的順序一一與所述事務(wù)數(shù)據(jù)庫(kù)的記錄對(duì)應(yīng); 若事務(wù)數(shù)據(jù)庫(kù)中的某條記錄包含該I項(xiàng)集中的項(xiàng),則將與該記錄對(duì)應(yīng)的數(shù)位上的邏輯值記為I ;否則,記為O ; 計(jì)算所述所有I項(xiàng)集的支持度,剔除支持度小于最小支持度閥值的所述I項(xiàng)集,得到所述頻繁I項(xiàng)集; 其中,布爾數(shù)組中“I”的個(gè)數(shù)與布爾數(shù)組的數(shù)位長(zhǎng)度之比作為所述支持度。
8.根據(jù)權(quán)利要求7的方法,其特征在于,還包括: 所述k+Ι項(xiàng)集及其對(duì)應(yīng)的布爾數(shù)組由頻繁K項(xiàng)集及其布爾數(shù)組和頻繁I項(xiàng)集及其布爾數(shù)組進(jìn)行無(wú)重復(fù)合并得到; 在所述無(wú)重復(fù)合并的過(guò)程中,頻繁k項(xiàng)集的布爾數(shù)組與頻繁I項(xiàng)集的布爾數(shù)組上的相同數(shù)位上的邏輯值進(jìn)行邏輯與運(yùn)算,得到候選頻繁k+Ι項(xiàng)集的布爾數(shù)組; 計(jì)算所述所有候選頻繁k+Ι項(xiàng)集的支持度;剔除支持度小于最小支持度閥值的所述k+Ι項(xiàng)集,得到所述頻繁k+Ι項(xiàng)集。
【文檔編號(hào)】G06F17/28GK103744842SQ201310713987
【公開(kāi)日】2014年4月23日 申請(qǐng)日期:2013年12月23日 優(yōu)先權(quán)日:2013年12月23日
【發(fā)明者】江潮 申請(qǐng)人:武漢傳神信息技術(shù)有限公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
庆元县| 河南省| 东光县| 明水县| 左权县| 永嘉县| 包头市| 建湖县| 万载县| 安国市| 建水县| 泰顺县| 武川县| 高邮市| 泉州市| 伊金霍洛旗| 调兵山市| 讷河市| 山阴县| 三亚市| 兰溪市| 修水县| 康定县| 黎平县| 甘洛县| 嵩明县| 桐城市| 新乡市| 穆棱市| 二手房| 平泉县| 舟山市| 阿拉尔市| 浦城县| 建水县| 五华县| 平阴县| 景德镇市| 名山县| 池州市| 景宁|