欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

大數(shù)據(jù)資產(chǎn)評(píng)估方法與流程

文檔序號(hào):12672865閱讀:2442來源:國知局

本發(fā)明涉及資產(chǎn)評(píng)估技術(shù)領(lǐng)域,特別涉及一種數(shù)據(jù)資產(chǎn)的評(píng)估方法。



背景技術(shù):

考慮到不同行業(yè)的數(shù)據(jù)價(jià)值不同,而稅收可以判斷企業(yè)交易金額的大小,故根據(jù)稅務(wù)年鑒等資料,將數(shù)據(jù)按行業(yè)分為:

(1)農(nóng)業(yè)數(shù)據(jù)

(2)采礦業(yè)數(shù)據(jù)

(3)制造業(yè)數(shù)據(jù)

(4)電力、熱力、燃?xì)饧八纳a(chǎn)和供應(yīng)業(yè)數(shù)據(jù)

(5)建筑業(yè)數(shù)據(jù)

(6)批發(fā)和零售業(yè)數(shù)據(jù)

(7)交通運(yùn)輸、倉儲(chǔ)和郵政業(yè)數(shù)據(jù)

(8)住宿和餐飲業(yè)數(shù)據(jù)

(9)信息傳輸、軟件和信息技術(shù)服務(wù)業(yè)

(10)金融業(yè)數(shù)據(jù)

(11)房地產(chǎn)業(yè)數(shù)據(jù)

(12)租賃和商業(yè)服務(wù)業(yè)數(shù)據(jù)

(13)教育數(shù)據(jù)

(14)衛(wèi)生和社會(huì)工作數(shù)據(jù)

(15)文化、體育和娛樂業(yè)數(shù)據(jù)

(16)公共管理、社會(huì)保障和社會(huì)組織數(shù)據(jù)

(17)其他行業(yè)數(shù)據(jù)

我們知道,每個(gè)數(shù)據(jù)文件通常包括多種信息,故按數(shù)據(jù)內(nèi)容又可將數(shù)據(jù)分為:

(1)交易數(shù)據(jù)

(2)個(gè)人信息

(3)商品(服務(wù))信息

(4)生產(chǎn)管理數(shù)據(jù)

(5)用戶評(píng)價(jià)數(shù)據(jù)

(6)社交網(wǎng)絡(luò)數(shù)據(jù)

其中,個(gè)人信息包括供應(yīng)方信息和消費(fèi)方信息。值得注意的是,每個(gè)數(shù)據(jù)文件包含上述六類數(shù)據(jù)中的一類或多類數(shù)據(jù)。

近年來,隨著“大數(shù)據(jù)”這個(gè)詞匯頻頻出現(xiàn)在我們的生活中,數(shù)據(jù)資產(chǎn)的評(píng)估問題也成為社會(huì)熱點(diǎn)問題。目前關(guān)于數(shù)據(jù)資產(chǎn)的研究還不夠完善??紤]到無形資產(chǎn)的評(píng)估在國內(nèi)已取得一定的研究成果,因而數(shù)據(jù)資產(chǎn)作為一種特殊的無形資產(chǎn),其價(jià)值評(píng)估可以與普通無形資產(chǎn)價(jià)值評(píng)估聯(lián)系起來。孫榮玲等首先提出對(duì)無形資產(chǎn)的價(jià)值及價(jià)值實(shí)現(xiàn)的量化方面進(jìn)行研究,但傳統(tǒng)的評(píng)估方法比較粗糙;而后陳昌云提出Black-Scholes期權(quán)定價(jià)模型和EVA方法,并把它引入到對(duì)企業(yè)整體價(jià)值的評(píng)估中,模型更精確,但是未考慮到不同企業(yè)之間的差距;而后專家學(xué)者不斷研究探討,形成了一套較為完善的無形資產(chǎn)評(píng)估體系,主要有收益法、市場(chǎng)法、和成本法,但是數(shù)據(jù)資產(chǎn)的評(píng)估標(biāo)準(zhǔn)和要素與這幾種方法依然存在沖突,因此,不能將這些方法完全應(yīng)用到數(shù)據(jù)資產(chǎn)中去;與此同時(shí),數(shù)據(jù)資產(chǎn)價(jià)值定義不統(tǒng)一性,數(shù)據(jù)資產(chǎn)價(jià)值評(píng)估模型或參考模型與系統(tǒng)的數(shù)據(jù)資產(chǎn)價(jià)值評(píng)估維度的缺乏以及數(shù)據(jù)資產(chǎn)的評(píng)估缺少一個(gè)具體的量化標(biāo)準(zhǔn),這給研究人員帶來了更多困難。

另外,數(shù)據(jù)評(píng)估對(duì)于不同類別來說重要性不同,將其模糊地視作一類,分析結(jié)果顯得有些脫離實(shí)際,與社會(huì)對(duì)數(shù)據(jù)的實(shí)際需求相悖。除此之外,數(shù)據(jù)資產(chǎn)的評(píng)估結(jié)構(gòu)應(yīng)考慮更多的方面,過去的研究在結(jié)構(gòu)上也存在不足。



技術(shù)實(shí)現(xiàn)要素:

有鑒于此,本發(fā)明的目的是針對(duì)過去方法的不足,提出一種新的數(shù)據(jù)資產(chǎn)的評(píng)估方法。

本發(fā)明大數(shù)據(jù)資產(chǎn)評(píng)估方法,其特征在于,包括:

一、數(shù)據(jù)質(zhì)量評(píng)估,包括:

1、數(shù)據(jù)準(zhǔn)確率的計(jì)算

首先從數(shù)據(jù)表中分別抽樣得到訓(xùn)練集、檢驗(yàn)集和準(zhǔn)確率預(yù)測(cè)集,每次針對(duì)訓(xùn)練集中的一個(gè)可預(yù)測(cè)屬性f,設(shè)定其為類標(biāo)號(hào),訓(xùn)練得到一個(gè)分類器,并通過檢驗(yàn)集進(jìn)行性能檢測(cè);然后用此分類器對(duì)預(yù)測(cè)集中的每個(gè)元組的該屬性f的值進(jìn)行預(yù)測(cè),預(yù)測(cè)值和實(shí)際值一致(對(duì)于數(shù)值屬性,其差異不超出一定的閾值,如標(biāo)準(zhǔn)差)則認(rèn)為該屬性值為正確的,而準(zhǔn)確預(yù)測(cè)的元組比率即為數(shù)據(jù)表關(guān)于該屬性的準(zhǔn)確率af。對(duì)數(shù)據(jù)表中的每個(gè)屬性重復(fù)這一過程,得到每個(gè)屬性的準(zhǔn)確率aj

其中j=1、2、…、m,m為可預(yù)測(cè)屬性的個(gè)數(shù);

其中,nt為預(yù)測(cè)集中的元組數(shù),nrj為預(yù)測(cè)集中被正確分類的元組數(shù);計(jì)算這些aj的加權(quán)算術(shù)平均值得到數(shù)據(jù)表的綜合準(zhǔn)確率A,即:

其中,j為被預(yù)測(cè)屬性的編號(hào),wfj為屬性j的權(quán)重,其值可以根據(jù)屬性j的取值范圍和離散程度來決定,因?yàn)閷傩匀≈捣秶酱?、離散程度越高,其預(yù)測(cè)的準(zhǔn)確率越低,賦予的權(quán)重應(yīng)越??;權(quán)重的計(jì)算公式為:

其中,hj為屬性j的熵,熵代表了屬性取值范圍的大小和離散程度的高低,其計(jì)算公式為:

其中,v為取值的個(gè)數(shù),pf為屬性取第f個(gè)值的概率;

最后整個(gè)數(shù)據(jù)集的總準(zhǔn)確率為:

其中,wti為表i的權(quán)重,t為被評(píng)估數(shù)據(jù)集中表的總個(gè)數(shù);權(quán)重的公式為:

其中,nti為表i的元組數(shù),nfi為整個(gè)數(shù)據(jù)集的屬性數(shù),nt為整個(gè)數(shù)據(jù)集的元組數(shù),nf為整個(gè)數(shù)據(jù)集的屬性數(shù);

2、數(shù)據(jù)完整度I的計(jì)算

其中,nnull為缺失或?yàn)閚ull的數(shù)據(jù)項(xiàng)個(gè)數(shù),nitem為數(shù)據(jù)項(xiàng)總個(gè)數(shù);

3、數(shù)據(jù)一致度C的計(jì)算

此公式以數(shù)據(jù)集中一個(gè)數(shù)據(jù)庫為考察對(duì)象,其中,Ci為被評(píng)估數(shù)據(jù)集第i個(gè)數(shù)據(jù)庫的一致度;fni為第i個(gè)數(shù)據(jù)庫中總屬性數(shù),nname為第i個(gè)數(shù)據(jù)庫中命名約定不一致的屬性數(shù),ncode為第i個(gè)數(shù)據(jù)庫中所用數(shù)據(jù)代碼不一致的屬性數(shù),nform為第i個(gè)數(shù)據(jù)庫中輸入字段的格式不一致的屬性數(shù),L為被評(píng)估數(shù)據(jù)集中包含的數(shù)據(jù)庫的個(gè)數(shù),Wi為第i個(gè)數(shù)據(jù)庫的權(quán)重;

4、數(shù)據(jù)時(shí)間價(jià)值T的計(jì)算

其中,tp表示信息發(fā)布的時(shí)間,tc表示當(dāng)前的時(shí)間,C(tc,tp)表示信息在tc時(shí)刻的影響力大小,即tc時(shí)刻的時(shí)間價(jià)值,a代表的是信息的老化率系數(shù),老化率系數(shù)a設(shè)置為0.1;

5、通過公式評(píng)估數(shù)據(jù)質(zhì)量

其中,Qi是按照數(shù)據(jù)內(nèi)容分類的第i類數(shù)據(jù)的數(shù)據(jù)質(zhì)量因子;

二、數(shù)據(jù)規(guī)模評(píng)估,包括:

1、數(shù)據(jù)屬性數(shù)的計(jì)算

1)數(shù)值數(shù)據(jù)的屬性數(shù)計(jì)算

(1)通過公式計(jì)算數(shù)值屬性A和B的相關(guān)系數(shù)rA,B,

其中,n是數(shù)據(jù)元組的個(gè)數(shù),ai和bi分別是元組i在A和B上值,和分別是A和B的均值,σA和σB分別是A和B的標(biāo)準(zhǔn)差;

(2)在得到相關(guān)系數(shù)后,對(duì)數(shù)值數(shù)據(jù)的屬性數(shù)進(jìn)行壓縮,得到各屬性的屬性數(shù)之和;

2)標(biāo)稱、分類數(shù)據(jù)的屬性數(shù)計(jì)算

(1)通過χ2檢驗(yàn)來判斷相關(guān)性;

其中,oij是聯(lián)合事件(Ai,Bj)的觀測(cè)頻度,而eij是(Ai,Bj)的期望頻度;

其中,n是數(shù)據(jù)元組的個(gè)數(shù),count(A=ai)是A上值為ai的元組個(gè)數(shù),count(B=bi)是B上值為bi的元組個(gè)數(shù);χ2統(tǒng)計(jì)檢驗(yàn)假設(shè)A和B獨(dú)立,基于檢驗(yàn)水平,具有自由度(R-1)×(C-1);通過上述公式計(jì)算χ2的值,再與χ2檢驗(yàn)的拒絕域比較,則可判段兩個(gè)屬性的相關(guān)性;

根據(jù)多次計(jì)算檢驗(yàn),得到自相關(guān)的情況下χ2=n,故在χ2>10.828的前提下,可將rA,B作為兩個(gè)屬性之間的相關(guān)度,公式如下:

其中,R,C是分類變量的類別數(shù);

(2)在得到相關(guān)系數(shù)后,對(duì)數(shù)值數(shù)據(jù)的屬性數(shù)進(jìn)行壓縮,屬性壓縮步驟:

①構(gòu)建相關(guān)系數(shù)矩陣

其中,rij=為屬性fi和fj的相關(guān)度,Ri為屬性fi與其他屬性相關(guān)性的總和,

②將R矩陣的行按Ri從大到小的順序排序,得到

③增加一列f0代表單個(gè)屬性初始規(guī)?;鶞?zhǔn)

④壓縮矩陣得到

⑤將對(duì)角線上的元素相加就得到壓縮后的屬性個(gè)數(shù)

fnc=r′11+r′22+…+r′nn

2、直接統(tǒng)計(jì)得到數(shù)據(jù)表中的數(shù)據(jù)元組個(gè)數(shù);tnj;

3、單位信息量的計(jì)算

(1)離散型屬性的信息熵計(jì)算公式為:

其中,P(xi)是每個(gè)屬性值出現(xiàn)的概率;

(2)連續(xù)型屬性的信息熵的計(jì)算:

先選擇一種離散化方法對(duì)其離散化以后,再按離散型屬性信息熵的計(jì)算公式進(jìn)行計(jì)算;

(3)得到每個(gè)屬性的信息熵后,求出屬性的平均信息熵:

fn為壓縮前單個(gè)數(shù)據(jù)表的屬性數(shù);

于是得到單個(gè)數(shù)據(jù)表規(guī)模的計(jì)算公式:

其中,S為某一張數(shù)據(jù)表的數(shù)據(jù)規(guī)模衡量因子(單位為bit),fnc為此數(shù)據(jù)表壓縮后的數(shù)據(jù)屬性數(shù),tn為此數(shù)據(jù)表的元組數(shù),為所有屬性的平均信息熵;

三、數(shù)據(jù)內(nèi)容評(píng)估

采用AHP三標(biāo)度法構(gòu)造一個(gè)比較矩陣B=(bij)n×n,bij為同一層次上元素比較所得標(biāo)度取值,具體為

用下式計(jì)算各元素的重要性排序指數(shù):

記rmax=MAX{ri},rmin=MIN{ri},bm=rmax/rmin,求出判斷矩陣C=(cij)n×n:

從而得到

得到判斷矩陣后,按以下步驟計(jì)算和檢驗(yàn):

(1)用方根法計(jì)算權(quán)重,公式如下:

計(jì)算步驟:①將C的元素按行相乘得一新向量,

②將新向量的每個(gè)分量開n次方,

③將所得向量歸一化即為權(quán)重向量;

(2)計(jì)算一致性指標(biāo)CI

其中,λmax為判斷矩陣C的最大特征值;

(3)查找一致性指標(biāo)RI

(4)計(jì)算一致性比例CR

當(dāng)CR<0.10時(shí),認(rèn)為判斷矩陣的一致性是可以接受的,否則應(yīng)對(duì)判斷矩陣作適量修正;由此,得到以內(nèi)容分類的每類數(shù)據(jù)的權(quán)重;

四、行業(yè)價(jià)值計(jì)算

1、取稅收收入最高的行業(yè),將其價(jià)值分?jǐn)?shù)定為100;

2、將其他行業(yè)的稅收與最高的行業(yè)稅收相除,再乘以100,得到其他行業(yè)的行業(yè)價(jià)值;

五、數(shù)據(jù)資產(chǎn)價(jià)值計(jì)算

1、將數(shù)據(jù)質(zhì)量因子Qij、數(shù)據(jù)規(guī)模因子Sij以及按內(nèi)容分類的權(quán)重Wi相乘,如果第i類數(shù)據(jù)包含多張數(shù)據(jù)表,則先計(jì)算單張數(shù)據(jù)表,再將這幾張數(shù)據(jù)表的結(jié)果累加;

2、按內(nèi)容分類的每類均按上述計(jì)算方法進(jìn)行計(jì)算,得到的結(jié)果依次累加;

3、將累加的結(jié)果與計(jì)算得到的行業(yè)價(jià)值相乘得到數(shù)據(jù)資產(chǎn)的價(jià)值分?jǐn)?shù)V;

價(jià)值分?jǐn)?shù)

4、通過價(jià)值分?jǐn)?shù)V評(píng)估數(shù)據(jù)資產(chǎn)價(jià)值。

本發(fā)明的有益效果:

本發(fā)明大數(shù)據(jù)資產(chǎn)評(píng)估方法,其為數(shù)據(jù)資產(chǎn)的評(píng)估提供了具體的量化標(biāo)準(zhǔn),使評(píng)判過程更簡單明晰,消除了評(píng)判者的主觀因素影響,使評(píng)判結(jié)果與實(shí)際更相符合。

附圖說明

圖1為數(shù)據(jù)資產(chǎn)價(jià)值評(píng)估總體結(jié)構(gòu)圖。

具體實(shí)施方式

下面結(jié)合附圖和實(shí)施例對(duì)本發(fā)明作進(jìn)一步描述。

本實(shí)施例大數(shù)據(jù)資產(chǎn)評(píng)估方法,包括:

一、數(shù)據(jù)質(zhì)量評(píng)估,包括:

1、數(shù)據(jù)準(zhǔn)確率的計(jì)算,數(shù)據(jù)準(zhǔn)確率描述數(shù)據(jù)是否與其對(duì)應(yīng)的客觀實(shí)體的特征相一致;

首先從數(shù)據(jù)表中分別抽樣得到訓(xùn)練集、檢驗(yàn)集和準(zhǔn)確率預(yù)測(cè)集,每次針對(duì)訓(xùn)練集中的一個(gè)可預(yù)測(cè)屬性f,設(shè)定其為類標(biāo)號(hào),訓(xùn)練得到一個(gè)分類器,并通過檢驗(yàn)集進(jìn)行性能檢測(cè);然后用此分類器對(duì)預(yù)測(cè)集中的每個(gè)元組的該屬性f的值進(jìn)行預(yù)測(cè),預(yù)測(cè)值和實(shí)際值一致,對(duì)于數(shù)值屬性,其差異不超出一定的閾值,則認(rèn)為該屬性值為正確的,而準(zhǔn)確預(yù)測(cè)的元組比率即為數(shù)據(jù)表關(guān)于該屬性的準(zhǔn)確率af,對(duì)數(shù)據(jù)表中的每個(gè)屬性重復(fù)這一過程,得到每個(gè)屬性的準(zhǔn)確率aj;

其中j=1、2、…、m,m為可預(yù)測(cè)屬性的個(gè)數(shù);

其中,nt為預(yù)測(cè)集中的元組數(shù),nrj為預(yù)測(cè)集中被正確分類的元組數(shù);其中分類算法可以自行選擇(如:決策樹歸納C4.5,CART等);

計(jì)算這些aj的加權(quán)算術(shù)平均值得到數(shù)據(jù)表的綜合準(zhǔn)確率A,即;

其中,j為被預(yù)測(cè)屬性的編號(hào),wfj為屬性j的權(quán)重,其值可以根據(jù)屬性j的取值范圍和離散程度來決定,因?yàn)閷傩匀≈捣秶酱?、離散程度越高,其預(yù)測(cè)的準(zhǔn)確率越低,賦予的權(quán)重應(yīng)越??;權(quán)重的計(jì)算公式為:

其中,hj為屬性j的熵,熵代表了屬性取值范圍的大小和離散程度的高低,其計(jì)算公式為:

其中,v為取值的個(gè)數(shù),pf為屬性取第f個(gè)值的概率;

最后整個(gè)數(shù)據(jù)集的總準(zhǔn)確率為:

其中,wti為表i的權(quán)重,t為被評(píng)估數(shù)據(jù)集中表的總個(gè)數(shù)。權(quán)重的公式為:

其中,nti為表i的元組數(shù),nfi為整個(gè)數(shù)據(jù)集的屬性數(shù),nt為整個(gè)數(shù)據(jù)集的元組數(shù),nf為整個(gè)數(shù)據(jù)集的屬性數(shù);

可預(yù)測(cè)屬性:有些屬性的取值范圍很大且具有一定的隨意性,其中有些信息往往涉及到個(gè)人的隱私,在涉及大數(shù)據(jù)交易和分析的應(yīng)用中一般需要進(jìn)行脫敏處理,如:姓名、電話號(hào)碼、住址等;有些則沒有實(shí)際含義,如:元組ID、一些項(xiàng)目編碼等,對(duì)這類屬性評(píng)估其準(zhǔn)確性沒有必要,稱為不可預(yù)測(cè)屬性,其他稱為可預(yù)測(cè)屬性;

2、數(shù)據(jù)完整度I的計(jì)算,數(shù)據(jù)完整度I描述數(shù)據(jù)是否存在缺失記錄或缺失字段,

其中,nnull為缺失或?yàn)閚ull的數(shù)據(jù)項(xiàng)個(gè)數(shù),nitem為數(shù)據(jù)項(xiàng)總個(gè)數(shù);

3、數(shù)據(jù)一致度C的計(jì)算,數(shù)據(jù)一致度描述同一實(shí)體的同一屬性的值在不同的系統(tǒng)或數(shù)據(jù)集中是否一致;

此公式以數(shù)據(jù)集中一個(gè)數(shù)據(jù)庫為考察對(duì)象,其中,Ci為被評(píng)估數(shù)據(jù)集第i個(gè)數(shù)據(jù)庫的一致度;fni為第i個(gè)數(shù)據(jù)庫中總屬性數(shù),nname為第i個(gè)數(shù)據(jù)庫中命名約定不一致的屬性數(shù),ncode為第i個(gè)數(shù)據(jù)庫中所用數(shù)據(jù)代碼不一致的屬性數(shù),nform為第i個(gè)數(shù)據(jù)庫中輸入字段的格式不一致的屬性數(shù),L為被評(píng)估數(shù)據(jù)集中包含的數(shù)據(jù)庫的個(gè)數(shù),Wi為第i個(gè)數(shù)據(jù)庫的權(quán)重;

4、數(shù)據(jù)時(shí)間價(jià)值(T)的計(jì)算

其中,tp表示信息發(fā)布的時(shí)間,tc表示當(dāng)前的時(shí)間,C(tc,tp)表示信息在tc時(shí)刻的影響力大小,即tc時(shí)刻的時(shí)間價(jià)值,a代表的是信息的老化率系數(shù),老化率系數(shù)a設(shè)置為0.1;

5、通過公式評(píng)估數(shù)據(jù)質(zhì)量

其中,Qi是按照數(shù)據(jù)內(nèi)容分類的第i類數(shù)據(jù)的數(shù)據(jù)質(zhì)量因子;

二、數(shù)據(jù)規(guī)模評(píng)估,包括:

1、數(shù)據(jù)屬性數(shù)的計(jì)算,數(shù)據(jù)屬性又稱字段,大多數(shù)時(shí),表的列稱為字段,每個(gè)字段包含某一專題的信息;

1)數(shù)值數(shù)據(jù)的屬性數(shù)計(jì)算

(1)通過公式計(jì)算數(shù)值屬性A和B的相關(guān)系數(shù)rAB,

其中,n是數(shù)據(jù)元組的個(gè)數(shù),ai和bi分別是元組i在A和B上值,和分別是A和B的均值,σA和σB分別是A和B的標(biāo)準(zhǔn)差;

(2)在得到相關(guān)系數(shù)后,對(duì)數(shù)值數(shù)據(jù)的屬性數(shù)進(jìn)行壓縮,得到各屬性的屬性數(shù)之和;

2)標(biāo)稱、分類數(shù)據(jù)的屬性數(shù)計(jì)算

(1)通過χ2檢驗(yàn)來判斷相關(guān)性;

其中,oij是聯(lián)合事件(Ai,Bj)的觀測(cè)頻度,而eij是(Ai,Bj)的期望頻度;

其中,n是數(shù)據(jù)元組的個(gè)數(shù),count(A=ai)是A上值為ai的元組個(gè)數(shù),count(B=bi)是B上值為bi的元組個(gè)數(shù);χ2統(tǒng)計(jì)檢驗(yàn)假設(shè)A和B獨(dú)立,基于檢驗(yàn)水平,具有自由度(R-1)×(C-1);通過上述公式計(jì)算χ2的值,再與χ2檢驗(yàn)的拒絕域比較,則可判段兩個(gè)屬性的相關(guān)性;

根據(jù)多次計(jì)算檢驗(yàn),得到自相關(guān)的情況下χ2=n,故在χ2>10.828的前提下,可將rA,B作為兩個(gè)屬性之間的相關(guān)度,公式如下:

其中,R,C是分類變量的類別數(shù);

(2)在得到相關(guān)系數(shù)后,對(duì)數(shù)值數(shù)據(jù)的屬性數(shù)進(jìn)行壓縮,屬性壓縮步驟:

①構(gòu)建相關(guān)系數(shù)矩陣

其中,rij=為屬性fi和fj的相關(guān)度,Ri為屬性fi與其他屬性相關(guān)性的總和,

②將R矩陣的行按Ri從大到小的順序排序,得到

③增加一列f0代表單個(gè)屬性初始規(guī)?;鶞?zhǔn),設(shè)為1;

④按以下程序計(jì)算屬性規(guī)模壓縮矩陣

得到

⑤將對(duì)角線上的元素相加就得到壓縮后的屬性個(gè)數(shù)

fnc=r′11+r′22+…+r′nn

2、直接統(tǒng)計(jì)得到數(shù)據(jù)表中的數(shù)據(jù)元組個(gè)數(shù);tnj;二維表中,元組又稱記錄,表中的每行,即數(shù)據(jù)庫中的每條記錄,就是一個(gè)元組;

3、單位信息量的計(jì)算,單位信息量指數(shù)據(jù)文件中,同一個(gè)屬性所包含不同數(shù)值的多少;

(1)離散型屬性的信息熵計(jì)算公式為:

其中,P(xi)是每個(gè)屬性值出現(xiàn)的概率;

(2)連續(xù)型屬性的信息熵的計(jì)算:

先選擇一種離散化方法對(duì)其離散化以后,再按離散型屬性信息熵的計(jì)算公式進(jìn)行計(jì)算;

(3)得到每個(gè)屬性的信息熵后,求出屬性的平均信息熵:

fn為壓縮前單個(gè)數(shù)據(jù)表的屬性數(shù);

于是得到單個(gè)數(shù)據(jù)表規(guī)模的計(jì)算公式:

其中,S為某一張數(shù)據(jù)表的數(shù)據(jù)規(guī)模衡量因子(單位為bit),fnc為此數(shù)據(jù)表壓縮后的數(shù)據(jù)屬性數(shù),tn為此數(shù)據(jù)表的元組數(shù),為所有屬性的平均信息熵;

三、數(shù)據(jù)內(nèi)容評(píng)估

采用AHP三標(biāo)度法構(gòu)造一個(gè)比較矩陣B=(bij)n×n,bij為同一層次上元素比較所得標(biāo)度取值,具體為

用下式計(jì)算各元素的重要性排序指數(shù):

記rmax=MAX{ri},rmin=MIN{ri},bm=rmax/rmin,求出判斷矩陣c=(cij)n×n:

從而得到

得到判斷矩陣后,按以下步驟計(jì)算和檢驗(yàn):

(1)用方根法計(jì)算權(quán)重,公式如下:

計(jì)算步驟:①將c的元素按行相乘得一新向量,

②將新向量的每個(gè)分量開n次方,

③將所得向量歸一化即為權(quán)重向量;

(2)計(jì)算一致性指標(biāo)CI

其中,λmax為判斷矩陣C的最大特征值;

(3)查找一致性指標(biāo)RI

(4)計(jì)算一致性比例CR

當(dāng)CR<0.10時(shí),認(rèn)為判斷矩陣的一致性是可以接受的,否則應(yīng)對(duì)判斷矩陣作適量修正;由此,得到以內(nèi)容分類的每類數(shù)據(jù)的權(quán)重;

四、行業(yè)價(jià)值計(jì)算

1、取稅收收入最高的行業(yè),將其價(jià)值分?jǐn)?shù)定為100;

2、將其他行業(yè)的稅收與最高的行業(yè)稅收相除,再乘以100,得到其他行業(yè)的行業(yè)價(jià)值;

五、數(shù)據(jù)資產(chǎn)價(jià)值計(jì)算

1、將數(shù)據(jù)質(zhì)量因子Qij、數(shù)據(jù)規(guī)模因子Sij以及按內(nèi)容分類的權(quán)重Wi相乘,如果第i類數(shù)據(jù)包含多張數(shù)據(jù)表,則先計(jì)算單張數(shù)據(jù)表,再將這幾張數(shù)據(jù)表的結(jié)果累加;

2、按內(nèi)容分類的每類均按上述計(jì)算方法進(jìn)行計(jì)算,得到的結(jié)果依次累加;

3、將累加的結(jié)果與計(jì)算得到的行業(yè)價(jià)值相乘得到數(shù)據(jù)資產(chǎn)的價(jià)值分?jǐn)?shù)V;

價(jià)值分?jǐn)?shù)

4、通過價(jià)值分?jǐn)?shù)V評(píng)估數(shù)據(jù)資產(chǎn)價(jià)值。

本實(shí)施例大數(shù)據(jù)資產(chǎn)評(píng)估方法,其為數(shù)據(jù)資產(chǎn)的評(píng)估提供了具體的量化標(biāo)準(zhǔn),使評(píng)判過程更簡單明晰,消除了評(píng)判者的主觀因素影響,使評(píng)判結(jié)果與實(shí)際更相符合。

最后說明的是,以上實(shí)施例僅用以說明本發(fā)明的技術(shù)方案而非限制,盡管參照較佳實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解,可以對(duì)本發(fā)明的技術(shù)方案進(jìn)行修改或者等同替換,而不脫離本發(fā)明技術(shù)方案的宗旨和范圍,其均應(yīng)涵蓋在本發(fā)明的權(quán)利要求范圍當(dāng)中。

當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
视频| 沿河| 炎陵县| 神木县| 仙桃市| 新宁县| 醴陵市| 泰安市| 双峰县| 岳普湖县| 苗栗市| 乐业县| 北票市| 边坝县| 乌兰县| 博客| 长泰县| 鱼台县| 安图县| 新龙县| 林口县| 娄烦县| 杂多县| 合水县| 新田县| 临泉县| 清镇市| 博乐市| 方城县| 崇仁县| 罗甸县| 霍城县| 句容市| 太仆寺旗| 慈利县| 辽宁省| 汝阳县| 中方县| 烟台市| 彭水| 澄城县|