欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

加快計(jì)算機(jī)運(yùn)算的數(shù)據(jù)分析方法及影像辨識(shí)系統(tǒng)運(yùn)作方法

文檔序號(hào):6462562閱讀:212來源:國知局
專利名稱:加快計(jì)算機(jī)運(yùn)算的數(shù)據(jù)分析方法及影像辨識(shí)系統(tǒng)運(yùn)作方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種加快計(jì)算機(jī)運(yùn)算的數(shù)字?jǐn)?shù)據(jù)分析方法及其應(yīng)用系統(tǒng), 特別是涉及一種可以大幅提升計(jì)算機(jī)分析系統(tǒng)對(duì)數(shù)據(jù)的運(yùn)算速度的數(shù)字?jǐn)?shù) 據(jù)分析方法及其推薦系統(tǒng)運(yùn)作方法及影像辨識(shí)系統(tǒng)運(yùn)作方法。
背景技術(shù)
在此信息爆炸時(shí)代,許多用于數(shù)據(jù)分析的計(jì)算機(jī)分析系統(tǒng)被開發(fā)出來 與其應(yīng)用裝置相結(jié)合,對(duì)欲分析的數(shù)據(jù)量做有效的分析與運(yùn)算,而數(shù)值分 析方法即是該些計(jì)算機(jī)分析系統(tǒng)中處理數(shù)據(jù)的核心所在。然而日益龐大的 數(shù)據(jù)量卻會(huì)大大地減緩整體計(jì)算機(jī)分析系統(tǒng)的運(yùn)算速度,如無線通訊系統(tǒng) 傳輸速度的提升大大增加了數(shù)據(jù)的傳輸量、影像感光組件中像素的提高大 大增加了影像的數(shù)據(jù)量、網(wǎng)絡(luò)的普及帶來大量使用者的瀏覽紀(jì)錄信息 量......等,因此極需要一種能符合所需而可快速處理該些數(shù)據(jù)量的數(shù)值方
法來對(duì)應(yīng)。
用來處理龐大數(shù)據(jù)量的分析中,數(shù)值分析法被用來處理與分析該些龐
大數(shù)據(jù)量,在這些數(shù)值分析法中,傳統(tǒng)的奇異值分解法(Singular Value Decomposition, SVD)是一種可靠的矩陣分解法,常被應(yīng)用在復(fù)雜的數(shù)據(jù)分 析,特別是多變量的分析。奇異值分解法(SVD)是將一個(gè)矩陣對(duì)應(yīng)的行向量 空間(column space)和列向量空間(row space)拆解成兩個(gè)正交矩陣和一個(gè) 對(duì)角矩陣的方法。假設(shè)X是一個(gè)m x n的實(shí)數(shù)矩陣,X的秩(rank)為r,X被 分解成X二SV7/,其中S和D是正交矩陣,即S和D的行向量長度為l,并 且彼此正交。V是一個(gè)對(duì)角矩陣,V的非對(duì)角線的值都是零。無論X是否 為對(duì)稱矩陣,X^T—定是對(duì)稱矩陣。傳統(tǒng)上求解奇異值分解法(SVD)就是
先把X自乘為,然后對(duì)矩陣求其特征值和特征向量。計(jì)算"r所
求得的特征向量所排成的矩陣就是S矩陣,其對(duì)應(yīng)的特征值正好是V的對(duì) 角線值的平方。同理,要計(jì)算D,就是把X自乘為f X,然后計(jì)算fX的特征 向量。所求得的特征向量矩陣就是D。
近年來奇異值分解法(SVD)技術(shù)被大量使用在自然語言處理中,最有名 的方法是隱含語意索引法(Latent Semantic Indexing, LSI)簡稱為LSI。利 用隱含語意索引法(LSI)技術(shù),學(xué)者可將文本和關(guān)鍵詞做一個(gè)對(duì)應(yīng),并且將 文本以及關(guān)鍵詞的數(shù)據(jù)同時(shí)投影在一個(gè)維度較小的空間,在此空間中,學(xué)者 可以做文本對(duì)關(guān)鍵詞、文本對(duì)文本以及關(guān)鍵詞對(duì)關(guān)鍵詞的比對(duì)與分類。在隱含語意索引法(LSI)分析過程中,首先用一個(gè)矩陣A來記錄文本與字詞的 關(guān)系,例如,要探討一百萬篇文章和五十萬詞的關(guān)聯(lián)性,那么這個(gè)矩陣中,每 一^f亍對(duì)應(yīng)一篇文章,每一列對(duì)應(yīng)一個(gè)詞,如下面的式(l)所示
<formula>formula see original document page 5</formula>
在上述的式(l)中,m=l, 000,000, n=500,000。第i行,第j列的元 素,是字典中第j個(gè)詞在第i篇文章中出現(xiàn)的加權(quán)詞頻。而這個(gè)矩陣非常 大,有一百萬乘以五十萬,即五千億個(gè)元素。假設(shè)這個(gè)大矩陣有顯著的秩 (rank)是100,隱含語意索引法(LSI)的關(guān)鍵技術(shù)就是利用奇異值分解法 (SVD)將這種大矩陣分解成三個(gè)小矩陣相乘,如圖l所示,是傳統(tǒng)的分析方 法的一實(shí)施例的示意圖,把上面例子中的矩陣分解成一個(gè)一百萬乘以 一百 的矩陣X, 一個(gè)一百乘以一百的矩陣B,和一個(gè)一百乘以五十萬的矩陣Y。這 三個(gè)矩陣的元素總數(shù)加起來為1.5億,僅是原來的三千分之一。相應(yīng)的存儲(chǔ) 量和計(jì)算量都可小三個(gè)數(shù)量級(jí)以上。在圖1中,分解后的第一個(gè)X矩陣就是 這一百萬篇文章在100維度的潛在語意索引法(LSI)空間的表現(xiàn),第三個(gè)Y 矩陣就是五十萬個(gè)字詞在潛在語意索引法(LSI)空間中的表現(xiàn),中間的矩陣 的對(duì)角線值代表在潛在語意索引法(LSI)空間中每一個(gè)軸向的重要性,當(dāng)同 時(shí)把文章和字詞投影在潛在語意索引法(LSI)空間中,若某些字詞落在文章 的附近(或相同方向),那么這些字詞就可以當(dāng)作這篇文章的關(guān)鍵詞。我們 也可以在潛在語意索引法(LS I)空間中比較文章與文章之間的距離,如果兩 個(gè)文章在潛在語意索引法(LSI)空間中的距離靠近,那么這兩個(gè)文章的內(nèi)容 也會(huì)比較靠近。同理,也可以比較字詞與字詞的距離,進(jìn)而找出有哪些詞匯 其實(shí)是近義詞。此即潛在語意索引法(LSI)在語意學(xué)上的基本應(yīng)用。然而假 設(shè)m與n大小相當(dāng),傳統(tǒng)的奇異值分解法(Singular Value Decomposition, SVD)其計(jì)算量即為0(n3),當(dāng)A為更大型矩陣時(shí),計(jì)算機(jī)分析系統(tǒng)的運(yùn)算時(shí)間 將會(huì)拖長,在實(shí)際的應(yīng)用上便會(huì)受到許多的限制。
主成分分析法(Principal Component Analysis, PCA)也是分析多變量 數(shù)據(jù)一個(gè)常用的方法,其主要精神是將數(shù)據(jù)通過線性轉(zhuǎn)換,使數(shù)據(jù)成為某 一組正交基底的線性組合,并且此正交的基底順序,對(duì)應(yīng)原始數(shù)據(jù)在該基底 展開方向的變異數(shù)。配合消息理論的精神,變異數(shù)越大的方向,為重要訊息 存在的方向,因此,主成分分析法(PCA)自然地提供依訊息重要性排序的數(shù) 據(jù)表示法。在許多的應(yīng)用上,主要的方向(成分)已充分提供所需的訊息。為 此,主成分分析法PCA則成為精簡數(shù)據(jù),與消除數(shù)據(jù)噪聲的重要工具。奇異值分解法(SVD)與主成分分析法(PCA)的計(jì)算精神非常類似,由于 主成分分析法(PCA)是從分解變異數(shù)矩陣開始,所以,主成分分析法(PCA)可 視為將行向量調(diào)整到質(zhì)心為零,再^L張量乘積(tensor product)后的矩陣 的奇異值分解法(SVD)。因此,若原始數(shù)據(jù)是分布再質(zhì)量中心為零的資料,奇 異值分解法(SVD)分解得到的行向量基底,會(huì)與主成分分析法(PCA)分解得 到的基底相同。
另外一種奇異值分解法(SVD)的重要應(yīng)用技術(shù)是在1952年被提出的多
元尺度分析。多元尺度分析(Multidimensional Scaling, MDS)是一種/人對(duì)
象與對(duì)象相對(duì)距離,回推對(duì)象與對(duì)象相對(duì)坐標(biāo)的方法,此方法主要應(yīng)用在已 知對(duì)象與對(duì)象具有相似性或差異性時(shí),如何用一個(gè)有效的視覺表示,來呈
現(xiàn)這些對(duì)象彼此的關(guān)系。因此,多元尺度分析(MDS)常被應(yīng)用在復(fù)雜的數(shù)據(jù) 分析,特別是多變量分析時(shí),將高維度數(shù)據(jù)映像到低維度的2D空間或是3D 空間,以方便人類的視覺系統(tǒng)判讀。根據(jù)維度詛咒定理(Curse of d imens i on),在高維度空間搜尋數(shù)據(jù)會(huì)比低維度空間需要更多的數(shù)據(jù)量,并 且精準(zhǔn)度會(huì)比低維度空間搜尋的結(jié)果差。因此,降低維度是一個(gè)必經(jīng)的過 程,而多元尺度分析(MDS)在這過程中占據(jù)舉足輕重的地位。以下所述的多 元尺度分析(MDS)技術(shù)過程,已闡明多元尺度分析(MDS)技術(shù)與主成分分析 法(PCA)及奇異值分解法(SVD)的密切關(guān)系。
上述的多元尺度分析(MDS),假設(shè)X是一個(gè)p by N的矩陣,亦即有N
個(gè)對(duì)象,每個(gè)對(duì)象都由相同的p種不同的變量來描述。令D二;^x為x的 相乘矩陣,i是一個(gè)N x l的向量,他的每一個(gè)元素都是l。定義
<formula>formula see original document page 6</formula>
式(2)是X平移到中心點(diǎn)的相乘矩陣,亦即X的變異矩陣。B矩陣可一見 為D矩陣做雙中心化(double centering)運(yùn)算后的結(jié)果。定義
<formula>formula see original document page 6</formula>
則B可以簡化成S二^D//。由于B矩陣是對(duì)稱矩陣,B的奇異值分解
法(SVD)分解會(huì)成為5 = t/Kt/,而 ] 丄
<formula>formula see original document page 6</formula>
a/^"的行向量即為X中心化平移后的坐標(biāo)。因此,對(duì)X矩陣的張量乘 積D做雙中心化恰好得到矩陣X的變異矩陣。將變異矩陣做平方拆解,所得 到的矩陣,恰好為X矩陣將行向量平移到質(zhì)心為零的矩陣。故,多元尺度分 析方法(脂S)的核心技巧就是矩陣的雙中心化與平方拆解,其中平方拆解 的過程就是利用奇異值分解法(SVD)的技術(shù)。計(jì)算后的結(jié)果會(huì)失去原始數(shù)據(jù)質(zhì)心的信息,但是仍舊保留相對(duì)位置的關(guān)系。由于多元尺度分析(MDS)步驟 中利用到奇異值分解法(SVD)技術(shù),所以其計(jì)算復(fù)雜度和奇異值分解法 (SVD)相當(dāng)。傳統(tǒng)的多元尺度分析方法(MDS)亦受限于計(jì)算量的限制,當(dāng)對(duì) 象的個(gè)數(shù)增加時(shí),其計(jì)算量是以0(N。的速度在增加。因此,當(dāng)對(duì)象個(gè)數(shù)龐 大時(shí),傳統(tǒng)的多元尺度分析(MDS)并無法真正的被使用。
因此,如何改良分析方法,使得在處理龐大的對(duì)象個(gè)數(shù)數(shù)據(jù)量時(shí),計(jì)算 機(jī)分析系統(tǒng)運(yùn)算時(shí)間冗長的瓶頸能有效改善,即為本發(fā)明的重點(diǎn)。

發(fā)明內(nèi)容
本發(fā)明的目的在于,提供一種加快計(jì)算機(jī)運(yùn)算的數(shù)字?jǐn)?shù)據(jù)分析方法及 其推薦系統(tǒng)運(yùn)作方法及影像辨識(shí)系統(tǒng)運(yùn)作方法,所要解決的技術(shù)問題是使 其可以改善現(xiàn)有傳統(tǒng)的分析方法(SVD)在分解龐大對(duì)象個(gè)數(shù)時(shí),運(yùn)算時(shí)間冗 長的瓶頸,非常適于實(shí)用。
本發(fā)明的目的及解決其技術(shù)問題是采用以下技術(shù)方案來實(shí)現(xiàn)的。依據(jù) 本發(fā)明提出的 一種加快計(jì)算機(jī)運(yùn)算的數(shù)字?jǐn)?shù)據(jù)分析方法,該分析方法包括 以下步驟(a).輸入一第一矩陣的數(shù)字?jǐn)?shù)據(jù)于一計(jì)算機(jī)中,其中該第一矩 陣為N乘p矩陣,N為一第一對(duì)象個(gè)數(shù),p為一變數(shù)個(gè)數(shù);(b).該計(jì)算機(jī)中 的一計(jì)算單元計(jì)算該第一矩陣列向量的一平均向量;(c).該計(jì)算單元對(duì)該 第一矩陣的行向量作重疊的隨機(jī)數(shù)分群,隨機(jī)將該N個(gè)第一對(duì)象拆解成K 個(gè)有部分重疊的小群;(d).該計(jì)算單元對(duì)該些小群的行向量分別計(jì)算其變 異矩陣;(e).該計(jì)算單元對(duì)該些變異矩陣計(jì)算其個(gè)別的多元尺度分析,(f). 該計(jì)算單元分別重組該些多元尺度分析的空間坐標(biāo);(g).該計(jì)算單元將重 組后的該些多元尺度坐標(biāo)轉(zhuǎn)換成一主成分分析(PCA)結(jié)果;(h).該計(jì)算機(jī)利 用該主成分分析(PCA)結(jié)果及該平均向量輸出一完整的矩陣數(shù)字?jǐn)?shù)據(jù)序。
本發(fā)明的目的及解決其技術(shù)問題還可采用以下技術(shù)措施進(jìn)一步實(shí)現(xiàn)。
前述的加快計(jì)算機(jī)運(yùn)算的數(shù)字?jǐn)?shù)據(jù)分析方法,其中所述的步驟(c)中,其 更包含該些重疊部分為一第二對(duì)象個(gè)數(shù),且該第二對(duì)象個(gè)數(shù)分別大于該 變數(shù)個(gè)數(shù)p。
前述的加快計(jì)算機(jī)運(yùn)算的數(shù)字?jǐn)?shù)據(jù)分析方法,其中所述的步驟(g)中,其 更包含該計(jì)算單元調(diào)整該第一矩陣列向量使其平均為0,再利用矩陣正交 化分解(QR分解)使該第一矩陣列向量互相正交計(jì)算出 一主成分分析(PCA) 結(jié)果。
前述的加快計(jì)算機(jī)運(yùn)算的數(shù)字?jǐn)?shù)據(jù)分析方法,其中所述的步驟(h)中,其 更包含該計(jì)算單元合并該主成分分析(PCA)結(jié)果與該平均向量形成一新矩 陣;該計(jì)^^元利用矩陣正交化分解(QR分解)將該新殺Ef車的列向量正交化,計(jì) 算出 一對(duì)角矩陣(Dr);該計(jì)算單元將該對(duì)角矩陣(Dr)乘回該第一矩陣并做行向量的正交化,計(jì)算出 一第二矩陣(Sr);該計(jì)算單元再將該第二矩陣(Sr) 與該對(duì)角矩陣(Dr)分別乘在該第一矩陣的左右兩邊,計(jì)算出一第三矩陣 (Vr);該計(jì)算機(jī)根據(jù)該第二矩陣(Sr)、該第三頭臥車(Vr)及該對(duì)角矩陣(Dr),輸 出 一 完整的矩陣數(shù)字?jǐn)?shù)據(jù)序。
本發(fā)明的目的及解決其技術(shù)問題還采用以下技術(shù)方案來實(shí)現(xiàn)。依據(jù)本 發(fā)明提出的一種使用上述技術(shù)方案(即如權(quán)利要求1所述)的加快計(jì)算機(jī)運(yùn) 算的數(shù)字?jǐn)?shù)據(jù)分析方法的推薦系統(tǒng)運(yùn)作方法,其包括以下步驟(a).輸入一 使用者記錄信息矩陣于該推薦系統(tǒng);(b).利用該數(shù)字?jǐn)?shù)據(jù)分析方法計(jì)算潛 在語意索引法(Latent semantic Index, LSI)在低維度空間的展開基底; (c).藉由該展開基底將潛在語意索引法(LSI)空間中的使用者分群;(d).建 立對(duì)應(yīng)于該使用者分群的推薦列表;(e).將一新使用者投影至該潛在語意 索引法(LSI)空間;(f).該推薦系統(tǒng)藉由該新使用者所對(duì)應(yīng)的推薦列表輸出 一推薦信息予該新使用者。
本發(fā)明的目的及解決其技術(shù)問題另外還采用以下技術(shù)方案來實(shí)現(xiàn)。依 據(jù)本發(fā)明提出的一種使用上述技術(shù)方案的加快計(jì)算機(jī)運(yùn)算的數(shù)字?jǐn)?shù)據(jù)分析 方法的影像辨識(shí)系統(tǒng)運(yùn)作方法,包括以下步驟(a).將擷取的一第一影像與 一第二影像的矩陣數(shù)據(jù)輸入該影像辨識(shí)系統(tǒng);(b).對(duì)該第一影像與該第二 影像的矩陣數(shù)據(jù)個(gè)別利用該數(shù)字?jǐn)?shù)據(jù)分析方法分解;(c).比較該第一影像 與該第二影像的矩陣數(shù)據(jù)分解后的行向量基底角度與列向量基底角度;(d). 統(tǒng)計(jì)該些基底角度是否接近0°或180° ,得到一分析結(jié)果;(e).該影像辨 識(shí)系統(tǒng)根據(jù)該分析結(jié)果,若接近0。或180°則判定該第一影像與該第二影 像的來源相同,辨識(shí)結(jié)果為符合;若為否則判定來源不同,辨識(shí)結(jié)果為不符 合。
本發(fā)明與現(xiàn)有技術(shù)相比具有明顯的優(yōu)點(diǎn)和有益效果。由以上技術(shù)方案 可知,本發(fā)明的主要技術(shù)內(nèi)容如下
為達(dá)上述目的,本發(fā)明提供一種加快計(jì)算機(jī)運(yùn)算的數(shù)字?jǐn)?shù)據(jù)分析方法 (快速奇異值分解法SVD),該分析方法包含以下步驟(a).輸入一第一矩陣 的數(shù)字?jǐn)?shù)據(jù)于一計(jì)算機(jī)中,其中該第一矩陣為N乘p矩陣,N為一第一對(duì)象 個(gè)數(shù),p為一變數(shù)個(gè)數(shù);(b).該計(jì)算機(jī)中的一計(jì)算單元計(jì)算該第一矩陣列向 量的一平均向量;(c),該計(jì)算單元對(duì)該第 一矩陣的行向量作重疊的隨機(jī)數(shù) 分群,隨機(jī)將該N個(gè)第一對(duì)象拆解成K個(gè)有部分重疊的小群,該些重疊部分 為一第二對(duì)象個(gè)數(shù),且該第二對(duì)象個(gè)數(shù)分別大于大于該變數(shù)個(gè)數(shù)p; (d). 該計(jì)算單元對(duì)該些小群的行向量計(jì)算其變異矩陣;(e).該計(jì)算單元對(duì)該些
變異矩陣計(jì)算其個(gè)別的多元尺度分析;(f).該計(jì)算單元分別重組該些多元 尺度分析的空間坐標(biāo);(g).該計(jì)算單元調(diào)整該第一矩陣列向量使其平均為 O,再利用矩陣正交化分解(QR分解)使該第一矩陣列向量互相正交計(jì)算出一主成分分析(PCA)結(jié)果;(h).該計(jì)算單元合并該主成分分析(PCA)結(jié)果與該 平均向量形成一新矩陣;(i).該計(jì)算單元調(diào)整該第一矩陣列向量使其平均 為0,再利用矩陣正交化分解(QR分解)將該新矩陣的列向量正交化,計(jì)算 出 一對(duì)角矩陣(Dr); (j).該計(jì)算單元將該對(duì)角矩陣(Dr)乘回該第 一矩陣并 做行向量的正交化,計(jì)算出 一第二矩陣(Sr),再將該第二矩陣(Sr)與該對(duì)角 矩陣(Dr)分別乘在該第一矩陣的左右兩邊,計(jì)算出一第三矩陣(Vr); (k).該 計(jì)算單元根據(jù)該第二矩陣(Sr)、該第三矩陣(Vr)及該對(duì)角矩陣(Dr),輸出 一完整的矩陣數(shù)字?jǐn)?shù)據(jù)序。本發(fā)明的 一 實(shí)施例是使用該分析方法的推薦系統(tǒng)運(yùn)作方法,其包含以 下步驟(a).輸入一使用者記錄信息矩陣于該推薦系統(tǒng);(b).利用該數(shù)字?jǐn)?shù) 據(jù)分析方法計(jì)算潛在語意索引法(LSI)在低維度空間的展開基底;(c).藉由 該展開基底將潛在語意索引法(LSI)空間中的使用者分群;(d).建立對(duì)應(yīng)于 該使用者分群的推薦列表;(e).將一新使用者投影至該潛在語意索引法 (LSI)空間;(f).該推薦系統(tǒng)藉由該新使用者所對(duì)應(yīng)的推薦列表輸出一推薦 信息予該新-使用者。本發(fā)明的另 一 實(shí)施例是使用該分析方法的影像辨識(shí)系統(tǒng)運(yùn)作方法,其 包含以下的步驟(a).將該影像辨識(shí)系統(tǒng)擷取的一第一影像與一第二影像 的矩陣數(shù)據(jù)輸入該影像辨識(shí)系統(tǒng);(b).對(duì)該第一影像與該第二影像的矩陣 數(shù)據(jù)個(gè)別利用該數(shù)字?jǐn)?shù)據(jù)分析方法分解;(c).比較該第一影像與該第二影 像的矩陣數(shù)據(jù)分解后的行向量基底角度與列向量基底角度;(d).統(tǒng)計(jì)該些 基底角度是否接近0°或180° ,得到一分析結(jié)果;(e)該影像辨識(shí)系統(tǒng)根 據(jù)該分析結(jié)果,若接近0。或180°則判定該第一影像與該第二影像的來源 相同,辨識(shí)結(jié)果為符合;若否則判定來源不同,辨識(shí)結(jié)果為不符合。借由上述技術(shù)方案,本發(fā)明加快計(jì)算機(jī)運(yùn)算的數(shù)字?jǐn)?shù)據(jù)的分析方法及 其推薦系統(tǒng)運(yùn)作方法及影像辨識(shí)系統(tǒng)運(yùn)作方法至少具有下列優(yōu)點(diǎn)及有益效 果藉此,多元尺度分析(MDS)雖為奇異值分解法(SVD)的應(yīng)用,但經(jīng)過本 發(fā)明的闡釋,反而能利用改良多元尺度分析(MDS)的方法,改進(jìn)主成分分析 (PCA)的運(yùn)算速度,進(jìn)而改善奇異值分解法(SVD)的運(yùn)算過程。因此,本發(fā) 明的一種加快計(jì)算機(jī)運(yùn)算的數(shù)字?jǐn)?shù)據(jù)分析方法(快速奇異值分解法SVD)使 用矩陣拆解及分群的概念,搭配變異矩陣的分解及列向量平均向量的調(diào)整 來最佳化奇異值分解法(SVD),而大幅提升整體計(jì)算機(jī)分析系統(tǒng)的運(yùn)算速 度。綜上所述,本發(fā)明是使用一種加快計(jì)算機(jī)運(yùn)算的數(shù)字?jǐn)?shù)據(jù)分析方法來 改善現(xiàn)有傳統(tǒng)的在分解龐大對(duì)象個(gè)數(shù)時(shí)運(yùn)算時(shí)間冗長的瓶頸,并且可以處 理任何形式的矩陣而不受對(duì)稱矩陣的限制。該分析方法使用矩陣拆解及分 群的概念,搭配變異矩陣的分解及列向量平均向量的調(diào)整來最佳化,而可大幅提升系統(tǒng)的運(yùn)算速度。本發(fā)明具有上述諸多優(yōu)點(diǎn)及實(shí)用價(jià)值,其不論 在方法、產(chǎn)品結(jié)構(gòu)或功能上皆有較大改進(jìn),在技術(shù)上有顯著的進(jìn)步,并產(chǎn) 生了好用及實(shí)用的效果,從而更加適于實(shí)用,誠為一新穎、進(jìn)步、實(shí)用的 新設(shè)計(jì)。上述說明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的 技術(shù)手段,而可依照說明書的內(nèi)容予以實(shí)施,并且為了讓本發(fā)明的上述和 其他目的、特征和優(yōu)點(diǎn)能夠更明顯易懂,以下特舉較佳實(shí)施例,并配合附圖,詳細(xì)il明如下。


圖1是現(xiàn)有傳統(tǒng)的分析方法的一實(shí)施例的示意圖。 圖2是本發(fā)明的加快計(jì)算機(jī)運(yùn)算的數(shù)字?jǐn)?shù)據(jù)分析方法(快速奇異值分解 法SVD)的流程圖。圖3是非滿秩矩陣的運(yùn)算速度比較圖。 圖4是非滿秩矩陣的運(yùn)算精準(zhǔn)度比較圖。圖5是運(yùn)算滿秩矩陣前十個(gè)奇異值的奇異值分解法(SVD)所需要的時(shí)間 的示意圖。圖6是本發(fā)明的加快計(jì)算機(jī)運(yùn)算的數(shù)字?jǐn)?shù)據(jù)分析方法應(yīng)用于推薦系統(tǒng) 運(yùn)作方法的流程圖。圖7是本發(fā)明的加快計(jì)算機(jī)運(yùn)算的數(shù)字?jǐn)?shù)據(jù)分析方法應(yīng)用于影像辨識(shí) 系統(tǒng)運(yùn)作方法的流程圖。
具體實(shí)施方式
為更進(jìn)一步闡述本發(fā)明為達(dá)成預(yù)定發(fā)明目的所采取的技術(shù)手段及功 效,以下結(jié)合附圖及較佳實(shí)施例,對(duì)依據(jù)本發(fā)明提出的數(shù)字?jǐn)?shù)據(jù)的分析方法 及其推薦系統(tǒng)及影像辨識(shí)系統(tǒng)其具體實(shí)施方式
、方法、步驟、結(jié)構(gòu)、特征及其功效,詳細(xì)i兌明如后。有關(guān)本發(fā)明的前述及其他技術(shù)內(nèi)容、特點(diǎn)及功效,在以下配合參考圖 式的較佳實(shí)施例的詳細(xì)說明中將可清楚呈現(xiàn)。通過具體實(shí)施方式
的說明,當(dāng);了解,、然而所附圖式僅是提供參考與說明之用,并非用來對(duì)本發(fā)明加以限制。以下介紹本發(fā)明內(nèi)容的過程中會(huì)多次使用到矩陣正交化分解(QR分解) 的技術(shù),為達(dá)到充分揭露的目的,在此簡單介紹何為矩陣正交化分解(QR分 解)。矩陣正交化分解(QR分解)是將矩陣的行向量或是列向量做正交化的一 種標(biāo)準(zhǔn)技術(shù),該理論是由Gram-Schmidt所提出。實(shí)數(shù)矩陣A的矩陣正交化分解(QR分解)是把A分解為A = QR,這里的Q是正交矩陣(意味著QTQ = I),而R是一個(gè)對(duì)角線以下的值為0的上三角矩陣。本發(fā)明是對(duì)大量數(shù)字?jǐn)?shù)據(jù)進(jìn)行一分析方法,該分析方法是為一快速奇 異值分解法(SVD),用來運(yùn)算及分析以大幅增進(jìn)系統(tǒng)效能。首先請(qǐng)參閱圖2所示,是本發(fā)明的加快計(jì)算機(jī)運(yùn)算的數(shù)字?jǐn)?shù)據(jù)分析方法(快速奇異值分解法 SVD)的流程圖。本發(fā)明的加快計(jì)算機(jī)運(yùn)算的數(shù)字?jǐn)?shù)據(jù)分析方法,包括以下步 驟(a) .輸入一第一矩陣的數(shù)字?jǐn)?shù)據(jù)于一計(jì)算機(jī)中,其中該第一矩陣為N 乘p矩陣,N為一第一觀測(cè)對(duì)象個(gè)數(shù),p為描述該觀測(cè)對(duì)象的一變量個(gè)數(shù);(b) .該計(jì)算機(jī)中的一計(jì)算單元計(jì)算該第一矩陣列向量的一平均向量b;(c) .該計(jì)算單元對(duì)該第一矩陣的行向量作重疊的隨機(jī)數(shù)分群,隨機(jī)將 該N個(gè)第一對(duì)象拆解成K個(gè)有部分重疊的小群,該些重疊部分為一第二對(duì) 象個(gè)數(shù),且該第二對(duì)象個(gè)數(shù)最佳為分別大于該變數(shù)個(gè)數(shù)p;(d) .該計(jì)算單元對(duì)該些小群的行向量分別計(jì)算其變異矩陣;(e) .該計(jì)算單元對(duì)該些變異矩陣計(jì)算其個(gè)別的多元尺度分析(MDS);(f) .該計(jì)算單元分別重組該些多元尺度分析(MDS)的空間坐標(biāo);(g) .該計(jì)算單元調(diào)整該第一矩陣列向量使其平均為O,再利用矩陣正 交化分解(QR分解)使該第一矩陣列向量互相正交計(jì)算出一主成分分析(PCA) 結(jié)果;(h) .該計(jì)算單元合并該主成分分析(PCA)結(jié)果與該平均向量形成一新矩陣;(i) .該計(jì)算單元利用矩陣正交化分解(QR分解)將該新矩陣的列向量正 交化,計(jì)算出一對(duì)角矩陣(Dr);(j).該計(jì)算單元將該對(duì)角矩陣(Dr)乘回該第一矩陣并做行向量的正交 化,計(jì)算出一第二矩陣(Sr),再將該第二矩陣(Sr)與該對(duì)角矩陣(Dr)分別乘 在該第一矩陣的左右兩邊,計(jì)算出一第三矩陣(Vr);(k).該計(jì)算機(jī)根據(jù)該第二矩陣(Sr)、該第三矩陣(Vr)及該對(duì)角矩陣 (Dr),輸出 一完整的矩陣數(shù)字?jǐn)?shù)據(jù)序。上述的步驟(i)是利用矩陣正交化分解(QR分解),計(jì)算出合并小群間坐標(biāo)所需要的轉(zhuǎn)換公式。如,第一小群的多元尺度分析(MDS)坐標(biāo)為Z,,第二小群的多元尺度分析(MDS)坐標(biāo)為義2, X,與12是對(duì)應(yīng)的對(duì)行向量中心化的坐標(biāo)矩陣,因此該轉(zhuǎn)換公式為Z^2必^^-2必"(^^)+^^,通過此 公式可以將12的坐標(biāo),轉(zhuǎn)換到《的坐標(biāo)系。依此類推,即可以將每一個(gè) 小群的坐標(biāo)系都轉(zhuǎn)換到第一個(gè)坐標(biāo)系上,進(jìn)而得到一個(gè)完整的坐標(biāo)。在一般 狀況下要連結(jié)的兩群坐標(biāo)其表示的維度會(huì)相同,假若要連結(jié)的兩群坐標(biāo)其表示的維度不同,例如《的維度是r,, A的維度是r2,其中r)<r2,此時(shí) 并不是將12的坐標(biāo)轉(zhuǎn)接到A的坐標(biāo),而是由低維度的坐標(biāo)表示轉(zhuǎn)接到高 維度的坐標(biāo)表示。這時(shí)轉(zhuǎn)換的公式變成^ = 222'、'—e^(^0+w。此時(shí)的込只取n個(gè)行向量,因此込是一個(gè)r2乘r,的矩陣,^是一個(gè)r,乘r,的 矩陣,公式仍舊滿足一般公式的形式。要串接更多的坐標(biāo)系統(tǒng),就依此維 度低的坐標(biāo)系轉(zhuǎn)接到維度高的坐標(biāo)系的原則,——將坐標(biāo)系統(tǒng)串接起來。接著請(qǐng)參閱圖3至圖5所示,是使用本發(fā)明的分析方法-快速奇異值分 解法(SVD)與使用傳統(tǒng)奇異值分解法(SVD)的相關(guān)模擬比較圖。該些圖式的 橫坐標(biāo)代表矩陣n x m中的n, ^^擬^使用的矩陣為n=m,大小為100*100的 矩陣到2000*2000的矩陣,做快速奇異值分解法(SVD)與傳統(tǒng)奇異值分解法 (SVD)的速度與精準(zhǔn)度分析,并分別對(duì)滿秩(full rank)矩陣和非滿秩矩陣 做模擬測(cè)試。在非滿秩矩陣中,設(shè)定以矩陣的秩(rank)是10對(duì)應(yīng)一個(gè)矩陣的大小。 接著用隨機(jī)數(shù)產(chǎn)生十六個(gè)矩陣大小相同,秩也相同的矩陣,矩陣中每一個(gè) 元素都是由
區(qū)間的平均分配中取出的隨機(jī)數(shù)。計(jì)算奇異值分解法 (SVD)分解所需要的時(shí)間以及誤差后,再利用這十六個(gè)隨機(jī)數(shù)產(chǎn)生的矩陣對(duì) 應(yīng)結(jié)果的平均作為圖表上的數(shù)據(jù)。請(qǐng)參閱圖3所示,是非滿秩矩陣的運(yùn)算速度比較圖,實(shí)線表示傳統(tǒng)奇 異值分解法(SVD),虛線表示本發(fā)明的快速奇異值分解法(SVD)。由圖3中可 以明顯得知,當(dāng)矩陣大小變大時(shí),本發(fā)明明顯的改善了運(yùn)算速度。請(qǐng)參閱圖 4所示,是非滿秩矩陣的運(yùn)算精準(zhǔn)度比較圖,所呈現(xiàn)的是相對(duì)誤差,由圖4 可得知,相對(duì)誤差并沒有隨著矩陣大小的增加而增加,且本分析方法的快 速奇異值分解法(SVD)的運(yùn)算誤差與傳統(tǒng)奇異值分解法(SVD)的誤差相比并 無太大的差別。請(qǐng)參閱圖5所示,是運(yùn)算滿秩矩陣前十個(gè)奇異值的傳統(tǒng)奇 異值分解法(SVD)所需要的時(shí)間,圖5顯示,本分析方法的快速奇異值分解 法(SVD)所需要的運(yùn)算時(shí)間隨著矩陣的大型化僅呈線性增加,相對(duì)于傳統(tǒng)奇 異值分解法(SVD)運(yùn)算時(shí)間的指數(shù)型增加要快速許多。本發(fā)明的加快計(jì)算機(jī)逸算的數(shù)字?jǐn)?shù)據(jù)分析方法的應(yīng)用-推薦系統(tǒng)本發(fā)明的一實(shí)施例是4吏用該分析方法應(yīng)用于一推薦系統(tǒng)(Recommender System)中。推薦系統(tǒng)是人工智能領(lǐng)域這十年來非常熱門的課題,其中結(jié)合 了統(tǒng)計(jì)學(xué),辨識(shí)科學(xué),數(shù)據(jù)處理,數(shù)值算法等重要知識(shí),并且被廣泛的應(yīng) 用到客戶管理系統(tǒng),交互式網(wǎng)站,推薦式廣告等領(lǐng)域。在現(xiàn)今信息爆炸時(shí) 代,網(wǎng)絡(luò)使用者在有限的時(shí)間內(nèi)能瀏覽的網(wǎng)站有限,如何有效的讓使用者 接觸到適合的內(nèi)容,并且減少接觸不適合內(nèi)容的機(jī)率是推薦系統(tǒng)主要的功 能。推薦系統(tǒng)企圖達(dá)到快速又精準(zhǔn)的推薦,但是快速與精準(zhǔn)通常是互相矛盾的限制條件。因此,本發(fā)明即利用具有快速奇異值分解法(SVD)開發(fā)出更新、更快、更準(zhǔn)確的推薦系統(tǒng)。推薦系統(tǒng)有兩大主要分類,第一大類是單一使用者記錄推薦此類方法 僅使用單一使用者的記錄,來學(xué)習(xí)該使用者的偏好(taste)。統(tǒng)計(jì)方法中的 變量分析常被應(yīng)用到此領(lǐng)域;第二大類是廣義數(shù)據(jù)學(xué)習(xí)此類方法用到該 使用者之外的其它使用者的使用記錄,來輔助學(xué)習(xí)出該使用者的偏好。由于 真實(shí)的應(yīng)用中, -使用者記錄通常會(huì)有缺值(missing data),而補(bǔ)足缺值的 方法,最常見的就是利用偏好相近的其它使用者的信息來補(bǔ)足這些缺值。因 此廣義數(shù)據(jù)學(xué)習(xí)的結(jié)果, 一般而言優(yōu)于單一使用者記錄推薦。當(dāng)今熱門的 廣義數(shù)據(jù)學(xué)習(xí)推薦系統(tǒng)是協(xié)同合作式篩選(Collaborative Filtering)。常見的協(xié)同合作式篩選,有總量統(tǒng)計(jì)法(POP Algorithm),鄰近法 (Nearest Neighbor Algori thm),還有特征偏好法(Eigentaste Algori thm)。 上述方法需要去定義使用者與其它使用者偏好的距離。這距離與使用者曾 經(jīng)點(diǎn)選過的對(duì)象有關(guān)。曾經(jīng)點(diǎn)選相同對(duì)象的不同使用者,假設(shè)該使用者有 相同的偏好。在定義距離時(shí)最常遇到的兩個(gè)挑戰(zhàn)是第一,不同的對(duì)象,可 能代表相同的偏好。第二,許多未曾被點(diǎn)選的對(duì)象,不代表該對(duì)象不在使 用者所偏好的范圍內(nèi),大部分僅是使用者沒有機(jī)會(huì)接觸到該對(duì)象,因此不 會(huì)去點(diǎn)選。為了克服這兩個(gè)主要的問題,等構(gòu)映圖(Isomap)和潛在語意索引 法(Latent semantic Index, LSI)方法是最常尋皮應(yīng)用的統(tǒng)計(jì)方法,多數(shù)的 推薦系統(tǒng)都是利用這兩個(gè)方法之一來達(dá)到將高維度數(shù)據(jù)轉(zhuǎn)換到低維度空 間,來進(jìn)行比對(duì),定義距離,進(jìn)而歸類等動(dòng)作。等構(gòu)映圖(Isomap)是一個(gè)類似 MDS的方法,也是將數(shù)據(jù)兩兩的相似性或差異性轉(zhuǎn)成低維度數(shù)據(jù)的方法,與 MDS的差別在于,等構(gòu)映圖(I s omap)將數(shù)據(jù)的差異性轉(zhuǎn)換成最'J、路徑的距離, 再利用這轉(zhuǎn)換過的距離矩陣,來計(jì)算MDS的結(jié)果。在數(shù)據(jù)不全以及數(shù)據(jù)有 特別的分布結(jié)構(gòu)時(shí),等構(gòu)映圖(Isomap)的計(jì)算結(jié)果會(huì)比MDS來的有意義。然而,無論是等構(gòu)映圖(Isomap)或是潛在語意索引法(LSI)方法,其基 本核心都是利用傳統(tǒng)奇異值分解法(SVD)來求得低維度空間的展開基底。為 了達(dá)到更精準(zhǔn)的推薦,就是將曾經(jīng)發(fā)生過的推薦數(shù)據(jù)都納入計(jì)算范圍,那 么實(shí)時(shí)性地重算潛在語意索引法(LSI)的使用者低維度表現(xiàn),就是整個(gè)推薦 系統(tǒng)的關(guān)鍵。在先前現(xiàn)有技術(shù)中,傳統(tǒng)奇異值分解法(SVD)的運(yùn)算速度是 0(n3)的規(guī)模,當(dāng)使用者的人數(shù)龐大的時(shí)候,0(n3)的計(jì)算規(guī)模要在短時(shí)間 內(nèi)完成而達(dá)到實(shí)時(shí)性更新的效果就變得相當(dāng)困難。因此,本發(fā)明使用的加 快計(jì)算機(jī)運(yùn)算數(shù)字?jǐn)?shù)據(jù)分析方法(快速奇異值分解法SVD)的推薦系統(tǒng)將可 以大幅改善這方面的需求,進(jìn)而能夠達(dá)到實(shí)時(shí)性的推薦信息更新。請(qǐng)參閱圖6所示,是本發(fā)明的加快計(jì)算機(jī)運(yùn)算的數(shù)字?jǐn)?shù)據(jù)分析方法應(yīng) 用于推薦系統(tǒng)運(yùn)作方法的流程圖,其包括以下步驟(a) .輸入一使用者記錄信息矩陣于該推薦系統(tǒng);其中,以N乘p矩陣來 說,N是網(wǎng)絡(luò)上的使用者個(gè)數(shù);p為此網(wǎng)頁服務(wù)器里,可供瀏覽的網(wǎng)頁個(gè)數(shù);(b) .利用該數(shù)字?jǐn)?shù)據(jù)分析方法計(jì)算潛在語意索引法(LSI)在低維度空 間的展開基底;(c) .藉由該展開基底將潛在語意索引法(LSI)空間中的使用者分群;(d) .建立對(duì)應(yīng)于該使用者分群的推薦列表;(e) .將一新使用者投影至該潛在語意索引法(LSI)空間;(f) .該推薦系統(tǒng)藉由該新使用者所對(duì)應(yīng)的推薦列表輸出 一推薦信息予 該新使用者。加快計(jì)算機(jī)運(yùn)算的數(shù)字?jǐn)?shù)據(jù)分析方法的應(yīng)用-影像辨識(shí)系統(tǒng)本發(fā)明的另 一實(shí)施例是使用該分析方法應(yīng)用于一影像辨識(shí)系統(tǒng)中。該 影像系統(tǒng)中的每一個(gè)影像都可以當(dāng)作是一個(gè)矩陣,在比對(duì)兩張影像的數(shù)字 數(shù)據(jù)時(shí),若用點(diǎn)對(duì)點(diǎn)的方式比對(duì),在影像大小不同以及影像做輕微的平移和 旋轉(zhuǎn)后,點(diǎn)對(duì)點(diǎn)的比對(duì)將會(huì)產(chǎn)生很大的差異。即兩張看似相同的影像,點(diǎn)對(duì) 點(diǎn)的比對(duì)差異將會(huì)非常的大。因此,最可靠的方式就是將對(duì)應(yīng)影像調(diào)整到 相同的大小,然后計(jì)算這兩個(gè)影像的快速奇異值分解法(SVD)分解,按照奇 異值的大小順序比對(duì)行向量基底和列向量基底。比對(duì)的方法是計(jì)算向量的 夾角。 一般來說,肉眼看似相似或是源于相同來源的影像,對(duì)應(yīng)的行向量和 對(duì)應(yīng)的列向量其向量的指向差距不大,亦即計(jì)算夾角的結(jié)果會(huì)接近平行。 使用本發(fā)明的分析方法只需比較前兩個(gè)最大奇異值對(duì)應(yīng)的行向量基底以及 列向量基底。對(duì)應(yīng)奇異值較小的行向量基底及列向量基底則可視為干擾項(xiàng) 的展開基底。請(qǐng)?jiān)賲㈤唸D7所示,是本發(fā)明的加快計(jì)算機(jī)運(yùn)算的數(shù)字?jǐn)?shù)據(jù)分析方法 應(yīng)用于影像辨識(shí)系統(tǒng)運(yùn)作方法的流程圖。其包括以下步驟(a) .將擷取的一第一影像XI與一第二影像X2的矩陣數(shù)據(jù)輸入該影像 辨識(shí)系統(tǒng);其中,該些矩陣資料中,N與p(N乘p矩陣)可為該些影像中x軸 與y軸的像素個(gè)數(shù);(b) .對(duì)該輸入的該第一影像X,與該第二影像X2矩陣數(shù)據(jù)個(gè)別利用該數(shù) 字?jǐn)?shù)據(jù)分析方法分解;(c) .比較該第一影像X,與該第二影像X2矩陣數(shù)據(jù)分解后的行向量基底 角度與列向量基底角度;(d) .統(tǒng)計(jì)該些基底角度是否接近O?;?80° ,得到一分析結(jié)果;(e) .該影像辨識(shí)系統(tǒng)根據(jù)該分析結(jié)果,若接近0?;?80°則判定該第 一影像與該第二影像的來源相同,辨識(shí)結(jié)果為符合;若為否則判定來源不 同,辨識(shí)結(jié)果為不符合。上述的加快計(jì)算機(jī)運(yùn)算的數(shù)字?jǐn)?shù)據(jù)分析方法(快速奇異值分解法SVD)是從求矩陣特征值所推導(dǎo)出的矩陣分解,因此和需要計(jì)算特征值有關(guān)的應(yīng)用都有關(guān)聯(lián)。除本發(fā)明的二個(gè)較佳實(shí)施例外,舉例來說在統(tǒng)計(jì)計(jì)算里, 奇異值分解法(SVD)被應(yīng)用到計(jì)算高維度數(shù)據(jù)最大變異方向,因此近年來被 廣泛應(yīng)用到脫氧核糖核酸(DNA)研究領(lǐng)域。在數(shù)值計(jì)算中,奇異值分解法 (SVD)最常被應(yīng)用到求劣質(zhì)反算問題(ill-pose inverse problem),在劣質(zhì) 反算問題的無窮多解里面,奇異值分解法(SVD)提供最快速找到近似解的能 力。在通訊領(lǐng)域里,奇異值分解法(SVD)提供最自然的頻譜分析。在人工智 能的領(lǐng)域里,特別是和語意學(xué)有關(guān)的領(lǐng)域,奇異值分解法(SVD)也提供了將 復(fù)雜的數(shù)據(jù)轉(zhuǎn)換到更有關(guān)聯(lián)性的特征空間的能力。簡言之,奇異值分解法 (SVD)是近代數(shù)值分析計(jì)算的重要基礎(chǔ)。如上所述,本發(fā)明的加快計(jì)算機(jī)運(yùn)算的數(shù)字?jǐn)?shù)據(jù)分析方法(快速奇異值 分解法SVD)改善了傳統(tǒng)奇異值分解法(SVD)在分解龐大對(duì)象個(gè)數(shù)時(shí),運(yùn)算時(shí) 間冗長的瓶頸,并且可以處理任何形式的矩陣而不受對(duì)稱矩陣的限制。該 快速傳統(tǒng)奇異值分解法(SVD)使用矩陣拆解及分群的概念,搭配變異矩陣的 分解及列向量平均向量的調(diào)整來最佳化奇異值分解法(SVD),而可大幅提升 整體計(jì)算機(jī)分析系統(tǒng)的運(yùn)算速度。以上所述,僅是本發(fā)明的較佳實(shí)施例而已,并非對(duì)本發(fā)明作任何形式 上的限制,雖然本發(fā)明已以較佳實(shí)施例揭露如上,然而并非用以限定本發(fā) 明,任何熟悉本專業(yè)的技術(shù)人員,在不脫離本發(fā)明技術(shù)方案范圍內(nèi),當(dāng)可利 用上述揭示的技術(shù)內(nèi)容作出些許更動(dòng)或修飾為等同變化的等效實(shí)施例,但 凡是未脫離本發(fā)明技術(shù)方案內(nèi)容,依據(jù)本發(fā)明的技術(shù)實(shí)質(zhì)對(duì)以上實(shí)施例所 作的任何簡單修改、等同變化與修飾,均仍屬于本發(fā)明技術(shù)方案的范圍內(nèi)。
權(quán)利要求
1、一種加快計(jì)算機(jī)運(yùn)算的數(shù)字?jǐn)?shù)據(jù)分析方法,其特征在于該分析方法包括以下步驟(a).輸入一第一矩陣的數(shù)字?jǐn)?shù)據(jù)于一計(jì)算機(jī)中,其中該第一矩陣為N乘p矩陣,N為一第一對(duì)象個(gè)數(shù),p為一變數(shù)個(gè)數(shù);(b).該計(jì)算機(jī)中的一計(jì)算單元計(jì)算該第一矩陣列向量的一平均向量;(c).該計(jì)算單元對(duì)該第一矩陣的行向量作重疊的隨機(jī)數(shù)分群,隨機(jī)將該N個(gè)第一對(duì)象拆解成K個(gè)有部分重疊的小群;(d).該計(jì)算單元對(duì)該些小群的行向量分別計(jì)算其變異矩陣;(e).該計(jì)算單元對(duì)該些變異矩陣計(jì)算其個(gè)別的多元尺度分析;(f).該計(jì)算單元分別重組該些多元尺度分析的空間坐標(biāo);(g).該計(jì)算單元將重組后的該些多元尺度坐標(biāo)轉(zhuǎn)換成一主成分分析(PCA)結(jié)果;(h).該計(jì)算機(jī)利用該主成分分析結(jié)果及該平均向量輸出一完整的矩陣數(shù)字?jǐn)?shù)據(jù)序。
2、 根據(jù)權(quán)利要求1所述的加快計(jì)算機(jī)運(yùn)算的數(shù)字?jǐn)?shù)據(jù)分析方法,其特 征在于其中所述的步驟(c)中,其更包舍該些重疊部分為一第二對(duì)象個(gè)數(shù),且 該第二對(duì)象個(gè)數(shù)分別大于該變數(shù)個(gè)數(shù)p。
3、 根據(jù)權(quán)利要求1所述的加快計(jì)算機(jī)運(yùn)算的數(shù)字?jǐn)?shù)據(jù)分析方法,其特 征在于其中所述的步驟(g)中,其更包含該計(jì)算單元調(diào)整該第一矩陣列向 量使其平均為0,再利用矩陣正交化分解使該第一矩陣列向量互相正交計(jì)算 出一主成分分析結(jié)果。
4、 根據(jù)權(quán)利要求3所述加快計(jì)算機(jī)運(yùn)算的數(shù)字?jǐn)?shù)據(jù)分析方法,其特征在于其中所述的步驟(h)中,其更包含該計(jì)算單元合并該主成分分析結(jié)果與該平均向量形成一新矩陣;該計(jì)算單元利用矩陣正交化分解將該新矩陣的列向量正交化,計(jì)算出一對(duì)角矩陣;該計(jì)算單元將該對(duì)角矩陣乘回該第一矩陣并做行向量的正交化,計(jì)算 出一第二矩陣(Sr);該計(jì)算單元再將該第二矩陣(Sr)與該對(duì)角矩陣(Dr)分別乘在該第一矩 陣的左右兩邊,計(jì)算出一第三矩陣(Vr);該計(jì)算機(jī)根據(jù)該第二矩陣(Sr)、該第三矩陣(Vr)及該對(duì)角矩陣(Dr),輸 出 一 完整的矩陣數(shù)字?jǐn)?shù)據(jù)序。
5、 一種使用如權(quán)利要求1所述的加快計(jì)算機(jī)運(yùn)算的數(shù)字?jǐn)?shù)據(jù)分析方法 的推薦系統(tǒng)運(yùn)作方法,其特征在于其包括以下步驟(a) .輸入一使用者記錄信息矩陣于該推薦系統(tǒng);(b) .利用該數(shù)字?jǐn)?shù)據(jù)分析方法計(jì)算潛在語意索引法在低維度空間的展 開基底;(c) .藉由該展開基底將潛在語意索引法空間中的使用者分群;(d) .建立對(duì)應(yīng)于該使用者分群的推薦列表;(e) .將一新使用者投影至該潛在語意索引法空間;(f) .該推薦系統(tǒng)藉由該新使用者所對(duì)應(yīng)的推薦列表輸出 一推薦信息予 該新使用者。
6、一種使用如權(quán)利要求1所述的加快計(jì)算機(jī)運(yùn)算的數(shù)字?jǐn)?shù)據(jù)分析方法 的影像辨識(shí)系統(tǒng)運(yùn)作方法,其特征在于其包括以下步驟(a) .將擷取的一第一影像與一第二影像的矩陣數(shù)據(jù)輸入該影像辨識(shí)系統(tǒng);(b) .對(duì)該第 一影像與該第二影像的矩陣數(shù)據(jù)個(gè)別利用該數(shù)字?jǐn)?shù)據(jù)分析 方法分解;(c) .比較該第 一影像與該第二影像的矩陣數(shù)據(jù)分解后的行向量基底角 度與列向量基底角度;(d) .統(tǒng)計(jì)該些基底角度是否接近O。或180° ,得到一分析結(jié)果;(e) .該影像辨識(shí)系統(tǒng)根據(jù)該分析結(jié)果,若接近O?;?80°則判定該第 一影像與該第二影像的來源相同,辨識(shí)結(jié)果為符合;若為否則判定來源不 同,辨識(shí)結(jié)果為不符合。
全文摘要
本發(fā)明是有關(guān)于一種加快計(jì)算機(jī)運(yùn)算的數(shù)字?jǐn)?shù)據(jù)分析方法及其推薦系統(tǒng)運(yùn)作方法及影像辨識(shí)系統(tǒng)運(yùn)作方法。本發(fā)明是使用一種加快計(jì)算機(jī)運(yùn)算的數(shù)字?jǐn)?shù)據(jù)分析方法來改善現(xiàn)有傳統(tǒng)的在分解龐大對(duì)象個(gè)數(shù)時(shí)運(yùn)算時(shí)間冗長的瓶頸,并且可以處理任何形式的矩陣而不受對(duì)稱矩陣的限制。該分析方法使用矩陣拆解及分群的概念,搭配變異矩陣的分解及列向量平均向量的調(diào)整來最佳化,而可大幅提升系統(tǒng)的運(yùn)算速度。
文檔編號(hào)G06F17/16GK101576871SQ20081009619
公開日2009年11月11日 申請(qǐng)日期2008年5月9日 優(yōu)先權(quán)日2008年5月9日
發(fā)明者曾正男 申請(qǐng)人:群冠資訊股份有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
来安县| 松潘县| 宝清县| 井陉县| 崇左市| 贡觉县| 台中市| 和政县| 都匀市| 枣庄市| 惠州市| 云安县| 呼图壁县| 林芝县| 义乌市| 三明市| 昌平区| 婺源县| 五常市| 容城县| 苏尼特右旗| 南和县| 衡阳县| 班玛县| 清水河县| 福泉市| 那坡县| 文登市| 津市市| 双峰县| 成安县| 彩票| 浑源县| 余江县| 娱乐| 西贡区| 高清| 巴南区| 利川市| 蓝田县| 曲阜市|