欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

用于數(shù)據(jù)分析的可視化的系統(tǒng)和方法

文檔序號(hào):6348904閱讀:270來源:國知局
專利名稱:用于數(shù)據(jù)分析的可視化的系統(tǒng)和方法
技術(shù)領(lǐng)域
本發(fā)明的實(shí)施例涉及數(shù)據(jù)分析的可視化,更具體地,涉及顯示分析的交互式可視化。
背景技術(shù)
隨著手機(jī)和存儲(chǔ)數(shù)據(jù)的增加,存在分析和弄清大量數(shù)據(jù)的增加的需求。大的數(shù)據(jù)集的示例可在金融服務(wù)公司、石油勘探、生物技術(shù)和學(xué)術(shù)界中找到。遺憾的是,之前對(duì)大的多維數(shù)據(jù)集的分析方法趨向于(如果可能)不足以識(shí)別重要的關(guān)系并且可能是計(jì)算低效的。在一個(gè)示例中,先前的分析方法通常利用分簇(clustering)。分簇通常是一種過于生硬的手段以至于無法識(shí)別數(shù)據(jù)中的重要關(guān)系。類似地,之前的線性回歸、投影尋蹤(projection pursuit)、主成分分析(principal component analysis)禾口多維定標(biāo) (multidimensional scaling)方法通常并未揭示重要的關(guān)系?,F(xiàn)有的線性代數(shù)和分析工具對(duì)于大尺度距離來言過于敏感了,結(jié)果失去了細(xì)節(jié)。另外,即便數(shù)據(jù)被分析,資深的專家通常必須要解釋和理解之前方法的輸出。雖然某些之前的方法允許描繪了在數(shù)據(jù)中的某些關(guān)系的示圖,但是,該示圖不是交互性的,并且,需要這種專家組花費(fèi)大量的時(shí)間來理解關(guān)系。另外,之前方法的輸出并不允許說明性數(shù)據(jù)分析(該分析可被快速修改以發(fā)現(xiàn)新的關(guān)系)。而是,之前的方法需要在測(cè)試之前公式化假說。

發(fā)明內(nèi)容
提供了用于對(duì)數(shù)據(jù)分析的可視化的示例性系統(tǒng)和方法。在各種實(shí)施例中,一種方法包括訪問數(shù)據(jù)庫;分析數(shù)據(jù)庫以標(biāo)識(shí)數(shù)據(jù)的分簇;生成包括多個(gè)節(jié)點(diǎn)和多個(gè)邊的交互式可視化,其中,多個(gè)節(jié)點(diǎn)中的第一節(jié)點(diǎn)代表分簇,并且,多個(gè)邊中的邊代表多個(gè)節(jié)點(diǎn)中的節(jié)點(diǎn)的交集;響應(yīng)于用戶動(dòng)作,選擇并拖住第一節(jié)點(diǎn);以及響應(yīng)于用戶選擇并拖住第一節(jié)點(diǎn)的動(dòng)作,重定向交互式可視化。在各種實(shí)施例中,該方法還包括將數(shù)據(jù)保存在與所選第一節(jié)點(diǎn)相關(guān)聯(lián)的數(shù)據(jù)庫中。該方法可包括選擇第二節(jié)點(diǎn)并顯示關(guān)于第一節(jié)點(diǎn)和第二節(jié)點(diǎn)的信息。在某些實(shí)施例中,該方法可包括接收對(duì)數(shù)據(jù)庫的數(shù)據(jù)標(biāo)識(shí)符的選擇,并且,加亮顯示多個(gè)節(jié)點(diǎn)中的與選擇相關(guān)聯(lián)的某些節(jié)點(diǎn)。交互式可視化的第一節(jié)點(diǎn)和第二節(jié)點(diǎn)基于所選的第一函數(shù)被不同地著色。在一個(gè)示例中,第一函數(shù)是過濾器。該方法還可包括接收第二函數(shù)選擇,并且,基于第二函數(shù)選擇來變更第一節(jié)點(diǎn)和第二節(jié)點(diǎn)的顏色。在各種實(shí)施例中,該方法還包括接收間隔值和重疊百分比,基于間隔值和重疊百分比重新分析數(shù)據(jù)庫,以及基于重新的分析來重新生成交互式可視化。另外,該方法可包括在生成后顯示交互式可視化的移動(dòng),移動(dòng)是基于對(duì)多個(gè)節(jié)點(diǎn)的視覺最優(yōu)化的。
在某些實(shí)施例中,該方法還可包括顯示關(guān)于第一節(jié)點(diǎn)和所選第二節(jié)點(diǎn)的統(tǒng)計(jì)信息。對(duì)數(shù)據(jù)庫的分析是拓?fù)浞治觥T谀承?shí)施例中,對(duì)數(shù)據(jù)庫的分析是非線性數(shù)據(jù)分析。一種示例性系統(tǒng),包括處理器、輸入模塊、分析模塊和可視化模塊。該輸入模塊被配置為訪問數(shù)據(jù)庫。該分析模塊被配置為分析數(shù)據(jù)庫以標(biāo)識(shí)數(shù)據(jù)的分簇。該可視化模塊被配置為生成包括多個(gè)節(jié)點(diǎn)和多個(gè)邊的交互式可視化,其中,多個(gè)節(jié)點(diǎn)中的第一節(jié)點(diǎn)代表分簇,并且,多個(gè)邊中的邊代表多個(gè)節(jié)點(diǎn)中的節(jié)點(diǎn)的交集,該可視化模塊還被配置為響應(yīng)于用戶動(dòng)作,選擇并拖住第一節(jié)點(diǎn),以及響應(yīng)于用戶選擇并拖住第一節(jié)點(diǎn)的動(dòng)作,重定向交互式可視化。一種示例性計(jì)算機(jī)可讀介質(zhì)可包括指令。指令通過處理器執(zhí)行以執(zhí)行一種方法。 該方法包括訪問數(shù)據(jù)庫;分析數(shù)據(jù)庫以標(biāo)識(shí)數(shù)據(jù)的分簇;生成包括多個(gè)節(jié)點(diǎn)和多個(gè)邊的交互式可視化,其中,多個(gè)節(jié)點(diǎn)中的第一節(jié)點(diǎn)代表分簇,并且,多個(gè)邊中的邊代表多個(gè)節(jié)點(diǎn)中的節(jié)點(diǎn)的交集;響應(yīng)于用戶動(dòng)作,選擇并拖住第一節(jié)點(diǎn);以及響應(yīng)于用戶選擇并拖住第一節(jié)點(diǎn)的動(dòng)作,重定向交互式可視化。


圖1是實(shí)施了實(shí)施例的示例性環(huán)境。圖2是示例性分析服務(wù)器的框圖。圖3是描繪了在某些實(shí)施例中的對(duì)數(shù)據(jù)集分析和可視化的示例性方法的流程圖。圖4是在某些實(shí)施例中的示例性ID字段選擇界面窗口。圖5是在某些實(shí)施例中的示例性數(shù)據(jù)字段選擇界面窗口。圖6是在某些實(shí)施例中的示例性測(cè)量標(biāo)準(zhǔn)和過濾器選擇界面窗口。圖7是在某些實(shí)施例中的示例性過濾器參數(shù)界面窗口。圖8是在某些實(shí)施例中的用于數(shù)據(jù)分析和生成可視化的流程圖。圖9是在某些實(shí)施例中的示例性交互可視化。圖10是在某些實(shí)施例中顯示了說明信息窗口的示例性交互可視化。圖11是在某些實(shí)施例中的交互式可視化的功能的流程圖。
具體實(shí)施例方式在各種實(shí)施例中,此處描述了不同于利用基于文本的方法的用于利用拖放(drag and drop)方法處理、分析并可視化數(shù)據(jù)的系統(tǒng)。明智地,數(shù)據(jù)分析工具不必被看做是“解算機(jī)(solver)”,而是被看做用于與數(shù)據(jù)交互的工具。例如,數(shù)據(jù)分析可包括若干個(gè)迭代處理,其中,計(jì)算工具指向在數(shù)據(jù)集中的興趣區(qū)域。然后,數(shù)據(jù)集可被具有關(guān)于數(shù)據(jù)的領(lǐng)域?qū)iL的人檢查,并且,數(shù)據(jù)集可隨后受制于進(jìn)一步的計(jì)算分析。在某些實(shí)施例中,此處所描述的方法提供在一邊的數(shù)學(xué)構(gòu)造(包括交互式可視化(例如,示圖))和在另一邊的數(shù)據(jù)之間來回反復(fù)。在此處所描述的某些實(shí)施例中的對(duì)數(shù)據(jù)分析的一個(gè)示例中,討論了可比現(xiàn)有技術(shù)更加強(qiáng)大的示例性分簇工具,因?yàn)槿藗兛稍诜执刂姓业浇Y(jié)構(gòu)并學(xué)習(xí)分簇如何在時(shí)段中變化或在尺度或分辨率的變化中變化。示例性交互性可視化工具(例如,此處進(jìn)一步所描述的可視化)可以以可被容易地可視化的示圖的形式產(chǎn)生組合輸出。在某些實(shí)施例中,示例性交互式可視化工具可比當(dāng)前的方法(諸如,多維定標(biāo))對(duì)距離的概念中的變更更加不敏感。此處所描述的某些實(shí)施例允許對(duì)來自可視化的數(shù)據(jù)的操縱。例如,從可視化被認(rèn)為是有趣的數(shù)據(jù)的一部分可被選擇并被轉(zhuǎn)換成可隨后被進(jìn)一步分析的數(shù)據(jù)庫對(duì)象。此處所描述的某些實(shí)施例允許在可視化中的對(duì)興趣點(diǎn)數(shù)據(jù)的位置,使得在給定可視化和可視化所代表的信息之間的聯(lián)系可被容易地理解。圖1是實(shí)施例可被實(shí)施的示例性環(huán)境100。在各種實(shí)施例中,可本地執(zhí)行數(shù)據(jù)分析和交互式可視化(例如,通過在本地?cái)?shù)字設(shè)備上的軟件和/或硬件),或通過網(wǎng)絡(luò)(例如, 經(jīng)由云計(jì)算),或二者的組合。在許多這些實(shí)施例中,數(shù)據(jù)結(jié)構(gòu)被訪問以獲取用于分析的數(shù)據(jù),基于由用戶所選擇的屬性和參數(shù)來執(zhí)行該分析,并且,交互式可視化被生成和顯示。在本地執(zhí)行所有或某些活動(dòng)和通過網(wǎng)絡(luò)執(zhí)行所有或某些活動(dòng)之間存在許多優(yōu)點(diǎn)。環(huán)境100包括用戶設(shè)備10 到102η、通信網(wǎng)絡(luò)104、數(shù)據(jù)存儲(chǔ)服務(wù)器106和分析服務(wù)器108。環(huán)境100描繪了功能通過網(wǎng)絡(luò)被執(zhí)行的實(shí)施例。在該實(shí)施例中,一個(gè)或多個(gè)用戶可通過在通信網(wǎng)絡(luò)104上將數(shù)據(jù)存儲(chǔ)在數(shù)據(jù)存儲(chǔ)服務(wù)器106中來利用云計(jì)算。分析服務(wù)器108可執(zhí)行分析和對(duì)交互式可視化的生成。用戶設(shè)備10 到102η可以是任意數(shù)字設(shè)備。數(shù)字設(shè)備是包括存儲(chǔ)器和處理器的任意設(shè)備。圖2中進(jìn)一步描述了數(shù)字設(shè)備。用戶設(shè)備10 到102η可以使任意類型的可用于訪問、分析和/或查看數(shù)據(jù)的數(shù)字設(shè)備,其包括但不限于桌面型計(jì)算機(jī)、膝上型筆記本、 筆記本或其他計(jì)算設(shè)備。在各種實(shí)施例中,諸如數(shù)據(jù)分析師的用戶可通過用戶設(shè)備10 生成將要保存在數(shù)據(jù)存儲(chǔ)服務(wù)器106中的數(shù)據(jù)庫或其他數(shù)據(jù)結(jié)構(gòu)。用戶設(shè)備10 可經(jīng)由通信網(wǎng)絡(luò)104與分析服務(wù)器108通信,以執(zhí)行對(duì)在數(shù)據(jù)庫中的數(shù)據(jù)的分析、檢查和可視化。用戶設(shè)備10 可包括用于與一個(gè)或多個(gè)在分析服務(wù)器108上的應(yīng)用相交互的客戶端程序。在其他實(shí)施例中,用戶設(shè)備10 可利用瀏覽器或其他標(biāo)準(zhǔn)程序來與分析服務(wù)器 108通信。在各種實(shí)施例中,用戶設(shè)備10 經(jīng)由虛擬私用網(wǎng)來與分析服務(wù)器108通信。本領(lǐng)域技術(shù)人員將理解,可加密或否則保護(hù)在用戶設(shè)備10 、數(shù)據(jù)存儲(chǔ)服務(wù)器106和/或分析服務(wù)器108之間的通信。通信網(wǎng)絡(luò)104可以是允許數(shù)據(jù)設(shè)備通信的任意網(wǎng)絡(luò)。通信網(wǎng)絡(luò)104可以是因特網(wǎng)和/或包括LAN和WAN。通信網(wǎng)絡(luò)104可支持無線和或有線通信。數(shù)據(jù)存儲(chǔ)服務(wù)器110是被配置為存儲(chǔ)數(shù)據(jù)的數(shù)字設(shè)備。在各種實(shí)施例中,數(shù)據(jù)存儲(chǔ)服務(wù)器110存儲(chǔ)數(shù)據(jù)庫和/或其他數(shù)據(jù)結(jié)構(gòu)。數(shù)據(jù)存儲(chǔ)服務(wù)器110可以是單個(gè)服務(wù)器或服務(wù)器的組合。在一個(gè)示例中,數(shù)據(jù)存儲(chǔ)服務(wù)器110可以是安全服務(wù)器,其中,用戶可在安全的連接上(例如,經(jīng)由https)存儲(chǔ)數(shù)據(jù)。數(shù)據(jù)可被加密和備份。在某些實(shí)施例中,數(shù)據(jù)存儲(chǔ)服務(wù)器106被諸如亞馬遜的S3服務(wù)之類的第三方所操作。數(shù)據(jù)庫或其他數(shù)據(jù)結(jié)構(gòu)可包括大的高維度數(shù)據(jù)集。傳統(tǒng)上,這些數(shù)據(jù)集很難以分析,結(jié)果是利用之前的方法可能無法識(shí)別在數(shù)據(jù)中的關(guān)系。另外,之前的方法可能是計(jì)算低效的。分析服務(wù)器108是可被配置為分析數(shù)據(jù)的數(shù)字設(shè)備。在各種實(shí)施例中,分析服務(wù)器可執(zhí)行許多功能以解釋、檢查、分析和顯示數(shù)據(jù)和/或數(shù)據(jù)中的關(guān)系。在某些實(shí)施例中,
6分析服務(wù)器108應(yīng)用由用戶所選擇的度量標(biāo)準(zhǔn)(metric)、過濾器和分辨率參數(shù)來至少部分地執(zhí)行對(duì)大的數(shù)據(jù)集的拓?fù)浞治?。這里分析被進(jìn)一步在圖8中討論。分析服務(wù)器108可生成對(duì)分析的輸出的交互式可視化。交互式可視化允許用戶觀察并探索數(shù)據(jù)中的關(guān)系。在各種實(shí)施例中,交互式可視化允許用戶選擇包括已被分簇的數(shù)據(jù)的節(jié)點(diǎn)。用戶可隨后訪問下面的數(shù)據(jù)、在下面的數(shù)據(jù)撒謊能夠執(zhí)行進(jìn)一步的分析(例如, 統(tǒng)計(jì)分析),并且,在交互式可視化中手動(dòng)重定位一個(gè)或多個(gè)示圖(例如,此處所描述的節(jié)點(diǎn)和邊的結(jié)構(gòu))。分析服務(wù)器108還可允許用戶與數(shù)據(jù)交互,請(qǐng)參看圖形結(jié)果。交互式可視化被進(jìn)一步在圖9到圖11中討論。在某些實(shí)施例中,分析服務(wù)器108在私用和/或安全通信網(wǎng)絡(luò)上與一個(gè)或多個(gè)用戶設(shè)備10 到102η交互。用戶設(shè)備10 可包括允許用戶與數(shù)據(jù)存儲(chǔ)服務(wù)器106、分析服務(wù)器108、另一用戶設(shè)備(例如,用戶設(shè)備102η)、數(shù)據(jù)庫和/或執(zhí)行在分析服務(wù)器108上的分析應(yīng)用相交互的客戶端程序。本領(lǐng)域技術(shù)人員將理解,所有或部分?jǐn)?shù)據(jù)分析可出現(xiàn)在用戶設(shè)備10 處。另外, 所有或部分與可視化(例如,示圖)的交互可在用戶設(shè)備10 上執(zhí)行。雖然描繪了兩個(gè)用戶設(shè)備10 和102η,但是,本領(lǐng)域技術(shù)人員將理解,在任意位置(例如,彼此遠(yuǎn)離)中可存在任意數(shù)量的用戶設(shè)備。類似地,可存在任意數(shù)量的通信網(wǎng)絡(luò)、 數(shù)據(jù)存儲(chǔ)服務(wù)器和分析服務(wù)器。云計(jì)算可允許在更快的連接上對(duì)大數(shù)據(jù)集(例如,經(jīng)由商用存儲(chǔ)服務(wù))的更棒的訪問。另外,本領(lǐng)域技術(shù)人員將理解提供給一個(gè)或多個(gè)用戶的服務(wù)和計(jì)算資源可以是可擴(kuò)展的。圖2是示例性分析服務(wù)器108的框圖。在示例性實(shí)施例中,分析服務(wù)器108包括處理器202、輸入/輸出(I/O)接口 204、通信網(wǎng)絡(luò)接口 206、存儲(chǔ)(memory)系統(tǒng)208,以及貯存(storage)系統(tǒng)210。處理器202可包括任意處理器或帶有一個(gè)或多個(gè)內(nèi)核的處理器的組合。輸入/輸出(I/O)設(shè)備204可包括用于各種I/O設(shè)備(諸如,例如,鍵盤、鼠標(biāo)和顯示設(shè)備)的接口。示例性通信網(wǎng)絡(luò)接口 206被配置為允許分析服務(wù)器108與通信網(wǎng)絡(luò)104 通信(參見圖1)。通信網(wǎng)絡(luò)接口 206可支持在以太網(wǎng)連接、串行連接、并行連接和/或ATA 連接上的通信。通信網(wǎng)絡(luò)接口 206還可支持無線通信(例如,802. lla/b/g/n, WiMax, LTE, WiFi)。對(duì)本領(lǐng)域技術(shù)人員而言,將很顯然,通信網(wǎng)絡(luò)界面206可支持許多有線和無線標(biāo)準(zhǔn)。存儲(chǔ)系統(tǒng)208可以是任意類型的存儲(chǔ)器,包括RAM、ROM或閃存、高速緩存、虛擬內(nèi)存等。在各種實(shí)施例中,工作數(shù)據(jù)被存儲(chǔ)在存儲(chǔ)系統(tǒng)208中。在存儲(chǔ)系統(tǒng)208中的數(shù)據(jù)可被清除或最終轉(zhuǎn)移到貯存系統(tǒng)210。貯存系統(tǒng)210包括任意被配置為檢索并存儲(chǔ)數(shù)據(jù)的貯存器。貯存系統(tǒng)210的某些示例包括閃存驅(qū)動(dòng)、硬盤驅(qū)動(dòng)、光驅(qū)動(dòng)和/或磁帶。存儲(chǔ)系統(tǒng)208和貯存系統(tǒng)210中的每一個(gè)包括計(jì)算機(jī)可讀介質(zhì),該計(jì)算機(jī)可讀介質(zhì)存儲(chǔ)由處理器202所執(zhí)行的指令(例如,軟件程序)。貯存系統(tǒng)210包括多個(gè)由本發(fā)明的實(shí)施例所利用的模塊。模塊可以是硬件、軟件 (例如,包括由處理器可執(zhí)行的指令)、或二者的組合。在一個(gè)實(shí)施例中,貯存系統(tǒng)210包括處理模塊212,該處理模塊212包括輸入模塊214、過濾模塊216、分辨率模塊218、分析模塊220、可視化引擎222和數(shù)據(jù)庫存儲(chǔ)224。分析服務(wù)器108和/或貯存系統(tǒng)210的可替換實(shí)施例可包括更多、更少或功能上等同的組件和模塊。輸入模塊214可被配置為從用戶設(shè)備10 接收命令和偏好。在各種示例中,輸入模塊214從用戶接收選擇,該選擇可被用于執(zhí)行分析。分析的輸出可以是交互式可視化。輸入模塊214可向用戶提供各種交互窗口,該交互窗口允許用戶選擇并訪問數(shù)據(jù)庫、選擇與數(shù)據(jù)庫相關(guān)聯(lián)的字段、選擇度量標(biāo)準(zhǔn)、選擇一個(gè)或多個(gè)過濾器,以及針對(duì)分析標(biāo)識(shí)分辨率參數(shù)。在一個(gè)示例中,輸入模塊214接收數(shù)據(jù)庫標(biāo)識(shí)符并訪問大型多維數(shù)據(jù)庫。輸入模塊214可掃描數(shù)據(jù)庫,并且,向用戶提供允許用戶標(biāo)識(shí)ID字段的界面窗口。ID字段是針對(duì)每個(gè)數(shù)據(jù)點(diǎn)的標(biāo)識(shí)符。在一個(gè)示例中,標(biāo)識(shí)符是唯一的。相同的列名可出現(xiàn)在表中,過濾器從該表中被選擇。在選擇了 ID字段之后,輸入模塊214可隨后向用戶提供另一界面窗口,以允許用戶從數(shù)據(jù)庫表中選擇一個(gè)或多個(gè)數(shù)據(jù)字段。雖然可在此處描述交互式窗口,但是,本領(lǐng)域技術(shù)人員將理解,可利用任意窗口、 圖形用戶界面和/或命令行來接收或向用戶或用戶設(shè)備10 提示信息。過濾模塊216可隨后向用戶提供界面窗口,以允許用戶選擇將要用于對(duì)在所選數(shù)據(jù)字段中的數(shù)據(jù)的分析中的度量標(biāo)準(zhǔn)。過濾模塊216還可允許用戶選擇和/或定義一個(gè)或多個(gè)濾波器。分辨率模塊218可允許用戶選擇包括過濾參數(shù)的分辨率。在一個(gè)示例中,用戶輸入濾波器的多個(gè)間隔和重疊百分比。分析模塊220可基于數(shù)據(jù)庫和由用戶所提供的信息來執(zhí)行數(shù)據(jù)分析。在各種實(shí)施例中,分析模塊220執(zhí)行代數(shù)拓?fù)浞治?,以?biāo)識(shí)在數(shù)據(jù)和數(shù)據(jù)簇中的結(jié)構(gòu)和關(guān)系。本領(lǐng)域技術(shù)人員將理解,分析模塊220可利用并行算法或利用對(duì)各種統(tǒng)計(jì)技術(shù)(例如,將自助 (bootstrap)概括為蜿蜒(zig-zag)方法)的概括來增加可被處理的數(shù)據(jù)集的大小。在圖 8中進(jìn)一步討論了該分析。本領(lǐng)域技術(shù)人員將理解,分析模塊220并不限于代數(shù)拓?fù)浞治觯?而是可執(zhí)行任何分析??梢暬?22生成包括來自分析模塊220的輸出的交互式可視化。交互式可視化允許用戶圖形地看到全部或部分分析。交互式可視化還允許用戶與交互式可視化。例如, 用戶可從可視化中選擇部分圖形并且/或與下面的數(shù)據(jù)和/或下面的分析交互。然后,用戶可變更分析的參數(shù)(例如,變更度量標(biāo)準(zhǔn)、一個(gè)或多個(gè)過濾器或一個(gè)或多個(gè)分辨率),該分析允許用戶視覺地標(biāo)識(shí)在數(shù)據(jù)中的關(guān)系,利用之前的手段這是無法檢測(cè)到的。在圖9到圖11中進(jìn)一步描述了交互式可視化。數(shù)據(jù)庫存儲(chǔ)2M被配置為存儲(chǔ)正被訪問的所有或部分?jǐn)?shù)據(jù)庫。在某些實(shí)施例中, 數(shù)據(jù)庫存儲(chǔ)2M可存儲(chǔ)數(shù)據(jù)庫所保存的部分。另外,數(shù)據(jù)庫存儲(chǔ)2M可被用于存儲(chǔ)用戶偏好、參數(shù)和分析輸出,從而允許用戶在數(shù)據(jù)庫上執(zhí)行許多不同的函數(shù)而不丟失之前的工作。本領(lǐng)域技術(shù)人員將理解,所有或部分處理模塊212可在用戶設(shè)備10 處或數(shù)據(jù)庫存儲(chǔ)服務(wù)器106處。在某些實(shí)施例中,處理模塊212的所有或部分功能可由用戶設(shè)備10 執(zhí)行。在各種實(shí)施例中,此處所討論的系統(tǒng)和方法可被實(shí)現(xiàn)在一個(gè)或多個(gè)數(shù)字設(shè)備中。 在某些示例中,此處所討論的某些實(shí)施例可由處理器所執(zhí)行的計(jì)算機(jī)程序(指令)所實(shí)現(xiàn)。 計(jì)算機(jī)程序可提供圖形用戶界面。雖然討論了這種計(jì)算機(jī)程序,但是,本領(lǐng)域技術(shù)人員將理解,可利用以下中的任一個(gè)(單獨(dú)或組合)來執(zhí)行實(shí)施例,其包括但不限于計(jì)算機(jī)程序、多個(gè)計(jì)算機(jī)程序、固件和或硬件。圖3是描繪了在某些實(shí)施例中的對(duì)數(shù)據(jù)集分析和可視化的示例方法的流程圖 300。在步驟302,輸入模塊214訪問數(shù)據(jù)庫。數(shù)據(jù)庫可以是包括數(shù)據(jù)(例如,非常大的多維數(shù)據(jù)的數(shù)據(jù)集)的任意數(shù)據(jù)結(jié)構(gòu)。在某些實(shí)施例中,數(shù)據(jù)庫可以是關(guān)系數(shù)據(jù)庫。在某些示例中,關(guān)系數(shù)據(jù)庫可利用MySQL、甲骨文、微軟SQL服務(wù)器、Aster nCluster、"Teradata和/ 或Vertica。本領(lǐng)域技術(shù)人員將理解,數(shù)據(jù)庫可以不是關(guān)系數(shù)據(jù)庫。在某些實(shí)施例中,輸入模塊214從用戶設(shè)備102a(參照?qǐng)D1)接收數(shù)據(jù)庫標(biāo)識(shí)符和數(shù)據(jù)庫(例如,數(shù)據(jù)存儲(chǔ)服務(wù)器106)的位置。輸入模塊214可隨后訪問已標(biāo)識(shí)的數(shù)據(jù)庫。 在各種實(shí)施例中,輸入模塊214可從許多不同的源讀取數(shù)據(jù),其包括但不限于MS Excel文件、文本文件(例如,被限定的或CSV)、Matlab. mat格式或任意其他文件。在某些實(shí)施例中,輸入模塊214接收IP地址或宿主數(shù)據(jù)庫的服務(wù)器的主機(jī)名、用戶名、密碼和數(shù)據(jù)庫標(biāo)識(shí)符。該信息(此處被稱為“連接信息”)可被緩存以用于稍后使用。 本領(lǐng)域技術(shù)人員將理解,可本地訪問數(shù)據(jù)庫,并且,可需要所有、某些連接信息或不需要連接信息。在一個(gè)示例中,用戶設(shè)備10 可具有對(duì)本地存儲(chǔ)在用戶設(shè)備10 上的數(shù)據(jù)庫的完全訪問,使得IP地址不是必須的。在另一示例中,用戶設(shè)備10 可能已經(jīng)載入了數(shù)據(jù)庫, 并且,輸入模塊214僅通過訪問所載入的數(shù)據(jù)庫來開始。在各種實(shí)施例中,所標(biāo)識(shí)的數(shù)據(jù)庫在表中存儲(chǔ)數(shù)據(jù)。表可具有存儲(chǔ)列名和其數(shù)據(jù)類型的“列說明”。在表中的“行”可以是帶有正確類型的每列的一個(gè)條目的數(shù)組。在一個(gè)示例中,用以存儲(chǔ)雇員記錄的表可具有如下的列說明· employee_id主鍵int (這可將雇員的ID存儲(chǔ)為整數(shù)型并唯一地標(biāo)識(shí)行) 年齡 int 性別char (1)(雇員的性別可以是M或F的單個(gè)字符) 薪水double (雇員的薪水可以是浮點(diǎn)數(shù)) 名字varchaH雇員的名字可以是可變長的字符串)在該示例中,每個(gè)雇員對(duì)應(yīng)于在該表中的一行。另外,在該示例性關(guān)系數(shù)據(jù)庫中的表被組織成被稱為數(shù)據(jù)庫的邏輯單元。類似于文件系統(tǒng)的是數(shù)據(jù)庫可被想成是文件夾和文件是表。對(duì)數(shù)據(jù)庫的訪問可由數(shù)據(jù)庫管理員通過分配用戶名/密碼對(duì)以認(rèn)證用戶來被控制。一旦數(shù)據(jù)庫被訪問,輸入模塊214可允許用戶訪問之前所存儲(chǔ)的分析或開始新的分析。如果用戶開始新的分析,則輸入模塊214可向用戶設(shè)備10 提供允許用戶從數(shù)據(jù)庫標(biāo)識(shí)表的界面窗口。在一個(gè)示例中,輸入模塊214從所標(biāo)識(shí)的數(shù)據(jù)庫提供可用表的列表。在步驟304,輸入模塊214從數(shù)據(jù)庫中接收標(biāo)識(shí)了表的表標(biāo)識(shí)符。輸入模塊214可隨后從表標(biāo)識(shí)符向用戶提供可用ID字段的列表。在步驟306,輸入模塊214從用戶和/或用戶設(shè)備10 接收ID字段標(biāo)識(shí)符。在某些實(shí)施例中,該ID字段是主鍵。在選擇了主鍵之后,輸入模塊214可生成新的界面窗口,以允許用戶選擇數(shù)據(jù)字段以用于分析。在步驟308,輸入模塊214從用戶設(shè)備10 接收數(shù)據(jù)字段標(biāo)識(shí)符。在數(shù)據(jù)字段中的數(shù)據(jù)可隨后被分析模塊220分析。在步驟310,過濾模塊216標(biāo)識(shí)度量標(biāo)準(zhǔn)。在某些實(shí)施例中,過濾模塊216和/或輸入模塊214生成界面窗口,該界面窗口允許用戶設(shè)備10 的用戶選擇各種不同的度量標(biāo)準(zhǔn)和過濾偏好。界面窗口可以是標(biāo)識(shí)將要用于分析中的各種距離度量標(biāo)準(zhǔn)的下拉菜單。度量標(biāo)準(zhǔn)選項(xiàng)可包括但不限于歐幾里得、DB度量標(biāo)準(zhǔn)、方差歸一化歐幾里得和完全歸一化歐幾里得。此處進(jìn)一步描述了度量標(biāo)準(zhǔn)和分析。在步驟312中,過濾模塊216選擇一個(gè)或多個(gè)過濾器。在某些實(shí)施例中,用戶選擇一個(gè)或多個(gè)過濾器標(biāo)識(shí)符并將一個(gè)或多個(gè)過濾器標(biāo)識(shí)符提供給過濾模塊216。此處還描述了在分析中的過濾器的角色。例如,過濾器可以是用戶所定義的、幾何的、或基于已被預(yù)處理的數(shù)據(jù)。在某些實(shí)施例中,基于數(shù)據(jù)的過濾器是數(shù)字?jǐn)?shù)據(jù),其可一般地將實(shí)數(shù)集分配給在表中的每行貨在數(shù)據(jù)中的每個(gè)點(diǎn)。多個(gè)幾何過濾器對(duì)于用戶來言是可用于選擇的。幾何過濾器可包括但不限于 密度· Ll離心率· L-無限離心率 基于見證的密度 基于見證的離心率 距離固定點(diǎn)的離心率 離心率的近似峭度在步驟314中,分辨率模塊218定義了將要與過濾器一起用于分析中的分辨率。分辨率可包括多個(gè)間隔和重疊參數(shù)。在各種實(shí)施例中,分辨率模塊218允許用戶針對(duì)一個(gè)或多個(gè)過濾器調(diào)整間隔的數(shù)量和重疊參數(shù)(例如,重疊百分比)。在步驟316中,分析模塊220基于度量標(biāo)準(zhǔn)、一個(gè)或多個(gè)過濾器和一個(gè)或多個(gè)分辨率來處理所選擇字段的數(shù)據(jù)以生成可視化。在圖8中討論了該處理。在步驟318中,可視化模塊222顯示交互式可視化。在各種實(shí)施例中,可視化可在二維或三維空間中渲染。可視化模塊222可利用與好的可視化(例如,嵌入的能量)相關(guān)的目標(biāo)函數(shù)的最優(yōu)化算法??梢暬娠@示對(duì)應(yīng)于在分析輸出和通過輸出將其如所規(guī)定地連接的邊中的部分分簇中的每一個(gè)的節(jié)點(diǎn)的集合。在圖9到圖11中進(jìn)一步討論了交互式可視化。雖然在許多示例中討論了作為提供界面窗口的輸入模塊214,但是,本領(lǐng)域技術(shù)人員將理解,所有或部分界面被由客戶端在用戶設(shè)備10 上提供。另外,在某些實(shí)施例中,用戶設(shè)備10 可運(yùn)行在所有或某些處理模塊212上。圖4到圖7描繪了各種界面窗口,以允許用戶做出選擇、輸入信息(例如,字段、度量標(biāo)準(zhǔn)和過濾器)、提供參數(shù)(例如,分辨率),以及提供將要用于分析的數(shù)據(jù)(例如,標(biāo)識(shí)數(shù)據(jù)庫)。本領(lǐng)域技術(shù)人員將理解,任意圖形用戶界面或命令行可被用于做出選擇、輸入信息、提供參數(shù)和提供數(shù)據(jù)。圖4是在某些實(shí)施例中的示例性ID字段選擇界面窗口 400。ID字段選擇界面窗口 400允許用戶標(biāo)識(shí)ID字段。ID字段選擇界面窗口 400包括表搜索字段402、表列表404 和字段選擇窗口 406。在各種實(shí)施例中,輸入模塊214從數(shù)據(jù)庫存儲(chǔ)224、用戶設(shè)備10 或數(shù)據(jù)存儲(chǔ)服務(wù)器106標(biāo)識(shí)并訪問數(shù)據(jù)庫。輸入模塊214可隨后生成ID字段選擇界面窗口 400,并且,提供在表列表404中的所選數(shù)據(jù)庫的可用表的列表。用戶可點(diǎn)擊表或通過在表搜索字段402中輸入搜索查詢(例如,關(guān)鍵字)來搜索表。一旦表被標(biāo)識(shí)(例如,被用戶點(diǎn)擊),字段選擇窗口 406可提供在所選表中的可用字段列表。用戶可隨后從字段選擇窗口 406選擇字段作為 ID字段。在某些實(shí)施例中,可選擇任意數(shù)量的字段作為一個(gè)或多個(gè)ID字段。圖5是在某些實(shí)施例中的示例性數(shù)據(jù)字段選擇界面窗口 500。數(shù)據(jù)字段選擇界面窗口 500允許用戶標(biāo)識(shí)數(shù)據(jù)字段。數(shù)據(jù)字段選擇界面窗口 500包括表搜索字段502、表列表 504、字段選擇窗口 506和所選窗口 508。在各種實(shí)施例中,在選擇了 ID字段之后,輸入模塊214提供在表列表504中的所選數(shù)據(jù)庫的可用表的列表。與在圖4中的表搜索字段402相類似,用戶可點(diǎn)擊表或者通過在表搜索字段502中輸入搜索查詢(例如,關(guān)鍵字)來搜索表。一旦表被標(biāo)識(shí)(例如,被用戶點(diǎn)擊),字段選擇窗口 506可提供在所選表中的可用字段的列表。用戶可隨后將從字段選擇窗口 506的任意數(shù)量的字段選作數(shù)據(jù)字段。所選的數(shù)據(jù)字段可出現(xiàn)在所選的窗口 508 中。用戶還可取消對(duì)出現(xiàn)在所選窗口 508中的字段的選擇。本領(lǐng)域技術(shù)人員將理解,在表的列表504中被用戶所選擇的表可以是關(guān)于圖4所選的相同表。但是,在某些實(shí)施例中,用戶可選擇不同的表。另外,在各種實(shí)施例中,用戶可從各種不同的表中選擇字段。圖6是在某些實(shí)施例中的示例性度量標(biāo)準(zhǔn)和過濾選擇界面窗口 600。度量標(biāo)準(zhǔn)和過濾選擇界面窗口 600允許用戶標(biāo)識(shí)度量標(biāo)準(zhǔn)、添加一個(gè)或多個(gè)過濾器并調(diào)整過濾參數(shù)。 度量標(biāo)準(zhǔn)和過濾選擇界面窗口 600包括度量標(biāo)準(zhǔn)下拉菜單602、從數(shù)據(jù)庫的添加過濾器按鈕604,以及添加幾何過濾器按鈕606。在各種實(shí)施例中,用戶可點(diǎn)擊度量標(biāo)準(zhǔn)下拉菜單602來查看各種度量標(biāo)準(zhǔn)選項(xiàng)。 此處描述了各種度量標(biāo)準(zhǔn)選項(xiàng)。在某些實(shí)施例中,用戶可定義度量標(biāo)準(zhǔn)。用戶所定義的度量標(biāo)準(zhǔn)可隨后用于分析。在一個(gè)示例中,有限的度量標(biāo)準(zhǔn)空間數(shù)據(jù)可從數(shù)據(jù)倉庫(即,數(shù)據(jù)庫、電子數(shù)據(jù)表或Matlab文件)構(gòu)造。這可意味著選擇字段的集合,當(dāng)該字段的條目時(shí)浮點(diǎn)或整型變量時(shí), 該字段的條目指示針對(duì)這些字段利用標(biāo)準(zhǔn)的歐幾里得度量標(biāo)準(zhǔn)的度量標(biāo)準(zhǔn)。還可支持諸如點(diǎn)集之間的圖形距離的其他距離的概念。分析模塊220可利用作為距離函數(shù)的一部分的度量標(biāo)準(zhǔn)來執(zhí)行分析。距離函數(shù)可通過公式、距離矩陣或其他計(jì)算例程來表示。用戶可通過點(diǎn)擊從數(shù)據(jù)庫添加過濾器按鈕604 來從數(shù)據(jù)庫添加過濾器。度量標(biāo)準(zhǔn)空間可由關(guān)系數(shù)據(jù)庫、Matlab文件、Excel電子表格或其他存儲(chǔ)并操縱數(shù)據(jù)的方法生成。度量標(biāo)準(zhǔn)和過濾選擇界面窗口 600可允許用戶瀏覽其他文件以用于分析。在圖8中還描述了分析和度量標(biāo)準(zhǔn)函數(shù)。用戶還可通過點(diǎn)擊添加幾何過濾器按鈕606來添加幾何過濾器。在各種實(shí)施例中,度量標(biāo)準(zhǔn)和過濾選擇界面窗口 600可提供用戶可從中選擇的幾何過濾器列表。圖7是在某些實(shí)施例中的示例性過濾參數(shù)界面窗口 700。過濾參數(shù)界面窗口 700 允許用戶確定一個(gè)或多個(gè)所選過濾器(例如,在度量標(biāo)準(zhǔn)和過濾選擇界面窗口 600中所選的過濾器)的分辨率。過濾參數(shù)界面窗口 700包括過濾器名菜單看702、間隔字段704、重疊條706,以及完成按鈕708。過濾參數(shù)界面窗口 700允許用戶從過濾器名菜單702中選擇過濾器。在某些實(shí)施例中,過濾器名菜單702是指示在度量標(biāo)準(zhǔn)和過濾選擇界面窗口 600中由用戶所選擇的所有過濾器的下落框。一旦過濾器被選擇,過濾器名將出現(xiàn)在過濾器名菜單702中。用戶可隨后針對(duì)一個(gè)、某些或所有所選的過濾器變更間隔和重疊。
間隔字段704允許用戶針對(duì)在過濾器名菜單702中所標(biāo)識(shí)的過濾器來定義多個(gè)間隔。用戶可輸入多個(gè)間隔或向上或向下滾動(dòng)以獲得所希望的間隔數(shù)。用戶可選擇任意數(shù)量的間隔。在圖8中進(jìn)一步討論了間隔的功能。
重疊條706允許用戶定義在過濾器名菜單702中所標(biāo)識(shí)的過濾器的間隔的重疊程度。在一個(gè)示例中,重疊條706包括允許用戶定義將要與所標(biāo)志的過濾器一起使用的間隔的重疊百分比的滑動(dòng)器。用戶可設(shè)置任意百分比的重疊。
一旦針對(duì)所希望的過濾器定義了間隔和重疊,用戶可點(diǎn)擊完成按鈕。用戶可隨后返回到度量標(biāo)準(zhǔn)和過濾選擇界面窗口 600,并且,看到新的選項(xiàng)以運(yùn)行分析。在某些實(shí)施例中,運(yùn)行分析的選項(xiàng)可在過濾參數(shù)界面窗口 700中獲得。一旦分析完成,結(jié)果將出現(xiàn)在交互式可視化中,在圖9到圖11中進(jìn)一步描述了該交互式可視化。
本領(lǐng)域技術(shù)人員將理解,在圖4到圖7中的界面窗口是示例性的。示例性的界面窗口并不限于所示出的功能對(duì)象(例如,按鈕、下拉菜單、滾動(dòng)字段和搜索字段)。可利用任意數(shù)量的不同的功能對(duì)象。如此處所描述的,還可利用任意其他界面、命令行或圖像用戶界
圖8是在某些實(shí)施例中用于數(shù)據(jù)分析和生成交互式可視化的流程圖800。在各種實(shí)施例中,對(duì)數(shù)據(jù)和用戶所指定的選項(xiàng)的處理是受來自拓?fù)涞募夹g(shù)啟發(fā)的,并且,在某些實(shí)施例中,是從代數(shù)拓?fù)渲惺盏絾l(fā)的。這些技術(shù)可以是健壯和一般的。在一個(gè)示例中,這些技術(shù)應(yīng)用于幾乎任意類型的數(shù)據(jù),其中,存在某些“接近”或“類似”的定性想法。此處所討論的技術(shù)可以是健壯的,因?yàn)榻Y(jié)果對(duì)在數(shù)據(jù)中的噪聲、用戶選項(xiàng)并甚至在對(duì)類似的定性測(cè)量的具體細(xì)節(jié)中的錯(cuò)誤可以是相對(duì)不敏感的,在某些實(shí)施例中,對(duì)類似的定性測(cè)量課一般被稱為“距離函數(shù)”或“度量標(biāo)準(zhǔn)”。本領(lǐng)域技術(shù)人員將理解,雖然對(duì)以下算法的描述可看起來是一般化的,但是,此處所描述的技術(shù)的實(shí)現(xiàn)可應(yīng)用于任意水平的歸一化。
在步驟802,輸入模塊214接收數(shù)據(jù)S。在一個(gè)示例中,用戶標(biāo)識(shí)數(shù)據(jù)結(jié)構(gòu)并隨后標(biāo)識(shí)ID和數(shù)據(jù)字段。數(shù)據(jù)S可以是基于在ID和數(shù)據(jù)字段中的信息的。在各種實(shí)施例中, 數(shù)據(jù)S被看作是作為有限的“相似空間”所處理的,其中,S具有定義在S中的點(diǎn)對(duì)s和t上的實(shí)值函數(shù)d,諸如
d(s, s) = 0
d(s, t) = d(t, s)
d(s, t) >= 0
這些條件可類似于針對(duì)有限度量標(biāo)準(zhǔn)空間的要求,但是,條件可能更弱。在各種示例中,該函數(shù)是度量標(biāo)準(zhǔn)。
本領(lǐng)域技術(shù)人員將理解,數(shù)據(jù)S可以是有限度量標(biāo)準(zhǔn)空間或諸如圖形或權(quán)重圖形的歸一化。在某些實(shí)施例中,數(shù)據(jù)S可由公式、算法或明確定義了每對(duì)距離的距離矩陣所指定。
在步驟804,輸入模塊214生成參考空間R。在一個(gè)示例中,參考空間R可以是已知的度量標(biāo)準(zhǔn)空間(例如,諸如實(shí)線)。參考空間R可由用戶定義。在步驟806中,分析模塊220生成從S到R的映射ref ()。從S到R的映射ref ()可被稱為“參考映射”。
在一個(gè)示例中,對(duì)來自S的映射的參考是參考度量標(biāo)準(zhǔn)空間R。R可以是某維度的歐幾里得空間,但是,也可以是圓圈、環(huán)面(torus)、樹或其他度量標(biāo)準(zhǔn)空間。可通過一個(gè)或多個(gè)過濾器(即,在S上的實(shí)值函數(shù))來描述映射。這些過濾器可由幾何不變量來定義,諸如,密度估計(jì)器的輸出、數(shù)據(jù)深度的概念、或由從數(shù)據(jù)集生出的S的源所定義的函數(shù)。
在步驟808中,分辨率模塊218基于從用戶所接收的分辨率來生成R的覆蓋(例如,一個(gè)或多個(gè)過濾器、間隔和重疊-參見圖7)。R的覆蓋可以是開集(在R的度量標(biāo)準(zhǔn)中) 的有限集,使得R中的每個(gè)點(diǎn)位于這些集中的至少一個(gè)中。在各種示例中,R是k維歐幾里得空間,其中,k是過濾函數(shù)的數(shù)量。在該示例中,更準(zhǔn)確地,R是由間隔[min_k,max_k]之積所給出的k維歐幾里得空間的框,其中,min_k是在S上的第k個(gè)過濾函數(shù)的最小值,而 max_k是最大值。
例如,假定存在2個(gè)過濾函數(shù)Fl和F2,并且,F(xiàn)l的值的范圍是從_1到+1,而F2的值的范圍是從0到5。然后,參考空間是帶有拐角(_1,0)、(1,0)、(_1,5)和(1,5)的在χ/ y平面中的矩形,因?yàn)镾的每個(gè)點(diǎn)s將產(chǎn)生位于在該矩形中的對(duì)(F1 (s),F(xiàn)2(s))。
在各種實(shí)施例中,R的覆蓋是通過針對(duì)k個(gè)過濾器的每一個(gè)求[min_k,max_k]的覆蓋的間隔的積來給出的。在一個(gè)示例中,如果用戶針對(duì)Fl請(qǐng)求2個(gè)間隔和50%的重疊, 則間隔[-1,+1]的覆蓋將是兩個(gè)間隔(-1.5,.5)和(-.5,1.5)。如果用戶針對(duì)F2請(qǐng)求5 個(gè)間隔和 30%的覆蓋,則
的覆蓋將是(-· 3,1. 3)、(· 7,2. 3)、(1. 7,3. 3)、(2. 7,4. 3)、 (3.7,5. 3)。通過取間隔的所有可能對(duì)(其中,該對(duì)的第一個(gè)從Fl的覆蓋中選擇,而第二個(gè)從F2的覆蓋中選擇),這些間隔可生成2維框的覆蓋。這可生成2*5或10個(gè)覆蓋了 2維參考空間的開框。但是,本領(lǐng)域技術(shù)人員將理解,間隔可能不是均一的,或者k維框的覆蓋可能不由間隔的積所構(gòu)成。在某些實(shí)施例中,存在許多其他對(duì)間隔的選擇。另外,在各種實(shí)施例中,可利用很寬范圍的覆蓋和/或更一般的參考空間。
在一個(gè)示例中,給定R的覆蓋C1,…,Cm,參考映射被用于將標(biāo)記集分配給在S中的每個(gè)點(diǎn),其為Cj的標(biāo)記,使得ref (s)屬于C」。該函數(shù)可被稱為ref_tags(s)。在諸如Java 的語言中,ref_tagS可以是返回int 口的方法。由于在該示例中的C的覆蓋R,ref (s)必須位于它們之一,但是,覆蓋的元素通常彼此重疊,這意味著“落在邊處”的點(diǎn)可很好地駐留在多覆蓋集中。考慮兩個(gè)過濾器的示例,如果Fl (s)是-.99,而F2(s)是.001 JlJref(S) 是(_. 99,. 001),并且,其位于覆蓋元素(-1. 5,. 5) χ (-. 3,1. 3)。假定其被標(biāo)記為C1,則參考映射可將s分配給集合{1}。在另一方面,如果t被F1、F2映射到(.1,2. 1),則ref(t)將在(-1. 5,· 5) χ (· 7,2. 3)、(-· 5,1. 5) χ (· 7,2. 3)、(-1. 5,· 5) χ (1. 7,3. 3)和(-· 5,1. 5) χ (1. 7, 3.3)中,因此標(biāo)記集針對(duì)t將具有四個(gè)元素。
針對(duì)每個(gè)點(diǎn)已經(jīng)計(jì)算了 “覆蓋標(biāo)記”被分配給的覆蓋元素,針對(duì)每個(gè)覆蓋元素Cd, 其標(biāo)記包括d的點(diǎn)可被構(gòu)建為集S(d)。這可意味著每個(gè)點(diǎn)s針對(duì)某些d可在S(d)中,但是,某些點(diǎn)可屬于多于一個(gè)的這種集合。但是,在某些實(shí)施例中,并不要求每個(gè)S(d)是非空的,并且,經(jīng)常的情形是這些集合中的某些是空的。在某些實(shí)施例的非類似版本中,每個(gè)點(diǎn) χ被反之處理,并且,針對(duì)在ref_tagS(t)中的每個(gè)j,χ被插入到哈希桶中(即,這可以是 S(d)集如何被計(jì)算的)。
本領(lǐng)域技術(shù)人員將理解,參考空間R的覆蓋可由在分辨率(例如,參見圖7)中所標(biāo)識(shí)的間隔數(shù)和重疊來控制。例如,間隔越大,在S中的分辨率越細(xì)-即,在每個(gè)S(d)中的點(diǎn)越少,但是,這些點(diǎn)更加類似(關(guān)于過濾器)。重疊越大,在S(d)中的分簇可與在S(e)中的分簇交互的時(shí)間越長-這意味著在點(diǎn)之間的更多“關(guān)系”可出現(xiàn),但是,在某些實(shí)施例中, 重疊越大,更可能出現(xiàn)偶然的關(guān)系。
在步驟810中,分析模塊220基于度量標(biāo)準(zhǔn)、過濾器和空間S來對(duì)每個(gè)S(d)進(jìn)行分簇。在某些實(shí)施例中,可利用動(dòng)態(tài)單鏈接分簇算法來分割S(d)。本領(lǐng)域技術(shù)人員將理解, 任意數(shù)量的分簇算法可被用于此處所討論的實(shí)施例。例如,針對(duì)某些k、單鏈接分簇、平均鏈接分簇或任意由用戶所指定的方法,分簇機(jī)制可以是k-手段分簇。
現(xiàn)在可看到用戶所指定的輸入的重要性。在某些實(shí)施例中,過濾器可相當(dāng)于在某方向上的“強(qiáng)制拉伸”。在某些實(shí)施例中,分析模塊220可并不對(duì)兩個(gè)點(diǎn)分簇,除非過濾器的所有值都足夠“相關(guān)”(回憶雖然正常相關(guān)可意味著“接近”,但是,覆蓋可能在過濾值上施加更一般的關(guān)系,諸如,如果ref(s)和ref(t)在平面中足夠靠近相同的圓圈,則將兩點(diǎn)s 和t相關(guān))。在各種實(shí)施例中,用戶施加一個(gè)或多個(gè)“關(guān)鍵測(cè)量”的能力使得該技術(shù)比常規(guī)的分簇更加強(qiáng)大,并且,這些過濾器可以是任意的事實(shí)使得其如此地一般化。
輸出可以是單形的復(fù)數(shù),從該單形的復(fù)數(shù)可提取其I-骨干。復(fù)數(shù)的節(jié)點(diǎn)可以是部分分簇(即,從S的子集所構(gòu)成的分簇,該S被指定為在給定的參考空間R的覆蓋中的集的前象)。
在步驟812中,可視化引擎222標(biāo)識(shí)與S(d)的所有分割元素的子集相關(guān)聯(lián)的節(jié)點(diǎn),以生成交互式可視化。例如,假定S= {1,2,3. 4},并且,覆蓋是CpCpC3tj然后,如果 ref_tags(l) = {1,2,3} J. ref_tags (2) = {2,3}且 ref_tags (3) = {3},并且最后,ref_ tags (4) = {1,3},則在該示例中 S(I)是{1,4}、S(2) = {1,2},并且 S (3) = {1,2,3,4} 0 如果1和2足夠靠近可以被分簇,并且3和4也是,但是其他的都不是,則S (1)的分簇可以是 {1}{3},針對(duì)“2)的可以是{1,2},針對(duì)3(3)的可以是{1,2}、{3,4} 0因此,在該示例中, 所生成的圖形具有由集合{1}、{4}、{1,2}和{3,4}所給出的最多四個(gè)節(jié)點(diǎn)(注意,{1,2} 出現(xiàn)在兩個(gè)不同的分簇中)。在所利用的點(diǎn)集中,如果相關(guān)聯(lián)的節(jié)點(diǎn)集具有非空交集,則兩個(gè)節(jié)點(diǎn)相交(雖然這可被容易地修改,以允許用戶要求交集是絕對(duì)的或相對(duì)的“足夠大”)。
出于任意數(shù)量的原因,節(jié)點(diǎn)可被消除。例如,由于具有太少點(diǎn)和/或未與任意其他相連接,節(jié)點(diǎn)可被消除。在某些實(shí)施例中,(如果有的話)用于消除節(jié)點(diǎn)的標(biāo)準(zhǔn)可以在用戶的控制下或者具有施加其上的特定于應(yīng)用的要求。例如,舉例來說,如果點(diǎn)是消費(fèi)者,則在由公司所服務(wù)的區(qū)域代碼中的具有太少人的分簇可被消除。但是,如果分簇被發(fā)現(xiàn)具有“足夠的”消費(fèi)者,則這可指示可確保擴(kuò)展到在分簇中的其他消費(fèi)者的區(qū)域代碼。
在步驟814中,可視化引擎222加入分簇以標(biāo)識(shí)邊(例如,連接在節(jié)點(diǎn)之間的線)。 一旦節(jié)點(diǎn)被構(gòu)建,則可通過針對(duì)每個(gè)點(diǎn)計(jì)算節(jié)點(diǎn)集的集合(這次不是ref_tagS)來“一次” 計(jì)算交集(例如,邊)。即,針對(duì)每個(gè)在S中的s,可計(jì)算node_id_set (s),其為int []。在某些實(shí)施例中,如果覆蓋被很好地執(zhí)行,則該操作在集合S的大小中是線性的,然后,在nd0e_ id_set(s)中迭代每個(gè)對(duì)。如果屬于相同的node_it_set()值,則在兩個(gè)node_id之間存在邊,并且,在交集中的點(diǎn)的數(shù)量精確地是所看到的對(duì)中的不同nodejd集的數(shù)量。這意味著,除了分簇步驟(其在集合S(d)的大小中通常是二次的,但是其大小可由對(duì)覆蓋的選擇所控制),在圖形構(gòu)建算法中的所有其他步驟可以在S的大小中是線性的,并且,可被非常14高效地計(jì)算。
在步驟816中,可視化引擎222生成對(duì)相連接的節(jié)點(diǎn)(例如,在圖10和圖11中所示的節(jié)點(diǎn)和邊)的交互式可視化。
本領(lǐng)域技術(shù)人員將理解,在某些實(shí)施例中,以相當(dāng)深的方式在各種ref ()映射之間連接和/或?qū)Ψ执氐倪x擇中是可以說得通的。另外,除了計(jì)算邊(節(jié)點(diǎn)對(duì))之外,此處所描述的實(shí)施例可被擴(kuò)展至計(jì)算三個(gè)節(jié)點(diǎn)等。例如,分析模塊220在節(jié)點(diǎn)上(通過各種規(guī)則)計(jì)算任意維度的單形復(fù)數(shù),并且,將來自透射(homology)理論的技術(shù)應(yīng)用到圖形,以幫助用戶以自動(dòng)(或半自動(dòng))的方式理解結(jié)構(gòu)。
另外,本領(lǐng)域技術(shù)人員將理解,在覆蓋中均一的間隔并不總是好的選擇。例如,如果點(diǎn)關(guān)于給定過濾器是指數(shù)分布的,則均一的間隔將失敗-舉例來說,在這種情形中,適應(yīng)性的間隔大小可產(chǎn)生均一大小的S(d)集。
另外,在各種實(shí)施例中,界面可被用于編碼技術(shù),以用于將第三方擴(kuò)展融合到數(shù)據(jù)訪問和顯示技術(shù)中。另外,針對(duì)對(duì)潛在的基礎(chǔ)設(shè)施的第三方擴(kuò)展,界面可被用于允許用于生成覆蓋并定義新的參考空間的新方法。
在某些實(shí)施例中,圖9是示例性交互式可視化900。從數(shù)學(xué)上講,對(duì)交互式可視化的顯示可被認(rèn)為是“圖”。交互式可視化包括兩種類型的對(duì)象節(jié)點(diǎn)(例如,節(jié)點(diǎn)902和906) (有顏色的球)和邊(例如,邊904)(黑線)。邊連接節(jié)點(diǎn)對(duì)(例如,邊904連接節(jié)點(diǎn)902和節(jié)點(diǎn)906)。如此處所討論的,每個(gè)節(jié)點(diǎn)可代表數(shù)據(jù)點(diǎn)的集合(由用戶所標(biāo)識(shí)的數(shù)據(jù)庫中的行)。在一個(gè)示例中,相連接的節(jié)點(diǎn)趨向于包括彼此“類似”(例如,相分簇的)的數(shù)據(jù)點(diǎn)。 數(shù)據(jù)點(diǎn)的集合可被稱為“在節(jié)點(diǎn)中”。交互式可視化可以是二維的、三維的、或二者的組合。
在各種實(shí)施例中,相連接的節(jié)點(diǎn)和邊科形成圖或結(jié)構(gòu)。在交互式可視化中可存在多個(gè)圖。在一個(gè)示例中,交互式可視化可顯示節(jié)點(diǎn)和邊的兩個(gè)或更多個(gè)未連接的結(jié)構(gòu)。
節(jié)點(diǎn)和邊的視覺屬性(諸如但不限于,顏色、畫筆顏色、文本、紋理、形狀,在屏幕上的節(jié)點(diǎn)的坐標(biāo))可編碼在每個(gè)節(jié)點(diǎn)你的數(shù)據(jù)點(diǎn)的任意基于數(shù)據(jù)的屬性。例如,節(jié)點(diǎn)和/ 或邊的顏色可指示(但并不限于)如下
字段或過濾器的值
在節(jié)點(diǎn)中的數(shù)據(jù)的任意一般功能(例如,如果數(shù)據(jù)是州的未雇傭率,則州的GDP 可以通過對(duì)節(jié)點(diǎn)著色來標(biāo)識(shí))
眷在節(jié)點(diǎn)中的數(shù)據(jù)點(diǎn)的數(shù)量
交互式可視化900可包括“顏色條”910,該顏色條可包括指示節(jié)點(diǎn)(例如,球) 的顏色的圖例,并且還可標(biāo)識(shí)顏色所指示的內(nèi)容。例如,在圖9中,顏色條910用指示 “4. 99e+03”的藍(lán)色(在顏色條910的最左邊)并且用指示“1. 43e+04”的紅色(在顏色條 910的最右邊)來指示顏色是基于密度過濾器的。一般而言,這可被擴(kuò)展以顯示節(jié)點(diǎn)和/或邊被著色的任意其他圖例。本領(lǐng)域技術(shù)人員將理解,在某些實(shí)施例中,用戶可控制顏色以及顏色(和/或畫筆顏色、文本、紋理、形狀,在屏幕上的節(jié)點(diǎn)的坐標(biāo))所指示的內(nèi)容。
用戶還可拖拉交互式可視化900的對(duì)象。在各種實(shí)施例中,用戶可通過將一個(gè)或多個(gè)節(jié)點(diǎn)拖到交互式可視化(例如,窗口)的另一部分來重定向節(jié)點(diǎn)和邊的結(jié)構(gòu)。在一個(gè)示例中,用戶可選擇節(jié)點(diǎn)902、握住jiedian902bing拖住該節(jié)點(diǎn)穿過窗口。節(jié)點(diǎn)902將追隨用戶的光標(biāo),拖住直接地或間接地連接到節(jié)點(diǎn)902的邊和/或節(jié)點(diǎn)的結(jié)構(gòu)。在某些實(shí)施例中,交互式可視化900可描繪多個(gè)未連接的結(jié)構(gòu)。每個(gè)結(jié)構(gòu)可包括節(jié)點(diǎn),但是,任意結(jié)果的節(jié)點(diǎn)都不彼此相連接。如果用戶選擇并拖住第一結(jié)構(gòu)的節(jié)點(diǎn),則僅有第一結(jié)構(gòu)將關(guān)于用戶的餓動(dòng)作被重定向。其他結(jié)構(gòu)將保持不變。用戶可希望重定向結(jié)構(gòu),以便查看節(jié)點(diǎn)、選擇節(jié)點(diǎn)和/或更好地理解下面數(shù)據(jù)的關(guān)系。
在一個(gè)示例中,用戶可拖住節(jié)點(diǎn)以重定向交互式可視化(例如,重定向節(jié)點(diǎn)和邊的結(jié)構(gòu))。隨著用戶選擇和/或拖住節(jié)點(diǎn),與所選節(jié)點(diǎn)相關(guān)聯(lián)的結(jié)構(gòu)的節(jié)點(diǎn)可移動(dòng)到彼此分離,以便提供更好的可視性。一旦用戶松手(例如,取消對(duì)已拖住的節(jié)點(diǎn)的選擇或丟棄已拖住的節(jié)點(diǎn)),結(jié)構(gòu)的節(jié)點(diǎn)可繼續(xù)移動(dòng)到彼此分離。
在各種實(shí)施例中,一旦可視化模塊222生成交互式顯示,所描繪的結(jié)構(gòu)可通過展開彼此節(jié)點(diǎn)來移動(dòng)。在一個(gè)示例中,節(jié)點(diǎn)緩慢地彼此展開,以允許用戶查看彼此不同的節(jié)點(diǎn)和邊。在某些實(shí)施例中,可視化模塊222針對(duì)用戶的視角最優(yōu)化對(duì)節(jié)點(diǎn)的展開。在一個(gè)示例中,一旦已達(dá)到最優(yōu)視角,一個(gè)或多個(gè)結(jié)構(gòu)停止移動(dòng)。
本領(lǐng)域技術(shù)人員將理解,交互式可視化900可響應(yīng)于姿勢(shì)(例如,多觸摸)、筆尖、 或其他允許用戶重定向節(jié)點(diǎn)和邊以及/或與下面的數(shù)據(jù)交互的交互。
諸如當(dāng)用戶拖、點(diǎn)擊或就愛那個(gè)鼠標(biāo)光標(biāo)懸停于節(jié)點(diǎn)之上時(shí),交互式可視化900 還可響應(yīng)于用戶的動(dòng)作。在某些實(shí)施例中,當(dāng)用戶選擇節(jié)點(diǎn)或邊時(shí),可顯示節(jié)點(diǎn)信息或邊信息。在一個(gè)示例中,當(dāng)節(jié)點(diǎn)被選擇(例如,由用戶用鼠標(biāo)點(diǎn)擊或鼠標(biāo)光標(biāo)懸停于節(jié)點(diǎn)之上) 時(shí),節(jié)點(diǎn)信息框908可出現(xiàn),指示關(guān)于所選節(jié)點(diǎn)的信息。在該示例中,節(jié)點(diǎn)信息框908指示 ID、框ID、元素?cái)?shù)(例如,與節(jié)點(diǎn)相關(guān)聯(lián)的數(shù)據(jù)點(diǎn))和與節(jié)點(diǎn)相關(guān)聯(lián)的數(shù)據(jù)的密度。
用戶還可通過單獨(dú)在每個(gè)對(duì)象上點(diǎn)擊或在所希望的對(duì)象周圍畫出形狀(諸如, 框)來選擇多個(gè)節(jié)點(diǎn)和/或邊。一旦對(duì)象被選擇,選擇信息框912可顯示關(guān)于選擇的某些信息。例如,選擇信息框912指示所選擇的節(jié)點(diǎn)數(shù)和所選節(jié)點(diǎn)的總共點(diǎn)(例如,數(shù)據(jù)點(diǎn)或元素)。
交互式可視化900還可允許用戶進(jìn)一步與顯示器交互。顏色選項(xiàng)914允許用戶基于對(duì)象的顏色來顯示不同的信息。在圖9中,顏色選項(xiàng)914被設(shè)置為過濾器密度,但是,可選擇其他過濾器并可基于選擇來重新對(duì)對(duì)象著色。本領(lǐng)域技術(shù)人員將理解,可基于任意過濾器、數(shù)據(jù)屬性或特點(diǎn)來對(duì)對(duì)象著色。當(dāng)在顏色選項(xiàng)914中新的選項(xiàng)被選擇時(shí),在顏色條910 中所描繪的信息和/或顏色可被更新以反映該變更。
布局復(fù)選框914可允許用戶固定(anchor)交互式可視化900。在一個(gè)示例中,布局復(fù)選框914被復(fù)選,指示交互式可視化900被固定。結(jié)果,用戶將不能選擇和拖住節(jié)點(diǎn)和 /或相關(guān)的結(jié)構(gòu)。雖然其他功能還可以是可用的,但是,布局復(fù)選框914可幫助用戶防止偶然地移動(dòng)和/或重定向節(jié)點(diǎn)、邊和/或相關(guān)的結(jié)構(gòu)。本領(lǐng)域技術(shù)人員將理解,當(dāng)布局復(fù)選框 914未被復(fù)選時(shí),布局復(fù)選框914可指示交互式可視化900被固定,并且,當(dāng)布局復(fù)選框914 被復(fù)選時(shí),指示交互式可視化900不再固定。
變更參數(shù)按鈕918可允許用戶變更參數(shù)(例如,添加/移除過濾器以及/或變更一個(gè)或多個(gè)過濾器的分辨率)。在一個(gè)示例中,當(dāng)變更參數(shù)按鈕918被激活時(shí),用戶可被導(dǎo)向回度量標(biāo)準(zhǔn)和過濾選擇界面窗口 600 (參見圖6),該度量標(biāo)準(zhǔn)和過濾選擇界面窗口允許用戶添加或移除過濾器(或變更度量標(biāo)準(zhǔn))。用戶可隨后查看過濾參數(shù)界面700(參見圖 7)并針對(duì)一個(gè)或多個(gè)過濾器變更參數(shù)(例如,間隔和重疊)。分析節(jié)點(diǎn)220可隨后基于變更來重新分析數(shù)據(jù)并顯示新的交互式可視化900,而無需再次指定數(shù)據(jù)集、過濾器等。
查找ID按鈕920允許用戶在交互式可視化900中搜索數(shù)據(jù)。在一個(gè)示例中,用戶可點(diǎn)擊查找ID按鈕920并接收允許用戶標(biāo)識(shí)數(shù)據(jù)或標(biāo)識(shí)數(shù)據(jù)范圍的窗口。數(shù)據(jù)可被ID所標(biāo)識(shí),或通過基于數(shù)據(jù)和/或元數(shù)據(jù)的屬性來搜索數(shù)據(jù)而被標(biāo)識(shí)。如果數(shù)據(jù)被找到并選擇, 交互式可視化900可加亮顯示與所選數(shù)據(jù)相關(guān)聯(lián)的節(jié)點(diǎn)。例如,選擇單個(gè)行或數(shù)據(jù)庫或電子表格的行的集合可產(chǎn)生對(duì)節(jié)點(diǎn)的加亮顯示,該節(jié)點(diǎn)的對(duì)應(yīng)部分分簇包括該選擇的任意元ο
在各種實(shí)施例中,用戶可選擇一個(gè)或多個(gè)對(duì)象并點(diǎn)擊說明按鈕922來接收關(guān)于選擇的深入信息。在某些實(shí)施例中,當(dāng)用戶選擇說明按鈕922時(shí),可顯示關(guān)于選擇所基于的數(shù)據(jù)的信息。關(guān)于圖10,進(jìn)一步討論了說明按鈕922的功能。
在各種實(shí)施例中,交互式可視化900可允許用戶指定并標(biāo)識(shí)興趣子集(諸如,輸出過濾)以移除過小或不感興趣的分簇或連接。另外,交互式可視化900可提供更一般的著色和顯示技術(shù),例如包括允許用戶基于用戶指定的斷言來加亮顯示節(jié)點(diǎn),以及基于用戶所指定的權(quán)重函數(shù)的密度來對(duì)節(jié)點(diǎn)進(jìn)行著色。
交互式可視化900可包括任意數(shù)量的菜單項(xiàng)目?!斑x擇”菜單可允許以下功能
眷選擇單元(選擇不與其他節(jié)點(diǎn)相連接的節(jié)點(diǎn))
選擇所有(選擇所有節(jié)點(diǎn)和邊)
眷選擇所有節(jié)點(diǎn)(選擇所有節(jié)點(diǎn))
選擇所有邊
清除選擇(沒有選擇)
反轉(zhuǎn)選擇(選擇節(jié)點(diǎn)或邊的互補(bǔ)集合)
選擇“小”節(jié)點(diǎn)(允許用戶基于其具有多少點(diǎn)來對(duì)節(jié)點(diǎn)限制閾值)
選擇葉(選擇在圖中連接到長“鏈”的所有節(jié)點(diǎn))
移除所選節(jié)點(diǎn)
在表中顯示(在表中顯示所選節(jié)點(diǎn)和其相關(guān)聯(lián)的數(shù)據(jù))
保存所選節(jié)點(diǎn)(以任意用戶所選格式保存所選數(shù)據(jù)。這可允許用戶對(duì)數(shù)據(jù)進(jìn)行子集化并創(chuàng)建可用于進(jìn)一步分析的新的數(shù)據(jù)源。)
在“在表中顯示”選項(xiàng)的一個(gè)示例中,可顯示來自對(duì)節(jié)點(diǎn)的選擇的信息。該信息科特定于數(shù)據(jù)的原點(diǎn)。在各種實(shí)施例中,數(shù)據(jù)庫表的元素可被列出,但是,還可包括由用戶所指定的其他方法。例如,在來自基因表達(dá)數(shù)據(jù)的微陣列數(shù)據(jù)的情形中,熱量映射可被用于查看選擇的結(jié)果。
交互式可視化900可包括任意數(shù)量的菜單項(xiàng)目?!氨4妗辈藛慰稍试S用戶以各種不同的格式包括整個(gè)輸出,該格式諸如(但不限于)
·圖像文件(PNG/JPG/PDF/SVG 等)
二進(jìn)制輸出(交互式輸出被以二進(jìn)制格式保存。用戶可在任意時(shí)刻再次打開該文件以再次獲得該交互式窗口)
在某些實(shí)施例中,圖可以以某格式保存,使得該圖可被用于呈現(xiàn)。這可包括簡(jiǎn)單地將圖像保存為Pdf或png文件,但是,這還意味著包括可執(zhí)行的.xml文件,該文件可允許其他用戶利用在文件上對(duì)數(shù)據(jù)庫的搜索和保存能力,而無需重新創(chuàng)建分析。
在各種實(shí)施例中,可顯示針對(duì)不同的間隔長度和重疊百分比值的第一和第二分析輸出/交互式可視化之間的關(guān)系。在第一和第二分析輸出/交互式可視化之間的正常關(guān)系可以是,當(dāng)一個(gè)覆蓋改善下一個(gè)覆蓋時(shí),存在從第一個(gè)的輸出到第二個(gè)的輸出的單形復(fù)數(shù)的映射。這可通過應(yīng)用三維圖嵌入算法的受限形式來被顯示,其中,圖是針對(duì)個(gè)各種參數(shù)值的圖的聯(lián)合,并且其中,連接是在各自圖中的連接以及從一個(gè)節(jié)點(diǎn)到在下一圖中的圖像的連接。構(gòu)成圖可被布置在3D空間的其自身的平面中。在某些實(shí)施例中,存在如下限制每個(gè)構(gòu)成圖保持在其相關(guān)聯(lián)的平面中??蓡蝹€(gè)顯示每個(gè)構(gòu)成圖,但是,參數(shù)值的小變更可都導(dǎo)致鄰近構(gòu)成圖的可視化。在某些實(shí)施例中,在初始圖中的節(jié)點(diǎn)可以以輕松可視化的方式移動(dòng)到在下一圖中的節(jié)點(diǎn)。
圖10是某些實(shí)施例中的顯示說明信息窗口 1002的示例性交互式可視化1000。在各種實(shí)施例中,用戶可選擇多個(gè)節(jié)點(diǎn)并點(diǎn)擊說明按鈕。當(dāng)說明按鈕被點(diǎn)擊時(shí),可生成說明信息窗口 1002。說明信息窗口 1002可標(biāo)識(shí)與所選的一個(gè)或多個(gè)對(duì)象相關(guān)聯(lián)的數(shù)據(jù)以及與數(shù)據(jù)相關(guān)聯(lián)的信息(例如,統(tǒng)計(jì)信息)。
在某些實(shí)施例中,說明按鈕允許用戶獲知在所選數(shù)據(jù)字段中的哪些字段負(fù)責(zé)在所選節(jié)點(diǎn)中的數(shù)據(jù)的“相似”以及差異特點(diǎn)。存在許多種對(duì)數(shù)據(jù)字段評(píng)分的方法。說明信息窗口 1002( S卩,在圖10中的評(píng)分窗口)與所選節(jié)點(diǎn)一同示出。得分最高的字段可關(guān)于剩余數(shù)據(jù)區(qū)分變量。
在一個(gè)示例中,說明信息窗口 1002指示來自字段dayO到day6的數(shù)據(jù)已被選擇。 在所有字段中的數(shù)據(jù)的最小值是0。說明信息窗口 1002還指示最大值。例如,貫穿所有所選節(jié)點(diǎn)的點(diǎn)的與dayO字段相關(guān)聯(lián)的所有數(shù)據(jù)的最大值是0. 353。貫穿所有所選節(jié)點(diǎn)的點(diǎn)的與dayO字段相關(guān)聯(lián)的所有數(shù)據(jù)的平均(即,均值)是0.031。分?jǐn)?shù)可以是相對(duì)(例如,歸一化的)值,該值指示過濾器的相對(duì)函數(shù);此處,分?jǐn)?shù)可指示貫穿所有所選節(jié)點(diǎn)的點(diǎn)的與dayO 字段相關(guān)聯(lián)的所有數(shù)據(jù)的相對(duì)密度。本領(lǐng)域技術(shù)人員將理解,關(guān)于數(shù)據(jù)和/或所選節(jié)點(diǎn)的任意信息可出現(xiàn)在說明信息窗口 1002中。
本領(lǐng)域技術(shù)人員將理解,數(shù)據(jù)和交互式可視化100可以任意數(shù)量的方式交互。用戶可直接與數(shù)據(jù)交互以查看圖哪里對(duì)應(yīng)于數(shù)據(jù)、對(duì)分析做出變更并查看圖中的變更、修改圖并查看對(duì)數(shù)據(jù)的變更、或執(zhí)行任意類型的交互。
圖11是在某些實(shí)施例中的交互式可視化的功能的流程圖1100。在步驟1102中, 可視化引擎222從分析模塊220接收分析以及作為球的圖節(jié)點(diǎn)和作為球1102之間的連接器的邊,以創(chuàng)建交互式可視化900 (參看圖9)。
在步驟1104中,可視化引擎222確定用戶是否將鼠標(biāo)光標(biāo)(或已選擇了)懸停在球(即,節(jié)點(diǎn))上。如果用戶正將鼠標(biāo)光標(biāo)懸停在球上火選擇球,則關(guān)于與球相關(guān)聯(lián)的信息被顯示。在一個(gè)示例中,可視化引擎222顯示節(jié)點(diǎn)信息窗口 908。
如果可視化引擎222并未確定用戶正將鼠標(biāo)光標(biāo)(或已選擇了)懸停在球(即, 節(jié)點(diǎn))上,則可視化引擎222確定用戶是否已選擇了圖中的球(例如,通過點(diǎn)擊多個(gè)球或在多個(gè)球周圍畫出框)。如果用戶已經(jīng)選擇了圖中的球,則可視化引擎222可在步驟1110中加亮顯示在圖中已選擇的球。可視化引擎222還可顯示關(guān)于選擇的信息(例如,通過顯示選擇信息窗口 912)。用戶還可點(diǎn)擊說明按鈕922以接收與選擇相關(guān)聯(lián)的更多信息(例如, 可視化引擎222可顯示說明信息窗口 1002)。
在步驟1112中,用戶可保持選擇。例如,可視化引擎222可保持下面的數(shù)據(jù)、所選的度量標(biāo)準(zhǔn)、過濾器和/或分辨率。用戶可隨后訪問所保存的信息并在另一交互式可視化 900中創(chuàng)建新的結(jié)構(gòu),從而允許用戶聚焦在數(shù)據(jù)的子集上。
如果可視化引擎222并未確定用戶已選擇了圖上的球,則可視化引擎222可在步驟1114中確定用戶是否選擇并拖住在圖中的球。如果用戶選擇并拖住在圖中的球,則可視化引擎222在步驟1116中可基于用戶的動(dòng)作重定向所選的球以及任意相連接的邊和球。
本領(lǐng)域技術(shù)人員將理解,雖然圖11討論了用戶懸停、選擇和/或拖住球,但是,用戶可與在交互式可視化900中的任意對(duì)象交互(例如,用戶可懸停、選擇和/或拖住邊)。 用戶還可利用交互式可視化900來放大或縮小,以聚焦在所有或部分結(jié)構(gòu)上(例如,一個(gè)或多個(gè)球和/或邊)。
另外,雖然在圖9到圖11中討論并描繪了球,但是,本領(lǐng)域技術(shù)人員將理解,節(jié)點(diǎn)可以是任意形狀的并可表現(xiàn)為任意類型的對(duì)象。另外,雖然此處所描述的某些實(shí)施例討論了基于代數(shù)拓?fù)涞妮敵鏊傻慕换ナ娇梢暬?,交互式可視化可基于任意類型的分析生成并不受限制?br> 上述功能和組件可包括存儲(chǔ)在存儲(chǔ)介質(zhì)(例如,計(jì)算機(jī)可讀存儲(chǔ)介質(zhì))上的指令。 指令可由處理器檢索并執(zhí)行。指令的某些示例是軟件、程序代碼和固件。存儲(chǔ)介質(zhì)的某些示例是存儲(chǔ)設(shè)備、磁盤、盤、集成電路和服務(wù)器。當(dāng)由處理器執(zhí)行時(shí),指令是可操作的,以指示處理器根據(jù)本發(fā)明的實(shí)施例來操作。本領(lǐng)域技術(shù)人員熟悉指令、一個(gè)或多個(gè)處理器以及存儲(chǔ)介質(zhì)。
以上,已經(jīng)參照示例性實(shí)施例描述了本發(fā)明。對(duì)本領(lǐng)域技術(shù)人員而言,很顯然,在不偏離發(fā)明的更廣范圍的前提下,可做出各種修改,并且,可利用其他實(shí)施例。因此,這些和其他對(duì)示例性實(shí)施例的變化意欲由本發(fā)明所覆蓋。
權(quán)利要求
1.一種方法,包括訪問數(shù)據(jù)庫;分析所述數(shù)據(jù)庫以標(biāo)識(shí)數(shù)據(jù)的分簇;生成包括多個(gè)節(jié)點(diǎn)和多個(gè)邊的交互式可視化,其中,所述多個(gè)節(jié)點(diǎn)中的第一節(jié)點(diǎn)代表分簇,并且,所述多個(gè)邊中的邊代表所述多個(gè)節(jié)點(diǎn)中的節(jié)點(diǎn)的交集;響應(yīng)于用戶動(dòng)作,選擇并拖住所述第一節(jié)點(diǎn);以及響應(yīng)于用戶選擇并拖住所述第一節(jié)點(diǎn)的動(dòng)作,重定向所述交互式可視化。
2.根據(jù)權(quán)利要求1所述的方法,還包括將數(shù)據(jù)保存在與所選擇的所述第一節(jié)點(diǎn)相關(guān)聯(lián)的數(shù)據(jù)庫中。
3.根據(jù)權(quán)利要求1所述的方法,還包括選擇第二節(jié)點(diǎn)并顯示關(guān)于所述第一節(jié)點(diǎn)和所述第二節(jié)點(diǎn)的信息。
4.根據(jù)權(quán)利要求1所述的方法,還包括接收對(duì)所述數(shù)據(jù)庫的數(shù)據(jù)標(biāo)識(shí)符的選擇,并且, 加亮顯示所述多個(gè)節(jié)點(diǎn)中的與所述選擇相關(guān)聯(lián)的某些節(jié)點(diǎn)。
5.根據(jù)權(quán)利要求1所述的方法,其中,所述交互式可視化的所述第一節(jié)點(diǎn)和第二節(jié)點(diǎn)基于所選的第一函數(shù)被不同地著色。
6.根據(jù)權(quán)利要求5所述的方法,其中,所述第一函數(shù)是過濾器。
7.根據(jù)權(quán)利要求5所述的方法,還包括接收第二函數(shù)選擇,并且,基于所述第二函數(shù)選擇來變更所述第一節(jié)點(diǎn)和所述第二節(jié)點(diǎn)的顏色。
8.根據(jù)權(quán)利要求1所述的方法,還包括接收間隔值和重疊百分比,基于所述間隔值和所述重疊百分比重新分析所述數(shù)據(jù)庫,以及基于重新的分析來重新生成交互式可視化。
9.根據(jù)權(quán)利要求1所述的方法,還包括在生成后顯示所述交互式可視化的移動(dòng),所述移動(dòng)是基于對(duì)所述多個(gè)節(jié)點(diǎn)的視覺最優(yōu)化的。
10.根據(jù)權(quán)利要求1所述的方法,還包括顯示關(guān)于所述第一節(jié)點(diǎn)和所選第二節(jié)點(diǎn)的統(tǒng)計(jì)fe息。
11.根據(jù)權(quán)利要求1所述的方法,其中,對(duì)所述數(shù)據(jù)庫的分析是拓?fù)浞治觥?br> 12.根據(jù)權(quán)利要求1所述的方法,其中,對(duì)所述數(shù)據(jù)庫的分析是非線性數(shù)據(jù)分析。
13.一種系統(tǒng),包括處理器;輸入模塊,該輸入模塊被配置為訪問數(shù)據(jù)庫;分析模塊,該分析模塊被配置為分析所述數(shù)據(jù)庫以標(biāo)識(shí)數(shù)據(jù)的分簇;以及可視化模塊,該可視化模塊被配置為生成包括多個(gè)節(jié)點(diǎn)和多個(gè)邊的交互式可視化,其中,所述多個(gè)節(jié)點(diǎn)中的第一節(jié)點(diǎn)代表分簇,并且,所述多個(gè)邊中的邊代表所述多個(gè)節(jié)點(diǎn)中的節(jié)點(diǎn)的交集,該可視化模塊還被配置為響應(yīng)于用戶動(dòng)作,選擇并拖住所述第一節(jié)點(diǎn),以及響應(yīng)于用戶選擇并拖住所述第一節(jié)點(diǎn)的動(dòng)作,重定向所述交互式可視化。
14.根據(jù)權(quán)利要求13所述的系統(tǒng),其中,所述可視化模塊還被配置為將數(shù)據(jù)保存在與所選擇的所述第一節(jié)點(diǎn)相關(guān)聯(lián)的數(shù)據(jù)庫中。
15.根據(jù)權(quán)利要求13所述的系統(tǒng),其中,所述可視化模塊還被配置為選擇第二節(jié)點(diǎn)并顯示關(guān)于所述第一節(jié)點(diǎn)和所述第二節(jié)點(diǎn)的信息。
16.根據(jù)權(quán)利要求13所述的系統(tǒng),其中,所述可視化模塊還被配置為接收對(duì)所述數(shù)據(jù)庫的數(shù)據(jù)標(biāo)識(shí)符的選擇,并且,加亮顯示所述多個(gè)節(jié)點(diǎn)中的與所述選擇相關(guān)聯(lián)的某些節(jié)點(diǎn)。
17.根據(jù)權(quán)利要求13所述的系統(tǒng),所述交互式可視化的所述第一節(jié)點(diǎn)和第二節(jié)點(diǎn)基于所選的第一函數(shù)被不同地著色。
18.根據(jù)權(quán)利要求17所述的系統(tǒng),其中,所述第一函數(shù)是過濾器。
19.根據(jù)權(quán)利要求17所述的系統(tǒng),其中,所述可視化模塊還被配置為接收第二函數(shù)選擇,并且,基于所述第二函數(shù)選擇來變更所述第一節(jié)點(diǎn)和所述第二節(jié)點(diǎn)的顏色。
20.根據(jù)權(quán)利要求13所述的系統(tǒng),其中,所述可視化模塊還被配置為接收間隔值和重疊百分比,并且所述分析模塊還被配置為基于所述間隔值和所述重疊百分比來重新分析所述數(shù)據(jù)庫。
21.根據(jù)權(quán)利要求13所述的系統(tǒng),其中,所述可視化模塊還被配置為在生成后顯示所述交互式可視化的移動(dòng),所述移動(dòng)是基于對(duì)所述多個(gè)節(jié)點(diǎn)的視覺最優(yōu)化的。
22.根據(jù)權(quán)利要求13所述的系統(tǒng),其中,所述可視化模塊還被配置為顯示關(guān)于所述第一節(jié)點(diǎn)和所選第二節(jié)點(diǎn)的統(tǒng)計(jì)信息。
23.根據(jù)權(quán)利要求13所述的系統(tǒng),其中,對(duì)所述數(shù)據(jù)庫的分析是拓?fù)浞治觥?br> 24.根據(jù)權(quán)利要求13所述的系統(tǒng),其中,對(duì)所述數(shù)據(jù)庫的分析是非線性數(shù)據(jù)分析。
25.—種包括指令的計(jì)算機(jī)可讀介質(zhì),所述指令通過處理器可執(zhí)行以執(zhí)行一種方法,所述方法包括訪問數(shù)據(jù)庫;分析所述數(shù)據(jù)庫以標(biāo)識(shí)數(shù)據(jù)的分簇;生成包括多個(gè)節(jié)點(diǎn)和多個(gè)邊的交互式可視化,其中,所述多個(gè)節(jié)點(diǎn)中的第一節(jié)點(diǎn)代表分簇,并且,所述多個(gè)邊中的邊代表所述多個(gè)節(jié)點(diǎn)中的節(jié)點(diǎn)的交集; 響應(yīng)于用戶動(dòng)作,選擇并拖住所述第一節(jié)點(diǎn);以及響應(yīng)于用戶選擇并拖住所述第一節(jié)點(diǎn)的動(dòng)作,重定向所述交互式可視化。
全文摘要
提供了用于對(duì)數(shù)據(jù)分析的可視化的示例性系統(tǒng)和方法。在各種實(shí)施例中,一種方法包括訪問數(shù)據(jù)庫;分析數(shù)據(jù)庫以標(biāo)識(shí)數(shù)據(jù)的分簇;生成包括多個(gè)節(jié)點(diǎn)和多個(gè)邊的交互式可視化,其中,多個(gè)節(jié)點(diǎn)中的第一節(jié)點(diǎn)代表分簇,并且,多個(gè)邊中的邊代表多個(gè)節(jié)點(diǎn)中的節(jié)點(diǎn)的交集;響應(yīng)于用戶動(dòng)作,選擇并拖住第一節(jié)點(diǎn);以及響應(yīng)于用戶選擇并拖住第一節(jié)點(diǎn)的動(dòng)作,重定向交互式可視化。
文檔編號(hào)G06F7/00GK102483693SQ201080016231
公開日2012年5月30日 申請(qǐng)日期2010年2月10日 優(yōu)先權(quán)日2009年2月10日
發(fā)明者岡納·卡爾松, 哈蘭·賽克斯頓, 居爾吉特·辛格 申請(qǐng)人:阿雅斯迪公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
临朐县| 普兰店市| 诸城市| 古浪县| 镇江市| 玉山县| 龙岩市| 延寿县| 温宿县| 方城县| 农安县| 屯昌县| 浦江县| 湟中县| 上虞市| 湟源县| 叶城县| 鹤岗市| 定州市| 淮北市| 昭平县| 沙湾县| 阿荣旗| 通辽市| 翁源县| 信丰县| 肥城市| 无棣县| 东阿县| 乌恰县| 德化县| 永仁县| 汝州市| 务川| 红原县| 华池县| 柞水县| 扶风县| 射洪县| 马尔康县| 大埔县|