專利名稱:線上資料擷取分析的代理服務(wù)系統(tǒng)及方法
技術(shù)領(lǐng)域:
本發(fā)明是有關(guān)于一種可以線上擷取并分析資料的系統(tǒng)及方法,特別是指一種可以根據(jù)客戶要求而提供線上擷取并分析資料的代理服務(wù)的系統(tǒng)及方法。
在知識(shí)經(jīng)濟(jì)到來的時(shí)代,″知識(shí)″(knowledge)越來越受到廣泛的重視?!逯R(shí)″是一種流動(dòng)性質(zhì)的綜合體,其中包括結(jié)構(gòu)化的經(jīng)驗(yàn)、價(jià)值、以及經(jīng)過文字化的信息(information)等。而所述的信息是將來源于報(bào)章、雜志及網(wǎng)站資料源等這些未經(jīng)整理分析過的原始資料(data)經(jīng)過諸如分類、整合及分析后所得到的,可以讓看的人了解其中的意義。如何將數(shù)量巨大的資料準(zhǔn)確而快速地轉(zhuǎn)化為有用的信息,或是更深層的知識(shí),正日益成為業(yè)界廣泛關(guān)注的課題。
不斷普及與發(fā)展的網(wǎng)際網(wǎng)絡(luò)特別是國(guó)際互聯(lián)網(wǎng)(Internet)已成為一種查詢及獲取相關(guān)資料的重要工具,用國(guó)際互聯(lián)網(wǎng)可快速查詢并獲取全面的各種資料,然而,國(guó)際互聯(lián)網(wǎng)上的資料種類繁多而又?jǐn)?shù)量巨大,使用者很難從浩如云煙的資料中找到它所需要的資料,為幫助使用者用最有效率的方式,找到切中需求的資料,可以借由現(xiàn)有的關(guān)鍵詞查詢檢索工具及搜索引擎技術(shù)從國(guó)際互聯(lián)網(wǎng)上萃取過濾資料,但即便如此,最終得到的查詢結(jié)果數(shù)量仍很巨大,要從數(shù)百,甚至上千筆資料中的統(tǒng)計(jì)分析中得到相關(guān)的分析結(jié)果,對(duì)于不是資料分析專業(yè)人員的普通用戶來講并非易事,而且,由于目前的網(wǎng)絡(luò)頻寬不足的限制,透過網(wǎng)絡(luò)下載大量的資料,會(huì)存在下載速度慢,耗費(fèi)用戶較多時(shí)間的問題,且較容易連網(wǎng)斷線而使資料下載中斷,使用戶無法及時(shí)得到所需資料。
請(qǐng)參見
圖1所示,它是一種現(xiàn)有的為客戶提供資料分析的服務(wù)模式,其中客戶(未圖出)需要在一客戶端3的計(jì)算機(jī)上透過國(guó)際互聯(lián)網(wǎng)向遠(yuǎn)程一原始數(shù)據(jù)庫(kù)10(亦可為一存放原始資料的網(wǎng)站)查詢出它所需要的資料,并從客戶端3下載這種資料,由于用戶所查詢到均為一些未經(jīng)處理過的原始資料,而且這種原始資料往往數(shù)量較為巨大,依靠人工的方式需花較多時(shí)間方能對(duì)上述的大量原始資料做到正確的處理與統(tǒng)計(jì),故相關(guān)的軟件供應(yīng)商2專門為客戶提供對(duì)特定的原始資料做統(tǒng)計(jì)分析的軟件系統(tǒng),例如AuriginTM公司的軟件產(chǎn)品IPAM System(相關(guān)網(wǎng)址為http//www.aurigin.com),以及Wisdomain公司的專利資料分析軟件產(chǎn)品PatentLabTM-II(相關(guān)網(wǎng)址為http//www.wisdomain.com、http//www.delphion.com)。當(dāng)客戶需要分析原始資料時(shí),須事先在相關(guān)的軟件供應(yīng)商2處購(gòu)買或免費(fèi)下載相關(guān)的統(tǒng)計(jì)分析軟件,然后安裝至客戶端3的計(jì)算機(jī)上后,再利用該軟件系統(tǒng)對(duì)原始資料做相應(yīng)的分析,它為一種典型的客戶端/服務(wù)器(Client/Server)模式的服務(wù)方法。綜上,現(xiàn)有的資料分析模式通常須經(jīng)過以下三個(gè)步驟(i)客戶從服務(wù)供應(yīng)商處購(gòu)買(或免費(fèi)下載)資料分析軟件;(ii)購(gòu)買并下載原始資料文件;(iii)客戶自行用資料分析軟件對(duì)原始資料做分析。
上述現(xiàn)有的資料分析方式的不足在于首先,客戶進(jìn)行資料分析的最終需求及目的各不相同,某些客戶只關(guān)心資料分析的結(jié)果或結(jié)論,而不關(guān)心資料分析的過程,或者,也許客戶并不是資料分析的專業(yè)人員,不知道如何查詢它所想得到的原始資料,也不了解如何分析資料方能得到它想要的結(jié)果,而現(xiàn)有的資料分析的動(dòng)作是由客戶自己完成,它可能無法正確的進(jìn)行資料分析,或不能從原始資料中得到它想要的正確分析結(jié)果;其次,隨著資料分析技術(shù)的不斷發(fā)展,同時(shí)客戶對(duì)于資料分析的數(shù)量,以及資料分析的深度要求愈來愈高,客戶從服務(wù)供應(yīng)商處購(gòu)買(或免費(fèi)下載)的資料分析軟件在經(jīng)過一定時(shí)間后可能會(huì)有新的功能增加或改進(jìn),而客戶必須對(duì)該軟件不斷升級(jí),并可能會(huì)有相應(yīng)的費(fèi)用產(chǎn)生,故現(xiàn)有的資料分析服務(wù)模式不能動(dòng)態(tài)而實(shí)時(shí)滿足客戶的更高要求;再次,如前所述,客戶須將大量原始資料購(gòu)買至本地后才能開始資料分析,當(dāng)資料數(shù)量很巨大時(shí),客戶要花較長(zhǎng)時(shí)間下載這種資料,并需用占用較大的存貯設(shè)備容量,但是,有時(shí)客戶僅僅需要對(duì)這種原始資料分析后的結(jié)果,而資料分析完成后這種原始資料并無更多的利用價(jià)值,所以,現(xiàn)有的資料分析的服務(wù)模式會(huì)有浪費(fèi)客戶資源(時(shí)間、費(fèi)用等)的現(xiàn)象。
本發(fā)明目的在于提供一種線上資料擷取分析的代理服務(wù)系統(tǒng)及方法,它可由客戶通過網(wǎng)際網(wǎng)絡(luò)向服務(wù)供應(yīng)商發(fā)出資料查詢及分析請(qǐng)求,而由服務(wù)供應(yīng)商代理客戶進(jìn)行資料擷取并分析,最后將分析結(jié)果傳送給客戶。
為達(dá)到上述目的,本發(fā)明采用了以下技術(shù)方案本發(fā)明提供一種線上資料擷取分析的代理服務(wù)的系統(tǒng)與方法,可使代理服務(wù)器根據(jù)客戶從客戶端發(fā)出的請(qǐng)求而從遠(yuǎn)程的原始數(shù)據(jù)庫(kù)中自動(dòng)擷取所需原始資料,并對(duì)這種原始資料予以分析。首先,客戶在客戶端向代理服務(wù)器發(fā)出資料分析的請(qǐng)求訊息;代理服務(wù)器接收到請(qǐng)求訊息后,以該請(qǐng)求訊息的內(nèi)容作為查詢條件進(jìn)行原始數(shù)據(jù)庫(kù)的查詢;代理服務(wù)器對(duì)原始數(shù)據(jù)庫(kù)中符合查詢條件的若干原始資料進(jìn)行適當(dāng)處理得到若干資料記錄,并將這種資料記錄寫入代理服務(wù)器的本地?cái)?shù)據(jù)庫(kù)中;代理服務(wù)器對(duì)存貯于本地?cái)?shù)據(jù)庫(kù)的資料記錄進(jìn)行分析處理,并將分析的結(jié)果自動(dòng)生成一分析報(bào)告;最后代理服務(wù)器將分析報(bào)告?zhèn)魉椭量蛻簟?br>
相較于現(xiàn)有技術(shù),本發(fā)明提供根據(jù)客戶需要而定制的資料查詢、下載及整理分析,可使客戶得到高效率而具附加價(jià)值的專業(yè)服務(wù),且本發(fā)明提供方便可靠的線上交易方式,可使客戶能夠在線上及時(shí)得到其所需要的資料擷取分析服務(wù)。
下面結(jié)合附圖及較佳實(shí)施例對(duì)本發(fā)明作進(jìn)一步說明。
圖1為一種現(xiàn)有的資料下載并分析的模式示意圖。
圖2為本發(fā)明線上資料擷取分析的代理服務(wù)系統(tǒng)的整體架構(gòu)圖。
圖3為本發(fā)明線上資料擷取分析的代理服務(wù)系統(tǒng)的線上擷取分析資料過程的方法流程圖。
圖4為本發(fā)明線上資料擷取分析的代理服務(wù)系統(tǒng)的線上自動(dòng)擷取資料的作業(yè)流程圖。
圖5為一在美國(guó)專利商標(biāo)局網(wǎng)站用″ICL/G06F″的查詢條件所得到的查詢結(jié)果Web網(wǎng)頁的局部圖。
圖6為圖5所示W(wǎng)eb網(wǎng)頁的原始碼片段。
圖7為圖5所示W(wǎng)eb網(wǎng)頁上超文本所鏈接的詳細(xì)內(nèi)容Web網(wǎng)頁局部圖。
圖8為圖7所示W(wǎng)eb網(wǎng)頁的原始碼片段。
圖9為資料擷取分析的代理服務(wù)系統(tǒng)的線上交易方法流程圖。
為便于理解,以下對(duì)本發(fā)明所涉及的專業(yè)術(shù)語做簡(jiǎn)要的說明超鏈接(Hyperlink),指一個(gè)文檔到另外一個(gè)文檔的導(dǎo)航鏈接,通常,超鏈接會(huì)以高亮文字顯示,當(dāng)以鼠標(biāo)點(diǎn)擊該超鏈接時(shí),則會(huì)跳到所鏈接的另外一個(gè)文檔上。
超文本(Hypertext),一種全局性的信息機(jī)制,它將文檔中的不同部分通過關(guān)鍵詞建立超鏈接,使信息得以用交互方式搜索。
國(guó)際互聯(lián)網(wǎng)(Internet),泛指由多個(gè)計(jì)算機(jī)網(wǎng)絡(luò)相互連接而成的一個(gè)網(wǎng)絡(luò),它是在功能和邏輯上組成的一個(gè)大型網(wǎng)絡(luò),專指全球最大的、開放的、由眾多網(wǎng)絡(luò)相互連接而成的計(jì)算機(jī)網(wǎng)絡(luò)。
網(wǎng)頁(Web page),也稱Web網(wǎng)頁,是Internet上的一種超媒體顯示頁面,一般由HTML語言(詳見后述)所編寫,它可作為文字、圖形、聲音等多媒體的傳播介質(zhì)。
HTML(Hypertext Markup Language),一種撰寫Web網(wǎng)頁的直譯式語言,HTML語言中允許文字中包含有定義字型、外觀、圖形及超文本鏈接的程序代碼,并利用超鏈接的特性,提供使用者以一種順序?yàn)g覽Web網(wǎng)頁的內(nèi)容。
URL(Universal Resource Locator),在Internet的WWW服務(wù)程序上用于指定信息位置的表示方法。例如www.uspto.gov/index.htm表示美國(guó)專利與商標(biāo)局的主頁位置。
瀏覽器(Browser),Web服務(wù)的客戶端瀏覽程序,可向網(wǎng)頁服務(wù)器發(fā)送各種請(qǐng)求,并對(duì)從網(wǎng)頁服務(wù)器發(fā)來的由HTML語言定義的超文本信息和各種多媒體數(shù)據(jù)格式進(jìn)行解釋、顯示和播放。
請(qǐng)參見圖2所示,為本發(fā)明線上資料擷取分析的代理服務(wù)系統(tǒng)的整體架構(gòu)圖,該服務(wù)系統(tǒng)包括有原始數(shù)據(jù)庫(kù)10(亦可為一存放有原始資料的網(wǎng)站)、服務(wù)供應(yīng)商2及客戶端3,其中在服務(wù)供應(yīng)商2端設(shè)有本地?cái)?shù)據(jù)庫(kù)23,它可用于存貯從原始數(shù)據(jù)庫(kù)10中擷取的原始資料。本發(fā)明線上資料擷取分析的代理服務(wù)系統(tǒng)的服務(wù)流程說明如下首先由客戶(未畫出)于客戶端3的計(jì)算機(jī)上向服務(wù)供應(yīng)商2發(fā)送資料分析的請(qǐng)求訊息,當(dāng)服務(wù)供應(yīng)商2接收到該請(qǐng)求訊息后會(huì)自動(dòng)將它做適當(dāng)轉(zhuǎn)換處理而生成標(biāo)準(zhǔn)格式的查詢訊息,然后,服務(wù)供應(yīng)商2將標(biāo)準(zhǔn)格式訊息發(fā)送至原始數(shù)據(jù)庫(kù)10,并借由原始數(shù)據(jù)庫(kù)10的查詢引擎進(jìn)行資料檢索查詢,進(jìn)而得到符合前述標(biāo)準(zhǔn)化的查詢條件的若干筆原始資料,然后對(duì)這種原始資料的文字做擷取分類并下載至本地?cái)?shù)據(jù)庫(kù)23的相關(guān)字段,由服務(wù)供應(yīng)商2對(duì)該本地?cái)?shù)據(jù)庫(kù)23中的資料做相應(yīng)分析處理,最后將分析結(jié)果傳送給客戶端3并向客戶收取服務(wù)酬金。
如上所述,本發(fā)明線上資料擷取分析的代理服務(wù)系統(tǒng)可用于為客戶提供一種具附加價(jià)值的代理服務(wù)機(jī)制,代理客戶進(jìn)行線上的資料查詢、下載及分析。
請(qǐng)參見圖3所示,是本發(fā)明線上資料擷取分析的代理服務(wù)系統(tǒng)的資料查詢、下載及分析的系統(tǒng)方框圖,包括有原始資料站點(diǎn)1、服務(wù)供應(yīng)商2及客戶端3,其中原始資料站點(diǎn)1具有一網(wǎng)頁服務(wù)器11及一原始數(shù)據(jù)庫(kù)10,原始數(shù)據(jù)庫(kù)10中存貯有大量的原始資料,這些原始資料可應(yīng)外界的查詢請(qǐng)求而以web網(wǎng)頁(以HTML語言編寫)的形式通過網(wǎng)頁服務(wù)器11向外界展示,它外界任何具有網(wǎng)頁瀏覽器功能的計(jì)算機(jī)均可訪問該網(wǎng)頁伺服器11并查詢到所需原始數(shù)據(jù)。服務(wù)供應(yīng)商2包括有一控制處理模塊21、數(shù)據(jù)分析模塊22及一本地?cái)?shù)據(jù)庫(kù)23,客戶端3包括有一網(wǎng)頁瀏覽器31。
當(dāng)原始資料站點(diǎn)1接收到某一資料查詢條件后,會(huì)通過訪問網(wǎng)頁伺服器11得到相應(yīng)查詢結(jié)果網(wǎng)頁5,于該頁面上所顯示的查詢結(jié)果為若干個(gè)超文本50,每個(gè)超文本50均以超鏈接方式對(duì)應(yīng)一詳細(xì)內(nèi)容網(wǎng)頁51。服務(wù)供應(yīng)商2的控制處理模塊21自動(dòng)擷取上述這種查詢結(jié)果訊息,并計(jì)算資料總數(shù)及所需服務(wù)酬金數(shù)目,通知客戶端3以確認(rèn)購(gòu)買(詳見后述)。
當(dāng)收到客戶的確認(rèn)購(gòu)買訊息后,控制處理模塊21即開始自動(dòng)下載并剖析查詢結(jié)果所對(duì)應(yīng)的詳細(xì)內(nèi)容網(wǎng)頁51,請(qǐng)參見圖4所示,為資料自動(dòng)下載剖析的流程圖,它包括的步驟如下所述,為使該流程的說明更易于理解,結(jié)合一具體實(shí)例說明(a)根據(jù)查詢條件得到查詢結(jié)果的Web網(wǎng)頁5;請(qǐng)參見第五圖所示,為一于美國(guó)專利商標(biāo)局(相關(guān)網(wǎng)址http//www.uspto.gov)用″ICL/G06F″的查詢條件所得到的查詢結(jié)果Web網(wǎng)頁5的局部圖,其中所查詢的符合條件的專利是以超文本50的方式顯示,這種超文本50是以超鏈接的方式與各具體專利說明書內(nèi)容對(duì)應(yīng)。
(b)獲得Web網(wǎng)頁5的HTML原始碼(source code);請(qǐng)參見圖6所示,為圖5的Web網(wǎng)頁5的HTML原始碼片段。
(c)找到超文本50所對(duì)應(yīng)的HTML原始碼,并得到該超文本所對(duì)應(yīng)的URL;請(qǐng)參見圖6的HTML原始碼,其中<AHREF=″http//patents.uspto.gov/cgi-bin/ifetch4?ENG+PATBIB-1999-2000+0+990662+0+1+165850+F+1+19984+1+ICL%2fg06f″/A>(第一行及第二行)是代表一個(gè)超文本50的超鏈接所對(duì)應(yīng)的URL地址。
(d)依照上述的URL地址,控制處理模塊21打開相對(duì)應(yīng)的詳細(xì)內(nèi)容Web網(wǎng)頁51;請(qǐng)參見圖7所示,為上述步驟(c)中的URL所對(duì)應(yīng)的詳細(xì)內(nèi)容Web網(wǎng)頁51,也就是圖五中的超文本50所鏈接的頁面,而圖8所示為圖7的詳細(xì)內(nèi)容Web網(wǎng)頁51的HTML原始碼片段。
(e)依據(jù)預(yù)定的數(shù)據(jù)庫(kù)字段名稱在詳細(xì)內(nèi)容Web網(wǎng)頁51的原始碼中查找相應(yīng)字符串,并將相關(guān)資料寫入數(shù)據(jù)庫(kù)中;例如本地?cái)?shù)據(jù)庫(kù)23的預(yù)定資料表字段的一為″Inventor″(發(fā)明人),則當(dāng)控制處理模塊21在上述詳細(xì)內(nèi)容Web網(wǎng)頁51的HTML原始碼中搜尋到字符串″Inventor″時(shí),則將自動(dòng)擷取該字符串之后的相應(yīng)創(chuàng)作人姓名的字符串至本地?cái)?shù)據(jù)庫(kù)23的相應(yīng)字段內(nèi)容中,在本例中,控制處理模塊21將擷取″Goodwin;David W.″、″Cohn;RobertS.″、″Lowney;Paul G.″以及″Rubin;Norman″四個(gè)字符串至本地?cái)?shù)據(jù)庫(kù)23的″Inventor″字段中,依據(jù)相同的原理與步驟,可以將該筆原始資料的其它相關(guān)字段訊息擷取至本地?cái)?shù)據(jù)庫(kù)23中,而形成一筆資料記錄6(如圖3所示)。
(f)在查詢結(jié)果Web網(wǎng)頁5的HTML原始碼中尋找下一條超文本50,如果有,則回到步驟(c),如果沒有,則結(jié)束。利用上述方法,可以將查詢結(jié)果Web網(wǎng)頁5的所有超文本50所鏈接的原始資料擷取,轉(zhuǎn)換并存貯入本地?cái)?shù)據(jù)庫(kù)23的相關(guān)欄位中,從而產(chǎn)生若干筆資料記錄6。
利用上述的方法,即可實(shí)現(xiàn)從遠(yuǎn)程原始數(shù)據(jù)庫(kù)10中查詢所需原始資料,并將這種原始數(shù)據(jù)由服務(wù)供應(yīng)商2端的控制處理模塊21自動(dòng)擷取至本地?cái)?shù)據(jù)庫(kù)23中的效果。
請(qǐng)參見圖9所示,為本發(fā)明線上資料擷取分析的代理服務(wù)系統(tǒng)的交易過程示意圖,在該交易機(jī)制中,包括有具網(wǎng)頁瀏覽器31的客戶端3、具有網(wǎng)頁服務(wù)器11的服務(wù)供應(yīng)商2以及原始資料站點(diǎn)1。需要資料查詢分析服務(wù)的客戶(未圖出)可利用客戶端3的網(wǎng)頁瀏覽器31訪問服務(wù)供應(yīng)商2的網(wǎng)頁服務(wù)器11,并在輸入請(qǐng)求Web頁面40上輸入請(qǐng)求訊息,并將此請(qǐng)求訊息發(fā)送回網(wǎng)頁服務(wù)器11;控制處理模塊21處理此請(qǐng)求訊息,將它轉(zhuǎn)換成標(biāo)準(zhǔn)格式的查詢語句,然后將此查詢語句作為限制條件查詢遠(yuǎn)程的原始資料站點(diǎn)1;控制處理模塊21自動(dòng)將查詢到的結(jié)果(原始資料的總數(shù)及列表)訊息及相應(yīng)的費(fèi)用自動(dòng)生成一確認(rèn)購(gòu)買的Web網(wǎng)頁41,在該確認(rèn)購(gòu)買的Web網(wǎng)頁41上具有查詢結(jié)果的原始資料列表及總數(shù),以及根據(jù)資料總數(shù)與客戶選擇的分析模式計(jì)算出的費(fèi)用總數(shù),所需費(fèi)用的計(jì)算公式可為總費(fèi)用=(分析的資料筆數(shù)×單價(jià))×分析模式權(quán)值,其中分析模式權(quán)值是根據(jù)資料分析所消耗服務(wù)供應(yīng)商2的資源總量(工作時(shí)間及工作量等)經(jīng)換算得到,每種分析模式是對(duì)應(yīng)于不同的資料分析內(nèi)容與深度,可供客戶根據(jù)各自需要而選擇,為便理解,現(xiàn)舉一例說明,在圖9所示的確認(rèn)購(gòu)買Web網(wǎng)頁41中共列出三種分析模式供客戶選擇A、B及A+B,每種分析模式所對(duì)應(yīng)的分析模式權(quán)值分別為1、1.2及1.5,如果所查詢的資料筆數(shù)為200筆,每筆資料的單價(jià)為3元,客戶所選擇的為B分析模式,則根據(jù)上述公式計(jì)算出的總費(fèi)用為200筆×3元/筆×1.2=720元??蛻粼邳c(diǎn)選所需分析模式并確定購(gòu)買后對(duì)應(yīng)產(chǎn)生確認(rèn)購(gòu)買訊息。
在接收到客戶的確認(rèn)購(gòu)買訊息后,控制處理模塊21擷取所查詢的原始資料并寫入本地?cái)?shù)據(jù)庫(kù)23,形成若干筆資料記錄6;由資料分析模塊22將上述的若干筆資料記錄6依據(jù)客戶選擇的分析模式做相應(yīng)分析,并將分析結(jié)果自動(dòng)產(chǎn)生一分析報(bào)告7;最后將此分析報(bào)告7的Web頁面42向客戶展示,客戶在收到此分析報(bào)告7后,將根據(jù)前述的確認(rèn)購(gòu)買的協(xié)議向服務(wù)供應(yīng)商2支付相應(yīng)的費(fèi)用,最后完成此次交易。
權(quán)利要求
1.一種線上資料擷取分析的代理服務(wù)系統(tǒng),其特征在于該系統(tǒng)包括有原始數(shù)據(jù)庫(kù),它內(nèi)存貯有原始資料;代理服務(wù)器,具有控制分析功能的模塊;客戶端,包括有發(fā)送及接收訊息的功能模塊;利用該系統(tǒng),可以通過客戶端向代理服務(wù)器發(fā)出請(qǐng)求,由代理服務(wù)器根據(jù)請(qǐng)求從原始數(shù)據(jù)庫(kù)中擷取原始資料并予以分析,并將分析結(jié)果傳送至客戶端。
2.根據(jù)權(quán)利要求1所述的線上資料擷取分析的代理服務(wù)系統(tǒng),其特征在于代理服務(wù)器上控制分析功能的模塊包括有控制處理模塊、本地?cái)?shù)據(jù)庫(kù)及數(shù)據(jù)分析模塊。
3.一種線上資料擷取分析的代理服務(wù)方法,可使代理服務(wù)器根據(jù)客戶從客戶端發(fā)出的請(qǐng)求而從遠(yuǎn)程的原始數(shù)據(jù)庫(kù)中自動(dòng)擷取所需原始資料,并對(duì)這種原始資料予以分析,其特征在于它包括以下步驟(a)客戶于客戶端向代理服務(wù)器發(fā)出資料分析的請(qǐng)求訊息;(b)代理服務(wù)器接收到請(qǐng)求訊息后,以該請(qǐng)求訊息的內(nèi)容作為查詢條件進(jìn)行原始數(shù)據(jù)庫(kù)的查詢;(c)代理服務(wù)器對(duì)原始數(shù)據(jù)庫(kù)中符合查詢條件的若干原始資料進(jìn)行適當(dāng)處理得到若干資料記錄,并將這種資料記錄寫入代理服務(wù)器所包括的本地?cái)?shù)據(jù)庫(kù)中;(d)代理服務(wù)器對(duì)存貯于本地?cái)?shù)據(jù)庫(kù)的資料記錄進(jìn)行分析處理,并將分析的結(jié)果自動(dòng)生成一分析報(bào)告;(e)代理服務(wù)器將分析報(bào)告?zhèn)魉椭量蛻簟?br>
4.根據(jù)權(quán)利要求3所述的線上資料擷取分析的代理服務(wù)方法,其特征在于代理服務(wù)器是通過訪問一網(wǎng)頁服務(wù)器來查詢?cè)紨?shù)據(jù)庫(kù)的原始資料。
5.根據(jù)權(quán)利要求3所述的線上資料擷取分析的代理服務(wù)方法,其特征在于前述符合查詢條件的若干筆原始資料是分別借由若干超文本所鏈接,這種超文本設(shè)置于一查詢結(jié)果網(wǎng)頁上,而超文本所鏈接的原始資料也以一原始資料網(wǎng)頁形式展示。
6.根據(jù)權(quán)利要求3所述的線上資料擷取分析的代理服務(wù)方法,其特征在于代理服務(wù)器又包括有一控制處理模塊,代理服務(wù)器通該控制處理模塊對(duì)原始數(shù)據(jù)庫(kù)中符合查詢條件的若干原始資料進(jìn)行適當(dāng)處理,以得到若干筆資料記錄。
7.根據(jù)權(quán)利要求3所述的線上資料擷取分析的代理服務(wù)方法,其特征在于代理服務(wù)器又包括有一數(shù)據(jù)分析模塊,代理服務(wù)器是通過該數(shù)據(jù)分析模塊對(duì)存貯于本地?cái)?shù)據(jù)庫(kù)的若干筆資料記錄進(jìn)行分析處理。
8.根據(jù)權(quán)利要求3所述的線上資料擷取分析的代理服務(wù)方法,其特征在于步驟(c)又包含以下過程(c-1)獲得上述查詢結(jié)果網(wǎng)頁的原始碼;(c-2)找到超文本所對(duì)應(yīng)的原始碼,以得到該超文本所對(duì)應(yīng)的鏈接地址;(c-3)依照上述超文本所對(duì)應(yīng)的鏈接地址,控制處理模塊打開相對(duì)應(yīng)的原始數(shù)據(jù)網(wǎng)頁;(c-4)依據(jù)代理服務(wù)器的本地?cái)?shù)據(jù)庫(kù)上預(yù)定字段名稱在于原始資料網(wǎng)頁的原始碼中查找相應(yīng)字段名稱的字符,并將字段名稱所對(duì)應(yīng)的資料寫入本地?cái)?shù)據(jù)庫(kù)中;(c-5)在查詢結(jié)果網(wǎng)頁的原始碼中尋找下一條超文本,如果有,則回到步驟(c-2)重復(fù)執(zhí)行,如果沒有,則結(jié)束。
9.一種線上資料擷取分析的代理服務(wù)的交易方法,它可使客戶向服務(wù)供應(yīng)商發(fā)出資料分析的請(qǐng)求,由服務(wù)供應(yīng)商所具有的代理服務(wù)器代理它完成向原始數(shù)據(jù)站點(diǎn)下載相關(guān)資料并作分析,最后在線上完成交易,其特征在于該方法包括以下步驟(a)客戶于客戶端向代理服務(wù)器發(fā)出資料分析的請(qǐng)求訊息;(b)代理服務(wù)器接收到請(qǐng)求訊息后,以該請(qǐng)求訊息的內(nèi)容作為查詢條件進(jìn)行原始數(shù)據(jù)庫(kù)的查詢;(c)代理服務(wù)器根據(jù)原始數(shù)據(jù)庫(kù)中符合查詢條件的若干原始資料數(shù)量計(jì)算出所需服務(wù)費(fèi)用;(d)代理服務(wù)器將符合查詢條件的若干原始數(shù)據(jù)清單及所需費(fèi)用訊息發(fā)送給客戶,以讓客戶進(jìn)行交易確認(rèn);(e)代理服務(wù)器在接收到客戶的交易確認(rèn)訊息之后,對(duì)原始數(shù)據(jù)庫(kù)中符合查詢條件的若干原始資料進(jìn)行適當(dāng)處理得到若干資料記錄,并將這種資料記錄寫入代理服務(wù)器所包括的本地?cái)?shù)據(jù)庫(kù)中;(f)代理服務(wù)器對(duì)存貯于本地?cái)?shù)據(jù)庫(kù)的資料記錄進(jìn)行分析處理,并將分析的結(jié)果自動(dòng)生成一分析報(bào)告;(g)代理服務(wù)器將分析報(bào)告?zhèn)魉椭量蛻簦?h)客戶支付根據(jù)步驟(c)中所計(jì)算的服務(wù)費(fèi)用給服務(wù)供應(yīng)商。
全文摘要
本發(fā)明有關(guān)于一種可以線上自動(dòng)擷取并分析資料的系統(tǒng)及方法,其可使代理服務(wù)器根據(jù)客戶從客戶端發(fā)出的請(qǐng)求而從遠(yuǎn)程的原始數(shù)據(jù)庫(kù)中自動(dòng)擷取所需原始資料,并對(duì)這種原始資料予以分析。首先客戶在客戶端向代理服務(wù)器發(fā)出資料分析的請(qǐng)求訊息,代理服務(wù)器接收到請(qǐng)求訊息后,以該請(qǐng)求訊息的內(nèi)容作為查詢條件進(jìn)行原始數(shù)據(jù)庫(kù)的查詢,再將原始數(shù)據(jù)庫(kù)中符合查詢條件的若干原始資料進(jìn)行分析處理,最后自動(dòng)生成分析報(bào)告?zhèn)魉椭量蛻簟?br>
文檔編號(hào)G06F17/30GK1387140SQ0111473
公開日2002年12月25日 申請(qǐng)日期2001年5月22日 優(yōu)先權(quán)日2001年5月22日
發(fā)明者李忠一, 耿笑昉, 段修明, 羅才洋 申請(qǐng)人:鴻富錦精密工業(yè)(深圳)有限公司, 鴻海精密工業(yè)股份有限公司