欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種應(yīng)用于移動(dòng)終端的網(wǎng)頁(yè)壓縮方法

文檔序號(hào):6338672閱讀:192來源:國(guó)知局
專利名稱:一種應(yīng)用于移動(dòng)終端的網(wǎng)頁(yè)壓縮方法
技術(shù)領(lǐng)域
本發(fā)明涉及移動(dòng)通訊領(lǐng)域,尤其涉及一種應(yīng)用于移動(dòng)終端的網(wǎng)頁(yè)壓縮方法。
背景技術(shù)
手機(jī)瀏覽器是指運(yùn)行在手機(jī)這種嵌入式環(huán)境當(dāng)中的互聯(lián)網(wǎng)瀏覽器。手機(jī)與傳統(tǒng)的個(gè)人電腦環(huán)境相比,具有運(yùn)算能力有限,內(nèi)存相對(duì)較小,電源續(xù)航能力低,用戶操作方式特殊等特點(diǎn)。因此,運(yùn)行在手機(jī)上的互聯(lián)網(wǎng)瀏覽器需要經(jīng)過特別的設(shè)計(jì)才能夠適應(yīng)嵌入式環(huán)境下的資源限制,提供較好的用戶體驗(yàn)。目前互聯(lián)網(wǎng)上的大多數(shù)網(wǎng)頁(yè)都是為普通的計(jì)算機(jī)屏幕設(shè)計(jì)的,網(wǎng)頁(yè)體積龐大,內(nèi)容繁多。手機(jī)的屏幕及其分辨率相對(duì)普通計(jì)算機(jī)而言是很小的,因此對(duì)于這些網(wǎng)頁(yè)很難有較好的呈現(xiàn)效果。而且,網(wǎng)頁(yè)中還往往包含了大量的無用信息(例如廣告鏈接,標(biāo)識(shí)圖片等等),這些內(nèi)容與網(wǎng)頁(yè)的實(shí)際主題并不相關(guān),但是仍然被下載到客戶端,占用了運(yùn)算和存儲(chǔ)資源,并且由于手機(jī)屏幕比較小,這些無關(guān)內(nèi)容會(huì)嚴(yán)重影響用戶的瀏覽體驗(yàn)。因此,為了增強(qiáng)手機(jī)終端的網(wǎng)頁(yè)瀏覽體驗(yàn),手機(jī)終端需要對(duì)終端上瀏覽器下載的網(wǎng)頁(yè)進(jìn)行分析,過濾,盡量去除無關(guān)內(nèi)容,減少主題不相關(guān)的鏈接資源的下載。目前已經(jīng)有許多商用的手機(jī)瀏覽器實(shí)現(xiàn)了對(duì)網(wǎng)頁(yè)進(jìn)行壓縮,但是基本都是以 C-S (Client Server)的結(jié)構(gòu)實(shí)現(xiàn),一般都包括以下幾個(gè)步驟手機(jī)的瀏覽器不直接訪問互聯(lián)網(wǎng)上的網(wǎng)站,而是通過瀏覽器廠商的服務(wù)器間接瀏覽網(wǎng)頁(yè);瀏覽器廠商的服務(wù)器對(duì)原始網(wǎng)頁(yè)進(jìn)行網(wǎng)頁(yè)架構(gòu)上的調(diào)整,圖片的壓縮等工作;瀏覽器廠商的服務(wù)器將處理過的網(wǎng)頁(yè)發(fā)往手機(jī)上的瀏覽器進(jìn)行呈現(xiàn);可以看出,這種類型的壓縮技術(shù),需要維護(hù)龐大的服務(wù)器群,消耗在帶寬以及硬件上的成本都是很高的,而且瀏覽器還會(huì)受第三方廠商的控制,與許多手機(jī)終端廠商的商業(yè)模式也可能發(fā)生沖突。本文提出的網(wǎng)頁(yè)壓縮技術(shù),完全依賴客戶端的運(yùn)算能力,對(duì)原始網(wǎng)頁(yè)進(jìn)行壓縮,在成本控制和產(chǎn)品集成上都有著較大的優(yōu)勢(shì)?,F(xiàn)在除了在手機(jī)上,在其他手持移動(dòng)終端上,由于屏幕及內(nèi)存等原因,上網(wǎng)也存在同樣的問題。

發(fā)明內(nèi)容
針對(duì)上述問題,本發(fā)明提供一種應(yīng)用于移動(dòng)終端的網(wǎng)頁(yè)壓縮方法,有效增強(qiáng)了移動(dòng)終端瀏覽器的網(wǎng)頁(yè)瀏覽速度。為達(dá)到上述目的,本發(fā)明提供如下技術(shù)方案一種應(yīng)用于移動(dòng)終端的網(wǎng)頁(yè)壓縮方法,該方法首先分別對(duì)html文檔和CSS文檔進(jìn)行解析,生成文檔對(duì)象模型樹以及渲染樹,根據(jù)html文檔中的鏈接下載所需的資源,最后將資源嵌入在網(wǎng)頁(yè)文檔中進(jìn)行渲染并呈現(xiàn)網(wǎng)頁(yè);在生成文檔對(duì)象模型樹之后進(jìn)行網(wǎng)頁(yè)壓縮,并在網(wǎng)頁(yè)壓縮后再根據(jù)html文檔中的連接下載所需資源。
所述網(wǎng)頁(yè)壓縮包括如下步驟步驟一、將網(wǎng)頁(yè)劃分為不同的內(nèi)容塊;步驟二、將不同的內(nèi)容塊根據(jù)與網(wǎng)頁(yè)主題的相關(guān)度劃分為主題內(nèi)容集合以及非主題內(nèi)容集合;步驟三、將非主題內(nèi)容集合中的元素與主題內(nèi)容集合中元素進(jìn)行相似度比較,相似度低于設(shè)定閾值的,則過濾非主題內(nèi)容集合中的元素,如果相似度高于設(shè)定閾值的,則保留該主題內(nèi)容集合中的元素。本發(fā)明采用將網(wǎng)頁(yè)劃分為主題內(nèi)容和非主題內(nèi)容對(duì)網(wǎng)頁(yè)進(jìn)行分析,過濾掉與網(wǎng)頁(yè)主題相似度不高的非主題內(nèi)容,從而達(dá)到了網(wǎng)頁(yè)壓縮的目的,其具有以下幾點(diǎn)優(yōu)點(diǎn)1、對(duì)網(wǎng)頁(yè)的內(nèi)容進(jìn)行分析,與網(wǎng)頁(yè)的主題不相關(guān)的非主題內(nèi)容將被作為噪聲被過濾,增強(qiáng)了瀏覽體驗(yàn);2、過濾基于主題內(nèi)容和非主題內(nèi)容的相似度比較,運(yùn)算復(fù)雜度低,消耗資源少,適用于運(yùn)算資源有限的移動(dòng)終端;3、過濾可以去除大量的無用資源鏈接,如廣告圖片,標(biāo)識(shí)等,減少了移動(dòng)終端流量消耗。


圖1為是移動(dòng)終端對(duì)已下載的網(wǎng)頁(yè)進(jìn)行解析渲染流程圖;圖2為本發(fā)明提供的應(yīng)用于移動(dòng)終端的網(wǎng)頁(yè)壓縮方法的原理流程圖。
具體實(shí)施例方式下面結(jié)合說明書附圖對(duì)本發(fā)明的具體實(shí)施方式
做詳細(xì)描述。請(qǐng)參閱圖1,是移動(dòng)終端對(duì)已下載的網(wǎng)頁(yè)進(jìn)行解析渲染流程圖首先分別對(duì)html 文檔和ess文檔進(jìn)行解析,生成文檔對(duì)象模型樹(DOM Tree)以及渲染樹(Rendering Tree),然后利用本發(fā)明提供的網(wǎng)頁(yè)壓縮方法壓縮網(wǎng)頁(yè),根據(jù)html文檔中的鏈接下載所需的資源(圖片,音頻視頻等多媒體元素);下載完成之后,瀏覽器就可以將資源嵌入在網(wǎng)頁(yè)文檔中進(jìn)行渲染并呈現(xiàn)網(wǎng)頁(yè)。請(qǐng)參閱圖2,是本發(fā)明提供的應(yīng)用于移動(dòng)終端的網(wǎng)頁(yè)壓縮方法的原理流程圖。步驟201,將網(wǎng)頁(yè)劃分為N個(gè)不同的內(nèi)容塊;步驟202,將N個(gè)不同的內(nèi)容塊根據(jù)與網(wǎng)頁(yè)主題的相關(guān)度劃分為χ個(gè)主題內(nèi)容以及 y個(gè)非主題內(nèi)容(χ彡1,y彡1,χ+y = N);步驟203,將y個(gè)非主題內(nèi)容分別和χ個(gè)主題內(nèi)容進(jìn)行相似度比較;步驟204,如果兩者的相似度低于用戶設(shè)定的閾值,則執(zhí)行步驟205,如果相似度高于用戶設(shè)定的閾值,則保留該非主題內(nèi)容;在相似度的對(duì)比過程中,可設(shè)定y個(gè)非主題內(nèi)容逐一與χ個(gè)主題內(nèi)容中其中一個(gè)主題內(nèi)容比較時(shí)相似度低于用戶設(shè)定的閾值,則執(zhí)行步驟 205 ;步驟205,過濾該非主題內(nèi)容,并執(zhí)行步驟207 ;步驟206,保留該非主題內(nèi)容,并執(zhí)行步驟207 ;步驟207,判斷非主題內(nèi)容是否已經(jīng)比較完畢,如果已比較完畢,則返回執(zhí)行步驟203,繼續(xù)進(jìn)行下一非主題內(nèi)容的比較,如果是,則結(jié)束該流程。在上述步驟201中,將網(wǎng)頁(yè)內(nèi)容劃分N個(gè)內(nèi)容,具體包括如下步驟步驟2011,遍歷DOM樹,根據(jù)DOM樹中不同的標(biāo)簽,將整個(gè)網(wǎng)頁(yè)劃分成為N個(gè)內(nèi)容塊。內(nèi)容塊劃分的粒度越細(xì),網(wǎng)頁(yè)的壓縮效果越好,但是相應(yīng)也會(huì)增加運(yùn)算量。故內(nèi)容塊劃分的粒度可以根據(jù)不同移動(dòng)終端的硬件配置進(jìn)行適配,比如,處理器主頻低于200M,用戶可支配內(nèi)存低于20M byte的移動(dòng)終端,劃分的粒度可以局限于DOM樹的第三層;更高配置的手機(jī)終端可以采用更細(xì)的粒度劃分。在上述步驟202中,將內(nèi)容塊劃分為主題模塊集合和非主題模塊集合,具體包括如下步驟步驟2021,獲取內(nèi)容塊j的權(quán)重CWj,即內(nèi)容塊j權(quán)值在網(wǎng)頁(yè)劃分的所有內(nèi)容塊中占據(jù)的比重,Wj代表內(nèi)容塊j的權(quán)值,
權(quán)利要求
1.一種應(yīng)用于移動(dòng)終端的網(wǎng)頁(yè)壓縮方法,該方法首先分別對(duì)html文檔和ess文檔進(jìn)行解析,生成文檔對(duì)象模型樹以及渲染樹,根據(jù)html文檔中的鏈接下載所需的資源,最后將資源嵌入在網(wǎng)頁(yè)文檔中進(jìn)行渲染并呈現(xiàn)網(wǎng)頁(yè);其特征在于在生成文檔對(duì)象模型樹之后進(jìn)行網(wǎng)頁(yè)壓縮,并在網(wǎng)頁(yè)壓縮后再根據(jù)html文檔中的連接下載所需資源。
2.如權(quán)利要求1所述的應(yīng)用于移動(dòng)終端的網(wǎng)頁(yè)壓縮方法,其特征在于所述網(wǎng)頁(yè)壓縮包括如下步驟步驟一、將網(wǎng)頁(yè)劃分為不同的內(nèi)容塊;步驟二、將不同的內(nèi)容塊根據(jù)與網(wǎng)頁(yè)主題的相關(guān)度劃分為主題內(nèi)容集合以及非主題內(nèi)容集合;步驟三、將非主題內(nèi)容集合中的元素與主題內(nèi)容集合中元素進(jìn)行相似度比較,相似度低于設(shè)定閾值的,則過濾非主題內(nèi)容集合中的元素,如果相似度高于設(shè)定閾值的,則保留該主題內(nèi)容集合中的元素。
3.如權(quán)利要求2所述的應(yīng)用于移動(dòng)終端的網(wǎng)頁(yè)壓縮方法,其特征在于所述的步驟一中通過遍歷文檔對(duì)象模型樹中的不同標(biāo)簽網(wǎng)頁(yè)劃分成為不同的內(nèi)容塊。
4.如權(quán)利要求2所述的應(yīng)用于移動(dòng)終端的網(wǎng)頁(yè)壓縮方法,其特征在于所述的步驟二中進(jìn)一步包括如下步驟獲取內(nèi)容塊j的權(quán)重CWp即內(nèi)容塊j權(quán)值在網(wǎng)頁(yè)劃分的所有內(nèi)容塊中占據(jù)的重要度,Wj代表內(nèi)容塊j的權(quán)值,i=l根據(jù)權(quán)重將N個(gè)內(nèi)容塊劃分為主題內(nèi)容集合C(C1; C2,…Ck,…(^),和非主題內(nèi)容集合 θ (θ” θ2,... 0k, ... 01 ),其中1(<叱當(dāng)內(nèi)容塊j的權(quán)重CW^大于設(shè)定閾值時(shí),該內(nèi)容塊j就可以被認(rèn)為是主題內(nèi)容集合,反之,則該內(nèi)容塊j被劃分為非主題內(nèi)容集合。
5.如權(quán)利要求3所述的應(yīng)用于移動(dòng)終端的網(wǎng)頁(yè)壓縮方法,其特征在于權(quán)值Wj主要取決于內(nèi)容塊j位于網(wǎng)頁(yè)的位置以及該內(nèi)容塊j內(nèi)鏈接的資源的媒體類型。
6.如權(quán)利要求2所述的應(yīng)用于移動(dòng)終端的網(wǎng)頁(yè)壓縮方法,其特征在于所述步驟三進(jìn)一步包括如下步驟遍歷網(wǎng)頁(yè)中的文字,提取網(wǎng)頁(yè)中出現(xiàn)過的詞組,組成該網(wǎng)頁(yè)的關(guān)鍵詞集合,設(shè)詞組的總數(shù)為n,則該網(wǎng)頁(yè)的關(guān)鍵詞組合為Τ( \,T2,-Ti,…Tn);為每個(gè)內(nèi)容塊構(gòu)建特征向量W(Wl,w2,...Wi,…^),該特征向量包含η個(gè)分量,每個(gè)分量由關(guān)鍵詞集合Τ( \,T2,…Ti,…??;)中的每個(gè)元素在該內(nèi)容塊中的詞頻計(jì)算得到,
全文摘要
本發(fā)明公開一種應(yīng)用于移動(dòng)終端的網(wǎng)頁(yè)壓縮方法,該方法首先分別對(duì)html文檔和css文檔進(jìn)行解析,生成文檔對(duì)象模型樹以及渲染樹,根據(jù)html文檔中的鏈接下載所需的資源,最后將資源嵌入在網(wǎng)頁(yè)文檔中進(jìn)行渲染并呈現(xiàn)網(wǎng)頁(yè);在生成文檔對(duì)象模型樹之后進(jìn)行網(wǎng)頁(yè)壓縮,并在網(wǎng)頁(yè)壓縮后再根據(jù)html文檔中的連接下載所需資源。本發(fā)明涉及移動(dòng)通訊領(lǐng)域,適用于各類可上網(wǎng)的移動(dòng)終端,可有效增強(qiáng)移動(dòng)終端瀏覽器的網(wǎng)頁(yè)瀏覽速度。
文檔編號(hào)G06F17/30GK102541863SQ201010588500
公開日2012年7月4日 申請(qǐng)日期2010年12月14日 優(yōu)先權(quán)日2010年12月14日
發(fā)明者胡晨鵬 申請(qǐng)人:聯(lián)芯科技有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
岳阳市| 富蕴县| 濉溪县| 苗栗市| 华池县| 桑日县| 长垣县| 哈尔滨市| 长顺县| 孝昌县| 沂南县| 崇州市| 桐庐县| 汽车| 出国| 枣庄市| 奉化市| 安国市| 平塘县| 松桃| 南昌市| 同德县| 阳新县| 桑植县| 江津市| 通许县| 康定县| 财经| 广西| 彭州市| 淮北市| 运城市| 武城县| 锡林郭勒盟| 新干县| 宁城县| 烟台市| 临澧县| 醴陵市| 东安县| 梁河县|