一種手機(jī)頁面分塊顯示方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及手機(jī)的Web頁面顯示技術(shù)領(lǐng)域,尤其涉及一種手機(jī)頁面分塊顯示方法。
【背景技術(shù)】
[0002]手機(jī)訪問Web網(wǎng)絡(luò)能夠滿足互聯(lián)網(wǎng)用戶隨時(shí)隨時(shí)隨地獲取信息的需求,但是,手機(jī)上瀏覽Web頁面具有局限性:一、手機(jī)通過無線網(wǎng)絡(luò)訪問Internet。無線網(wǎng)絡(luò)的寬帶相對(duì)有線網(wǎng)絡(luò)比較窄,因此Web頁數(shù)據(jù)在無線網(wǎng)絡(luò)上的傳輸會(huì)帶來較重的負(fù)擔(dān)。二、手機(jī)的微瀏覽器屏幕尺寸相對(duì)個(gè)人電腦小。目前Web頁大多是為個(gè)人電腦設(shè)計(jì)的,要在移動(dòng)設(shè)備上瀏覽需要大量的水平和垂直滾動(dòng)操作,而在該類設(shè)備上實(shí)現(xiàn)這些操作比較困難。
【發(fā)明內(nèi)容】
[0003]本發(fā)明的目的在于通過一種手機(jī)頁面分塊顯示方法,來解決以上【背景技術(shù)】部分提到的問題。
[0004]為達(dá)此目的,本發(fā)明采用以下技術(shù)方案:
[0005]一種手機(jī)頁面分塊顯示方法,其包括如下步驟:
[0006]S101、去除網(wǎng)頁噪音;
[0007]S102、基于DOM分析和頁面邏輯結(jié)構(gòu)劃分內(nèi)容文本;
[0008]S103、構(gòu)造塊樹;
[0009]S104、優(yōu)化塊布局結(jié)構(gòu),消除網(wǎng)頁不必要元素;
[0010]S105、切割塊為合適的子頁;
[0011]S106、為每一個(gè)子頁生成一個(gè)標(biāo)題;
[0012]S107、構(gòu)造導(dǎo)航鏈接。
[0013]特別地,所述步驟S103具體包括:當(dāng)頁面所有內(nèi)容都被提取出來后,遍歷DOM樹,查看DOM結(jié)構(gòu)點(diǎn)是否包含相同的主題;每一個(gè)不可切分的結(jié)點(diǎn)定義為原子塊,否則稱為復(fù)合塊;塊以層次結(jié)構(gòu)組織,一個(gè)復(fù)合塊可以由原子塊組成,也可以由復(fù)合塊組成,每個(gè)塊由一個(gè)唯一的標(biāo)識(shí);將DOM樹轉(zhuǎn)換成一個(gè)新的樹,稱之為塊樹,即葉子結(jié)點(diǎn)由原子塊組成,中間結(jié)點(diǎn)由復(fù)合塊組成,根結(jié)點(diǎn)顯示網(wǎng)頁所表達(dá)的全部內(nèi)容;其中,通過塊樹調(diào)整相應(yīng)大小,生成合適的頁面。
[0014]特別地,所述步驟S105包括:將網(wǎng)頁分成不同的子頁面,每個(gè)子頁面包括相關(guān)的信息并且適合手機(jī)屏幕大?。环指畹倪^程是自頂向下遍歷塊樹,判斷處于同一子頁中的塊。
[0015]特別地,所述步驟S106包括:在確定子頁的層次結(jié)構(gòu)后,為每一個(gè)子頁生成標(biāo)題;若一個(gè)信息塊包含標(biāo)題元素或文本中一些文本字體大小明顯大于其他文本大小,標(biāo)題元素或此文本被認(rèn)作標(biāo)題,否則必須提取主體詞,其由詞在文本或文本鏈接部分出現(xiàn)的頻率決定。
[0016]本發(fā)明提出的手機(jī)頁面分塊顯示方法能智能化地切割多個(gè)內(nèi)容相關(guān)子塊,然后對(duì)子塊進(jìn)行優(yōu)化,通過塊結(jié)構(gòu)樹將頁面分割成使其適應(yīng)手機(jī)屏幕的大小的子頁,用戶能夠快速高效地訪問Web內(nèi)容,能有效對(duì)任意下載的、不同內(nèi)容類型的頁面進(jìn)行高效顯示。
【附圖說明】
[0017]圖1為本發(fā)明實(shí)施例提供的手機(jī)頁面分塊顯示方法流程圖。
【具體實(shí)施方式】
[0018]下面結(jié)合附圖和實(shí)施例對(duì)本發(fā)明作進(jìn)一步說明??梢岳斫獾氖?,此處所描述的具體實(shí)施例僅僅用于解釋本發(fā)明,而非對(duì)本發(fā)明的限定。另外還需要說明的是,為了便于描述,附圖中僅示出了與本發(fā)明相關(guān)的部分而非全部內(nèi)容,除非另有定義,本文所使用的所有技術(shù)和科學(xué)術(shù)語與屬于本發(fā)明的技術(shù)領(lǐng)域的技術(shù)人員通常理解的含義相同。本文中所使用的術(shù)語只是為了描述具體的實(shí)施例,不是旨在于限制本發(fā)明。
[0019]請參照圖1所示,圖1為本發(fā)明實(shí)施例提供的手機(jī)頁面分塊顯示方法流程圖。本實(shí)施例中手機(jī)頁面分塊顯示方法具體包括如下步驟:
[0020]S101、去除網(wǎng)頁噪音。網(wǎng)頁將重要的內(nèi)容放在中間部分,而網(wǎng)頁中的噪音一般在網(wǎng)頁中的次重要位置。本發(fā)明首先對(duì)網(wǎng)頁的框架結(jié)構(gòu)進(jìn)行分析,即通過標(biāo)簽將網(wǎng)頁分割各個(gè)部分,并對(duì)標(biāo)簽的長和寬進(jìn)行比較,去掉長寬比很大的部分,來區(qū)分主體內(nèi)容和噪音內(nèi)容,最后生成只含有主題內(nèi)容的文本文檔。
[0021]S102、基于DOM分析和頁面邏輯結(jié)構(gòu)劃分內(nèi)容文本。
[0022]S103、構(gòu)造塊樹。當(dāng)頁面所有內(nèi)容都被提取出來后,遍歷DOM樹,查看DOM結(jié)構(gòu)點(diǎn)是否包含相同的主題;每一個(gè)不可切分的結(jié)點(diǎn)定義為原子塊,否則稱為復(fù)合塊;塊以層次結(jié)構(gòu)組織,一個(gè)復(fù)合塊可以由原子塊組成,也可以由復(fù)合塊組成,每個(gè)塊由一個(gè)唯一的標(biāo)識(shí);將DOM樹轉(zhuǎn)換成一個(gè)新的樹,稱之為塊樹,即葉子結(jié)點(diǎn)由原子塊組成,中間結(jié)點(diǎn)由復(fù)合塊組成,根結(jié)點(diǎn)顯示網(wǎng)頁所表達(dá)的全部內(nèi)容;其中,通過塊樹調(diào)整相應(yīng)大小,生成合適的頁面。
[0023]S104、優(yōu)化塊布局結(jié)構(gòu),消除網(wǎng)頁不必要元素。
[0024]S105、切割塊為合適的子頁。將網(wǎng)頁分成不同的子頁面,每個(gè)子頁面包括相關(guān)的信息并且適合手機(jī)屏幕大??;分割的過程是自頂向下遍歷塊樹,判斷處于同一子頁中的塊。
[0025]S106、為每一個(gè)子頁生成一個(gè)標(biāo)題。在確定子頁的層次結(jié)構(gòu)后,為每一個(gè)子頁生成標(biāo)題;若一個(gè)信息塊包含標(biāo)題元素或文本中一些文本字體大小明顯大于其他文本大小,標(biāo)題元素或此文本被認(rèn)作標(biāo)題,否則必須提取主體詞,其由詞在文本或文本鏈接部分出現(xiàn)的頻率決定。
[0026]S107、構(gòu)造導(dǎo)航鏈接。
[0027]本發(fā)明的技術(shù)方案能智能化地切割多個(gè)內(nèi)容相關(guān)子塊,然后對(duì)子塊進(jìn)行優(yōu)化,通過塊結(jié)構(gòu)樹將頁面分割成使其適應(yīng)手機(jī)屏幕的大小的子頁,用戶能夠快速高效地訪問Web內(nèi)容,能有效對(duì)任意下載的、不同內(nèi)容類型的頁面進(jìn)行高效顯示。
[0028]注意,上述僅為本發(fā)明的較佳實(shí)施例及所運(yùn)用技術(shù)原理。本領(lǐng)域技術(shù)人員會(huì)理解,本發(fā)明不限于這里所述的特定實(shí)施例,對(duì)本領(lǐng)域技術(shù)人員來說能夠進(jìn)行各種明顯的變化、重新調(diào)整和替代而不會(huì)脫離本發(fā)明的保護(hù)范圍。因此,雖然通過以上實(shí)施例對(duì)本發(fā)明進(jìn)行了較為詳細(xì)的說明,但是本發(fā)明不僅僅限于以上實(shí)施例,在不脫離本發(fā)明構(gòu)思的情況下,還可以包括更多其他等效實(shí)施例,而本發(fā)明的范圍由所附的權(quán)利要求范圍決定。
【主權(quán)項(xiàng)】
1.一種手機(jī)頁面分塊顯示方法,其特征在于,包括如下步驟: 5101、去除網(wǎng)頁噪音; 5102、基于DOM分析和頁面邏輯結(jié)構(gòu)劃分內(nèi)容文本; 5103、構(gòu)造塊樹; 5104、優(yōu)化塊布局結(jié)構(gòu),消除網(wǎng)頁不必要元素; 5105、切割塊為合適的子頁; 5106、為每一個(gè)子頁生成一個(gè)標(biāo)題; 5107、構(gòu)造導(dǎo)航鏈接。2.根據(jù)權(quán)利要求1所述的手機(jī)頁面分塊顯示方法,其特征在于,所述步驟S103具體包括:當(dāng)頁面所有內(nèi)容都被提取出來后,遍歷DOM樹,查看DOM結(jié)構(gòu)點(diǎn)是否包含相同的主題;每一個(gè)不可切分的結(jié)點(diǎn)定義為原子塊,否則稱為復(fù)合塊;塊以層次結(jié)構(gòu)組織,一個(gè)復(fù)合塊可以由原子塊組成,也可以由復(fù)合塊組成,每個(gè)塊由一個(gè)唯一的標(biāo)識(shí);將DOM樹轉(zhuǎn)換成一個(gè)新的樹,稱之為塊樹,即葉子結(jié)點(diǎn)由原子塊組成,中間結(jié)點(diǎn)由復(fù)合塊組成,根結(jié)點(diǎn)顯示網(wǎng)頁所表達(dá)的全部內(nèi)容;其中,通過塊樹調(diào)整相應(yīng)大小,生成合適的頁面。3.根據(jù)權(quán)利要求1所述的手機(jī)頁面分塊顯示方法,其特征在于,所述步驟S105包括:將網(wǎng)頁分成不同的子頁面,每個(gè)子頁面包括相關(guān)的信息并且適合手機(jī)屏幕大??;分割的過程是自頂向下遍歷塊樹,判斷處于同一子頁中的塊。4.根據(jù)權(quán)利要求1至3之一所述的手機(jī)頁面分塊顯示方法,其特征在于,所述步驟S106包括:在確定子頁的層次結(jié)構(gòu)后,為每一個(gè)子頁生成標(biāo)題;若一個(gè)信息塊包含標(biāo)題元素或文本中一些文本字體大小明顯大于其他文本大小,標(biāo)題元素或此文本被認(rèn)作標(biāo)題,否則必須提取主體詞,其由詞在文本或文本鏈接部分出現(xiàn)的頻率決定。
【專利摘要】本發(fā)明公開一種手機(jī)頁面分塊顯示方法,包括如下步驟:S101、去除網(wǎng)頁噪音。S102、基于DOM分析和頁面邏輯結(jié)構(gòu)劃分內(nèi)容文本。S103、構(gòu)造塊樹。S104、優(yōu)化塊布局結(jié)構(gòu),消除網(wǎng)頁不必要元素。S105、切割塊為合適的子頁。S106、為每一個(gè)子頁生成一個(gè)標(biāo)題。S107、構(gòu)造導(dǎo)航鏈接。本發(fā)明能智能化地切割多個(gè)內(nèi)容相關(guān)子塊,然后對(duì)子塊進(jìn)行優(yōu)化,通過塊結(jié)構(gòu)樹將頁面分割成使其適應(yīng)手機(jī)屏幕的大小的子頁,用戶能夠快速高效地訪問Web內(nèi)容,能有效對(duì)任意下載的、不同內(nèi)容類型的頁面進(jìn)行高效顯示。
【IPC分類】G06F3/0481
【公開號(hào)】CN104951187
【申請?zhí)枴緾N201510335300
【發(fā)明人】王浩
【申請人】無錫久源軟件科技有限公司
【公開日】2015年9月30日
【申請日】2015年6月16日