本發(fā)明涉及到互聯(lián)網(wǎng)技術(shù)領(lǐng)域,特別涉及到一種豎向文本廣告過濾方法和裝置。
背景技術(shù):
互聯(lián)網(wǎng)的快速發(fā)展給人們的生活帶來了極大的便利,人們可以利用互聯(lián)網(wǎng)瀏覽網(wǎng)頁(如QQ瀏覽器的話題圈評論系統(tǒng)或一些論壇網(wǎng)站等)、或者通過聊天工具進(jìn)行通信(如QQ、微信等)、或者通過安裝一些應(yīng)用軟件獲取一些信息(如天氣預(yù)報(bào)應(yīng)用、日歷應(yīng)用等)。
在互聯(lián)網(wǎng)給人們帶來便利的同時(shí),一些廣告發(fā)布者會(huì)利用互聯(lián)網(wǎng)的便利發(fā)布各種廣告,給用戶帶來了極大的煩惱。例如,廣告發(fā)布者通常在QQ瀏覽器的話題圈評論系統(tǒng)上發(fā)布廣告,或者在QQ群聊、微信群聊里發(fā)布廣告,或者在一些應(yīng)用軟件中自動(dòng)彈出一浮窗來發(fā)布廣告。
為了自動(dòng)過濾掉這些廣告,現(xiàn)有技術(shù)中通常會(huì)對當(dāng)前頁面上顯示的文本信息按照行進(jìn)行語義識別,在識別結(jié)果為廣告時(shí)則進(jìn)行過濾處理。
然而,廣告發(fā)布者為了利用現(xiàn)有廣告過濾方法的漏洞,通常會(huì)發(fā)布一些豎向廣告。如圖1所示,圖1為豎向廣告的示意圖,這種廣告通常需要豎向閱讀。例如,對于圖1所示的豎向廣告,其實(shí)際廣告內(nèi)容為“買時(shí)尚睡衣加微信357mai”。由于現(xiàn)有的廣告過濾方法一般都是按照行進(jìn)行廣告識別,若采用現(xiàn)有技術(shù)進(jìn)行識別,則按照行將上述豎向廣告解析為“買加7時(shí)微m尚信a睡3i衣5”,此時(shí)解析出的內(nèi)容的語義已經(jīng)發(fā)生變化,采用現(xiàn)有的方法并不能識別出其為廣告,因此現(xiàn)有技術(shù)對豎向廣告的識別率比較低下,并不能過濾掉豎向廣告。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明實(shí)施例提供一種豎向文本廣告過濾方法和裝置,旨在解決不能過 濾掉豎向廣告的技術(shù)問題。
為實(shí)現(xiàn)上述目的,本發(fā)明實(shí)施例提出豎向文本廣告過濾方法,所述豎向文本廣告過濾方法包括步驟:
獲取文本信息;
將所述文本信息按照行進(jìn)行分組,依次生成若干第一文本序列;
按照順序依次提取各個(gè)所述第一文本序列對應(yīng)位置的字符,根據(jù)所述對應(yīng)位置依次生成若干第二文本序列;
根據(jù)所述第二文本序列過濾廣告。
為了實(shí)現(xiàn)上述目的,本發(fā)明實(shí)施例還進(jìn)一步提出一種豎向文本廣告過濾裝置,所述豎向文本廣告過濾裝置包括:
獲取模塊,用于獲取文本信息;
分組模塊,用于將所述文本信息按照行進(jìn)行分組,依次生成若干第一文本序列;
提取模塊,按照順序依次提取各個(gè)所述第一文本序列對應(yīng)位置的字符,根據(jù)所述對應(yīng)位置依次生成若干第二文本序列;
過濾模塊,用于根據(jù)所述第二文本序列過濾廣告。
本發(fā)明提出的豎向文本廣告過濾方法和裝置,通過獲取文本信息,先將所述文本信息按照行進(jìn)行分組,依次生成若干第一文本序列,然后再按照順序依次提取各個(gè)所述第一文本序列對應(yīng)位置的字符,根據(jù)所述對應(yīng)位置依次生成若干第二文本序列,最后根據(jù)所述第二文本序列過濾廣告。由于本發(fā)明通過依次提取第一文本序列對應(yīng)位置的字符而生成第二文本序列,根據(jù)第二文本序列過濾廣告,因此能夠有效地識別豎向文本信息,從而達(dá)到過濾掉豎向廣告的目的。
附圖說明
圖1為豎向文本廣告的示意圖;
圖2為本發(fā)明實(shí)施例豎向文本廣告過濾裝置所涉及的硬件架構(gòu)示意圖;
圖3為本發(fā)明豎向文本廣告過濾方法的流程示意圖;
圖4為頁面中顯示的文本信息的示意圖;
圖5為本發(fā)明豎向文本廣告過濾方法中根據(jù)第二文本序列過濾廣告步驟的第一細(xì)化流程示意圖;
圖6為本發(fā)明豎向文本廣告過濾方法中根據(jù)文本重組序列過濾廣告步驟的第一細(xì)化流程示意圖;
圖7為本發(fā)明豎向文本廣告過濾方法中根據(jù)文本重組序列過濾廣告步驟的第二細(xì)化流程示意圖;
圖8為本發(fā)明豎向文本廣告過濾方法中根據(jù)文本重組序列過濾廣告步驟的第三細(xì)化流程示意圖;
圖9為本發(fā)明豎向文本廣告過濾方法中根據(jù)第二文本序列過濾廣告步驟的第二細(xì)化流程示意圖;
圖10為本發(fā)明豎向文本廣告過濾方法中根據(jù)第二文本序列過濾廣告步驟的第三細(xì)化流程示意圖;
圖11為本發(fā)明豎向文本廣告過濾裝置的功能模塊示意圖;
圖12為本發(fā)明豎向文本廣告過濾裝置中過濾模塊的第一細(xì)化功能模塊示意圖;
圖13為本發(fā)明豎向文本廣告過濾裝置中第一過濾單元的第一細(xì)化功能模塊示意圖;
圖14為本發(fā)明豎向文本廣告過濾裝置中第一過濾單元的第二細(xì)化功能模塊示意圖;
圖15為本發(fā)明豎向文本廣告過濾裝置中第一過濾單元的第三細(xì)化功能模塊示意圖;
圖16為本發(fā)明豎向文本廣告過濾裝置中過濾模塊的第二細(xì)化功能模塊示意圖;
圖17為本發(fā)明豎向文本廣告過濾裝置中過濾模塊的第三細(xì)化功能模塊示意圖。
本發(fā)明目的的實(shí)現(xiàn)、功能特點(diǎn)及優(yōu)點(diǎn)將結(jié)合實(shí)施例,參照附圖做進(jìn)一步說明。
具體實(shí)施方式
應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
本發(fā)明實(shí)施例的主要解決方案是:獲取文本信息;將所述文本信息按照行進(jìn)行分組,依次生成若干第一文本序列;按照順序依次提取各個(gè)所述第一文本序列對應(yīng)位置的字符,根據(jù)所述對應(yīng)位置依次生成若干第二文本序列;根據(jù)所述第二文本序列過濾廣告。
由于現(xiàn)有的豎向文本廣告過濾方法一般都是按照行進(jìn)行廣告識別,采用現(xiàn)有的方法并不能有效地識別出豎向廣告。
本發(fā)明實(shí)施例架構(gòu)一豎向文本廣告過濾裝置,該工具通過獲取文本信息,先將所述文本信息按照行進(jìn)行分組,依次生成若干第一文本序列,然后再按照順序依次提取各個(gè)所述第一文本序列對應(yīng)位置的字符,根據(jù)所述對應(yīng)位置依次生成若干第二文本序列,最后根據(jù)所述第二文本序列過濾廣告。由于本發(fā)明通過依次提取第一文本序列對應(yīng)位置的字符而生成第二文本序列,根據(jù)第二文本序列過濾廣告,因此能夠有效地識別豎向文本信息,從而達(dá)到過濾掉豎向廣告的目的。
其中,本實(shí)施例豎向文本廣告過濾裝置可以承載于服務(wù)器也可承載于終端,終端例如可以為計(jì)算機(jī)、手機(jī)或平板電腦等。本實(shí)施例以豎向文本廣告過濾裝置承載于終端為例說明。該豎向文本廣告過濾裝置所涉及的硬件架構(gòu)可以如圖2所示。
圖2示出了本發(fā)明實(shí)施例豎向文本廣告過濾裝置所涉及的硬件架構(gòu)。如圖2所示,所述豎向文本廣告過濾裝置所涉及的硬件包括:處理器1001,例如CPU,通信總線1002,用戶接口1003,網(wǎng)絡(luò)接口1004,存儲(chǔ)器1005,數(shù)據(jù)接口1006。其中,通信總線1002用于實(shí)現(xiàn)該服務(wù)器中各組成部件之間的連接通信。用戶接口1003可以包括顯示屏(Display)、鍵盤(Keyboard)、鼠標(biāo)等組件,用于接收用戶輸入的信息,并將接收的信息發(fā)送至處理器1005進(jìn)行處理。顯示屏可以為LCD顯示屏、LED顯示屏,也可以為觸摸屏。可選用戶接口1003還可以包括標(biāo)準(zhǔn)的有線接口、無線接口。網(wǎng)絡(luò)接口1004可選的可以包括標(biāo)準(zhǔn)的有線接口、無線接口(如WI-FI接口)。存儲(chǔ)器1005可以是高速RAM存儲(chǔ)器,也可以是穩(wěn)定的存儲(chǔ)器(non-volatile memory),例如磁盤存儲(chǔ)器。存儲(chǔ)器1005 可選的還可以是獨(dú)立于前述處理器1001的存儲(chǔ)裝置。數(shù)據(jù)接口1006可以為USB接口或可接收外部數(shù)據(jù)的通信接口。如圖2所示,作為一種計(jì)算機(jī)存儲(chǔ)介質(zhì)的存儲(chǔ)器1005中可以包括操作系統(tǒng)、網(wǎng)絡(luò)通信模塊、用戶接口模塊以及廣告過濾程序。
在圖2所示的服務(wù)器所涉及的硬件中,網(wǎng)絡(luò)接口1004主要用于連接其它應(yīng)用服務(wù)器,與其它應(yīng)用服務(wù)器進(jìn)行數(shù)據(jù)通信;用戶接口1003主要用于連接客戶端,與客戶端進(jìn)行數(shù)據(jù)通信,接收客戶端輸入的信息和指令;而處理器1001可以用于調(diào)用存儲(chǔ)器1005中存儲(chǔ)的廣告過濾程序,并執(zhí)行以下操作:
獲取文本信息;
將所述文本信息按照行進(jìn)行分組,依次生成若干第一文本序列;
按照順序依次提取各個(gè)所述第一文本序列對應(yīng)位置的字符,根據(jù)所述對應(yīng)位置依次生成若干第二文本序列;
根據(jù)所述第二文本序列過濾廣告。
進(jìn)一步地,在一個(gè)實(shí)施例中,處理器1001調(diào)用存儲(chǔ)器1005中存儲(chǔ)的廣告過濾程序可以執(zhí)行以下操作:
按照順序依次將各個(gè)所述第二文本序列重組,生成文本重組序列;
根據(jù)所述文本重組序列過濾廣告。
進(jìn)一步地,在一個(gè)實(shí)施例中,處理器1001調(diào)用存儲(chǔ)器1005中存儲(chǔ)的廣告過濾程序可以執(zhí)行以下操作:
將預(yù)設(shè)廣告庫中的關(guān)鍵詞與所述文本重組序列進(jìn)行匹配;
在至少一所述關(guān)鍵詞與所述文本重組序列匹配時(shí),則確定所述文本信息包含廣告,并將所述文本信息過濾。
進(jìn)一步地,在一個(gè)實(shí)施例中,處理器1001調(diào)用存儲(chǔ)器1005中存儲(chǔ)的廣告過濾程序可以執(zhí)行以下操作:
提取所述文本重組序列中的字母和/或數(shù)字組合序列,并計(jì)算提取出的字母和/或數(shù)字組合序列的最大長度;
在所述最大長度大于預(yù)設(shè)閾值時(shí),則確定所述文本信息包含廣告,并將所述文本信息過濾。
進(jìn)一步地,在一個(gè)實(shí)施例中,處理器1001調(diào)用存儲(chǔ)器1005中存儲(chǔ)的廣告過濾程序可以執(zhí)行以下操作:
將預(yù)設(shè)廣告庫中的關(guān)鍵詞與所述第二文本序列進(jìn)行匹配;
在至少一所述關(guān)鍵詞與所述第二文本序列匹配時(shí),則確定所述文本信息包含廣告,并將所述文本信息過濾。
進(jìn)一步地,在一個(gè)實(shí)施例中,處理器1001調(diào)用存儲(chǔ)器1005中存儲(chǔ)的廣告過濾程序可以執(zhí)行以下操作:
提取所述第二文本序列中的字母和/或數(shù)字組合序列,并計(jì)算提取出的字母和/或數(shù)字組合序列的最大長度;
在所述最大長度大于預(yù)設(shè)閾值時(shí),則確定所述文本信息包含廣告,并將所述文本信息過濾;
其中,在提取所述第二文本序列中的字母和/或數(shù)字組合序列時(shí),按照所述第二文本序列的順序,在相鄰兩第二文本序列中,若前一所述第二文本序列的尾端為字母和/或數(shù)字組合序列、且后一所述第二文本序列的首端為字母和/或數(shù)字組合序列,則將所述第二文本序列尾端的字母和/或數(shù)字組合序列和所述第二文本序列首端的字母和/或數(shù)字組合序列拼接形成一所述字母和/或數(shù)字組合序列。
進(jìn)一步地,在一個(gè)實(shí)施例中,處理器1001調(diào)用存儲(chǔ)器1005中存儲(chǔ)的廣告過濾程序可以執(zhí)行以下操作:
在根據(jù)所述文本重組序列過濾廣告之前,先剔除所述文本重組序列中的預(yù)設(shè)字符。
本實(shí)施例根據(jù)上述方案,通過獲取文本信息,先將所述文本信息按照行進(jìn)行分組,依次生成若干第一文本序列,然后再按照順序依次提取各個(gè)所述第一文本序列對應(yīng)位置的字符,根據(jù)所述對應(yīng)位置依次生成若干第二文本序列,最后根據(jù)所述第二文本序列過濾廣告。由于本發(fā)明通過依次提取第一文本序列對應(yīng)位置的字符而生成第二文本序列,根據(jù)第二文本序列過濾廣告,因此能夠有效地識別豎向文本信息,從而達(dá)到過濾掉豎向廣告的目的。
基于上述硬件架構(gòu),提出本發(fā)明豎向文本廣告過濾方法實(shí)施例。
如圖3所示,提出本發(fā)明一種豎向文本廣告過濾方法的第一實(shí)施例,所述豎向文本廣告過濾方法包括:
步驟S10,獲取文本信息;
在本實(shí)施例中,可以獲取當(dāng)前瀏覽的網(wǎng)頁中的文本信息,例如一些論壇網(wǎng)站(如QQ瀏覽器的話題圈評論系統(tǒng)、天涯論壇、百度貼吧等);或者當(dāng)前開啟的軟件所顯示的文本信息(如QQ群聊、微信群聊);或者當(dāng)前開啟的應(yīng)用軟件中自動(dòng)彈出的浮窗中的信息(如游戲軟件中的浮窗等)。
可選的,可以只獲取預(yù)設(shè)頁面中的文本信息。即用戶可以對需要進(jìn)行廣告過濾的頁面進(jìn)行預(yù)設(shè)。
預(yù)設(shè)頁面可以包括基于瀏覽器瀏覽的頁面、預(yù)設(shè)應(yīng)用軟件顯示的界面和/或預(yù)設(shè)應(yīng)用軟件對應(yīng)的預(yù)設(shè)界面。
可選的,可以預(yù)設(shè)網(wǎng)址,在瀏覽器當(dāng)前瀏覽的頁面地址為預(yù)設(shè)網(wǎng)址時(shí),則獲取當(dāng)前頁面中的文本信息。即,只對預(yù)設(shè)網(wǎng)址對應(yīng)的網(wǎng)頁進(jìn)行廣告過濾。
上述預(yù)設(shè)應(yīng)用軟件對應(yīng)的預(yù)設(shè)界面例如可以為QQ軟件對應(yīng)的群聊界面,或者微信軟件對應(yīng)的群聊界面。
可選的,在獲取文本信息時(shí),可以根據(jù)空行獲取文本信息??梢灶A(yù)設(shè)空行的數(shù)量,可以為一行、兩行或多行,在文本信息之間的空行數(shù)量大于或等于預(yù)設(shè)數(shù)量時(shí),則以空行為分界將文本信息劃分為兩段文本信息。如圖4所示,圖4為頁面中顯示的文本信息的示意圖,位于上方的文本信息與位于下方的文本信息之間具有三個(gè)空行,若預(yù)設(shè)空行數(shù)量為一行,則系統(tǒng)將以空行為分界將圖4所述的文本信息劃分為兩段文本信息,因此在獲取文本信息時(shí),將會(huì)獲取兩段相互獨(dú)立的文本信息,第一段文本信息為“嶺南文化是悠久燦爛的中華文化的有機(jī)組成部分。嶺南先民遺址的出土材料證明,嶺南文化為原生性文化?!保坏诙挝谋拘畔椤百I加7時(shí)微m尚信a睡3i衣5”。在本實(shí)施例后續(xù)的處理步驟中,每段文本信息將會(huì)分別單獨(dú)處理。
步驟S20,將所述文本信息按照行進(jìn)行分組,依次生成若干第一文本序列;
在本實(shí)施例中,可以按照換行符“\n”對文本信息進(jìn)行分組??梢杂缮现料乱来伟凑招猩傻谝晃谋拘蛄?,也可以由下至上依次按照行生成第一文本序列。本實(shí)施例中以由上至下依次生成第一文本序列為例進(jìn)行說明。
如圖4所示的文本信息中,對于第一段文本信息,可分為5組第一文本序列,第一組為“嶺南文化是悠久燦爛的”,第二組為“中華文化的有機(jī)組成部”,第三組為“分。嶺南先民遺址的出”,第四組為“土材料證明,嶺南文 化”,第五組為“為原生性文化?!?。對于第二段文本信息,可分為5組第一文本序列,第一組為“買加7”,第二組為“時(shí)微m”,第三組為“尚信a”,第四組為“睡3i”,第五組為“衣5”。
步驟S30,按照順序依次提取各個(gè)所述第一文本序列對應(yīng)位置的字符,根據(jù)所述對應(yīng)位置依次生成若干第二文本序列;
在本實(shí)施例中,每一對應(yīng)位置生成一第二文本序列。在提取各個(gè)第一文本序列的某一對應(yīng)位置的字符時(shí),可以按照文本行由上至下的順序依次提取,也可以按照文本行由下至上的順序依次提取。本實(shí)施例以按照文本行由上至下的順序依次提取為例進(jìn)行說明,例如,若對應(yīng)位置為第一文本序列的第一個(gè)位置,則可以依次提取第一組第一文本序列、第二組第一文本序列、第三組第一文本序列、第四組第一文本序列和第五組第一文本序列的第一個(gè)字符。以上述第二段文本信息為例,則提取出的第一個(gè)位置的第二文本序列為“買時(shí)尚睡衣”。同理,提取出的第二個(gè)位置的第二文本序列為“加微信35”,提取出的第三個(gè)位置的第二文本序列為“7mai”。
對于每一第二文本序列來說,在從第一文本序列中提取字符時(shí),各個(gè)第一文本序列的對應(yīng)位置可以為相同位置,即同一第二文本序列中的字符在各個(gè)文本行中的位置相同,例如,對于上述第二文本序列“買時(shí)尚睡衣”來說,該第二文本序列中的各個(gè)字符在各個(gè)第一文本序列中的位置均為第一個(gè)字符,對于上述第二文本序列“加微信35”來說,該第二文本序列中的各個(gè)字符在各個(gè)第一文本序列中的位置均為第二個(gè)字符,對于上述第二文本序列“7mai”來說,該第二文本序列中的各個(gè)字符在各個(gè)第一文本序列中的位置均為第三個(gè)字符。
或者同一第二文本序列中的字符在各個(gè)第一文本序列中的位置呈規(guī)則變化。例如,可以依次提取第一組第一文本序列中的第一個(gè)位置的字符、第二組第一文本序列中的第二個(gè)位置的字符、第三組第一文本序列中的第三個(gè)位置的字符、第四組第一文本序列中的第四個(gè)位置的字符和第五組第一文本序列中的第五個(gè)位置的字符,并將提取出的這五個(gè)字符作為第一個(gè)第二文本序列。同理,可以依次提取第一組第一文本序列中的第二個(gè)位置的字符、第二組第一文本序列中的第三個(gè)位置的字符、第三組第一文本序列中的第四個(gè)位置的字符、第四組第一文本序列中的第五個(gè)位置的字符和第五組第一文本序 列中的第六個(gè)位置的字符,并將提取出的這五個(gè)字符作為第二個(gè)第二文本序列。對于上述第一段文本信息來說,第一個(gè)第二文本序列為“嶺華嶺證文”,第二個(gè)第二文本序列為“南文南明化”。
由于某些豎向廣告可能包含若干特殊字符,比如空格等,從而使得廣告并不是完全豎向顯示,而且斜豎向顯示,為了使得廣告明顯,通常廣告文本前會(huì)增加一些特殊字符。可選的,在生成第二文本序列之前,先剔除各個(gè)所述第一文本序列中的預(yù)設(shè)字符。預(yù)設(shè)字符可以為空格、“*”、“-”以及其他字符等,在此不作限定。
步驟S40,根據(jù)所述第二文本序列過濾廣告。
在本實(shí)施例中,可以設(shè)置一包含若干關(guān)鍵詞的預(yù)設(shè)廣告庫,然后查找第二文本序列中是否有關(guān)鍵詞,含有預(yù)設(shè)廣告庫中的關(guān)鍵詞時(shí)則認(rèn)為其含有廣告,則將獲取的文本信息過濾。還可以確定第二文本序列中的字母和/或數(shù)字組合序列的長度,在確定的長度達(dá)到預(yù)設(shè)長度閾值時(shí),則認(rèn)為包含廣告,則將獲取的文本信息過濾。
本發(fā)明提供的豎向文本廣告過濾方法,通過獲取文本信息,先將所述文本信息按照行進(jìn)行分組,依次生成若干第一文本序列,然后再按照順序依次提取各個(gè)所述第一文本序列對應(yīng)位置的字符,根據(jù)所述對應(yīng)位置依次生成若干第二文本序列,最后根據(jù)所述第二文本序列過濾廣告。由于本發(fā)明通過依次提取第一文本序列對應(yīng)位置的字符而生成第二文本序列,根據(jù)第二文本序列過濾廣告,因此能夠有效地識別豎向文本信息,從而達(dá)到過濾掉豎向廣告的目的。
以下提出幾種根據(jù)所述第二文本序列過濾廣告的實(shí)施方式:
方式一,如圖5所示,步驟S40包括:
步驟S41,按照順序依次將各個(gè)所述第二文本序列重組,生成文本重組序列;
對于上述第二段文本信息來說,第一個(gè)第二文本序列為“買時(shí)尚睡衣”,第二個(gè)第二文本序列為“加微信35”,第三個(gè)第二文本序列為“7mai”。因此,按照第二文本序列的順序,生成的文本重組序列為“買時(shí)尚睡衣加微信357mai”。
步驟S42,根據(jù)所述文本重組序列過濾廣告。
在本實(shí)施例中,可以對文本重組序列進(jìn)行語義分析,以辨別其是否為廣告。或者還可以將文本重組序列與預(yù)設(shè)的廣告庫進(jìn)行匹配,在匹配時(shí),則認(rèn)為該文本重組序列對應(yīng)的文本信息為廣告。在確定文本重組序列包含廣告時(shí),則將該文本重組序列對應(yīng)的文本信息過濾。過濾的方式可以為屏蔽、模糊、或亂碼的形式等,具體可以根據(jù)實(shí)際需要進(jìn)行設(shè)置。
例如,上述生成的文本重組序列為“買時(shí)尚睡衣加微信357mai”,根據(jù)語義分析結(jié)果確定其為廣告,或者通過判定確定其與預(yù)設(shè)的廣告庫匹配,從而確定其為廣告。因此將上述第一段文本信息過濾。
以下提出幾種根據(jù)文本重組序列過濾廣告的方案。
方案一,如圖6所示,步驟S42包括:
步驟S421,將預(yù)設(shè)廣告庫中的關(guān)鍵詞與所述文本重組序列進(jìn)行匹配;
步驟S422,在至少一所述關(guān)鍵詞與所述文本重組序列匹配時(shí),則確定所述文本信息包含廣告,并將所述文本信息過濾。
在本實(shí)施例中,若預(yù)設(shè)廣告庫中的某一關(guān)鍵詞與文本重組序列中的部分連續(xù)字符或所有連續(xù)字符一致,則認(rèn)為預(yù)設(shè)廣告庫中的關(guān)鍵詞與文本重組序列匹配。本實(shí)施例提供的豎向文本廣告過濾方法,能夠準(zhǔn)確的識別出豎向廣告。
方案二,為了進(jìn)一步提高豎向廣告過濾的準(zhǔn)確性,如圖7所示,步驟S421包括:
步驟S423,將預(yù)設(shè)廣告庫中的關(guān)鍵詞與所述文本重組序列進(jìn)行匹配;
步驟S424,提取所述文本重組序列中的字母和/或數(shù)字組合序列,并計(jì)算提取出的字母和/或數(shù)字組合序列的最大長度;
在本實(shí)施例中,上述步驟S423和步驟S424可以同時(shí)執(zhí)行,也可以不同時(shí)執(zhí)行,執(zhí)行順序不分先后。
上述字母和/或數(shù)字組合序列可以只包含字母,也可以只包含數(shù)字,也可以同時(shí)包含字母和數(shù)字。在提取字母和/或數(shù)字組合序列時(shí),該字母和/或數(shù)字組合序列中的各個(gè)字母和/或數(shù)字在上述文本重組序列中為連續(xù)的。每一文本重組序列可能包含多個(gè)字母和/或數(shù)字組合序列,只需在各個(gè)字母和/或數(shù)字組合序列中確定最大長度的序列即可。
步驟S425,在至少一所述關(guān)鍵詞與所述文本重組序列匹配,且所述最大長度大于預(yù)設(shè)閾值時(shí),則確定所述文本信息包含廣告,并將所述文本信息過濾。
由于一般在做廣告宣傳時(shí),尤其對于一些不良廣告內(nèi)容,通常會(huì)留有QQ號碼、電話號碼、微信號等,因此通過對字母和數(shù)字進(jìn)行檢測,可以快速有效地過濾掉廣告。預(yù)設(shè)閾值可以根據(jù)實(shí)際需要進(jìn)行設(shè)置,在本實(shí)施例中,預(yù)設(shè)閾值可以取6。
本實(shí)施例中提供的豎向文本廣告過濾方法,通過將語義分析與字母數(shù)字組合相結(jié)合的方式進(jìn)行廣告的判斷與過濾,準(zhǔn)確性較高。
方案三,為了進(jìn)一步提高豎向廣告過濾的準(zhǔn)確性,如圖8所示,步驟S42包括:
步驟S426,提取所述文本重組序列中的字母和/或數(shù)字組合序列,并計(jì)算提取出的字母和/或數(shù)字組合序列的最大長度;
在本實(shí)施例中,字母和/或數(shù)字組合序列可以只包含字母,也可以只包含數(shù)字,也可以同時(shí)包含字母和數(shù)字。在提取字母和/或數(shù)字組合序列時(shí),該字母和/或數(shù)字組合序列中的各個(gè)字母和/或數(shù)字在上述文本重組序列中為連續(xù)的。每一文本重組序列可能包含多個(gè)字母和/或數(shù)字組合序列,只需在各個(gè)字母和/或數(shù)字組合序列中確定最大長度的序列即可。
步驟S427,在所述最大長度大于預(yù)設(shè)閾值時(shí),則確定所述文本信息包含廣告,并將所述文本信息過濾。
由于一般在做廣告宣傳時(shí),尤其對于一些不良廣告內(nèi)容,通常會(huì)留有QQ號碼、電話號碼、微信號等,因此通過對字母和數(shù)字進(jìn)行檢測,可以快速有效地過濾掉廣告。預(yù)設(shè)閾值可以根據(jù)實(shí)際需要進(jìn)行設(shè)置,在本實(shí)施例中,預(yù)設(shè)閾值可以取6。
本實(shí)施例中提供的豎向文本廣告過濾方法,僅通過字母數(shù)字組合的方式進(jìn)行廣告的判斷與過濾,使得豎向文本廣告過濾方法更加高效率。
此外,上述根據(jù)所述文本重組序列過濾廣告的實(shí)施方式還可以為,提取所述文本重組序列中的字母和/或數(shù)字組合序列,并計(jì)算提取出的字母和/或數(shù)字組合序列的最大長度;在所述最大長度大于預(yù)設(shè)閾值時(shí),則確定所述文本信息包含廣告,并將所述文本信息過濾;在所述最大長度小于或等于預(yù)設(shè)閾 值時(shí),則將預(yù)設(shè)廣告庫中的關(guān)鍵詞與所述文本重組序列進(jìn)行匹配;在至少一所述關(guān)鍵詞與所述文本重組序列匹配時(shí),則確定所述文本信息包含廣告,并將所述文本信息過濾。
此外,基于上述豎向文本廣告過濾方法的任一實(shí)施例,上述根據(jù)所述文本重組序列過濾廣告的實(shí)施方式還可以與現(xiàn)有技術(shù)中的橫向豎向文本廣告過濾方法相結(jié)合。
方式二,如圖9所示,步驟S40包括:
步驟S43,將預(yù)設(shè)廣告庫中的關(guān)鍵詞與所述第二文本序列進(jìn)行匹配;
步驟S44,在至少一所述關(guān)鍵詞與所述第二文本序列匹配時(shí),則確定所述文本信息包含廣告,并將所述文本信息過濾。
在本實(shí)施例中,若預(yù)設(shè)廣告庫中的某一關(guān)鍵詞與第二文本序列中的部分連續(xù)字符或所有連續(xù)字符一致,則認(rèn)為預(yù)設(shè)廣告庫中的關(guān)鍵詞與第二文本序列匹配。本實(shí)施例提供的豎向文本廣告過濾方法,能夠準(zhǔn)確的識別出豎向廣告。
方式三,如圖10所示,步驟S40包括:
步驟S45,提取所述第二文本序列中的字母和/或數(shù)字組合序列,并計(jì)算提取出的字母和/或數(shù)字組合序列的最大長度;
步驟S46,在所述最大長度大于預(yù)設(shè)閾值時(shí),則確定所述文本信息包含廣告,并將所述文本信息過濾;
其中,在提取所述第二文本序列中的字母和/或數(shù)字組合序列時(shí),按照所述第二文本序列的順序,在相鄰兩第二文本序列中,若前一所述第二文本序列的尾端為字母和/或數(shù)字組合序列、且后一所述第二文本序列的首端為字母和/或數(shù)字組合序列,則將所述第二文本序列尾端的字母和/或數(shù)字組合序列和所述第二文本序列首端的字母和/或數(shù)字組合序列拼接形成一所述字母和/或數(shù)字組合序列。
在本實(shí)施例中,字母和/或數(shù)字組合序列可以只包含字母,也可以只包含數(shù)字,也可以同時(shí)包含字母和數(shù)字。
以上述生成的第二文本序列為例,按照提取位置的順序,第二文本序列 依次為“買時(shí)尚睡衣”、“加微信35”、“7mai”。對于第二個(gè)第二文本序列,其字母和/或數(shù)字組合序列為“35”,且位于其尾端;對于第三個(gè)第二文本序列來說,其與第二個(gè)第二文本序列相鄰,且位于其后面,且其字母和/或數(shù)字組合序列為“7mai”,且位于其首端,因此拼接形成一個(gè)字母和/或數(shù)字組合序列“357mai”,其長度為6。
本實(shí)施例中提供的豎向文本廣告過濾方法,僅通過字母數(shù)字組合的方式進(jìn)行廣告的判斷與過濾,使得豎向文本廣告過濾方法更加高效率。
對應(yīng)地,提出本發(fā)明豎向文本廣告過濾裝置的較佳實(shí)施例。參考圖11,所述豎向文本廣告過濾裝置包括:獲取模塊10、分組模塊20、提取模塊30、過濾模塊40,其中,
獲取模塊10,用于獲取文本信息;
在本實(shí)施例中,可以獲取當(dāng)前瀏覽的網(wǎng)頁中的文本信息,例如一些論壇網(wǎng)站(如QQ瀏覽器的話題圈評論系統(tǒng)、天涯論壇、百度貼吧等);或者當(dāng)前開啟的軟件所顯示的文本信息(如QQ群聊、微信群聊);或者當(dāng)前開啟的應(yīng)用軟件中自動(dòng)彈出的浮窗中的信息(如游戲軟件中的浮窗等)。
可選的,可以只獲取預(yù)設(shè)頁面中的文本信息。即用戶可以對需要進(jìn)行廣告過濾的頁面進(jìn)行預(yù)設(shè)。
預(yù)設(shè)頁面可以包括基于瀏覽器瀏覽的頁面、預(yù)設(shè)應(yīng)用軟件顯示的界面和/或預(yù)設(shè)應(yīng)用軟件對應(yīng)的預(yù)設(shè)界面。
可選的,可以預(yù)設(shè)網(wǎng)址,在瀏覽器當(dāng)前瀏覽的頁面地址為預(yù)設(shè)網(wǎng)址時(shí),則獲取文本信息。即,只對預(yù)設(shè)網(wǎng)址對應(yīng)的網(wǎng)頁進(jìn)行廣告過濾。
上述預(yù)設(shè)應(yīng)用軟件對應(yīng)的預(yù)設(shè)界面例如可以為QQ軟件對應(yīng)的群聊界面,或者微信軟件對應(yīng)的群聊界面。
可選的,在獲取文本信息時(shí),可以根據(jù)空行獲取文本信息。可以預(yù)設(shè)空行的數(shù)量,可以為一行、兩行或多行,在文本信息之間的空行數(shù)量大于或等于預(yù)設(shè)數(shù)量時(shí),則以空行為分界將文本信息劃分為兩段文本信息。如圖4所示,圖4為頁面中顯示的文本信息的示意圖,位于上方的文本信息與位于下方的文本信息之間具有三個(gè)空行,若預(yù)設(shè)空行數(shù)量為一行,則系統(tǒng)將以空行為分界將圖4所述的文本信息劃分為兩段文本信息,因此在獲取文本信息時(shí), 將會(huì)獲取兩段相互獨(dú)立的文本信息,第一段文本信息為“嶺南文化是悠久燦爛的中華文化的有機(jī)組成部分。嶺南先民遺址的出土材料證明,嶺南文化為原生性文化?!?;第二段文本信息為“買加7時(shí)微m尚信a睡3i衣5”。在本實(shí)施例后續(xù)的處理步驟中,每段文本信息將會(huì)分別單獨(dú)處理。
分組模塊20,用于將所述文本信息按照行進(jìn)行分組,依次生成若干第一文本序列;
在本實(shí)施例中,可以按照換行符“\n”對文本信息進(jìn)行分組??梢杂缮现料乱来伟凑招猩傻谝晃谋拘蛄校部梢杂上轮辽弦来伟凑招猩傻谝晃谋拘蛄?。本實(shí)施例中以由上至下依次生成第一文本序列為例進(jìn)行說明。
如圖4所示的文本信息中,對于第一段文本信息,可分為5組第一文本序列,第一組為“嶺南文化是悠久燦爛的”,第二組為“中華文化的有機(jī)組成部”,第三組為“分。嶺南先民遺址的出”,第四組為“土材料證明,嶺南文化”,第五組為“為原生性文化?!?。對于第二段文本信息,可分為5組第一文本序列,第一組為“買加7”,第二組為“時(shí)微m”,第三組為“尚信a”,第四組為“睡3i”,第五組為“衣5”。
提取模塊30,按照順序依次提取各個(gè)所述第一文本序列對應(yīng)位置的字符,依次生成若干第二文本序列;
在本實(shí)施例中,每一對應(yīng)位置生成一第二文本序列。在提取各個(gè)第一文本序列的某一對應(yīng)位置的字符時(shí),可以按照文本行由上至下的順序依次提取,也可以按照文本行由下至上的順序依次提取。本實(shí)施例以按照文本行由上至下的順序依次提取為例進(jìn)行說明,例如,若對應(yīng)位置為第一文本序列的第一個(gè)位置,則可以依次提取第一組第一文本序列、第二組第一文本序列、第三組第一文本序列、第四組第一文本序列和第五組第一文本序列的第一個(gè)字符。以上述第二段文本信息為例,則提取出的第一個(gè)位置的第二文本序列為“買時(shí)尚睡衣”。同理,提取出的第二個(gè)位置的第二文本序列為“加微信35”,提取出的第三個(gè)位置的第二文本序列為“7mai”。
對于每一第二文本序列來說,在從第一文本序列中提取字符時(shí),各個(gè)第一文本序列的對應(yīng)位置可以為相同位置,即同一第二文本序列中的字符在各個(gè)文本行中的位置相同,例如,對于上述第二文本序列“買時(shí)尚睡衣”來說,該第二文本序列中的各個(gè)字符在各個(gè)第一文本序列中的位置均為第一個(gè)字 符,對于上述第二文本序列“加微信35”來說,該第二文本序列中的各個(gè)字符在各個(gè)第一文本序列中的位置均為第二個(gè)字符,對于上述第二文本序列“7mai”來說,該第二文本序列中的各個(gè)字符在各個(gè)第一文本序列中的位置均為第三個(gè)字符。
或者同一第二文本序列中的字符在各個(gè)第一文本序列中的位置呈規(guī)則變化。例如,可以依次提取第一組第一文本序列中的第一個(gè)位置的字符、第二組第一文本序列中的第二個(gè)位置的字符、第三組第一文本序列中的第三個(gè)位置的字符、第四組第一文本序列中的第四個(gè)位置的字符和第五組第一文本序列中的第五個(gè)位置的字符,并將提取出的這五個(gè)字符作為第一個(gè)第二文本序列。同理,可以依次提取第一組第一文本序列中的第二個(gè)位置的字符、第二組第一文本序列中的第三個(gè)位置的字符、第三組第一文本序列中的第四個(gè)位置的字符、第四組第一文本序列中的第五個(gè)位置的字符和第五組第一文本序列中的第六個(gè)位置的字符,并將提取出的這五個(gè)字符作為第二個(gè)第二文本序列。對于上述第一段文本信息來說,第一個(gè)第二文本序列為“嶺華嶺證文”,第二個(gè)第二文本序列為“南文南明化”。
由于某些豎向廣告可能包含若干特殊字符,比如空格等,從而使得廣告并不是完全豎向顯示,而且斜豎向顯示,為了使得廣告明顯,通常廣告文本前會(huì)增加一些特殊字符??蛇x的,所述提取模塊還用于在生成第二文本序列之前,先剔除各個(gè)所述第一文本序列中的預(yù)設(shè)字符。預(yù)設(shè)字符可以為空格、“*”、“-”以及其他字符等,在此不作限定。
過濾模塊40,用于根據(jù)所述第二文本序列過濾廣告。
在本實(shí)施例中,可以設(shè)置一包含若干關(guān)鍵詞的預(yù)設(shè)廣告庫,然后查找第二文本序列中是否有關(guān)鍵詞,含有預(yù)設(shè)廣告庫中的關(guān)鍵詞時(shí)則認(rèn)為其含有廣告,則將獲取的文本信息過濾。還可以確定第二文本序列中的字母和/或數(shù)字組合序列的長度,在確定的長度達(dá)到預(yù)設(shè)長度閾值時(shí),則認(rèn)為包含廣告,則將獲取的文本信息過濾。
本發(fā)明提供的豎向文本廣告過濾裝置,通過獲取文本信息,先將所述文本信息按照行進(jìn)行分組,依次生成若干第一文本序列,然后再按照順序依次提取各個(gè)所述第一文本序列對應(yīng)位置的字符,依次生成若干第二文本序列,并按照順序依次將各個(gè)所述第二文本序列重組,生成文本重組序列,最后根 據(jù)所述文本重組序列過濾廣告。由于本發(fā)明通過依次提取第一文本序列對應(yīng)位置的字符而生成第二文本序列,并對第二文本序列按照順序進(jìn)行重組,因此能夠有效地識別豎向文本信息,從而達(dá)到過濾掉豎向廣告的目的。
以下提出幾種過濾模塊40的實(shí)施方式:
方式一,如圖12所示,過濾模塊40包括:
重組單元41,用于按照順序依次將各個(gè)所述第二文本序列重組,生成文本重組序列;
對于上述第二段文本信息來說,第一個(gè)第二文本序列為“買時(shí)尚睡衣”,第二個(gè)第二文本序列為“加微信35”,第三個(gè)第二文本序列為“7mai”。因此,按照第二文本序列的順序,生成的文本重組序列為“買時(shí)尚睡衣加微信357mai”。
第一過濾單元42,用于根據(jù)所述文本重組序列過濾廣告。
在本實(shí)施例中,可以對文本重組序列進(jìn)行語義分析,以辨別其是否為廣告。或者還可以將文本重組序列與預(yù)設(shè)的廣告庫進(jìn)行匹配,在匹配時(shí),則認(rèn)為該文本重組序列對應(yīng)的文本信息為廣告。在確定文本重組序列包含廣告時(shí),則將該文本重組序列對應(yīng)的文本信息過濾。過濾的方式可以為屏蔽、模糊、或亂碼的形式等,具體可以根據(jù)實(shí)際需要進(jìn)行設(shè)置。
例如,上述生成的文本重組序列為“買時(shí)尚睡衣加微信357mai”,根據(jù)語義分析結(jié)果確定其為廣告,或者通過判定確定其與預(yù)設(shè)的廣告庫匹配,從而確定其為廣告。因此將上述第一段文本信息過濾。
以下提出幾種第一過濾單元42的方案。
方案一,如圖13所示,第一過濾單元42包括:
匹配子單元421,用于將預(yù)設(shè)廣告庫中的關(guān)鍵詞與所述文本重組序列進(jìn)行匹配;
第一過濾子單元422,用于在至少一所述關(guān)鍵詞與所述文本重組序列匹配時(shí),則確定所述文本信息包含廣告,并將所述文本信息過濾。
在本實(shí)施例中,若預(yù)設(shè)廣告庫中的某一關(guān)鍵詞與文本重組序列中的部分連續(xù)字符或所有連續(xù)字符一致,則認(rèn)為預(yù)設(shè)廣告庫中的關(guān)鍵詞與文本重組序列匹配。本實(shí)施例提供的豎向文本廣告過濾方法,能夠準(zhǔn)確的識別出豎向廣 告。
方案二,為了進(jìn)一步提高豎向廣告過濾的準(zhǔn)確性,如圖14所示,第一過濾單元42包括:
匹配子單元421,用于將預(yù)設(shè)廣告庫中的關(guān)鍵詞與所述文本重組序列進(jìn)行匹配;
計(jì)算子單元423,用于提取所述文本重組序列中的字母和/或數(shù)字組合序列,并計(jì)算提取出的字母和/或數(shù)字組合序列的最大長度;
上述字母和/或數(shù)字組合序列可以只包含字母,也可以只包含數(shù)字,也可以同時(shí)包含字母和數(shù)字。在提取字母和/或數(shù)字組合序列時(shí),該字母和/或數(shù)字組合序列中的各個(gè)字母和/或數(shù)字在上述文本重組序列中為連續(xù)的。每一文本重組序列可能包含多個(gè)字母和/或數(shù)字組合序列,只需在各個(gè)字母和/或數(shù)字組合序列中確定最大長度的序列即可。
第二過濾子單元424,用于在至少一所述關(guān)鍵詞與所述文本重組序列匹配,且所述最大長度大于預(yù)設(shè)閾值時(shí),則確定所述文本信息包含廣告,并將所述文本信息過濾。
由于一般在做廣告宣傳時(shí),尤其對于一些不良廣告內(nèi)容,通常會(huì)留有QQ號碼、電話號碼、微信號等,因此通過對字母和數(shù)字進(jìn)行檢測,可以快速有效地過濾掉廣告。預(yù)設(shè)閾值可以根據(jù)實(shí)際需要進(jìn)行設(shè)置,在本實(shí)施例中,預(yù)設(shè)閾值可以取6。
本實(shí)施例中提供的豎向文本廣告過濾裝置,通過將語義分析與字母數(shù)字組合相結(jié)合的方式進(jìn)行廣告的判斷與過濾,準(zhǔn)確性較高。
方案三,為了進(jìn)一步提高豎向廣告過濾的準(zhǔn)確性,如圖15所示,第一過濾單元42包括:
計(jì)算子單元423,用于提取所述文本重組序列中的字母和/或數(shù)字組合序列,并計(jì)算提取出的字母和/或數(shù)字組合序列的最大長度;
在本實(shí)施例中,字母和/或數(shù)字組合序列可以只包含字母,也可以只包含數(shù)字,也可以同時(shí)包含字母和數(shù)字。在提取字母和/或數(shù)字組合序列時(shí),該字母和/或數(shù)字組合序列中的各個(gè)字母和/或數(shù)字在上述文本重組序列中為連續(xù)的。每一文本重組序列可能包含多個(gè)字母和/或數(shù)字組合序列,只需在各個(gè)字母和/或數(shù)字組合序列中確定最大長度的序列即可。
第三過濾子單元425,用于在所述最大長度大于預(yù)設(shè)閾值時(shí),則確定所述文本信息包含廣告,并將所述文本信息過濾。
由于一般在做廣告宣傳時(shí),尤其對于一些不良廣告內(nèi)容,通常會(huì)留有QQ號碼、電話號碼、微信號等,因此通過對字母和數(shù)字進(jìn)行檢測,可以快速有效地過濾掉廣告。預(yù)設(shè)閾值可以根據(jù)實(shí)際需要進(jìn)行設(shè)置,在本實(shí)施例中,預(yù)設(shè)閾值可以取6。
本實(shí)施例中提供的豎向文本廣告過濾裝置,僅通過字母數(shù)字組合的方式進(jìn)行廣告的判斷與過濾,使得豎向文本廣告過濾方法更加高效率。
此外,上述第一過濾單元42的實(shí)施方式還可以為,第一過濾單元42還用于提取所述文本重組序列中的字母和/或數(shù)字組合序列,并計(jì)算提取出的字母和/或數(shù)字組合序列的最大長度;在所述最大長度大于預(yù)設(shè)閾值時(shí),則確定所述文本信息包含廣告,并將所述文本信息過濾;在所述最大長度小于或等于預(yù)設(shè)閾值時(shí),則將預(yù)設(shè)廣告庫中的關(guān)鍵詞與所述文本重組序列進(jìn)行匹配;在至少一所述關(guān)鍵詞與所述文本重組序列匹配時(shí),則確定所述文本信息包含廣告,并將所述文本信息過濾。
此外,基于上述豎向文本廣告過濾裝置的任一實(shí)施例,上述第一過濾單元42的實(shí)施方式還可以與現(xiàn)有技術(shù)中的橫向豎向文本廣告過濾方法相結(jié)合,即上述第一過濾單元42還可以同時(shí)用于進(jìn)行橫向廣告過濾。
方式二,如圖16所示,過濾模塊40包括:
匹配單元43,用于將預(yù)設(shè)廣告庫中的關(guān)鍵詞與所述第二文本序列進(jìn)行匹配;
第二過濾單元44,用于在至少一所述關(guān)鍵詞與所述第二文本序列匹配時(shí),則確定所述文本信息包含廣告,并將所述文本信息過濾。
在本實(shí)施例中,若預(yù)設(shè)廣告庫中的某一關(guān)鍵詞與第二文本序列中的部分連續(xù)字符或所有連續(xù)字符一致,則認(rèn)為預(yù)設(shè)廣告庫中的關(guān)鍵詞與第二文本序列匹配。本實(shí)施例提供的豎向文本廣告過濾方法,能夠準(zhǔn)確的識別出豎向廣告。
方式三,如圖17所示,過濾模塊40包括:
計(jì)算單元45,用于提取所述第二文本序列中的字母和/或數(shù)字組合序列,并計(jì)算提取出的字母和/或數(shù)字組合序列的最大長度;
第三過濾單元46,用于在所述最大長度大于預(yù)設(shè)閾值時(shí),則確定所述文本信息包含廣告,并將所述文本信息過濾;
其中,在提取所述第二文本序列中的字母和/或數(shù)字組合序列時(shí),按照所述第二文本序列的順序,在相鄰兩第二文本序列中,若前一所述第二文本序列的尾端為字母和/或數(shù)字組合序列、且后一所述第二文本序列的首端為字母和/或數(shù)字組合序列,則將所述第二文本序列尾端的字母和/或數(shù)字組合序列和所述第二文本序列首端的字母和/或數(shù)字組合序列拼接形成一所述字母和/或數(shù)字組合序列。
在本實(shí)施例中,字母和/或數(shù)字組合序列可以只包含字母,也可以只包含數(shù)字,也可以同時(shí)包含字母和數(shù)字。
以上述生成的第二文本序列為例,按照提取位置的順序,第二文本序列依次為“買時(shí)尚睡衣”、“加微信35”、“7mai”。對于第二個(gè)第二文本序列,其字母和/或數(shù)字組合序列為“35”,且位于其尾端;對于第三個(gè)第二文本序列來說,其與第二個(gè)第二文本序列相鄰,且位于其后面,且其字母和/或數(shù)字組合序列為“7mai”,且位于其首端,因此拼接形成一個(gè)字母和/或數(shù)字組合序列“357mai”,其長度為6。
本實(shí)施例中提供的豎向文本廣告過濾方法,僅通過字母數(shù)字組合的方式進(jìn)行廣告的判斷與過濾,使得豎向文本廣告過濾方法更加高效率。
需要說明的是,在本文中,術(shù)語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者裝置不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者裝置所固有的要素。在沒有更多限制的情況下,由語句“包括一個(gè)……”限定的要素,并不排除在包括該要素的過程、方法、物品或者裝置中還存在另外的相同要素。
上述本發(fā)明實(shí)施例序號僅僅為了描述,不代表實(shí)施例的優(yōu)劣。
通過以上的實(shí)施方式的描述,本領(lǐng)域的技術(shù)人員可以清楚地了解到上述實(shí)施例方法可借助軟件加必需的通用硬件平臺的方式來實(shí)現(xiàn),當(dāng)然也可以通 過硬件,但很多情況下前者是更佳的實(shí)施方式?;谶@樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻(xiàn)的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計(jì)算機(jī)軟件產(chǎn)品存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)(如ROM/RAM、磁碟、光盤)中,包括若干指令用以使得一臺終端設(shè)備(可以是手機(jī),計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個(gè)實(shí)施例所述的方法。