欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種關鍵詞查找的樹結構及實現(xiàn)方法

文檔序號:10655238閱讀:230來源:國知局
一種關鍵詞查找的樹結構及實現(xiàn)方法
【專利摘要】一種關鍵詞查找的樹結構及實現(xiàn)方法,涉及互聯(lián)網(wǎng)網(wǎng)絡領域,包括建立過程,將所有關鍵詞建成所述樹結構;查找過程,獲取文章的第一個字作為當前字,判斷根節(jié)點的下一級,是否有包含當前字的子節(jié)點,若否,結束;若是,將當前字加入已存在關鍵詞后面;在所述子節(jié)點沒有結束標識的情況下,去掉文章的當前字,剩余的文章為子文章,子文章的第一個字作為新的當前字,判斷所述子節(jié)點的下一級,是否有包含新的當前字的子節(jié)點,若否,結束;若是,將新的當前字繼續(xù)加入到已存在關鍵詞后面,再次同理判斷,直至找到子節(jié)點的結束標識,返回已存在關鍵詞;并將文章所有的字查找完畢。本發(fā)明節(jié)約關鍵詞的查找時間,提高關鍵詞查找效率。
【專利說明】
一種關鍵詞查找的樹結構及實現(xiàn)方法
技術領域
[0001]本發(fā)明涉及互聯(lián)網(wǎng)領域,具體來講涉及一種關鍵詞查找的樹結構及實現(xiàn)方法?!颈尘凹夹g】
[0002]在互聯(lián)網(wǎng)網(wǎng)絡領域中,需要經(jīng)常對用戶發(fā)布的內容(以下簡稱文章)進行審核。審核的方式通常為:將通常需要審核的關鍵性詞匯生成一個關鍵詞列表,借助關鍵詞列表,每次選取關鍵詞列表中的一個關鍵詞,然后查找該關鍵詞是否在文章中出現(xiàn),直至整個關鍵詞列表中的每個關鍵詞否在文章中查找完畢。
[0003]但是現(xiàn)有技術中,通常一個關鍵詞列表中含有大量的關鍵詞,而一篇文章中,并不可能包含關鍵詞列表中所有的關鍵詞。如果將關鍵詞列表中的每個關鍵詞都在文章中查找一遍,那么有多少個關鍵詞,就要查找多少遍文章,關鍵詞查找浪費的時間較長,導致關鍵詞查找的效率低。
【發(fā)明內容】

[0004]針對現(xiàn)有技術中存在的缺陷,本發(fā)明的目的在于提供一種關鍵詞查找的樹結構及實現(xiàn)方法,節(jié)約關鍵詞的查找時間,提高關鍵詞查找效率。
[0005]為達到以上目的,本發(fā)明采取一種關鍵詞查找的樹結構,包括一個根節(jié)點和多級子節(jié)點,每級子節(jié)點有多個,每個子節(jié)點都為關鍵詞中的一個字,且每個關鍵詞中,后一個字位于前一個字的下一級子節(jié)點,每個關鍵詞的最后一個字所在的子節(jié)點,具有一個表示結束的結束標識。
[0006]本發(fā)明還提供一種關鍵詞查找實現(xiàn)方法,包括:建立過程,根據(jù)關鍵詞列表,將所有關鍵詞建成所述樹結構;查找過程,初始化一個空字符串作為已存在關鍵詞,獲取文章的第一個字作為當前字,根據(jù)所述樹結構,判斷根節(jié)點的下一級,是否有包含當前字的子節(jié)點,若否,結束;若是,將當前字加入已存在關鍵詞后面;在所述子節(jié)點沒有結束標識的情況下,去掉文章的當前字,剩余的文章為子文章,子文章的第一個字作為新的當前字,判斷所述子節(jié)點的下一級,是否有包含新的當前字的子節(jié)點,若否,結束;若是,將新的當前字繼續(xù)加入到已存在關鍵詞后面,再次同理判斷,直至找到子節(jié)點的結束標識,返回已存在關鍵詞;并將文章所有的字查找完畢。
[0007]在上述技術方案的基礎上,所有關鍵詞建成的樹結構稱為全局樹,關鍵詞中的每一個字都是其根節(jié)點的一個子節(jié)點,且第一個字是根節(jié)點的下一級子節(jié)點。
[0008]在上述技術方案的基礎上,建立過程中,在關鍵詞列表中含有關鍵詞的時候,取出一個關鍵詞作為當前關鍵詞,并將當前關鍵詞從關鍵詞列表中刪除。[〇〇〇9]在上述技術方案的基礎上,建立過程中,取出當前關鍵詞的第一個字作為當前字, 判斷根節(jié)點的下一級,是否有包含當前字的子節(jié)點,若否,將當前字作為一個子節(jié)點插入根節(jié)點,若是,將去除第一個字的關鍵詞作為新的當前關鍵詞,取第一個字作為新的當前字, 將所述子節(jié)點和下級節(jié)點作為新的樹,同理循環(huán)處理。
[0010]在上述技術方案的基礎上,當去除當前字后,關鍵詞為空時,則給當前字所在的子節(jié)點設置一個結束標識。[〇〇11]在上述技術方案的基礎上,初始化一個空字符串作為已存在關鍵詞之后,判斷當前文章是否為空,若是,結束;若否,將建成的樹結構作為當前樹,進行當前文章中第一個字的判斷。
[0012]在上述技術方案的基礎上,將當前字加入已存在關鍵詞后面之后,進一步判斷當前子節(jié)點是否設置有結束標識,若是,查找成功,結束;若否,將當前子節(jié)點和下級節(jié)點作為當前子樹,將去掉第一字的剩余文章為當前子文章,進行內部查找。
[0013]在上述技術方案的基礎上,進行內部查找時,將當前子文章的第一個字作為新的當前字,進行下一級子節(jié)點的判斷,若下一級子節(jié)點含有新的當前字,則繼續(xù)添加到已存在關鍵詞后面,并且將下一級子節(jié)點再次當成新的子節(jié)點,將新的子節(jié)點和下級子節(jié)點作為新的當前子樹,進一步循環(huán)。
[0014]在上述技術方案的基礎上,內部查找中,當查找到的子節(jié)點設置有結束標識,視為查找成功,返回已存在關鍵詞,結束。
[0015]本發(fā)明的有益效果在于:對于文章中的每個字,依次在樹結構中進行查找,當樹結構中第一級子節(jié)點中的字,與文章中的字不符合,則表示所有關鍵詞中都沒有這個字,查找文章中的下一個字;當?shù)谝患壸庸?jié)點含有該字,再去查找下文章中一個字是存在于下一級子節(jié)點中,直至找到的子節(jié)點含有結束標識,表明一個關鍵詞查找完畢。本方法可以高效的查找出文章中是否含有關鍵詞,節(jié)約關鍵詞的查找時間,提高關鍵詞查找效率?!靖綀D說明】
[0016]圖1為本發(fā)明實施例樹結構的示意圖;
[0017]圖2為本發(fā)明樹結構的建立過程流程圖;
[0018]圖3為本發(fā)明查找過程的流程圖?!揪唧w實施方式】
[0019]以下結合附圖及實施例對本發(fā)明作進一步詳細說明。
[0020]本發(fā)明關鍵詞查找的樹結構,包括一個根節(jié)點和多級子節(jié)點,每級子節(jié)點有多個。 每個子節(jié)點都為關鍵詞中的一個字,且每個關鍵詞中,第一個字是根節(jié)點的下一級子節(jié)點, 后一個字位于前一個字的下一級子節(jié)點;每個關鍵詞的最后一個字所在的子節(jié)點,都具有一個結束標識,用來表示這個關鍵詞的結束。
[0021]如圖1所示,為樹結構的一個實施例。假定關鍵詞列表中包括專利、互聯(lián)網(wǎng)、互聯(lián)網(wǎng)系統(tǒng)、關鍵詞、非關鍵詞和無關緊要這些關鍵詞。根節(jié)點下面的包括多級子節(jié)點,第一級子節(jié)點中的字分別為每個關鍵詞的第一個字,如:專、互、關、非和無。然后每個第一級子節(jié)點的下一級子節(jié)點中,分別是關鍵詞中的第二個字,如:利、聯(lián)、鍵、關和關。又由于關鍵詞“專利”只有兩個字,因此“利”字所在的子節(jié)點,帶有一個結束標識,即“完”。然后其余關鍵詞中的第三個字再設置于第三級子節(jié)點,以此類推,直至所有關鍵詞中的字都設置在一個子節(jié)點中。
[0022]如圖2所示,本發(fā)明樹結構的建立過程,樹結構是根據(jù)關鍵詞列表中所有關鍵詞建立的,還稱為全局樹,具體包括如下步驟:
[0023]A101.判斷關鍵詞列表是否為空,若是,結束;若否,進入A102。
[0024]A102.從關鍵詞列表中取出一個關鍵詞作為當前關鍵詞,并將此當前關鍵詞從關鍵詞列表中刪除。[〇〇25]A103 ?將全局樹作為當前樹。
[0026]A104.從當前關鍵詞取出第一個字,作為當前字。
[0027]A105.判斷根節(jié)點的下一級節(jié)點中,是否有包含當前字的子節(jié)點,若是,進入A106; 若否,進入A107。[〇〇28]A106.將當前字作為一個子節(jié)點,插入到當前樹的根節(jié)點。
[0029]A107.去除當前關鍵詞的第一個字,判斷去除第一個字后的當前關鍵詞是否為空, 若是,進入A108;若否,進入A109。
[0030]A108.給當前子節(jié)點(S卩A105、A106中的子節(jié)點)設置一個結束標記。[〇〇31]A109.將去除第一個字的當前關鍵詞,作為新的當前關鍵詞,將所述子節(jié)點和下級節(jié)點作為新的樹,跳轉到A104。
[0032]如圖3所示,本發(fā)明基于上述樹結構的關鍵詞查找方法,具體查找過程包括如下步驟:[〇〇33]B101.獲取待查找文章作為當前文章,初始化一個空字符串作為已存在關鍵詞。[〇〇34]B102.判斷當前文章是否為空,若是,進入B117;若否,進入B103。[〇〇35]B103.將全局樹和作為當前樹。
[0036]B104.獲取當前文章的第一個字作為當前字。
[0037]B105.根據(jù)當前樹,判斷根節(jié)點的下一級子節(jié)點中,是否有包含當前字的子節(jié)點, 若是,進入B106;若否,進入B116。[〇〇38]B106.將當前字追加到已存在關鍵詞后面。[〇〇39]B107.判斷當前的子節(jié)點是否有結束標記,若是,進入B115;若否,進入B108。[〇〇4〇] B108.將當前子節(jié)點和下級節(jié)點作為當前子樹,將文章去掉第一個字,將去掉第一字的剩余文章為當前子文章,進入B109。[〇〇411B109.判斷當前子文章是否為空,若是,進入B117;若否,進入B110。
[0042]B110.獲取當前字文章的第一個字作為新的當前字。
[0043]Bill.判斷當前子樹的下一級子節(jié)點中,是否有包含新的當前字的子節(jié)點,若否, 進入B117;若是,進入B112。
[0044]B112.將新的當前字繼續(xù)追加到已存在關鍵詞的后面。
[0045]B113.判斷包含新當前字的子節(jié)點中,是否有結束標識,若是,進入B115;若否,進入B114〇
[0046]B114.將包含新當前字的子節(jié)點作為當前子節(jié)點,以及下級子節(jié)點作為當前子樹, 當前子文章去掉第一個字作為新的當前子文章,轉入B109。[〇〇47] B115.查找成功,返回已存在關鍵詞,結束。[〇〇48] B116.將當前文章去除第一個字,作為新的當前文章,轉到B102。
[0049]B117.查找失敗,結束。
[0050] 上述查找過程中,涉及到兩個查找的過程,一個是基于全局樹查找的過程,一個是在此基礎上,在內部循環(huán)進行查找的內部查找過程,內部查找包括B109至B114;是在各級子節(jié)點中進行的查找。[0051 ]下面以圖1中的樹結構為例,以“這是一篇專利的草稿文章”作為待查詢文章,進一步說明查找過程。[〇〇52]首先獲取“這是一篇專利的草稿文章”,作為當前文章,初始化一個空字符串作為已存在關鍵詞。[〇〇53]由于當前文章不為空,將全局樹作為當前樹,獲取當前文章的第一個字“這”。[〇〇54]根節(jié)點下一級子節(jié)點不包含“這”字,去掉“這”字,將“是一篇專利的草稿文章”作為新的當前文章,重新進行查找。
[0055]同理,依次去掉“是”、“一”、“篇”這幾個字,直至剩下“專利的草稿文章”。此時,根節(jié)點下一級子節(jié)點包含“?!弊?,將“?!弊旨尤胍汛嬖陉P鍵詞后面。
[0056]然后判斷“?!弊炙谧庸?jié)點不包含結束標識,將該子節(jié)點及下級子節(jié)點(含有 “利”字的子節(jié)點)作為當前子樹,以“利的草稿文章”作為當前子文章進一步查找。[〇〇57]獲取第一個字“利”,當前子樹的子節(jié)點包含“利”字,將“利”繼續(xù)追加到已存在關鍵詞后面(即,繼續(xù)加在“?!钡暮竺?,已存在關鍵詞后面增加兩個字“專利”。并且,含有 “利”字的子節(jié)點設置有結束標識,返回最原始的已存在關鍵詞(也就是空字符串),結束。
[0058]最后,按照上述內容,依次查找后面剩余的字,直至文章結束。
[0059]本發(fā)明不局限于上述實施方式,對于本技術領域的普通技術人員來說,在不脫離本發(fā)明原理的前提下,還可以做出若干改進和潤飾,這些改進和潤飾也視為本發(fā)明的保護范圍之內。本說明書中未作詳細描述的內容屬于本領域專業(yè)技術人員公知的現(xiàn)有技術。
【主權項】
1.一種關鍵詞查找的樹結構,其特征在于:包括一個根節(jié)點和多級子節(jié)點,每級子節(jié)點 有多個,每個子節(jié)點都為關鍵詞中的一個字,且每個關鍵詞中,后一個字位于前一個字的下 一級子節(jié)點,每個關鍵詞的最后一個字所在的子節(jié)點,具有一個表示結束的結束標識。2.—種基于權利要求1所述樹結構的關鍵詞查找實現(xiàn)方法,其特征在于,包括:建立過程,根據(jù)關鍵詞列表,將所有關鍵詞建成所述樹結構;查找過程,初始化一個空字符串作為已存在關鍵詞,獲取文章的第一個字作為當前字, 根據(jù)所述樹結構,判斷根節(jié)點的下一級,是否有包含當前字的子節(jié)點,若否,結束;若是,將 當前字加入已存在關鍵詞后面;在所述子節(jié)點沒有結束標識的情況下,去掉文章的當前字, 剩余的文章為子文章,子文章的第一個字作為新的當前字,判斷所述子節(jié)點的下一級,是否 有包含新的當前字的子節(jié)點,若否,結束;若是,將新的當前字繼續(xù)加入到已存在關鍵詞后 面,再次同理判斷,直至找到子節(jié)點的結束標識,返回已存在關鍵詞;并將文章所有的字查 找完畢。3.如權利要求2所述的關鍵詞查找的實現(xiàn)方法,其特征在于:所有關鍵詞建成的樹結構 稱為全局樹,關鍵詞中的每一個字都是其根節(jié)點的一個子節(jié)點,且第一個字是根節(jié)點的下 一級子節(jié)點。4.如權利要求2所述的關鍵詞查找的實現(xiàn)方法,其特征在于:建立過程中,在關鍵詞列 表中含有關鍵詞的時候,取出一個關鍵詞作為當前關鍵詞,并將當前關鍵詞從關鍵詞列表 中刪除。5.如權利要求4所述的關鍵詞查找的實現(xiàn)方法,其特征在于:建立過程中,取出當前關 鍵詞的第一個字作為當前字,判斷根節(jié)點的下一級,是否有包含當前字的子節(jié)點,若否,將 當前字作為一個子節(jié)點插入根節(jié)點,若是,將去除第一個字的關鍵詞作為新的當前關鍵詞, 取第一個字作為新的當前字,將所述子節(jié)點和下級節(jié)點作為新的樹,同理循環(huán)處理。6.如權利要求5所述的關鍵詞查找的實現(xiàn)方法,其特征在于:當去除當前字后,關鍵詞 為空時,則給當前字所在的子節(jié)點設置一個結束標識。7.如權利要求2所述的關鍵詞查找的實現(xiàn)方法,其特征在于:初始化一個空字符串作為 已存在關鍵詞之后,判斷當前文章是否為空,若是,結束;若否,將建成的樹結構作為當前 樹,進行當前文章中第一個字的判斷。8.如權利要求7所述的關鍵詞查找的實現(xiàn)方法,其特征在于:將當前字加入已存在關鍵 詞后面之后,進一步判斷當前子節(jié)點是否設置有結束標識,若是,查找成功,結束;若否,將 當前子節(jié)點和下級節(jié)點作為當前子樹,將去掉第一字的剩余文章為當前子文章,進行內部 查找。9.如權利要求8所述的關鍵詞查找的實現(xiàn)方法,其特征在于:進行內部查找時,將當前 子文章的第一個字作為新的當前字,進行下一級子節(jié)點的判斷,若下一級子節(jié)點含有新的 當前字,則繼續(xù)添加到已存在關鍵詞后面,并且將下一級子節(jié)點再次當成新的子節(jié)點,將新 的子節(jié)點和下級子節(jié)點作為新的當前子樹,進一步循環(huán)。10.如權利要求9所述的關鍵詞查找的實現(xiàn)方法,其特征在于:內部查找中,當查找到的 子節(jié)點設置有結束標識,視為查找成功,返回已存在關鍵詞,結束。
【文檔編號】G06F17/30GK106021397SQ201610315781
【公開日】2016年10月12日
【申請日】2016年5月12日
【發(fā)明人】張利平
【申請人】武漢斗魚網(wǎng)絡科技有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
灯塔市| 彭山县| 霸州市| 黄龙县| 措美县| 日土县| 博客| 南雄市| 姚安县| 泉州市| 留坝县| 濮阳县| 海安县| 南川市| 余姚市| 谷城县| 佛学| 柏乡县| 资源县| 视频| 池州市| 鄱阳县| 自治县| 丽水市| 黄山市| 盈江县| 萝北县| 米脂县| 治多县| 新野县| 金湖县| 年辖:市辖区| 商洛市| 河东区| 固原市| 自治县| 开封市| 长子县| 鹿邑县| 清远市| 邳州市|