專利名稱:基于正則表達式的字符串匹配方法和裝置的制作方法
技術領域:
本發(fā)明涉及數(shù)據(jù)處理領域,特別涉及基于正則表達式的字符串匹配方法和裝置。
背景技術:
正則表達式是一種正規(guī)的描述字符串模式的方法,可以用來進行文本匹配,具體為在給定的字符串中尋找與給定的正則表達式相匹配的部分。正則表達式由普通字符和元字符組成,普通字符包括數(shù)字和大小寫的字母,而元字符是具有特殊的含義的字符,例如, “\s”表示任何空白字符,包括空格、制表符、換頁符等,”表示除換行元字符“\n”以外的任意字符,表示前面的子表達式重復零次或多次。正則表達式可以用來進行文本匹配,具體為在給定的字符串中尋找和匹配正則表達式相匹配的部分。正則表達式廣泛應用在通信行業(yè)中,用于對數(shù)據(jù)流量進行模式匹配檢查,例如進行協(xié)議解析、病毒檢測和業(yè)務分類等。在實際應用中,在進行文本匹配時,需要根據(jù)不同的匹配內(nèi)容編寫不同的字符串匹配結構,設計過程較為繁瑣,而匹配內(nèi)容的格式一旦改變,就需要重新設計字符串匹配結構,造成維護困難。由此,需要自動根據(jù)正則表達式設計進行字符串匹配的方法和裝置
發(fā)明內(nèi)容
本發(fā)明的目的在于提供易于維護基于正則表達式的字符串匹配方法和裝置。本發(fā)明公開了一種基于正則表達式的字符串匹配方法,包括步驟100、解析匹配字符串,根據(jù)預先設定的段模式分隔符以及字符串格式判斷匹配字符串的匹配類型為段模式還是行模式,根據(jù)判斷得到的匹配類型設置匹配類型標識;步驟200、根據(jù)匹配類型標識將匹配字符串按段分割或按行分割為多個子字符串, 對每個子字符串確定正則表達式生成模式,并根據(jù)正則表達式生成模式以不同的連接式連接所述子字符串中以預定詞組標記標識的詞組生成子字符串正則表達式,獲得包含至少一個子字符串正則表達式的正則表達式列表;步驟300、根據(jù)匹配類型標識對待匹配數(shù)據(jù)進行按段分割或按行分割獲得待匹配子字符串,按子字符串正則表達式逐一地對分割得到的待匹配子字符串進行匹配,輸出匹配結果。優(yōu)選地,匹配類型為段模式是指所述匹配字符串的格式以所述預定的段模式分隔符為界進行重復,匹配類型為行模式是指所述匹配字符串格式為不符合段模式的其它模式。優(yōu)選地,所述按段分割是以預定段模式分隔符為界截取子字符串,所述按行分割是以換行符為界截取子字符串。優(yōu)選地,所述正則表達式生成模式包括列模式和非列模式,對于列模式,利用代表至少一個空白字符的連接正則表達式連接詞組生成子字符串正則表達式,對于非列模式, 利用代表至少一個非換行符的任意字符的連接則正表達式生成子字符串正則表達式。
優(yōu)選地,所述步驟100包括步驟101、解析所述匹配字符串;步驟102、判斷所述匹配字符串的格式是否以預定的段模式分隔符為界進行重復, 如果是,所述匹配字符串匹配類型為段模式,執(zhí)行步驟103,如果否,所述匹配字符串匹配類型為行模式,執(zhí)行步驟104;步驟103、設置所述匹配字符串的匹配類型標識為段模式,結束步驟100流程;步驟104、設置所述匹配字符串的匹配類型標識為行模式,結束100流程。優(yōu)選地,所述步驟200包括步驟201、判斷所述匹配字符串的匹配類型標識為段模式還是行模式,如果為段模式,則執(zhí)行步驟202,如果為行模式則執(zhí)行步驟203 ;步驟202、按段模式分隔符將所述匹配字符串分割為多個匹配子字符串,執(zhí)行步驟 204 ;步驟203、按換行符將所述匹配字符串分割為多個子字符串,執(zhí)行步驟204 ;步驟204、取出一個未處理的匹配子字符串,根據(jù)預定的詞組標記提取其中的由詞組標記標識的詞組和詞組間字符;步驟205、根據(jù)詞組間字符判斷所述匹配子字符串的正則表達式生成模式為列模式還是非列模式,如果是列模式,則執(zhí)行步驟206,如果是非列模式,則執(zhí)行步驟207 ;步驟206、將在步驟204中提取的詞組用表示至少一個空白字符的連接正則表達式連接為子字符串正則表達式,執(zhí)行步驟208 ;步驟207、將在步驟204中提取的詞組用表示至少一個非換行符的任意字符的連接正則表達式連接為子字符串正則表達式,執(zhí)行步驟208 ;步驟208、將得到的子字符串正則表達式加入正則表達式列表;步驟209、判斷是否還有未處理的匹配子字符串,如果有,則執(zhí)行步驟204,如果沒有,則執(zhí)行步驟210 ;步驟210、結束正則表達式生成。優(yōu)選地,所述步驟300包括步驟301、判斷所述匹配類型標識為段模式還是行模式,如果為段模式,則執(zhí)行步驟302,如果為行模式則執(zhí)行步驟303 ;步驟302、將待匹配數(shù)據(jù)按段分割為待匹配子字符串,執(zhí)行步驟304 ;步驟303、將待匹配數(shù)據(jù)按行分割為待匹配子字符串,執(zhí)行步驟304 ;步驟304、按順序從所述正則表達式列表中讀取一個未處理的子字符串正則表達式;步驟305、用子字符串正則表達式與待匹配子字符串進行匹配;步驟306、判斷子字符串匹配是否成功,如果失敗執(zhí)行步驟307,如果成功執(zhí)行步驟 308 ;步驟307、輸出字符串匹配失敗,結束匹配流程;步驟308、判斷是否還有未處理的子字符串正則表達式,如果有,則執(zhí)行步驟304, 如果沒有,則執(zhí)行步驟309 ;步驟309、輸出字符串匹配成功,結束匹配流程。
本發(fā)明還公開了一種基于正則表達式的字符串匹配裝置,包括解析模塊,用于解析匹配字符串,根據(jù)預先設定的段模式分隔符以及字符串格式判斷匹配字符串的匹配類型為段模式還是行模式,根據(jù)判斷得到的匹配類型設置匹配類型標識;正則表達式生成模塊,用于根據(jù)匹配類型標識將匹配字符串按段分割或按行分割為多個子字符串,對每個子字符串確定正則表達式生成模式,并根據(jù)正則表達式生成模式以不同的連接式連接所述子字符串中以預定詞組標記標識的詞組生成子字符串正則表達式,獲得包含至少一個子字符串正則表達式的正則表達式列表;數(shù)據(jù)匹配模塊,用于根據(jù)匹配類型標識對待匹配數(shù)據(jù)進行按段分割或按行分割獲得待匹配子字符串,按子字符串正則表達式逐一地對分割得到的待匹配子字符串進行匹配,輸出匹配結果。本發(fā)明通過不同匹配模式來覆蓋所有的字符串匹配形式,通過設置正則表達式生成模式從而簡化了字符串匹配結構體的設計過程。使匹配高效,設計簡單,維護方便。
圖I是本發(fā)明的基于正則表達式的字符串匹配方法的流程圖;圖2是本發(fā)明的基于正則表達式的字符串匹配方法的解析子過程的流程圖;圖3是本發(fā)明的基于正則表達式的字符串匹配方法的正則表達式生成子過程的流程圖;圖4是本發(fā)明的基于正則表達式的字符串匹配方法的數(shù)據(jù)匹配子過程的流程圖;圖5是本發(fā)明的基于正則表達式的字符串匹配裝置的框圖。
具體實施例方式下面結合附圖并通過具體實施方式
來進一步說明本發(fā)明的技術方案。本發(fā)明實施例根據(jù)匹配字符串的排列方式特點,對匹配字符串類型進行分配,根據(jù)不同類型進行不同的正則表達式生成和字符串匹配操作,從而實現(xiàn)簡化字符串匹配結構的設計過程的目的。其中,本發(fā)明實施例根據(jù)匹配字符串的分隔特點,將匹配字符串的匹配模式分為行模式和段模式。其中,匹配模式為段模式的匹配字符串中被匹配內(nèi)容是按照某種固定格式重復出現(xiàn)的,即在整個字符串中字符組合以相同格式重復出現(xiàn)(以特定字符/字符串分隔重復,例如,字符串“123**234**789#”中,內(nèi)容以為分隔符每三個字符重復出現(xiàn))。 不具備段模式特點的字符串(即字符串內(nèi)容不按照特定格式重復)被分類為行模式的字符串。在一個優(yōu)選實施例中,匹配模式為行模式的字符串可以根據(jù)是否存在換行符進一步分為單行模式和多行模式,單行模式的匹配字符串在匹配字符串內(nèi)沒有換行符,匹配字符串只在同一行中出現(xiàn),而多行模式的匹配字符串內(nèi)存在至少一個換行符,匹配字符串在多行中出現(xiàn)。本發(fā)明按照不同的模式來對匹配字符串進行分割和匹配。同時,本發(fā)明實施例在根據(jù)匹配字符串生成正則表達式時,還根據(jù)字符串中詞組的特點,將匹配字符串分為列模式和非列模式。此處所述的詞組是字符串中利用詞組標記標示的字符組合,例如字符串“$catch$ $it$”,利用“$”作為詞組標記標示了兩個詞組“catch”和“it”,通過這種方式可以在解析時識別字符串中的哪些字符組合是詞組。在列模式中,匹配字符串的詞組之間僅使用至少一個空白字符(包括空格、制表符等)連接,即匹配字符串的詞組在邏輯上是緊密相連的,在相鄰詞組之間不存在其他字符,例如上述的 “$(^化1!$$^$”就是列模式的字符串。而在非列模式中,匹配字符串的詞組之間包括除空白字符外的其它字符,例如“$catched$,$it$”。圖I示出了本發(fā)明的基于正則表達式的字符串匹配方法的流程圖。其具體流程如下步驟100、解析匹配字符串,根據(jù)預先設定的段模式分隔符以及字符串格式判斷匹配字符串的匹配類型為段模式還是行模式,根據(jù)判斷得到的匹配類型為匹配字符串設置代表其匹配類型的標識,即匹配類型標識。步驟200、按匹配類型標識將匹配字符串劃分為多個子字符串組成的字符串列表, 對每個子字符串確定正則表達式生成模式,并根據(jù)正則表達式生成模生成子字符串匹配正則表達式。其中,對于段模式的匹配字符串,將該匹配字符串按分隔符進行分割,對于行模式的匹配字符串,將該匹配字符串按換行符進行分割。分割后,對于每一個子字符串,按預先設定的詞組標記解析該子字符串,獲得子字符串中的詞組以及詞組之間的字符,根據(jù)所述詞組之間的字符判斷該子字符串的正則表達式生成類型是列模式還是非列模式,對于列模式的子字符串,在提取得到的詞組之間用“\s*”元符號連接形成子字符串正則表達式,對于非列模式的子字符串,在提取得到的詞組之間用* ”元符號連接形成子字符串正則表達式,最后將各子字符串正則表達式合并為子字符串正則表達式列表,并將所屬匹配類型標識設置到所述正則表達式列表。步驟300、進行數(shù)據(jù)匹配,獲取正則表達式列表的匹配類型標識,根據(jù)匹配類型對待匹配數(shù)據(jù)進行劃分,即,如果用于進行匹配的正則表達式列表為段模式,則按預定分隔符對待匹配數(shù)據(jù)進行分割(分隔符之間的部分或字符串開始/結束與分隔符之間的部分劃分為一個子字符串)如果用于進行匹配的正則表達式列表為行模式,則按換行符對待匹配數(shù)據(jù)進行分割(換行符之間或字符串開始/結束與換行符之間的部分劃分為一個子字符串)。 分割后,按子字符串正則表達式逐一地對分隔得到的待匹配子字符串進行匹配。圖2是進一步說明所述步驟100的具體流程的方法流程圖。如圖2所示,所述步驟100包括步驟101、解析所述匹配字符串;步驟102、判斷所述匹配字符串的格式是否以預定的段模式分隔符為界進行重復, 如果是,所述匹配字符串匹配類型為段模式,執(zhí)行步驟103,如果否,所述匹配字符串匹配類型為行模式,執(zhí)行步驟104;步驟103、設置所述匹配字符串的匹配類型標識為段模式,結束;步驟104、設置所述匹配字符串的匹配類型標識為行模式,結束。圖3是進一步說明所述步驟200的具體流程的方法流程圖。如圖3所示,所述步驟200包括步驟201、判斷所述匹配字符串的匹配類型標識為段模式還是行模式,如果為段模式,則執(zhí)行步驟202,如果為行模式則執(zhí)行步驟203 ;步驟202、按段模式分隔符將所述匹配字符串分割為多個匹配子字符串,即將以段模式分隔符為界重復的部分提取為子字符串,執(zhí)行步驟204 ;步驟203、按換行符將所述匹配字符串分割為多個子字符串,即將字符串中的每一行提取為子字符串,執(zhí)行步驟204 ;步驟204、取出一個匹配子字符串,根據(jù)預定的詞組標記提取其中的由詞組標記標識的詞組和詞組間字符;步驟205、根據(jù)詞組間字符判斷所述匹配子字符串的正則表達式生成模式為列模式還是非列模式,如果是列模式,則執(zhí)行步驟206,如果是非列模式,則執(zhí)行步驟207 ;步驟206、將在步驟204中提取的詞組用表示至少一個空白字符的正則表達式 “\s*”連接為子字符串正則表達式,執(zhí)行步驟208 ;步驟207、將在步驟204中提取的詞組用表示至少一個非換行符的任意字符的正則表達式* ”連接為子字符串正則表達式,執(zhí)行步驟208 ;步驟208、將得到的子字符串正則表達式加入正則表達式列表;步驟209、判斷是否還有未處理的匹配子字符串,如果有,則執(zhí)行步驟204,如果沒有,則執(zhí)行步驟210 ;步驟210、結束正則表達式生成。圖4是進一步說明所述步驟300基于正則表達式進行字符串匹配的具體流程的方法流程圖。如圖4所示,所述步驟300包括步驟301、判斷所述正則表達式列表的匹配類型標識為段模式還是行模式,如果為段模式,則執(zhí)行步驟302,如果為行模式則執(zhí)行步驟303 ;
式; 驟308
步驟302、將待匹配數(shù)據(jù)按段分割為待匹配子字符串,執(zhí)行步驟304 ;
步驟303、將待匹配數(shù)據(jù)按行分割為待匹配子字符串,執(zhí)行步驟304 ;
步驟304、按順序從所述正則表達式列表中讀取一個未處理的子字符串正則表達
步驟305、用子字符串正則表達式與待匹配子字符串進行匹配;
步驟306、判斷子字符串匹配是否成功,如果失敗執(zhí)行步驟307,如果成功執(zhí)行步
步驟307、輸出字符串匹配失敗,結束匹配流程;
步驟308、判斷是否還有未處理的子字符串正則表達式,如果有,則執(zhí)行步驟304, 如果沒有,則執(zhí)行步驟309 ;步驟309、輸出字符串匹配成功,結束匹配流程。本發(fā)明通過不同匹配模式來覆蓋所有的字符串匹配形式,通過設置正則表達式生成模式從而簡化了字符串匹配結構體的設計過程。使匹配高效,設計簡單,維護方便。在本發(fā)明的另一個優(yōu)選實施例中,可以對行模式進行進一步細分,將行模式分為單行模式和多行模式單行模式的匹配字符串在匹配字符串內(nèi)沒有換行符,匹配字符串只在同一行中出現(xiàn),而多行模式的匹配字符串內(nèi)存在至少一個換行符,匹配字符串在多行中出現(xiàn)。也就是說,將匹配類型分為三種類型,即段模式、單行模式和多行模式。在步驟200中分割所述匹配字符串時,對于單行模式的字符串不必進行分割,而對于多行模式的字符串按行進行分割獲得多個匹配子字符串。在步驟300中對待匹配數(shù)據(jù)進行分割時,如果匹配正則表達式的匹配模式為單行模式,則對于待匹配數(shù)據(jù)不進行分割,如果匹配模式為多行模式,則將待匹配數(shù)據(jù)按行進行分割。在本發(fā)明的又一個優(yōu)選實施例中,在步驟305進行匹配時,逐字符進行匹配,直到整個子字符串匹配完成。圖5是本發(fā)明的另一優(yōu)選實施例的基于正則表達式的字符串匹配裝置,所述裝置包括解析模塊,用于解析匹配字符串,根據(jù)預先設定的段模式分隔符以及字符串格式判斷匹配字符串的匹配類型為段模式還是行模式,根據(jù)判斷得到的匹配類型為匹配字符串設置代表其匹配類型的標識,即匹配類型標識。正則表達式生成模塊,用于按匹配類型標識將匹配字符串劃分為多個子字符串組成的字符串列表,對每個子字符串確定正則表達式生成模式,并根據(jù)正則表達式生成模生成子字符串匹配正則表達式。其中,對于段模式的匹配字符串,將該匹配字符串按分隔符進行分割,對于行模式的匹配字符串,將該匹配字符串按換行符進行分割。分割后,對于每一個子字符串,按預先設定的詞組標記解析該子字符串,獲得子字符串中的詞組以及詞組之間的字符,根據(jù)所述詞組之間的字符判斷該子字符串的正則表達式生成類型是列模式還是非列模式,對于列模式的子字符串,在提取得到的詞組之間用“\s*”元符號連接形成子字符串正則表達式,對于非列模式的子字符串,在提取得到的詞組之間用“.* ”元符號連接形成子字符串正則表達式,最后將各子字符串正則表達式合并為子字符串正則表達式列表, 并將所屬匹配類型標識設置到所述正則表達式列表。數(shù)據(jù)匹配模塊,用于進行數(shù)據(jù)匹配,獲取正則表達式列表的匹配類型標識,根據(jù)匹配類型對待匹配數(shù)據(jù)進行劃分,即,如果用于進行匹配的正則表達式列表為段模式,則按預定分隔符對待匹配數(shù)據(jù)進行分割(分隔符之間的部分或字符串開始/結束與分隔符之間的部分劃分為一個子字符串)如果用于進行匹配的正則表達式列表為行模式,則按換行符對待匹配數(shù)據(jù)進行分割(換行符之間或字符串開始/結束與換行符之間的部分劃分為一個子字符串)。分割后,按子字符串正則表達式逐一地對分割得到的待匹配子字符串進行匹配。上述僅為本發(fā)明的較佳實施例及所運用技術原理,任何熟悉本技術領域的技術人員在本發(fā)明揭露的技術范圍內(nèi),可輕易想到的變化或替換,都應涵蓋在本發(fā)明的保護范圍內(nèi)。
權利要求
1.一種基于正則表達式的字符串匹配方法,包括步驟100、解析匹配字符串,根據(jù)預先設定的段模式分隔符以及字符串格式判斷匹配字符串的匹配類型為段模式還是行模式,根據(jù)判斷得到的匹配類型設置匹配類型標識;步驟200、根據(jù)匹配類型標識將匹配字符串按段分割或按行分割為多個子字符串,對每個子字符串確定正則表達式生成模式,并根據(jù)正則表達式生成模式以不同的連接式連接所述子字符串中以預定詞組標記標識的詞組生成子字符串正則表達式,獲得包含至少一個子字符串正則表達式的正則表達式列表;步驟300、根據(jù)匹配類型標識對待匹配數(shù)據(jù)進行按段分割或按行分割獲得待匹配子字符串,按子字符串正則表達式逐一地對分割得到的待匹配子字符串進行匹配,輸出匹配結果。
2.如權利要求I所述的基于正則表達式的字符串匹配方法,其特征在于匹配類型為段模式是指所述匹配字符串的格式以所述預定的段模式分隔符為界進行重復,匹配類型為行模式是指所述匹配字符串格式為不符合段模式的其它模式。
3.如權利要求I所述的基于正則表達式的字符串匹配方法,其特征在于所述按段分割是以預定段模式分隔符為界截取子字符串,所述按行分割是以換行符為界截取子字符串。
4.如權利要求I所述的基于正則表達式的字符串匹配方法,其特征在于所述正則表達式生成模式包括列模式和非列模式,對于列模式,利用代表至少一個空白字符的連接正則表達式連接詞組生成子字符串正則表達式,對于非列模式,利用代表至少一個非換行符的任意字符的連接則正表達式生成子字符串正則表達式。
5.如權利要求I所述的基于正則表達式的字符串匹配方法,其特征在于,所述步驟100 包括步驟101、解析所述匹配字符串;步驟102、判斷所述匹配字符串的格式是否以預定的段模式分隔符為界進行重復,如果是,所述匹配字符串匹配類型為段模式,執(zhí)行步驟103,如果否,所述匹配字符串匹配類型為行模式,執(zhí)行步驟104;步驟103、設置所述匹配字符串的匹配類型標識為段模式,結束步驟100流程;步驟104、設置所述匹配字符串的匹配類型標識為行模式,結束100流程。
6.如權利要求I所述的基于正則表達式的字符串匹配方法,其特征在于,所述步驟200 包括步驟201、判斷所述匹配字符串的匹配類型標識為段模式還是行模式,如果為段模式, 則執(zhí)行步驟202,如果為行模式則執(zhí)行步驟203 ;步驟202、按段模式分隔符將所述匹配字符串分割為多個匹配子字符串,執(zhí)行步驟204 ;步驟203、按換行符將所述匹配字符串分割為多個子字符串,執(zhí)行步驟204 ;步驟204、取出一個未處理的匹配子字符串,根據(jù)預定的詞組標記提取其中的由詞組標記標識的詞組和詞組間字符;步驟205、根據(jù)詞組間字符判斷所述匹配子字符串的正則表達式生成模式為列模式還是非列模式,如果是列模式,則執(zhí)行步驟206,如果是非列模式,則執(zhí)行步驟207 ;步驟206、將在步驟204中提取的詞組用表示至少一個空白字符的連接正則表達式連接為子字符串正則表達式,執(zhí)行步驟208 ;步驟207、將在步驟204中提取的詞組用表示至少一個非換行符的任意字符的連接正則表達式連接為子字符串正則表達式,執(zhí)行步驟208 ;步驟208、將得到的子字符串正則表達式加入正則表達式列表;步驟209、判斷是否還有未處理的匹配子字符串,如果有,則執(zhí)行步驟204,如果沒有, 則執(zhí)行步驟210 ;步驟210、結束正則表達式生成。
7.如權利要求I所述的基于正則表達式的字符串匹配方法,其特征在于,所述步驟300 包括步驟301、判斷所述匹配類型標識為段模式還是行模式,如果為段模式,則執(zhí)行步驟 302,如果為行模式則執(zhí)行步驟303 ;步驟302、將待匹配數(shù)據(jù)按段分割為待匹配子字符串,執(zhí)行步驟304 ;步驟303、將待匹配數(shù)據(jù)按行分割為待匹配子字符串,執(zhí)行步驟304 ;步驟304、按順序從所述正則表達式列表中讀取一個未處理的子字符串正則表達式; 步驟305、用子字符串正則表達式與待匹配子字符串進行匹配;步驟306、判斷子字符串匹配是否成功,如果失敗執(zhí)行步驟307,如果成功執(zhí)行步驟308 ;步驟307、輸出字符串匹配失敗,結束匹配流程;步驟308、判斷是否還有未處理的子字符串正則表達式,如果有,則執(zhí)行步驟304,如果沒有,則執(zhí)行步驟309 ;步驟309、輸出字符串匹配成功,結束匹配流程。
8.一種基于正則表達式的字符串匹配裝置,包括解析模塊,用于解析匹配字符串,根據(jù)預先設定的段模式分隔符以及字符串格式判斷匹配字符串的匹配類型為段模式還是行模式,根據(jù)判斷得到的匹配類型設置匹配類型標正則表達式生成模塊,用于根據(jù)匹配類型標識將匹配字符串按段分割或按行分割為多個子字符串,對每個子字符串確定正則表達式生成模式,并根據(jù)正則表達式生成模式以不同的連接式連接所述子字符串中以預定詞組標記標識的詞組生成子字符串正則表達式,獲得包含至少一個子字符串正則表達式的正則表達式列表;數(shù)據(jù)匹配模塊,用于根據(jù)匹配類型標識對待匹配數(shù)據(jù)進行按段分割或按行分割獲得待匹配子字符串,按子字符串正則表達式逐一地對分割得到的待匹配子字符串進行匹配,輸出匹配結果。
全文摘要
本發(fā)明公開了一種基于正則表達式的字符串匹配方法,包括步驟100、根據(jù)字符串格式判斷匹配字符串的匹配類型為段模式還是行模式,設置匹配類型標識;步驟200、根據(jù)匹配類型標識將匹配字符串按段分割或按行分割為多個子字符串,對每個子字符串確定正則表達式生成模式,并根據(jù)正則表達式生成模式以不同的連接正則表達式連接詞組生成子字符串正則表達式,獲得包含至少一個子字符串正則表達式的正則表達式列表;步驟300、根據(jù)匹配類型標識對待匹配數(shù)據(jù)進行按段分割或按行分割獲得待匹配子字符串,按子字符串正則表達式逐一地對分割得到的待匹配子字符串進行匹配,輸出匹配結果。
文檔編號G06F17/30GK102609459SQ20121000927
公開日2012年7月25日 申請日期2012年1月12日 優(yōu)先權日2012年1月12日
發(fā)明者劉磊 申請人:神州數(shù)碼網(wǎng)絡(北京)有限公司