“3587”和“4273”,也即簡體中文字“說”、“明”和“書”各自對應的文字編碼。事實上,對于計算機系統(tǒng)而言,該系統(tǒng)在對文字進行識別時,通常也會將具體的文字編譯為文字編碼,因此,從系統(tǒng)的角度,頁面文件中的作為第一標識項的第一版式的文字內容本身也可以視為是其文字編碼,然而本發(fā)明對此不作限定。
[0099]當然,以上只是一種示例,并不會對本發(fā)明構成限定。例如,在本發(fā)明目前或未來的一些實施例中,該第一標識項也可以具體表現(xiàn)為各種其他可行的形式,前提是該第一標識項能夠被正確識別、并且能夠起到對第一版式的文字進行標識的作用。
[0100]在另一方面,在本發(fā)明實施例中,第一獲取單元302所執(zhí)行的對第一標識項的獲取操作一般可以通過在頁面文件對第一標識項的搜索操作來完成。具體地,該搜索操作可以是對整個頁面文件的遍歷,也可以采用更為復雜的搜索邏輯,例如,作為一種可選的方式,在本發(fā)明實施例中,第一獲取單元302可以包括:
[0101]I)第一判斷模塊,用于判斷多個頁面元素中的任一個是否滿足預設條件,該頁面文件包括該多個頁面元素;
[0102]2)獲取模塊,用于在該任一個滿足預設條件時,在該任一個中獲取第一標識項。
[0103]在本發(fā)明實施例中,可以先對頁面文件中的頁面元素進行遍歷,并篩選出滿足預設條件的頁面元素,然后在篩選出的頁面元素中搜索第一標識項,或者是將篩選出的頁面元素的全部內容或者是與文字對應的內容作為第一標識項,這就達到了縮減搜索范圍的目的,從而可以提高系統(tǒng)的處理速度和處理效率。具體地,對于常見的作為頁面文件的html文檔來說,作為上述判斷的對象的頁面元素具體可以是DOM節(jié)點,或者說頁面節(jié)點,例如,在本發(fā)明的一些實施例中,可以通過第一判斷模塊對頁面文件中的所有子節(jié)點進行遍歷,判斷其中每個子節(jié)點是否滿足預設條件,若滿足,則可以通過獲取模塊獲取該子節(jié)點對應的文字內容、比如該子節(jié)點的一個或多個文字屬性的數(shù)值作為第一標識項。更具體地,作為其中一種可選的方式,在本發(fā)明實施例中,上述獲取模塊可以包括:
[0104]I)獲取子模塊,用于將第一字符和/或第一字符串作為第一標識項,其中,任一個包括一個或多個第一字符,和/或一個或多個第一字符串;
[0105]其中,相對應地,查詢單元304可以包括:
[0106]I)查詢模塊,用于查詢與第一字符對應的第二字符和/或與第一字符串對應的第二字符串,其中,第二標識項包括一個或多個第二字符,和/或一個或多個第二字符串。
[0107]在另一方面,在本發(fā)明實施例中,設置預設條件的作用在于篩選出指定的頁面元素,該指定的頁面元素通??梢允怯脕碚故疚淖謨热莸捻撁嬖?。具體來說,作為其中一種可選的方式,在本發(fā)明實施例中,上述第一判斷模塊可以包括:
[0108]判斷子模塊,用于判斷所述任一個是否滿足以下預設條件至少之一:所述任一個屬于用于展示文字內容的頁面元素類型、所述任一個對應的文字屬性不為空。
[0109]在上述場景下,可以利用頁面元素的類型對頁面元素進行篩選。仍以html文檔為例,對于html文檔中的任一子節(jié)點來說,均可以針對該子節(jié)點的各屬性進行判斷,比如可以判斷該子節(jié)點是否具有標題(title)等用于展示文字內容的屬性,若具有,則可以判斷出該子節(jié)點屬于用于展示文字內容的頁面元素類型。然而本發(fā)明的實施方式并不限于此,例如,在一些實施例中,也可以判斷該子節(jié)點的節(jié)點類型屬性(nodetype)的值是否為3,值為3時則表示該子節(jié)點為文字節(jié)點,從而也可以判斷出該子節(jié)點屬于用于展示文字內容的頁面元素類型,進而判斷出該子節(jié)點滿足預設條件。
[0110]通過上述實施例中描述的方式,便可以完成對頁面文件中的第一標識項的獲取,進而可以通過查詢單元304查詢到與第一標識項對應的第二標識項,并通過更新單元306將頁面文件中的第一標識項更新為查詢到的第二標識項,以便于完成對頁面文件的處理,并達到將用于展示第一版式的文字內容的頁面文件轉換為用于展示第二版式的相同文字內容的頁面文件的目的。具體地,更新單元306所執(zhí)行的上述更新處理可以通過簡單的替換操作來完成,也即將頁面文件中的第一標識項替換為對應的第二標識項,然而本發(fā)明對此不作限定。
[0111]在本發(fā)明實施例中,第二標識項可以用于標識第二版式的該文字內容。其中,類似于第一標識項對第一版式的文字內容的標識作用,第二標識項也可以起到對第二版是的文字內容的標識作用,且二者的具體表現(xiàn)形式均可以存在多種。換而言之,在本發(fā)明實施例中,第二標識項也可以是第二版式的文字本身或者是該文字的編碼,且第一標識項和第二標識項可以用來標識相同的文字內容。例如,以中文繁體作為第二版式的情形為例,則用于標識文字內容“說明書”的第二標識項可以直接以繁體中文字“說明書”的形式出現(xiàn),然而其也可以表現(xiàn)為繁體中文字“說”、“明”和“書”各自對應的文字編碼,如BIG5編碼等能夠被瀏覽器或編譯器識別的編碼形式。
[0112]在另一方面,在本發(fā)明實施例中,查詢單元304所執(zhí)行的查詢第二標識項的操作可以有多種具體的實施方式,其可以從多種為本領域技術人員所知的可行的查詢方式中選取。一般地,作為一種可選的方式,在本發(fā)明實施例中,查詢單元304可以包括:
[0113]I)查詢模塊,用于根據第一集合與第二結合之間的映射關系查詢第二標識項,其中,第一集合具有包括第一標識項在內的多個標識項,第二集合具有包括第二標識項在內的多個標識項。
[0114]具體來說,在本發(fā)明實施例中,計算機系統(tǒng)至少可以維護有兩個標識項集合,也即上述第一集合和第二集合,其中,第一集合可以包括M個標識項,第二集合可以包括N個標識項,并且在第一集合與第二集合之間、或者說該M個標識項與該N個標識項之間建立有映射關系,基于該映射關系,可以查詢到與第一集合中的任一標識項A對應的第二集合中的一個標識項B,則查詢到的標識項B便可以視為是與標識項A對應的標識項。在上述場景下,若第一集合所包括的標識項均用于標識第一版式的文字內容,也即上述M個標識項均可以視為是第一標識項,且第二集合所包括的標識項均用于標識第二版式的對應文字內容,也即上述N個標識項均可以視為是第二標識項,則可以基于上述映射關系查詢到與第一標識項對應的第二標識項,從而實現(xiàn)查詢單元304中所描述的操作。
[0115]當然,上述查詢方式只是一種示例,并非查詢單元304的唯一的實現(xiàn)方式。在本發(fā)明實施例中,還可以通過其他可行的查詢方式來獲取與第一標識項對應的第二標識項,這些查詢方式所涉及的映射關系也可以依賴于第一集合或第二集合之外的手段來實現(xiàn),本發(fā)明對此不作任何限定。
[0116]通過以上實施例,對通過本發(fā)明實施例所提供的頁面文件的處理裝置進行了闡述,然而應當理解的是,上述實施例僅服務于對本發(fā)明技術方案的理解,并不應視為是對本發(fā)明的任何限定,例如,在上述實施例中,以中文簡體作為第一版式、中文繁體作為第二版式為例給出了具體描述,然而在本發(fā)明的全部實施例中,第一版式并不限于是中文簡體,第二版式也不限于是中文繁體,比如最簡單地,二者可以進行調換,也即可以將中文繁體作為第一版式,并將中文簡體作為第二版式,或者,在本發(fā)明的一些實施例中,該第一版式和第二版式分別可以表示不同的字體或字型等,版式所針對的文字也可以是中文以外的文字如英文字,等等,本發(fā)明對此均不作任何限定,類似的實施方式也均應視為是在本發(fā)明的保護范圍之內。
[0117]在以上描述的基礎上,在本發(fā)明實施例中,還可以結合對頁面文件的實時處理和后續(xù)加載操作來完成對展示頁面的實時轉換,其中,該展示頁面表示加載上述頁面文件后所展示的頁面。
[0118]具體地,作為一種可選的方式,在本發(fā)明實施例中,與第一獲取單元302耦合地,上述裝置還可以包括:
[0119]第二獲取單元,用于獲取用于請求展示第二版式的文字內容的消息;
[0120]判斷單元,用于判斷預設cookie字段是否處于預設狀態(tài),若否,則將預設cookie字段設置為預設狀態(tài);
[0121]其中,第一獲取單元302可以包括:
[0122]第二判斷模塊,用于判斷預設cookie字段是否為預設狀態(tài),若是,則獲取頁面文件中的第一標識項;
[0123]其中,與更新單元306耦合地,上述裝置還可以包括:
[0124]I)加載單元,用于加載更新后的頁面文件。
[0125]在本發(fā)明實施例中,可以利用服務器與客戶端之間進行交互所需的cookie來實現(xiàn)對展示頁面或其頁面文件的當前狀態(tài)進行跟蹤,并可以將預設cookie字段作為對頁面文件執(zhí)行如前述實施例中所描述的轉換處理的觸發(fā)標準,相對應地,服務器或客戶端則可以通過對該預設cookie字段的設置來選擇是否對頁面文件進行轉換處理,而該設置操作可以響應于用戶輸入來進行,例如,用戶選擇展示第二版式的文字內容時,則服務器或客戶端可以響應