用戶設備提取文本信息中的特征信息的方法和用戶設備的制造方法
【技術領域】
[0001]本發(fā)明實施例涉及通信領域,并且更具體地,涉及一種用戶設備提取文本信息中的特征信息的方法和用戶設備。
【背景技術】
[0002]隨著自然語言處理技術的進步和智能設備的普及,人們對智能設備的期望越來越高,希望能夠對智能設備進行一些更加智能和人性化的操作。例如,在接收到的短信息中含有連續(xù)數字或網址時,智能設備可以自動地將連續(xù)數字或網址識別出來。相對應地,用戶可以對識別出的信息進行特定的操作,將識別出的電話號碼加入電話薄、撥打識別出的電話號碼、或者用瀏覽器打開識別出的網頁鏈接等。
[0003]然而,在識別短信息包含的其它有用信息時,例如,地址和應用名稱等,需要將大量的資源加載到智能設備的內存中。這樣,識別過程會占用大量的內存和CPU(CentralProcessing Unit,中央處理器)的計算時間,影響了智能設備的性能,進而降低了用戶體驗。
【發(fā)明內容】
[0004]本發(fā)明實施例提供了一種用戶設備提取文本信息中的特征信息的方法和用戶設備,能夠提高用戶設備的性能,進而提升用戶體驗。
[0005]第一方面,提供了一種用戶設備提取文本信息中的特征信息的方法,包括:根據獲取的用戶信息從存儲在用戶設備的外存儲器的資源庫中選擇第一資源集,資源庫中包括至少一個用于從文本信息中提取特征信息的資源;將第一資源集從用戶設備的外存儲器加載至用戶設備的內存中;基于內存中的第一資源集,提取存儲在用戶設備中的文本信息中的特征信息。
[0006]結合第一方面,在第一方面的第一種實現方式中,基于內存中的第一資源集,提取存儲在用戶設備中的文本信息中的特征信息,包括:基于內存中的第一資源集,提取文本信息中的文字的屬性信息作為文本信息的特征信息,文字的屬性信息包括文字的句子結構、文字的詞性和文字的詞義中的一種或多種。
[0007]結合第一方面及其上述實現方式,在第一方面的第二種實現方式中,在根據獲取的用戶信息從存儲在用戶設備的外存儲器的資源庫中選擇第一資源集之前,該方法還包括:獲取用戶的聯(lián)系人信息或用戶當前的位置信息,作為用戶信息。
[0008]結合第一方面及其上述實現方式,在第一方面的第三種實現方式中,用戶信息包括用戶姓名、用戶性別、用戶年齡、用戶手機號碼、用戶住址、用戶當前位置、用戶上下文信息和用戶興趣信息中的一種或多種。
[0009]結合第一方面及其上述實現方式,在第一方面的第四種實現方式中,文本信息包括短信中的文本信息、彩信中的文本信息或安裝在用戶設備上的軟件中存儲的文本信息。
[0010]第二方面,提供了一種用戶設備,包括:選擇單元,用于根據獲取的用戶信息從存儲在用戶設備的外存儲器的資源庫中選擇第一資源集,資源庫中包括至少一個用于從文本信息中提取特征信息的資源;加載單元,用于將第一資源集從用戶設備的外存儲器加載至用戶設備的內存中;提取單元,用于基于內存中的第一資源集,提取存儲在用戶設備中的文本信息中的特征信息。
[0011]結合第二方面,在第二方面的第一種實現方式中,提取單元,具體用于基于內存中的第一資源集,提取文本信息中的文字的屬性信息作為文本信息的特征信息,文字的屬性信息包括文字的句子結構、文字的詞性和文字的詞義中的一種或多種。
[0012]結合第二方面及其上述實現方式,在第二方面的第二種實現方式中,用戶設備還包括獲取單元,獲取單元,用于獲取用戶的聯(lián)系人信息或用戶當前的位置信息,作為用戶信肩、O
[0013]結合第二方面及其上述實現方式,在第二方面的第三種實現方式中,用戶信息包括用戶姓名、用戶性別、用戶年齡、用戶手機號碼、用戶住址、用戶當前位置、用戶上下文信息和用戶興趣信息中的一種或多種。
[0014]結合第二方面及其上述實現方式,在第二方面的第四種實現方式中,文本信息包括短信中的文本信息、彩信中的文本信息或安裝在用戶設備上的軟件中存儲的文本信息。
[0015]基于上述技術方案,在本發(fā)明實施例中,提取文本信息中的特征信息時,根據用戶信息將選擇的資源集加載至用戶設備的內存中,而不是將整個資源庫加載到用戶設備的內存中。這樣,可以降低內存占用量,減短CPU的計算時間,進而提高了用戶設備的性能,提升了用戶體驗。
【附圖說明】
[0016]為了更清楚地說明本發(fā)明實施例的技術方案,下面將對本發(fā)明實施例中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領域普通技術人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。
[0017]圖1是本發(fā)明一個實施例的用戶設備提取文本信息中的特征信息的方法的示意性流程圖。
[0018]圖2是本發(fā)明另一實施例的用戶設備提取文本信息中的特征信息的方法的示意性流程圖。
[0019]圖3是本發(fā)明一個實施例的用戶設備的示意性框圖。
[0020]圖4是本發(fā)明另一實施例的用戶設備的示意性框圖。
【具體實施方式】
[0021]下面將結合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例是本發(fā)明的一部分實施例,而不是全部實施例?;诒景l(fā)明中的實施例,本領域普通技術人員在沒有做出創(chuàng)造性勞動的前提下所獲得的所有其他實施例,都應屬于本發(fā)明保護的范圍。
[0022]應理解,在本發(fā)明實施例中,用戶設備(User Equipment,簡稱為“UE”)可稱之為終端(Terminal)、移動臺(Mobile Stat1n,簡稱為 “MS”)、移動終端(Mobile Terminal)等,該用戶設備可以經無線接入網(Rad1 Access Network,簡稱為“RAN”)與一個或多個核心網進行通信,例如,用戶設備可以是移動電話(或稱為“蜂窩”電話)、具有移動終端的計算機等,例如,用戶設備還可以是便攜式、袖珍式、手持式、計算機內置的或者車載的移動裝置,它們與無線接入網交換語音和/或數據。
[0023]圖1是本發(fā)明一個實施例的用戶設備提取文本信息中的特征信息的方法的示意性流程圖。圖1的方法10可以由用戶設備執(zhí)行。
[0024]101,根據獲取的用戶信息從存儲在用戶設備的外存儲器的資源庫中選擇第一資源集,資源庫中包括至少一個用于從文本信息中提取特征信息的資源。
[0025]例如,資源庫可以預先存儲在用戶設備的外存儲器中,或者用戶設備可以通過網絡從服務器下載并存儲在外存儲器中。然后,將用戶信息作為選擇條件,從資源庫中選擇第一資源集。
[0026]又如,根據提取不同特征信息的需要,用戶信息包含的具體內容可以是不同的,或者用戶信息可以包括提取不同特征信息所需要的所有信息。比如,在提取文本信息中的地址字段作為特征信息時,用戶信息中至少要包含與用戶相關的位置信息。
[0027]102,將第一資源集從用戶設備的外存儲器加載至用戶設備的內存中。
[0028]103,基于內存中的第一資源集,提取存儲在用戶設備中的文本信息中的特征信肩、O
[0029]基于上述技術方案,在本發(fā)明實施例中,提取文本信息中的特征信息時,根據用戶信息將選擇的資源集加載至用戶設備的內存中,而不是將整個資源庫加載到用戶設備的內存中。這樣,可以降低內存占用量,減短CPU的計算時間,進而提高了用戶設備的性能,提升了用戶體驗。
[0030]另外,在提取文本信息中的特征信息時,不依據第一資源集外的其它資源進行特征信息的提取,降低了數據間的沖突,提升了特征信息提取的準確率。
[0031]例如,假設文本信息中包含字段“來鳳山”時,可以結合用戶信息中的用戶當前位置、用戶住址和用戶上下文來確定相應的特征信息。具體地,如果用戶信息顯示該用戶與云南省相關性比較高時,可以將與云南省相關的匹配資源加載至用戶設備的內存。經過計算處理后,進一步地可以確定該字段“來鳳山”表示的是一個地址信息,詞性為名詞,具體含義為云南省的“來鳳山”,并據此形成對應的特征信息。
[0032]或者,如果用戶信息顯示該用戶與廣西省相關性比較高時,可以將與廣西省相關的匹配資源加載至用戶設備的內存。經過計算處理后,進一步地可以確定該字段“來鳳山”包含兩部分,名詞“鳳山”和動詞“來”。這樣,可以從字段“來鳳山”中提取到地址信息“鳳山”作為特征信息的一部分,具體含義為廣西省“鳳山”。
[0033]應理解,外存儲器是相對內存而言的,用戶設備中除了內存以外的存儲資源都可以稱為外存儲器。這樣,按照用戶信息將選擇的第一資源集從外存儲器加載至內存中,而不是將整個資源庫加載至內存中,可以節(jié)省大量的內存占用量。由于從文本信息中提取豐富的特征信息需要占用較大的內存,這種情況下,本發(fā)明實施例為提取豐富的特征信息提供了一種可實現的方式,為進一步提升用戶體驗提供了可能。
[0034]可選地,作為一個實施例,在步驟103中,基于內存中的第一資源集,提取存儲在用戶設備中的文本信息中的特征信息時,可以基于內存中的第一資源集,提取文本信息中的文字的屬性信息作為文本信息的特征信息,文字的屬性信息包括文字的句子結構、文字的詞性和文字的詞義中的一種或多種。
[0035]例如,如前文所述的,基于