本發(fā)明涉及信息處理技術(shù)領(lǐng)域,尤其涉及一種基于人工智能的語(yǔ)義判定處理方法和裝置。
背景技術(shù):
人工智能(Artificial Intelligence),英文縮寫為AI。它是研究、開發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué)。人工智能是計(jì)算機(jī)科學(xué)的一個(gè)分支,它企圖了解智能的實(shí)質(zhì),并生產(chǎn)出一種新的能以人類智能相似的方式做出反應(yīng)的智能機(jī)器,該領(lǐng)域的研究包括機(jī)器人、語(yǔ)言識(shí)別、圖像識(shí)別、自然語(yǔ)言處理和專家系統(tǒng)等。
隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,語(yǔ)義識(shí)別越來(lái)越廣泛的被應(yīng)用于各個(gè)應(yīng)用場(chǎng)景中,比如,在導(dǎo)航應(yīng)用程序中,可通過(guò)對(duì)用戶輸入的語(yǔ)音進(jìn)行語(yǔ)義識(shí)別,以為用戶提供導(dǎo)航服務(wù)等。
其中,在對(duì)待解析的文本等信息進(jìn)行語(yǔ)義識(shí)別時(shí),為了提高識(shí)別效率,將不具有語(yǔ)義的信息單獨(dú)處理,對(duì)包含明確的信息進(jìn)行語(yǔ)義解析處理。
然而相關(guān)技術(shù)中,在對(duì)待解析的文本等信息進(jìn)行語(yǔ)義識(shí)別時(shí),可能會(huì)產(chǎn)生誤判,比如會(huì)將一些指令型文本誤判為無(wú)語(yǔ)義文本等,語(yǔ)義判定不準(zhǔn)確。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的旨在至少在一定程度上解決上述的技術(shù)問題之一。
為此,本發(fā)明的第一個(gè)目的在于提出一種基于人工智能的語(yǔ)義判定處理方法,該方法根據(jù)待處理輸入信息的文本特征對(duì)待處理信息進(jìn)行處理,提高了語(yǔ)義識(shí)別的準(zhǔn)確率。
本發(fā)明的第二個(gè)目的在于提出一種基于人工智能的語(yǔ)義判定處理裝置。
本發(fā)明的第三個(gè)目的在于提出另一種基于人工智能的語(yǔ)義判定處理裝置。
本發(fā)明的第四個(gè)目的在于提出一種非臨時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。
本發(fā)明的第五個(gè)目的在于提出一種計(jì)算機(jī)程序產(chǎn)品。
為了實(shí)現(xiàn)上述目的,本發(fā)明第一方面實(shí)施例提出了一種基于人工智能的語(yǔ)義判定處理方法,包括以下步驟:對(duì)待處理的輸入信息進(jìn)行切詞處理,提取一個(gè)或多個(gè)文本特征;根據(jù)預(yù)先訓(xùn)練的語(yǔ)義識(shí)別模型對(duì)所述文本特征進(jìn)行分類處理,獲取與所述文本特征對(duì)應(yīng)的語(yǔ)義置信度;若所述語(yǔ)義置信度小于預(yù)設(shè)閾值,則確定所述輸入信息不具有語(yǔ)義文本。
本發(fā)明實(shí)施例的基于人工智能的語(yǔ)義判定處理方法,對(duì)待處理的輸入信息進(jìn)行切詞處理,提取一個(gè)或多個(gè)文本特征,并根據(jù)預(yù)先訓(xùn)練的語(yǔ)義識(shí)別模型對(duì)文本特征進(jìn)行分類處理,獲取與文本特征對(duì)應(yīng)的語(yǔ)義置信度,從而若語(yǔ)義置信度小于預(yù)設(shè)閾值,則確定輸入信息不具有語(yǔ)義文本。由此,根據(jù)待處理輸入信息的文本特征對(duì)待處理信息進(jìn)行處理,提高了語(yǔ)義識(shí)別的準(zhǔn)確率。
另外,本發(fā)明實(shí)施例的基于人工智能的語(yǔ)義判定處理方法,還具有如下附加的技術(shù)特征:
在本發(fā)明的一個(gè)實(shí)施例中,還包括:
若所述語(yǔ)義置信度大于等于預(yù)設(shè)閾值,則確定所述輸入信息具有語(yǔ)義文本。
在本發(fā)明的一個(gè)實(shí)施例中,在所述對(duì)待處理的輸入信息進(jìn)行切詞處理,提取一個(gè)或多個(gè)文本特征之前,還包括:
將所述輸入信息與預(yù)設(shè)的語(yǔ)義特征庫(kù)進(jìn)行匹配;
如果所述輸入信息與預(yù)設(shè)的語(yǔ)義特征庫(kù)匹配失敗,則對(duì)所述輸入信息進(jìn)行切詞處理。
在本發(fā)明的一個(gè)實(shí)施例中,在所述將所述輸入信息與預(yù)設(shè)的語(yǔ)義特征庫(kù)進(jìn)行匹配之后,還包括:如果所述輸入信息與預(yù)設(shè)的語(yǔ)義特征庫(kù)匹配成功,根據(jù)所述語(yǔ)義特征庫(kù)的類型確定所述輸入信息是否具有語(yǔ)義文本。
在本發(fā)明的一個(gè)實(shí)施例中,所述如果所述輸入信息與預(yù)設(shè)的語(yǔ)義特征庫(kù)匹配成功,根據(jù)所述語(yǔ)義特征庫(kù)的類型確定所述輸入信息是否具有語(yǔ)義文本,包括以下至少之一:
若所述語(yǔ)義特征庫(kù)包含指令模板,如果所述輸入信息與所述指令模板匹配成功,則確定所述輸入信息包含語(yǔ)義文本;
若所述語(yǔ)義特征庫(kù)包含閑聊語(yǔ)料模板,如果所述輸入信息與所述閑聊語(yǔ)料模板匹配成功,則確定所述輸入信息包含無(wú)語(yǔ)義文本;
若所述語(yǔ)義特征庫(kù)包含無(wú)語(yǔ)義文本的黑名單信息,如果所述輸入信息與所述黑名單信息匹配成功,則確定所述輸入信息包含無(wú)語(yǔ)義文本;
若所述語(yǔ)義特征庫(kù)包含具有語(yǔ)義文本的白名單信息,如果所述輸入信息與所述白名單信息匹配成功,則確定所述輸入信息包含語(yǔ)義文本。
為了實(shí)現(xiàn)上述目的,本發(fā)明第二方面實(shí)施例提出了一種基于人工智能的語(yǔ)義判定處理裝置,包括:第一處理模塊,用于對(duì)待處理的輸入信息進(jìn)行切詞處理;提取模塊,用于提取一個(gè)或多個(gè)文本特征;第二處理模塊,用于根據(jù)預(yù)先訓(xùn)練的語(yǔ)義識(shí)別模型對(duì)所述文本特征進(jìn)行分類處理;獲取模塊,用于獲取與所述文本特征對(duì)應(yīng)的語(yǔ)義置信度;第一確定模塊,用于在所述語(yǔ)義置信度小于預(yù)設(shè)閾值時(shí),確定所述輸入信息不具有語(yǔ)義文本。
本發(fā)明實(shí)施例的基于人工智能的語(yǔ)義判定處理裝置,對(duì)待處理的輸入信息進(jìn)行切詞處理,提取一個(gè)或多個(gè)文本特征,并根據(jù)預(yù)先訓(xùn)練的語(yǔ)義識(shí)別模型對(duì)文本特征進(jìn)行分類處理,獲取與文本特征對(duì)應(yīng)的語(yǔ)義置信度,從而若語(yǔ)義置信度小于預(yù)設(shè)閾值,則確定輸入信息不具有語(yǔ)義文本。由此,根據(jù)待處理輸入信息的文本特征對(duì)待處理信息進(jìn)行處理,提高了語(yǔ)義識(shí)別的準(zhǔn)確率。
另外,本發(fā)明實(shí)施例的基于人工智能的語(yǔ)義判定處理裝置,還具有如下附加的技術(shù)特征:
在本發(fā)明的一個(gè)實(shí)施例中,所述第一確定模塊還用于:
在所述語(yǔ)義置信度大于等于預(yù)設(shè)閾值時(shí),確定所述輸入信息具有語(yǔ)義文本。
在本發(fā)明的一個(gè)實(shí)施例中,還包括:
匹配模塊,用于將所述輸入信息與預(yù)設(shè)的語(yǔ)義特征庫(kù)進(jìn)行匹配;
所述第一處理模塊,用于在所述輸入信息與預(yù)設(shè)的語(yǔ)義特征庫(kù)匹配失敗時(shí),對(duì)所述輸入信息進(jìn)行切詞處理。
在本發(fā)明的一個(gè)實(shí)施例中,還包括:
第二確定模塊,用于在所述輸入信息與預(yù)設(shè)的語(yǔ)義特征庫(kù)匹配成功時(shí),根據(jù)所述語(yǔ)義特征庫(kù)的類型確定所述輸入信息是否具有語(yǔ)義文本。
在本發(fā)明的一個(gè)實(shí)施例中,所述第二確定模塊用于:
若所述語(yǔ)義特征庫(kù)包含指令模板,在所述輸入信息與所述指令模板匹配成功時(shí),確定所述輸入信息包含語(yǔ)義文本;
若所述語(yǔ)義特征庫(kù)包含閑聊語(yǔ)料模板,在所述輸入信息與所述閑聊語(yǔ)料模板匹配成功時(shí),確定所述輸入信息包含無(wú)語(yǔ)義文本;
若所述語(yǔ)義特征庫(kù)包含無(wú)語(yǔ)義文本的黑名單信息,在所述輸入信息與所述黑名單信息匹配成功時(shí),確定所述輸入信息包含無(wú)語(yǔ)義文本;
若所述語(yǔ)義特征庫(kù)包含具有語(yǔ)義文本的白名單信息,在所述輸入信息與所述白名單信息匹配成功時(shí),確定所述輸入信息包含語(yǔ)義文本。
為了實(shí)現(xiàn)上述目的,本發(fā)明第三方面實(shí)施例提出了另一種基于人工智能的語(yǔ)義判定處理裝置,其特征在于,包括:
處理器;
用于存儲(chǔ)處理器可執(zhí)行指令的存儲(chǔ)器;
其中,所述處理器被配置為:
對(duì)待處理的輸入信息進(jìn)行切詞處理,提取一個(gè)或多個(gè)文本特征;
根據(jù)預(yù)先訓(xùn)練的語(yǔ)義識(shí)別模型對(duì)所述文本特征進(jìn)行分類處理,獲取與所述文本特征對(duì)應(yīng)的語(yǔ)義置信度;
若所述語(yǔ)義置信度小于預(yù)設(shè)閾值,則確定所述輸入信息不具有語(yǔ)義文本。
為了實(shí)現(xiàn)上述目的,本發(fā)明第四方面實(shí)施例提出了一種非臨時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),當(dāng)所述存儲(chǔ)介質(zhì)中的指令由移動(dòng)終端的處理器被執(zhí)行時(shí),使得移動(dòng)終端能夠執(zhí)行一種基于人工智能的語(yǔ)義判定處理方法,所述方法包括:
對(duì)待處理的輸入信息進(jìn)行切詞處理,提取一個(gè)或多個(gè)文本特征;
根據(jù)預(yù)先訓(xùn)練的語(yǔ)義識(shí)別模型對(duì)所述文本特征進(jìn)行分類處理,獲取與所述文本特征對(duì)應(yīng)的語(yǔ)義置信度;
若所述語(yǔ)義置信度小于預(yù)設(shè)閾值,則確定所述輸入信息不具有語(yǔ)義文本。
為了實(shí)現(xiàn)上述目的,本發(fā)明第五方面實(shí)施例提出了一種計(jì)算機(jī)程序產(chǎn)品,當(dāng)所述計(jì)算機(jī)程序產(chǎn)品中的指令處理器執(zhí)行時(shí),執(zhí)行一種基于人工智能的語(yǔ)義判定處理方法,所述方法包括:
對(duì)待處理的輸入信息進(jìn)行切詞處理,提取一個(gè)或多個(gè)文本特征;
根據(jù)預(yù)先訓(xùn)練的語(yǔ)義識(shí)別模型對(duì)所述文本特征進(jìn)行分類處理,獲取與所述文本特征對(duì)應(yīng)的語(yǔ)義置信度;
若所述語(yǔ)義置信度小于預(yù)設(shè)閾值,則確定所述輸入信息不具有語(yǔ)義文本。
本發(fā)明附加的方面和優(yōu)點(diǎn)將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過(guò)本發(fā)明的實(shí)踐了解到。
附圖說(shuō)明
本發(fā)明上述的和/或附加的方面和優(yōu)點(diǎn)從下面結(jié)合附圖對(duì)實(shí)施例的描述中將變得明顯和容易理解,其中:
圖1是根據(jù)本發(fā)明一個(gè)實(shí)施例的基于人工智能的語(yǔ)義判定處理方法的流程圖;
圖2是根據(jù)本發(fā)明另一個(gè)實(shí)施例的基于人工智能的語(yǔ)義判定處理方法的流程圖;
圖3是根據(jù)本發(fā)明一個(gè)實(shí)施例的基于人工智能的語(yǔ)義判定處理裝置的結(jié)構(gòu)示意圖;以及
圖4是根據(jù)本發(fā)明另一個(gè)實(shí)施例的基于人工智能的語(yǔ)義判定處理裝置的結(jié)構(gòu)示意圖。
具體實(shí)施方式
下面詳細(xì)描述本發(fā)明的實(shí)施例,所述實(shí)施例的示例在附圖中示出,其中自始至終相同或類似的標(biāo)號(hào)表示相同或類似的元件或具有相同或類似功能的元件。下面通過(guò)參考附圖描述的實(shí)施例是示例性的,旨在用于解釋本發(fā)明,而不能理解為對(duì)本發(fā)明的限制。
下面參考附圖描述本發(fā)明實(shí)施例的基于人工智能的語(yǔ)義判定處理方法和裝置。
通常,在很多應(yīng)用場(chǎng)景下,提供語(yǔ)義識(shí)別功能,比如,對(duì)于導(dǎo)航應(yīng)用程序,可通過(guò)語(yǔ)義識(shí)別的方式,識(shí)別用戶發(fā)出的語(yǔ)音“我想要去富國(guó)路”中的語(yǔ)義,以便于根據(jù)該語(yǔ)義轉(zhuǎn)換為需求指令“去富國(guó)路”,并提供到該目的地的導(dǎo)航服務(wù)等。
然而,由于相關(guān)技術(shù)中,語(yǔ)義識(shí)別的準(zhǔn)確率不高,比如無(wú)法有效區(qū)分指令文本和閑聊文本等,比如會(huì)將指令文本“下一個(gè)”、“三”等識(shí)別為無(wú)語(yǔ)義文本,從而不根據(jù)該指令文本進(jìn)行相應(yīng)的操作,影響用戶體驗(yàn)。
為了避免上述問題,提高語(yǔ)義識(shí)別的準(zhǔn)確率,本發(fā)明提出了一種基于人工智能的語(yǔ)義判定處理方法,具體如下:
圖1是根據(jù)本發(fā)明一個(gè)實(shí)施例的基于人工智能的語(yǔ)義判定處理方法的流程圖。
如圖1所示,該基于人工智能的語(yǔ)義判定處理方法可包括:
S101,對(duì)待處理的輸入信息進(jìn)行切詞處理,提取一個(gè)或多個(gè)文本特征。
具體地,為了避免待處理的輸入信息因?yàn)樘卣鞑幻鞔_,導(dǎo)致對(duì)待處理的輸入信息整體識(shí)別時(shí)差生誤判,比如,長(zhǎng)度較短的待處理的輸入信息,可能由于特征稀疏、主題不明確,而導(dǎo)致語(yǔ)義誤判,本發(fā)明實(shí)施例中,對(duì)待處理的輸入信息進(jìn)行切詞處理,根據(jù)切詞處理后的輸入信息進(jìn)行識(shí)別。
其中,待處理的輸入信息可包括文本信息、語(yǔ)音信息等,且當(dāng)待處理的輸入信息是語(yǔ)音信息等非文本信息時(shí),需要在對(duì)待處理的輸入信息進(jìn)行切詞處理之前,將非文本信息轉(zhuǎn)換為文本信息等。
其中,根據(jù)具體應(yīng)用需求的不同,可采用多種方式對(duì)待處理的輸入信息進(jìn)行切詞處理,舉例如下:
第一種示例,根據(jù)待處理的輸入信息的詞性,對(duì)待處理的輸入信息進(jìn)行切詞處理。
在本示例中,獲取待處理的輸入信息的詞性,即通過(guò)解析輸入信息中的名詞、動(dòng)詞、副詞、或,專有名詞等,對(duì)待處理的輸入信息進(jìn)行切詞處理。
舉例而言,對(duì)待處理的輸入信息“請(qǐng)幫我翻到下一頁(yè)”,根據(jù)詞性進(jìn)行切詞處理后,識(shí)別“請(qǐng)”、“幫”、“翻到”為動(dòng)詞,“我”為代詞,“下一頁(yè)”為方位詞等,從而獲得的切詞處理結(jié)果是“請(qǐng)”、“幫”、“我”、“翻到”、“下一頁(yè)”。
第二種示例,根據(jù)復(fù)試切詞的方式,對(duì)待處理的輸入信息進(jìn)行切詞處理。
在本示例中,舉例而言,可采用一元二元混合切詞的方式,對(duì)待處理的輸入信息進(jìn)行切詞處理,比如,將待處理的輸入信息“聯(lián)合國(guó)教科文組織”進(jìn)行一元二元混合切詞處理,獲得的處理結(jié)果為“聯(lián)”、“聯(lián)合”、“合”、“合國(guó)”、“國(guó)”、“國(guó)教”、“教”、“教科”、“科”、“科文”、“文”、“文組”、“組”、“組織”。
第三種示例,通過(guò)識(shí)別待處理的輸入信息中的特征詞,對(duì)待處理的輸入信息進(jìn)行切詞處理。其中,特征詞為與待處理的輸入信息,表達(dá)的主題思想相關(guān)的詞,比如可以為專有實(shí)體名詞等。
舉例而言,將待處理的輸入信息“聯(lián)合國(guó)教科文組織”進(jìn)行一元二元混合切詞處理,獲得的處理結(jié)果為“聯(lián)合國(guó)”、“教科文”、“組織”。
應(yīng)當(dāng)理解的是,在上述切詞處理過(guò)程中,還可綜合考慮鄰近詞的關(guān)聯(lián)度,以根據(jù)關(guān)聯(lián)度以及詞本身的權(quán)重等,丟棄掉一些與待處理的輸入信息,表達(dá)的主題無(wú)關(guān)的詞。
進(jìn)而,對(duì)待處理的輸入信息進(jìn)行切詞處理后,采用TFIDF算法等提取一個(gè)或多個(gè)文本特征,其中,文本特征包括待處理信息切詞處理后,得到的特征詞及其權(quán)重,關(guān)鍵詞及其摘要,抽取的特定信息等。
其中,權(quán)重是針對(duì)某一個(gè)指標(biāo)而言的,某一個(gè)指標(biāo)的權(quán)重是指該指標(biāo)在整體評(píng)價(jià)中的相對(duì)重要程度,比如,某一個(gè)特征詞的詞頻的權(quán)重,指的是其在分類評(píng)價(jià)中的相對(duì)重要程度。
S102,根據(jù)預(yù)先訓(xùn)練的語(yǔ)義識(shí)別模型對(duì)文本特征進(jìn)行分類處理,獲取與文本特征對(duì)應(yīng)的語(yǔ)義置信度。
具體地,預(yù)先根據(jù)大量具有語(yǔ)義的語(yǔ)料訓(xùn)練語(yǔ)義識(shí)別模型,從而根據(jù)預(yù)先訓(xùn)練的語(yǔ)義識(shí)別模型對(duì)文本驗(yàn)證進(jìn)行分析,以根據(jù)分析結(jié)果對(duì)文本特征進(jìn)行分類處理,以確定待處理文本屬于哪種語(yǔ)義。
比如,預(yù)先訓(xùn)練的語(yǔ)義識(shí)別模型,如果根據(jù)關(guān)鍵詞進(jìn)行分類處理,則根據(jù)文本特征中的關(guān)鍵詞A1,與預(yù)先訓(xùn)練后的識(shí)別模型中A分類關(guān)鍵詞A2的匹配度較高,則確定該待處理的輸入信息為A類。
又比如,預(yù)先訓(xùn)練的語(yǔ)義識(shí)別模型,如果根據(jù)特征詞及其權(quán)重進(jìn)行分類處理,則對(duì)文本特征中的特征詞的詞頻等計(jì)算權(quán)重,進(jìn)而對(duì)特征詞的權(quán)重值進(jìn)行加權(quán)處理,預(yù)先訓(xùn)練的語(yǔ)義識(shí)別模型獲得的處理值,判斷該處理值接近于那一分類以得到分類結(jié)果。
然而,應(yīng)當(dāng)理解的是,預(yù)先訓(xùn)練的語(yǔ)義識(shí)別模型的并不保證完全分類正確,當(dāng)待處理的輸入信息是無(wú)語(yǔ)義文本時(shí),可能會(huì)將其識(shí)別為有語(yǔ)義文本,因而,還可根據(jù)預(yù)先訓(xùn)練的語(yǔ)義識(shí)別模型的準(zhǔn)確率,獲取與文本特征對(duì)應(yīng)的語(yǔ)義置信度,以便于根據(jù)語(yǔ)義置信度,判斷該待處理文本的分類處理結(jié)果是否可信等。
其中,根據(jù)具體應(yīng)用場(chǎng)景的不同,語(yǔ)義置信度的表示方式可有多種,比如可以百分比的形式表示,或以分?jǐn)?shù)的形式表示,或以等級(jí)的形式表示,或以文字表述的方式進(jìn)行表示等。
比如,預(yù)先訓(xùn)練的語(yǔ)義識(shí)別模型的準(zhǔn)確率為80%,則獲取與文本特征對(duì)應(yīng)的語(yǔ)義置信度為80%等,從而判斷該分類處理結(jié)果可信度較高。
S103,若語(yǔ)義置信度小于預(yù)設(shè)閾值,則確定輸入信息不具有語(yǔ)義文本。
具體地,為了判斷該待處理文本的分類處理結(jié)果的準(zhǔn)確率,預(yù)先設(shè)置針對(duì)語(yǔ)義置信度的閾值。
當(dāng)語(yǔ)義置信度小于預(yù)設(shè)閾值時(shí),則表明雖然預(yù)先訓(xùn)練的語(yǔ)義識(shí)別模型對(duì)所述文本特征進(jìn)行分類處理后,將該待處理文本分為某一類具有語(yǔ)義的文本,但分類的準(zhǔn)確率不高,因而確定輸入信息不具有語(yǔ)義文本。
在本發(fā)明的另一個(gè)實(shí)施例中,若語(yǔ)義置信度大于等于預(yù)設(shè)閾值,則表明預(yù)先訓(xùn)練的語(yǔ)義識(shí)別模型對(duì)文本特征進(jìn)行分類處理的處理結(jié)果,可信度較高,因而確定輸入信息具有語(yǔ)義文本。
綜上所述,本發(fā)明實(shí)施例的基于人工智能的語(yǔ)義判定處理方法,對(duì)待處理的輸入信息進(jìn)行切詞處理,提取一個(gè)或多個(gè)文本特征,并根據(jù)預(yù)先訓(xùn)練的語(yǔ)義識(shí)別模型對(duì)文本特征進(jìn)行分類處理,獲取與文本特征對(duì)應(yīng)的語(yǔ)義置信度,從而若語(yǔ)義置信度小于預(yù)設(shè)閾值,則確定輸入信息不具有語(yǔ)義文本。由此,根據(jù)待處理輸入信息的文本特征對(duì)待處理信息進(jìn)行處理,提高了語(yǔ)義識(shí)別的準(zhǔn)確率。
基于以上實(shí)施例,應(yīng)當(dāng)理解的是,為了進(jìn)一步提高語(yǔ)義判定處理的效率,還可在對(duì)待處理的輸入信息進(jìn)行文本特征提取之前,對(duì)待處理的輸入信息進(jìn)行簡(jiǎn)單的預(yù)識(shí)別,只有當(dāng)識(shí)別不出待處理的輸入信息是否為語(yǔ)義文本后,才實(shí)施上述語(yǔ)義判定處理的步驟。具體說(shuō)明如下:
圖2是根據(jù)本發(fā)明另一個(gè)實(shí)施例的基于人工智能的語(yǔ)義判定處理方法的流程圖,如圖2所示,在上述步驟S101之前,該基于人工智能的語(yǔ)義判定處理方法包括:
S201,將輸入信息與預(yù)設(shè)的語(yǔ)義特征庫(kù)進(jìn)行匹配。
具體地,預(yù)先設(shè)置語(yǔ)義特征庫(kù),該語(yǔ)義特征庫(kù)中包括不具有語(yǔ)義的信息,或者具有語(yǔ)義的信息,從而將輸入信息與預(yù)設(shè)的語(yǔ)義特征庫(kù)進(jìn)行匹配,根據(jù)匹配情況,確定輸入信息是否具有語(yǔ)義。
S202,如果輸入信息與預(yù)設(shè)的語(yǔ)義特征庫(kù)匹配失敗,則對(duì)輸入信息進(jìn)行切詞處理。
具體地,如果輸入信息與預(yù)設(shè)的語(yǔ)義特征庫(kù)匹配失敗,則表明輸入信息與預(yù)設(shè)的語(yǔ)義特征庫(kù)中的具有語(yǔ)義的信息不匹配,同時(shí),輸入信息與預(yù)設(shè)的語(yǔ)義特征庫(kù)中的不具有語(yǔ)義的信息也不匹配,因而,無(wú)法準(zhǔn)確確定輸入信息是否具有語(yǔ)義,從而對(duì)輸入信息進(jìn)行切詞處理。
進(jìn)而,進(jìn)入上述步驟S101,通過(guò)提取待處理的輸入信息的文本特征的方法,進(jìn)一步根據(jù)待處理的輸入信息的文本特征,確定待處理的輸入信息是否具有語(yǔ)義。
也就是說(shuō),可綜合使用語(yǔ)義特征庫(kù)與待處理的輸入信息的文本特征,對(duì)待處理的輸入信息進(jìn)行語(yǔ)義識(shí)別,提高了語(yǔ)義識(shí)別準(zhǔn)確度。
S203,如果輸入信息與預(yù)設(shè)的語(yǔ)義特征庫(kù)匹配成功,根據(jù)語(yǔ)義特征庫(kù)的類型確定輸入信息是否具有語(yǔ)義文本。
具體地,由于語(yǔ)義特征庫(kù)中可能既包括不具有語(yǔ)義的信息,又包括具有語(yǔ)義的信息,因而,如果輸入信息與預(yù)設(shè)的語(yǔ)義特征庫(kù)匹配成功,根據(jù)語(yǔ)義特征庫(kù)的類型確定輸入信息是否具有語(yǔ)義文本。
下面結(jié)合具體的應(yīng)用場(chǎng)景,詳細(xì)說(shuō)明如何根據(jù)語(yǔ)義特征庫(kù)的類型,確定輸入信息是否具有語(yǔ)義文本,說(shuō)明如下:
第一種示例,若語(yǔ)義特征庫(kù)包含指令模板,則如果輸入信息與指令模板匹配成功,則確定輸入信息為包含語(yǔ)義文本。
其中,指令模板可包括對(duì)應(yīng)用程序的具體操作指令等,比如針對(duì)導(dǎo)航應(yīng)用程序的導(dǎo)航操作指令,針對(duì)小說(shuō)閱讀應(yīng)用程序的閱讀指令等。
在本示例中,如果輸入信息與指令模板匹配值超過(guò)一定值,則認(rèn)為輸入信息與指令模板匹配成功,從而確定輸入信息為包含語(yǔ)義文本。
舉例而言,將輸入信息“幫我翻頁(yè)到下一章節(jié)”與指令模板“指令模板匹配值”匹配,得到匹配值較高,則認(rèn)為輸入信息與指令模板匹配成功,從而確定輸入信息為包含語(yǔ)義文本。
第二種示例,若語(yǔ)義特征庫(kù)包含閑聊語(yǔ)料模板,如果輸入信息與閑聊語(yǔ)料模板匹配成功,則確定輸入信息包含無(wú)語(yǔ)義文本。
其中,閑聊語(yǔ)料模板中包括日常生活中,聊天常用的語(yǔ)氣助詞,擬聲詞等不包含明確語(yǔ)義的詞。
在本示例中,如果輸入信息與閑聊語(yǔ)料模板匹配值超過(guò)一定值,則認(rèn)為輸入信息與閑聊語(yǔ)料模板匹配成功,從而確定輸入信息為包含無(wú)語(yǔ)義文本。
舉例而言,將輸入信息“你好呀,哈哈哈”與閑聊語(yǔ)料模板“你好,哈哈”匹配,得到匹配值較高,則認(rèn)為輸入信息與閑聊語(yǔ)料模板匹配成功,從而確定輸入信息為包含無(wú)語(yǔ)義文本。
第三種示例,若語(yǔ)義特征庫(kù)包含無(wú)語(yǔ)義文本的黑名單信息,如果輸入信息與黑名單信息匹配成功,則確定輸入信息包含無(wú)語(yǔ)義文本。
其中,上述黑名單信息中包含大量的無(wú)語(yǔ)義文本,比如包含擬聲詞,語(yǔ)氣助詞等。
在本示例中,如果輸入信息與黑名單匹配值超過(guò)一定值,則認(rèn)為輸入信息與黑名單信息匹配成功,從而確定輸入信息為包含無(wú)語(yǔ)義文本。
舉例而言,將輸入信息“你好呀,哈哈哈”與黑名單信息“你好,哈哈”匹配,得到匹配值較高,則認(rèn)為輸入信息與黑名單信息匹配成功,從而確定輸入信息為包含無(wú)語(yǔ)義文本。
第四種示例,若語(yǔ)義特征庫(kù)包含具有語(yǔ)義文本的白名單信息,如果輸入信息與白名單信息匹配成功,則確定輸入信息包含語(yǔ)義文本。
其中,上述白名單信息中包含大量的語(yǔ)義文本,比如包含實(shí)體詞,指令詞等。
在本示例中,如果輸入信息與白名單匹配值超過(guò)一定值,則認(rèn)為輸入信息與白名單信息匹配成功,從而確定輸入信息為包含語(yǔ)義文本。
舉例而言,將輸入信息“請(qǐng)告訴我蘋果的藥用功效”與白名單信息“蘋果的藥用功效”匹配,得到匹配值較高,則認(rèn)為輸入信息與白名單信息匹配成功,從而確定輸入信息為包含語(yǔ)義文本。
綜上所述,本發(fā)明實(shí)施例的基于人工智能的語(yǔ)義判定處理方法,在根據(jù)待處理的輸入信息的文本特征,對(duì)待處理信息進(jìn)行語(yǔ)義識(shí)別之前,通過(guò)預(yù)設(shè)的語(yǔ)義特征庫(kù)與輸入信息進(jìn)行匹配,并根據(jù)匹配結(jié)果確定輸入信息是否具有語(yǔ)義,只有在無(wú)法識(shí)別輸入信息是否具有語(yǔ)義時(shí),才根據(jù)待處理的輸入信息的文本特征,對(duì)待處理信息進(jìn)行語(yǔ)義識(shí)別,進(jìn)一步提高了語(yǔ)義識(shí)別的效率。
為實(shí)現(xiàn)上述目的,本發(fā)明還提出一種基于人工智能的語(yǔ)義判定處理裝置。
圖3是根據(jù)本發(fā)明一個(gè)實(shí)施例的基于人工智能的語(yǔ)義判定處理裝置的結(jié)構(gòu)示意圖。
如圖3所示,該基于人工智能的語(yǔ)義判定處理裝置可包括:第一處理模塊10、提取模塊20、第二處理模塊30、獲取模塊40和第一確定模塊50。
其中,第一處理模塊10,用于對(duì)待處理的輸入信息進(jìn)行切詞處理。
提取模塊20,用于提取一個(gè)或多個(gè)文本特征。
第二處理模塊30,用于根據(jù)預(yù)先訓(xùn)練的語(yǔ)義識(shí)別模型對(duì)文本特征進(jìn)行分類處理。
獲取模塊40,用于獲取與文本特征對(duì)應(yīng)的語(yǔ)義置信度。
第一確定模塊50,用于在語(yǔ)義置信度小于預(yù)設(shè)閾值時(shí),確定輸入信息不具有語(yǔ)義文本。
在本發(fā)明的一個(gè)實(shí)施例中,第一確定模塊50還用于在語(yǔ)義置信度大于等于預(yù)設(shè)閾值時(shí),確定輸入信息具有語(yǔ)義文本。
需要說(shuō)明的是,前述對(duì)基于人工智能的語(yǔ)義判定處理方法的解釋說(shuō)明,也適用于本發(fā)明實(shí)施例的基于人工智能的語(yǔ)義判定處理裝置,本發(fā)明基于人工智能的語(yǔ)義判定處理裝置中未披露的細(xì)節(jié),在此不再贅述。
綜上所述,本發(fā)明實(shí)施例的基于人工智能的語(yǔ)義判定處理裝置,對(duì)待處理的輸入信息進(jìn)行切詞處理,提取一個(gè)或多個(gè)文本特征,并根據(jù)預(yù)先訓(xùn)練的語(yǔ)義識(shí)別模型對(duì)文本特征進(jìn)行分類處理,獲取與文本特征對(duì)應(yīng)的語(yǔ)義置信度,從而若語(yǔ)義置信度小于預(yù)設(shè)閾值,則確定輸入信息不具有語(yǔ)義文本。由此,根據(jù)待處理輸入信息的文本特征對(duì)待處理信息進(jìn)行處理,提高了語(yǔ)義識(shí)別的準(zhǔn)確率。
圖4是根據(jù)本發(fā)明另一個(gè)實(shí)施例的基于人工智能的語(yǔ)義判定處理裝置的結(jié)構(gòu)示意圖,如圖4所示,在如圖3所示的基礎(chǔ)上,基于人工智能的語(yǔ)義判定處理裝置還包括:匹配模塊60和第二確定模塊70。
其中,匹配模塊60,用于將輸入信息與預(yù)設(shè)的語(yǔ)義特征庫(kù)進(jìn)行匹配。
在本發(fā)明的實(shí)施例中,第一處理模塊10,用于在輸入信息與預(yù)設(shè)的語(yǔ)義特征庫(kù)匹配失敗時(shí),對(duì)輸入信息進(jìn)行切詞處理。
第二確定模塊70,用于在輸入信息與預(yù)設(shè)的語(yǔ)義特征庫(kù)匹配成功時(shí),根據(jù)語(yǔ)義特征庫(kù)的類型確定輸入信息是否具有語(yǔ)義文本。
在本發(fā)明的一個(gè)實(shí)施例中,若語(yǔ)義特征庫(kù)包含指令模板,在輸入信息與指令模板匹配成功時(shí),第二確定模塊70確定輸入信息包含語(yǔ)義文本。
在本發(fā)明的一個(gè)實(shí)施例中,若語(yǔ)義特征庫(kù)包含閑聊語(yǔ)料模板,在輸入信息與閑聊語(yǔ)料模板匹配成功時(shí),第二確定模塊70確定輸入信息包含無(wú)語(yǔ)義文本。
在本發(fā)明的一個(gè)實(shí)施例中,若語(yǔ)義特征庫(kù)包含無(wú)語(yǔ)義文本的黑名單信息,在輸入信息與黑名單信息匹配成功時(shí),第二確定模塊70確定輸入信息包含無(wú)語(yǔ)義文本。
在本發(fā)明的一個(gè)實(shí)施例中,若語(yǔ)義特征庫(kù)包含具有語(yǔ)義文本的白名單信息,在輸入信息與白名單信息匹配成功時(shí),第二確定模塊70確定輸入信息包含語(yǔ)義文本。
需要說(shuō)明的是,前述對(duì)基于人工智能的語(yǔ)義判定處理方法的解釋說(shuō)明,也適用于本發(fā)明實(shí)施例的基于人工智能的語(yǔ)義判定處理裝置,本發(fā)明基于人工智能的語(yǔ)義判定處理裝置中未披露的細(xì)節(jié),在此不再贅述。
綜上所述,本發(fā)明實(shí)施例的基于人工智能的語(yǔ)義判定處理裝置,在根據(jù)待處理的輸入信息的文本特征,對(duì)待處理信息進(jìn)行語(yǔ)義識(shí)別之前,通過(guò)預(yù)設(shè)的語(yǔ)義特征庫(kù)與輸入信息進(jìn)行匹配,并根據(jù)匹配結(jié)果確定輸入信息是否具有語(yǔ)義,只有在無(wú)法識(shí)別輸入信息是否具有語(yǔ)義時(shí),才根據(jù)待處理的輸入信息的文本特征,對(duì)待處理信息進(jìn)行語(yǔ)義識(shí)別,進(jìn)一步提高了語(yǔ)義識(shí)別的效率。
在本說(shuō)明書的描述中,參考術(shù)語(yǔ)“一個(gè)實(shí)施例”、“一些實(shí)施例”、“示例”、“具體示例”、或“一些示例”等的描述意指結(jié)合該實(shí)施例或示例描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)包含于本發(fā)明的至少一個(gè)實(shí)施例或示例中。在本說(shuō)明書中,對(duì)上述術(shù)語(yǔ)的示意性表述不必須針對(duì)的是相同的實(shí)施例或示例。而且,描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)可以在任一個(gè)或多個(gè)實(shí)施例或示例中以合適的方式結(jié)合。此外,在不相互矛盾的情況下,本領(lǐng)域的技術(shù)人員可以將本說(shuō)明書中描述的不同實(shí)施例或示例以及不同實(shí)施例或示例的特征進(jìn)行結(jié)合和組合。
盡管上面已經(jīng)示出和描述了本發(fā)明的實(shí)施例,可以理解的是,上述實(shí)施例是示例性的,不能理解為對(duì)本發(fā)明的限制,本領(lǐng)域的普通技術(shù)人員在本發(fā)明的范圍內(nèi)可以對(duì)上述實(shí)施例進(jìn)行變化、修改、替換和變型。