基于人工智能的語(yǔ)義判定處理方法和裝置與流程

文檔序號(hào)：12121498閱讀：582來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

本發(fā)明涉及信息處理技術(shù)領(lǐng)域，尤其涉及一種基于人工智能的語(yǔ)義判定處理方法和裝置。

背景技術(shù)：

人工智能(Artificial Intelligence)，英文縮寫為AI。它是研究、開發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué)。人工智能是計(jì)算機(jī)科學(xué)的一個(gè)分支，它企圖了解智能的實(shí)質(zhì)，并生產(chǎn)出一種新的能以人類智能相似的方式做出反應(yīng)的智能機(jī)器，該領(lǐng)域的研究包括機(jī)器人、語(yǔ)言識(shí)別、圖像識(shí)別、自然語(yǔ)言處理和專家系統(tǒng)等。

隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展，語(yǔ)義識(shí)別越來(lái)越廣泛的被應(yīng)用于各個(gè)應(yīng)用場(chǎng)景中，比如，在導(dǎo)航應(yīng)用程序中，可通過(guò)對(duì)用戶輸入的語(yǔ)音進(jìn)行語(yǔ)義識(shí)別，以為用戶提供導(dǎo)航服務(wù)等。

其中，在對(duì)待解析的文本等信息進(jìn)行語(yǔ)義識(shí)別時(shí)，為了提高識(shí)別效率，將不具有語(yǔ)義的信息單獨(dú)處理，對(duì)包含明確的信息進(jìn)行語(yǔ)義解析處理。

然而相關(guān)技術(shù)中，在對(duì)待解析的文本等信息進(jìn)行語(yǔ)義識(shí)別時(shí)，可能會(huì)產(chǎn)生誤判，比如會(huì)將一些指令型文本誤判為無(wú)語(yǔ)義文本等，語(yǔ)義判定不準(zhǔn)確。

技術(shù)實(shí)現(xiàn)要素：

本發(fā)明的目的旨在至少在一定程度上解決上述的技術(shù)問題之一。

為此，本發(fā)明的第一個(gè)目的在于提出一種基于人工智能的語(yǔ)義判定處理方法，該方法根據(jù)待處理輸入信息的文本特征對(duì)待處理信息進(jìn)行處理，提高了語(yǔ)義識(shí)別的準(zhǔn)確率。

本發(fā)明的第二個(gè)目的在于提出一種基于人工智能的語(yǔ)義判定處理裝置。

本發(fā)明的第三個(gè)目的在于提出另一種基于人工智能的語(yǔ)義判定處理裝置。

本發(fā)明的第四個(gè)目的在于提出一種非臨時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。

本發(fā)明的第五個(gè)目的在于提出一種計(jì)算機(jī)程序產(chǎn)品。

為了實(shí)現(xiàn)上述目的，本發(fā)明第一方面實(shí)施例提出了一種基于人工智能的語(yǔ)義判定處理方法，包括以下步驟：對(duì)待處理的輸入信息進(jìn)行切詞處理，提取一個(gè)或多個(gè)文本特征；根據(jù)預(yù)先訓(xùn)練的語(yǔ)義識(shí)別模型對(duì)所述文本特征進(jìn)行分類處理，獲取與所述文本特征對(duì)應(yīng)的語(yǔ)義置信度；若所述語(yǔ)義置信度小于預(yù)設(shè)閾值，則確定所述輸入信息不具有語(yǔ)義文本。

本發(fā)明實(shí)施例的基于人工智能的語(yǔ)義判定處理方法，對(duì)待處理的輸入信息進(jìn)行切詞處理，提取一個(gè)或多個(gè)文本特征，并根據(jù)預(yù)先訓(xùn)練的語(yǔ)義識(shí)別模型對(duì)文本特征進(jìn)行分類處理，獲取與文本特征對(duì)應(yīng)的語(yǔ)義置信度，從而若語(yǔ)義置信度小于預(yù)設(shè)閾值，則確定輸入信息不具有語(yǔ)義文本。由此，根據(jù)待處理輸入信息的文本特征對(duì)待處理信息進(jìn)行處理，提高了語(yǔ)義識(shí)別的準(zhǔn)確率。

另外，本發(fā)明實(shí)施例的基于人工智能的語(yǔ)義判定處理方法，還具有如下附加的技術(shù)特征：

在本發(fā)明的一個(gè)實(shí)施例中，還包括：

若所述語(yǔ)義置信度大于等于預(yù)設(shè)閾值，則確定所述輸入信息具有語(yǔ)義文本。

在本發(fā)明的一個(gè)實(shí)施例中，在所述對(duì)待處理的輸入信息進(jìn)行切詞處理，提取一個(gè)或多個(gè)文本特征之前，還包括：

將所述輸入信息與預(yù)設(shè)的語(yǔ)義特征庫(kù)進(jìn)行匹配；

如果所述輸入信息與預(yù)設(shè)的語(yǔ)義特征庫(kù)匹配失敗，則對(duì)所述輸入信息進(jìn)行切詞處理。

在本發(fā)明的一個(gè)實(shí)施例中，在所述將所述輸入信息與預(yù)設(shè)的語(yǔ)義特征庫(kù)進(jìn)行匹配之后，還包括：如果所述輸入信息與預(yù)設(shè)的語(yǔ)義特征庫(kù)匹配成功，根據(jù)所述語(yǔ)義特征庫(kù)的類型確定所述輸入信息是否具有語(yǔ)義文本。

在本發(fā)明的一個(gè)實(shí)施例中，所述如果所述輸入信息與預(yù)設(shè)的語(yǔ)義特征庫(kù)匹配成功，根據(jù)所述語(yǔ)義特征庫(kù)的類型確定所述輸入信息是否具有語(yǔ)義文本，包括以下至少之一：

若所述語(yǔ)義特征庫(kù)包含指令模板，如果所述輸入信息與所述指令模板匹配成功，則確定所述輸入信息包含語(yǔ)義文本；

若所述語(yǔ)義特征庫(kù)包含閑聊語(yǔ)料模板，如果所述輸入信息與所述閑聊語(yǔ)料模板匹配成功，則確定所述輸入信息包含無(wú)語(yǔ)義文本；

若所述語(yǔ)義特征庫(kù)包含無(wú)語(yǔ)義文本的黑名單信息，如果所述輸入信息與所述黑名單信息匹配成功，則確定所述輸入信息包含無(wú)語(yǔ)義文本；

若所述語(yǔ)義特征庫(kù)包含具有語(yǔ)義文本的白名單信息，如果所述輸入信息與所述白名單信息匹配成功，則確定所述輸入信息包含語(yǔ)義文本。

為了實(shí)現(xiàn)上述目的，本發(fā)明第二方面實(shí)施例提出了一種基于人工智能的語(yǔ)義判定處理裝置，包括：第一處理模塊，用于對(duì)待處理的輸入信息進(jìn)行切詞處理；提取模塊，用于提取一個(gè)或多個(gè)文本特征；第二處理模塊，用于根據(jù)預(yù)先訓(xùn)練的語(yǔ)義識(shí)別模型對(duì)所述文本特征進(jìn)行分類處理；獲取模塊，用于獲取與所述文本特征對(duì)應(yīng)的語(yǔ)義置信度；第一確定模塊，用于在所述語(yǔ)義置信度小于預(yù)設(shè)閾值時(shí)，確定所述輸入信息不具有語(yǔ)義文本。

本發(fā)明實(shí)施例的基于人工智能的語(yǔ)義判定處理裝置，對(duì)待處理的輸入信息進(jìn)行切詞處理，提取一個(gè)或多個(gè)文本特征，并根據(jù)預(yù)先訓(xùn)練的語(yǔ)義識(shí)別模型對(duì)文本特征進(jìn)行分類處理，獲取與文本特征對(duì)應(yīng)的語(yǔ)義置信度，從而若語(yǔ)義置信度小于預(yù)設(shè)閾值，則確定輸入信息不具有語(yǔ)義文本。由此，根據(jù)待處理輸入信息的文本特征對(duì)待處理信息進(jìn)行處理，提高了語(yǔ)義識(shí)別的準(zhǔn)確率。

另外，本發(fā)明實(shí)施例的基于人工智能的語(yǔ)義判定處理裝置，還具有如下附加的技術(shù)特征：

在本發(fā)明的一個(gè)實(shí)施例中，所述第一確定模塊還用于：

在所述語(yǔ)義置信度大于等于預(yù)設(shè)閾值時(shí)，確定所述輸入信息具有語(yǔ)義文本。

在本發(fā)明的一個(gè)實(shí)施例中，還包括：

匹配模塊，用于將所述輸入信息與預(yù)設(shè)的語(yǔ)義特征庫(kù)進(jìn)行匹配；

所述第一處理模塊，用于在所述輸入信息與預(yù)設(shè)的語(yǔ)義特征庫(kù)匹配失敗時(shí)，對(duì)所述輸入信息進(jìn)行切詞處理。

在本發(fā)明的一個(gè)實(shí)施例中，還包括：

第二確定模塊，用于在所述輸入信息與預(yù)設(shè)的語(yǔ)義特征庫(kù)匹配成功時(shí)，根據(jù)所述語(yǔ)義特征庫(kù)的類型確定所述輸入信息是否具有語(yǔ)義文本。

在本發(fā)明的一個(gè)實(shí)施例中，所述第二確定模塊用于：

若所述語(yǔ)義特征庫(kù)包含指令模板，在所述輸入信息與所述指令模板匹配成功時(shí)，確定所述輸入信息包含語(yǔ)義文本；

若所述語(yǔ)義特征庫(kù)包含閑聊語(yǔ)料模板，在所述輸入信息與所述閑聊語(yǔ)料模板匹配成功時(shí)，確定所述輸入信息包含無(wú)語(yǔ)義文本；

若所述語(yǔ)義特征庫(kù)包含無(wú)語(yǔ)義文本的黑名單信息，在所述輸入信息與所述黑名單信息匹配成功時(shí)，確定所述輸入信息包含無(wú)語(yǔ)義文本；

若所述語(yǔ)義特征庫(kù)包含具有語(yǔ)義文本的白名單信息，在所述輸入信息與所述白名單信息匹配成功時(shí)，確定所述輸入信息包含語(yǔ)義文本。

為了實(shí)現(xiàn)上述目的，本發(fā)明第三方面實(shí)施例提出了另一種基于人工智能的語(yǔ)義判定處理裝置，其特征在于，包括：

處理器；

用于存儲(chǔ)處理器可執(zhí)行指令的存儲(chǔ)器；

其中，所述處理器被配置為：

對(duì)待處理的輸入信息進(jìn)行切詞處理，提取一個(gè)或多個(gè)文本特征；

根據(jù)預(yù)先訓(xùn)練的語(yǔ)義識(shí)別模型對(duì)所述文本特征進(jìn)行分類處理，獲取與所述文本特征對(duì)應(yīng)的語(yǔ)義置信度；

若所述語(yǔ)義置信度小于預(yù)設(shè)閾值，則確定所述輸入信息不具有語(yǔ)義文本。

為了實(shí)現(xiàn)上述目的，本發(fā)明第四方面實(shí)施例提出了一種非臨時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)，當(dāng)所述存儲(chǔ)介質(zhì)中的指令由移動(dòng)終端的處理器被執(zhí)行時(shí)，使得移動(dòng)終端能夠執(zhí)行一種基于人工智能的語(yǔ)義判定處理方法，所述方法包括：

對(duì)待處理的輸入信息進(jìn)行切詞處理，提取一個(gè)或多個(gè)文本特征；

根據(jù)預(yù)先訓(xùn)練的語(yǔ)義識(shí)別模型對(duì)所述文本特征進(jìn)行分類處理，獲取與所述文本特征對(duì)應(yīng)的語(yǔ)義置信度；

若所述語(yǔ)義置信度小于預(yù)設(shè)閾值，則確定所述輸入信息不具有語(yǔ)義文本。

為了實(shí)現(xiàn)上述目的，本發(fā)明第五方面實(shí)施例提出了一種計(jì)算機(jī)程序產(chǎn)品，當(dāng)所述計(jì)算機(jī)程序產(chǎn)品中的指令處理器執(zhí)行時(shí)，執(zhí)行一種基于人工智能的語(yǔ)義判定處理方法，所述方法包括：

對(duì)待處理的輸入信息進(jìn)行切詞處理，提取一個(gè)或多個(gè)文本特征；

根據(jù)預(yù)先訓(xùn)練的語(yǔ)義識(shí)別模型對(duì)所述文本特征進(jìn)行分類處理，獲取與所述文本特征對(duì)應(yīng)的語(yǔ)義置信度；

若所述語(yǔ)義置信度小于預(yù)設(shè)閾值，則確定所述輸入信息不具有語(yǔ)義文本。

本發(fā)明附加的方面和優(yōu)點(diǎn)將在下面的描述中部分給出，部分將從下面的描述中變得明顯，或通過(guò)本發(fā)明的實(shí)踐了解到。

附圖說(shuō)明

本發(fā)明上述的和/或附加的方面和優(yōu)點(diǎn)從下面結(jié)合附圖對(duì)實(shí)施例的描述中將變得明顯和容易理解，其中：

圖1是根據(jù)本發(fā)明一個(gè)實(shí)施例的基于人工智能的語(yǔ)義判定處理方法的流程圖；

圖2是根據(jù)本發(fā)明另一個(gè)實(shí)施例的基于人工智能的語(yǔ)義判定處理方法的流程圖；

圖3是根據(jù)本發(fā)明一個(gè)實(shí)施例的基于人工智能的語(yǔ)義判定處理裝置的結(jié)構(gòu)示意圖；以及

圖4是根據(jù)本發(fā)明另一個(gè)實(shí)施例的基于人工智能的語(yǔ)義判定處理裝置的結(jié)構(gòu)示意圖。

具體實(shí)施方式

下面詳細(xì)描述本發(fā)明的實(shí)施例，所述實(shí)施例的示例在附圖中示出，其中自始至終相同或類似的標(biāo)號(hào)表示相同或類似的元件或具有相同或類似功能的元件。下面通過(guò)參考附圖描述的實(shí)施例是示例性的，旨在用于解釋本發(fā)明，而不能理解為對(duì)本發(fā)明的限制。

下面參考附圖描述本發(fā)明實(shí)施例的基于人工智能的語(yǔ)義判定處理方法和裝置。

通常，在很多應(yīng)用場(chǎng)景下，提供語(yǔ)義識(shí)別功能，比如，對(duì)于導(dǎo)航應(yīng)用程序，可通過(guò)語(yǔ)義識(shí)別的方式，識(shí)別用戶發(fā)出的語(yǔ)音“我想要去富國(guó)路”中的語(yǔ)義，以便于根據(jù)該語(yǔ)義轉(zhuǎn)換為需求指令“去富國(guó)路”，并提供到該目的地的導(dǎo)航服務(wù)等。

然而，由于相關(guān)技術(shù)中，語(yǔ)義識(shí)別的準(zhǔn)確率不高，比如無(wú)法有效區(qū)分指令文本和閑聊文本等，比如會(huì)將指令文本“下一個(gè)”、“三”等識(shí)別為無(wú)語(yǔ)義文本，從而不根據(jù)該指令文本進(jìn)行相應(yīng)的操作，影響用戶體驗(yàn)。

為了避免上述問題，提高語(yǔ)義識(shí)別的準(zhǔn)確率，本發(fā)明提出了一種基于人工智能的語(yǔ)義判定處理方法，具體如下：

圖1是根據(jù)本發(fā)明一個(gè)實(shí)施例的基于人工智能的語(yǔ)義判定處理方法的流程圖。

如圖1所示，該基于人工智能的語(yǔ)義判定處理方法可包括：

S101，對(duì)待處理的輸入信息進(jìn)行切詞處理，提取一個(gè)或多個(gè)文本特征。

具體地，為了避免待處理的輸入信息因?yàn)樘卣鞑幻鞔_，導(dǎo)致對(duì)待處理的輸入信息整體識(shí)別時(shí)差生誤判，比如，長(zhǎng)度較短的待處理的輸入信息，可能由于特征稀疏、主題不明確，而導(dǎo)致語(yǔ)義誤判，本發(fā)明實(shí)施例中，對(duì)待處理的輸入信息進(jìn)行切詞處理，根據(jù)切詞處理后的輸入信息進(jìn)行識(shí)別。

其中，待處理的輸入信息可包括文本信息、語(yǔ)音信息等，且當(dāng)待處理的輸入信息是語(yǔ)音信息等非文本信息時(shí)，需要在對(duì)待處理的輸入信息進(jìn)行切詞處理之前，將非文本信息轉(zhuǎn)換為文本信息等。

其中，根據(jù)具體應(yīng)用需求的不同，可采用多種方式對(duì)待處理的輸入信息進(jìn)行切詞處理，舉例如下：

第一種示例，根據(jù)待處理的輸入信息的詞性，對(duì)待處理的輸入信息進(jìn)行切詞處理。

在本示例中，獲取待處理的輸入信息的詞性，即通過(guò)解析輸入信息中的名詞、動(dòng)詞、副詞、或，專有名詞等，對(duì)待處理的輸入信息進(jìn)行切詞處理。

舉例而言，對(duì)待處理的輸入信息“請(qǐng)幫我翻到下一頁(yè)”，根據(jù)詞性進(jìn)行切詞處理后，識(shí)別“請(qǐng)”、“幫”、“翻到”為動(dòng)詞，“我”為代詞，“下一頁(yè)”為方位詞等，從而獲得的切詞處理結(jié)果是“請(qǐng)”、“幫”、“我”、“翻到”、“下一頁(yè)”。

第二種示例，根據(jù)復(fù)試切詞的方式，對(duì)待處理的輸入信息進(jìn)行切詞處理。

在本示例中，舉例而言，可采用一元二元混合切詞的方式，對(duì)待處理的輸入信息進(jìn)行切詞處理，比如，將待處理的輸入信息“聯(lián)合國(guó)教科文組織”進(jìn)行一元二元混合切詞處理，獲得的處理結(jié)果為“聯(lián)”、“聯(lián)合”、“合”、“合國(guó)”、“國(guó)”、“國(guó)教”、“教”、“教科”、“科”、“科文”、“文”、“文組”、“組”、“組織”。

第三種示例，通過(guò)識(shí)別待處理的輸入信息中的特征詞，對(duì)待處理的輸入信息進(jìn)行切詞處理。其中，特征詞為與待處理的輸入信息，表達(dá)的主題思想相關(guān)的詞，比如可以為專有實(shí)體名詞等。

舉例而言，將待處理的輸入信息“聯(lián)合國(guó)教科文組織”進(jìn)行一元二元混合切詞處理，獲得的處理結(jié)果為“聯(lián)合國(guó)”、“教科文”、“組織”。

應(yīng)當(dāng)理解的是，在上述切詞處理過(guò)程中，還可綜合考慮鄰近詞的關(guān)聯(lián)度，以根據(jù)關(guān)聯(lián)度以及詞本身的權(quán)重等，丟棄掉一些與待處理的輸入信息，表達(dá)的主題無(wú)關(guān)的詞。

進(jìn)而，對(duì)待處理的輸入信息進(jìn)行切詞處理后，采用TFIDF算法等提取一個(gè)或多個(gè)文本特征，其中，文本特征包括待處理信息切詞處理后，得到的特征詞及其權(quán)重，關(guān)鍵詞及其摘要，抽取的特定信息等。

其中，權(quán)重是針對(duì)某一個(gè)指標(biāo)而言的，某一個(gè)指標(biāo)的權(quán)重是指該指標(biāo)在整體評(píng)價(jià)中的相對(duì)重要程度，比如，某一個(gè)特征詞的詞頻的權(quán)重，指的是其在分類評(píng)價(jià)中的相對(duì)重要程度。

S102，根據(jù)預(yù)先訓(xùn)練的語(yǔ)義識(shí)別模型對(duì)文本特征進(jìn)行分類處理，獲取與文本特征對(duì)應(yīng)的語(yǔ)義置信度。

具體地，預(yù)先根據(jù)大量具有語(yǔ)義的語(yǔ)料訓(xùn)練語(yǔ)義識(shí)別模型，從而根據(jù)預(yù)先訓(xùn)練的語(yǔ)義識(shí)別模型對(duì)文本驗(yàn)證進(jìn)行分析，以根據(jù)分析結(jié)果對(duì)文本特征進(jìn)行分類處理，以確定待處理文本屬于哪種語(yǔ)義。

比如，預(yù)先訓(xùn)練的語(yǔ)義識(shí)別模型，如果根據(jù)關(guān)鍵詞進(jìn)行分類處理，則根據(jù)文本特征中的關(guān)鍵詞A1，與預(yù)先訓(xùn)練后的識(shí)別模型中A分類關(guān)鍵詞A2的匹配度較高，則確定該待處理的輸入信息為A類。

又比如，預(yù)先訓(xùn)練的語(yǔ)義識(shí)別模型，如果根據(jù)特征詞及其權(quán)重進(jìn)行分類處理，則對(duì)文本特征中的特征詞的詞頻等計(jì)算權(quán)重，進(jìn)而對(duì)特征詞的權(quán)重值進(jìn)行加權(quán)處理，預(yù)先訓(xùn)練的語(yǔ)義識(shí)別模型獲得的處理值，判斷該處理值接近于那一分類以得到分類結(jié)果。

然而，應(yīng)當(dāng)理解的是，預(yù)先訓(xùn)練的語(yǔ)義識(shí)別模型的并不保證完全分類正確，當(dāng)待處理的輸入信息是無(wú)語(yǔ)義文本時(shí)，可能會(huì)將其識(shí)別為有語(yǔ)義文本，因而，還可根據(jù)預(yù)先訓(xùn)練的語(yǔ)義識(shí)別模型的準(zhǔn)確率，獲取與文本特征對(duì)應(yīng)的語(yǔ)義置信度，以便于根據(jù)語(yǔ)義置信度，判斷該待處理文本的分類處理結(jié)果是否可信等。

其中，根據(jù)具體應(yīng)用場(chǎng)景的不同，語(yǔ)義置信度的表示方式可有多種，比如可以百分比的形式表示，或以分?jǐn)?shù)的形式表示，或以等級(jí)的形式表示，或以文字表述的方式進(jìn)行表示等。

比如，預(yù)先訓(xùn)練的語(yǔ)義識(shí)別模型的準(zhǔn)確率為80％，則獲取與文本特征對(duì)應(yīng)的語(yǔ)義置信度為80％等，從而判斷該分類處理結(jié)果可信度較高。

S103，若語(yǔ)義置信度小于預(yù)設(shè)閾值，則確定輸入信息不具有語(yǔ)義文本。

具體地，為了判斷該待處理文本的分類處理結(jié)果的準(zhǔn)確率，預(yù)先設(shè)置針對(duì)語(yǔ)義置信度的閾值。

當(dāng)語(yǔ)義置信度小于預(yù)設(shè)閾值時(shí)，則表明雖然預(yù)先訓(xùn)練的語(yǔ)義識(shí)別模型對(duì)所述文本特征進(jìn)行分類處理后，將該待處理文本分為某一類具有語(yǔ)義的文本，但分類的準(zhǔn)確率不高，因而確定輸入信息不具有語(yǔ)義文本。

在本發(fā)明的另一個(gè)實(shí)施例中，若語(yǔ)義置信度大于等于預(yù)設(shè)閾值，則表明預(yù)先訓(xùn)練的語(yǔ)義識(shí)別模型對(duì)文本特征進(jìn)行分類處理的處理結(jié)果，可信度較高，因而確定輸入信息具有語(yǔ)義文本。

綜上所述，本發(fā)明實(shí)施例的基于人工智能的語(yǔ)義判定處理方法，對(duì)待處理的輸入信息進(jìn)行切詞處理，提取一個(gè)或多個(gè)文本特征，并根據(jù)預(yù)先訓(xùn)練的語(yǔ)義識(shí)別模型對(duì)文本特征進(jìn)行分類處理，獲取與文本特征對(duì)應(yīng)的語(yǔ)義置信度，從而若語(yǔ)義置信度小于預(yù)設(shè)閾值，則確定輸入信息不具有語(yǔ)義文本。由此，根據(jù)待處理輸入信息的文本特征對(duì)待處理信息進(jìn)行處理，提高了語(yǔ)義識(shí)別的準(zhǔn)確率。

基于以上實(shí)施例，應(yīng)當(dāng)理解的是，為了進(jìn)一步提高語(yǔ)義判定處理的效率，還可在對(duì)待處理的輸入信息進(jìn)行文本特征提取之前，對(duì)待處理的輸入信息進(jìn)行簡(jiǎn)單的預(yù)識(shí)別，只有當(dāng)識(shí)別不出待處理的輸入信息是否為語(yǔ)義文本后，才實(shí)施上述語(yǔ)義判定處理的步驟。具體說(shuō)明如下：

圖2是根據(jù)本發(fā)明另一個(gè)實(shí)施例的基于人工智能的語(yǔ)義判定處理方法的流程圖，如圖2所示，在上述步驟S101之前，該基于人工智能的語(yǔ)義判定處理方法包括：

S201，將輸入信息與預(yù)設(shè)的語(yǔ)義特征庫(kù)進(jìn)行匹配。

具體地，預(yù)先設(shè)置語(yǔ)義特征庫(kù)，該語(yǔ)義特征庫(kù)中包括不具有語(yǔ)義的信息，或者具有語(yǔ)義的信息，從而將輸入信息與預(yù)設(shè)的語(yǔ)義特征庫(kù)進(jìn)行匹配，根據(jù)匹配情況，確定輸入信息是否具有語(yǔ)義。

S202，如果輸入信息與預(yù)設(shè)的語(yǔ)義特征庫(kù)匹配失敗，則對(duì)輸入信息進(jìn)行切詞處理。

具體地，如果輸入信息與預(yù)設(shè)的語(yǔ)義特征庫(kù)匹配失敗，則表明輸入信息與預(yù)設(shè)的語(yǔ)義特征庫(kù)中的具有語(yǔ)義的信息不匹配，同時(shí)，輸入信息與預(yù)設(shè)的語(yǔ)義特征庫(kù)中的不具有語(yǔ)義的信息也不匹配，因而，無(wú)法準(zhǔn)確確定輸入信息是否具有語(yǔ)義，從而對(duì)輸入信息進(jìn)行切詞處理。

進(jìn)而，進(jìn)入上述步驟S101，通過(guò)提取待處理的輸入信息的文本特征的方法，進(jìn)一步根據(jù)待處理的輸入信息的文本特征，確定待處理的輸入信息是否具有語(yǔ)義。

也就是說(shuō)，可綜合使用語(yǔ)義特征庫(kù)與待處理的輸入信息的文本特征，對(duì)待處理的輸入信息進(jìn)行語(yǔ)義識(shí)別，提高了語(yǔ)義識(shí)別準(zhǔn)確度。

S203，如果輸入信息與預(yù)設(shè)的語(yǔ)義特征庫(kù)匹配成功，根據(jù)語(yǔ)義特征庫(kù)的類型確定輸入信息是否具有語(yǔ)義文本。

具體地，由于語(yǔ)義特征庫(kù)中可能既包括不具有語(yǔ)義的信息，又包括具有語(yǔ)義的信息，因而，如果輸入信息與預(yù)設(shè)的語(yǔ)義特征庫(kù)匹配成功，根據(jù)語(yǔ)義特征庫(kù)的類型確定輸入信息是否具有語(yǔ)義文本。

下面結(jié)合具體的應(yīng)用場(chǎng)景，詳細(xì)說(shuō)明如何根據(jù)語(yǔ)義特征庫(kù)的類型，確定輸入信息是否具有語(yǔ)義文本，說(shuō)明如下：

第一種示例，若語(yǔ)義特征庫(kù)包含指令模板，則如果輸入信息與指令模板匹配成功，則確定輸入信息為包含語(yǔ)義文本。

其中，指令模板可包括對(duì)應(yīng)用程序的具體操作指令等，比如針對(duì)導(dǎo)航應(yīng)用程序的導(dǎo)航操作指令，針對(duì)小說(shuō)閱讀應(yīng)用程序的閱讀指令等。

在本示例中，如果輸入信息與指令模板匹配值超過(guò)一定值，則認(rèn)為輸入信息與指令模板匹配成功，從而確定輸入信息為包含語(yǔ)義文本。

舉例而言，將輸入信息“幫我翻頁(yè)到下一章節(jié)”與指令模板“指令模板匹配值”匹配，得到匹配值較高，則認(rèn)為輸入信息與指令模板匹配成功，從而確定輸入信息為包含語(yǔ)義文本。

第二種示例，若語(yǔ)義特征庫(kù)包含閑聊語(yǔ)料模板，如果輸入信息與閑聊語(yǔ)料模板匹配成功，則確定輸入信息包含無(wú)語(yǔ)義文本。

其中，閑聊語(yǔ)料模板中包括日常生活中，聊天常用的語(yǔ)氣助詞，擬聲詞等不包含明確語(yǔ)義的詞。

在本示例中，如果輸入信息與閑聊語(yǔ)料模板匹配值超過(guò)一定值，則認(rèn)為輸入信息與閑聊語(yǔ)料模板匹配成功，從而確定輸入信息為包含無(wú)語(yǔ)義文本。

舉例而言，將輸入信息“你好呀，哈哈哈”與閑聊語(yǔ)料模板“你好，哈哈”匹配，得到匹配值較高，則認(rèn)為輸入信息與閑聊語(yǔ)料模板匹配成功，從而確定輸入信息為包含無(wú)語(yǔ)義文本。

第三種示例，若語(yǔ)義特征庫(kù)包含無(wú)語(yǔ)義文本的黑名單信息，如果輸入信息與黑名單信息匹配成功，則確定輸入信息包含無(wú)語(yǔ)義文本。

其中，上述黑名單信息中包含大量的無(wú)語(yǔ)義文本，比如包含擬聲詞，語(yǔ)氣助詞等。

在本示例中，如果輸入信息與黑名單匹配值超過(guò)一定值，則認(rèn)為輸入信息與黑名單信息匹配成功，從而確定輸入信息為包含無(wú)語(yǔ)義文本。

舉例而言，將輸入信息“你好呀，哈哈哈”與黑名單信息“你好，哈哈”匹配，得到匹配值較高，則認(rèn)為輸入信息與黑名單信息匹配成功，從而確定輸入信息為包含無(wú)語(yǔ)義文本。

第四種示例，若語(yǔ)義特征庫(kù)包含具有語(yǔ)義文本的白名單信息，如果輸入信息與白名單信息匹配成功，則確定輸入信息包含語(yǔ)義文本。

其中，上述白名單信息中包含大量的語(yǔ)義文本，比如包含實(shí)體詞，指令詞等。

在本示例中，如果輸入信息與白名單匹配值超過(guò)一定值，則認(rèn)為輸入信息與白名單信息匹配成功，從而確定輸入信息為包含語(yǔ)義文本。

舉例而言，將輸入信息“請(qǐng)告訴我蘋果的藥用功效”與白名單信息“蘋果的藥用功效”匹配，得到匹配值較高，則認(rèn)為輸入信息與白名單信息匹配成功，從而確定輸入信息為包含語(yǔ)義文本。

綜上所述，本發(fā)明實(shí)施例的基于人工智能的語(yǔ)義判定處理方法，在根據(jù)待處理的輸入信息的文本特征，對(duì)待處理信息進(jìn)行語(yǔ)義識(shí)別之前，通過(guò)預(yù)設(shè)的語(yǔ)義特征庫(kù)與輸入信息進(jìn)行匹配，并根據(jù)匹配結(jié)果確定輸入信息是否具有語(yǔ)義，只有在無(wú)法識(shí)別輸入信息是否具有語(yǔ)義時(shí)，才根據(jù)待處理的輸入信息的文本特征，對(duì)待處理信息進(jìn)行語(yǔ)義識(shí)別，進(jìn)一步提高了語(yǔ)義識(shí)別的效率。

為實(shí)現(xiàn)上述目的，本發(fā)明還提出一種基于人工智能的語(yǔ)義判定處理裝置。

圖3是根據(jù)本發(fā)明一個(gè)實(shí)施例的基于人工智能的語(yǔ)義判定處理裝置的結(jié)構(gòu)示意圖。

如圖3所示，該基于人工智能的語(yǔ)義判定處理裝置可包括：第一處理模塊10、提取模塊20、第二處理模塊30、獲取模塊40和第一確定模塊50。

其中，第一處理模塊10，用于對(duì)待處理的輸入信息進(jìn)行切詞處理。

提取模塊20，用于提取一個(gè)或多個(gè)文本特征。

第二處理模塊30，用于根據(jù)預(yù)先訓(xùn)練的語(yǔ)義識(shí)別模型對(duì)文本特征進(jìn)行分類處理。

獲取模塊40，用于獲取與文本特征對(duì)應(yīng)的語(yǔ)義置信度。

第一確定模塊50，用于在語(yǔ)義置信度小于預(yù)設(shè)閾值時(shí)，確定輸入信息不具有語(yǔ)義文本。

在本發(fā)明的一個(gè)實(shí)施例中，第一確定模塊50還用于在語(yǔ)義置信度大于等于預(yù)設(shè)閾值時(shí)，確定輸入信息具有語(yǔ)義文本。

需要說(shuō)明的是，前述對(duì)基于人工智能的語(yǔ)義判定處理方法的解釋說(shuō)明，也適用于本發(fā)明實(shí)施例的基于人工智能的語(yǔ)義判定處理裝置，本發(fā)明基于人工智能的語(yǔ)義判定處理裝置中未披露的細(xì)節(jié)，在此不再贅述。

綜上所述，本發(fā)明實(shí)施例的基于人工智能的語(yǔ)義判定處理裝置，對(duì)待處理的輸入信息進(jìn)行切詞處理，提取一個(gè)或多個(gè)文本特征，并根據(jù)預(yù)先訓(xùn)練的語(yǔ)義識(shí)別模型對(duì)文本特征進(jìn)行分類處理，獲取與文本特征對(duì)應(yīng)的語(yǔ)義置信度，從而若語(yǔ)義置信度小于預(yù)設(shè)閾值，則確定輸入信息不具有語(yǔ)義文本。由此，根據(jù)待處理輸入信息的文本特征對(duì)待處理信息進(jìn)行處理，提高了語(yǔ)義識(shí)別的準(zhǔn)確率。

圖4是根據(jù)本發(fā)明另一個(gè)實(shí)施例的基于人工智能的語(yǔ)義判定處理裝置的結(jié)構(gòu)示意圖，如圖4所示，在如圖3所示的基礎(chǔ)上，基于人工智能的語(yǔ)義判定處理裝置還包括：匹配模塊60和第二確定模塊70。

其中，匹配模塊60，用于將輸入信息與預(yù)設(shè)的語(yǔ)義特征庫(kù)進(jìn)行匹配。

在本發(fā)明的實(shí)施例中，第一處理模塊10，用于在輸入信息與預(yù)設(shè)的語(yǔ)義特征庫(kù)匹配失敗時(shí)，對(duì)輸入信息進(jìn)行切詞處理。

第二確定模塊70，用于在輸入信息與預(yù)設(shè)的語(yǔ)義特征庫(kù)匹配成功時(shí)，根據(jù)語(yǔ)義特征庫(kù)的類型確定輸入信息是否具有語(yǔ)義文本。

在本發(fā)明的一個(gè)實(shí)施例中，若語(yǔ)義特征庫(kù)包含指令模板，在輸入信息與指令模板匹配成功時(shí)，第二確定模塊70確定輸入信息包含語(yǔ)義文本。

在本發(fā)明的一個(gè)實(shí)施例中，若語(yǔ)義特征庫(kù)包含閑聊語(yǔ)料模板，在輸入信息與閑聊語(yǔ)料模板匹配成功時(shí)，第二確定模塊70確定輸入信息包含無(wú)語(yǔ)義文本。

在本發(fā)明的一個(gè)實(shí)施例中，若語(yǔ)義特征庫(kù)包含無(wú)語(yǔ)義文本的黑名單信息，在輸入信息與黑名單信息匹配成功時(shí)，第二確定模塊70確定輸入信息包含無(wú)語(yǔ)義文本。

在本發(fā)明的一個(gè)實(shí)施例中，若語(yǔ)義特征庫(kù)包含具有語(yǔ)義文本的白名單信息，在輸入信息與白名單信息匹配成功時(shí)，第二確定模塊70確定輸入信息包含語(yǔ)義文本。

綜上所述，本發(fā)明實(shí)施例的基于人工智能的語(yǔ)義判定處理裝置，在根據(jù)待處理的輸入信息的文本特征，對(duì)待處理信息進(jìn)行語(yǔ)義識(shí)別之前，通過(guò)預(yù)設(shè)的語(yǔ)義特征庫(kù)與輸入信息進(jìn)行匹配，并根據(jù)匹配結(jié)果確定輸入信息是否具有語(yǔ)義，只有在無(wú)法識(shí)別輸入信息是否具有語(yǔ)義時(shí)，才根據(jù)待處理的輸入信息的文本特征，對(duì)待處理信息進(jìn)行語(yǔ)義識(shí)別，進(jìn)一步提高了語(yǔ)義識(shí)別的效率。

在本說(shuō)明書的描述中，參考術(shù)語(yǔ)“一個(gè)實(shí)施例”、“一些實(shí)施例”、“示例”、“具體示例”、或“一些示例”等的描述意指結(jié)合該實(shí)施例或示例描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)包含于本發(fā)明的至少一個(gè)實(shí)施例或示例中。在本說(shuō)明書中，對(duì)上述術(shù)語(yǔ)的示意性表述不必須針對(duì)的是相同的實(shí)施例或示例。而且，描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)可以在任一個(gè)或多個(gè)實(shí)施例或示例中以合適的方式結(jié)合。此外，在不相互矛盾的情況下，本領(lǐng)域的技術(shù)人員可以將本說(shuō)明書中描述的不同實(shí)施例或示例以及不同實(shí)施例或示例的特征進(jìn)行結(jié)合和組合。

盡管上面已經(jīng)示出和描述了本發(fā)明的實(shí)施例，可以理解的是，上述實(shí)施例是示例性的，不能理解為對(duì)本發(fā)明的限制，本領(lǐng)域的普通技術(shù)人員在本發(fā)明的范圍內(nèi)可以對(duì)上述實(shí)施例進(jìn)行變化、修改、替換和變型。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁(yè)1 2 3

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：胡澤進(jìn);姚樹杰;
技術(shù)所有人：百度在線網(wǎng)絡(luò)技術(shù)（北京）有限公司;
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無(wú)損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

人工智能自然語(yǔ)義分析相關(guān)技術(shù)

人工智能處理器相關(guān)技術(shù)

人工智能與自動(dòng)化裝置相關(guān)技術(shù)

人工智能自然語(yǔ)言處理相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

基于人工智能的語(yǔ)義判定處理方法和裝置與流程