1.一種信息處理的方法,包括:
提供模型樣例庫,所述模型樣例庫包括樣例標準問以及與每個樣例標準問相對應的樣例擴展問;
提供知識庫,所述知識庫包括知識庫標準問以及與每個知識庫標準問相對應的知識庫擴展問和答案,所述知識庫用于為用戶問句提供答案;
確定所述模型樣例庫中是否存在與人機交互日志中的用戶問句相匹配的樣例擴展問;
若存在,則確定所述人機交互日志中所述用戶問句的所對應標準問與匹配的樣例擴展問的所對應樣例標準問是否相同;
若不相同,則優(yōu)化所述知識庫。
2.如權(quán)利要求1所述的信息處理的方法,其特征在于,所述樣例擴展問包括知識庫擴展問,所述樣例標準問包括知識庫標準問。
3.如權(quán)利要求1所述的信息處理的方法,其特征在于,確定所述模型樣例庫中是否存在與所述用戶問句相匹配的樣例擴展問包括:
將所述用戶問句與樣例擴展問執(zhí)行語義相似度計算以確定所述模型樣例庫中是否存在至少一個與所述用戶問句的語義相似度大于第一閾值的樣例擴展問。
4.如權(quán)利要求1所述的信息處理的方法,其特征在于,確定所述用戶問句的所對應標準問與匹配的樣例擴展問的所對應樣例標準問是否相同包括:
比較所述用戶問句的所對應標準問與匹配的樣例擴展問的所對應樣例標準問文字是否完全一致。
5.如權(quán)利要求4所述的信息處理的方法,其特征在于,若存在與所述用戶問句語義相似度大于所述第一閾值且小于100%的樣例擴展問,且所述用戶問句的所對應標準問與語義相似度大于所述第一閾值且小于100%的樣例擴展問的所對應樣例標準問句相同,則將所述用戶問句及所述用戶問句的所對應標準問相關(guān)聯(lián)地添加入所述模型樣例庫。
6.如權(quán)利要求4所述的信息處理的方法,其特征在于,若存在多個匹配的樣例擴展問,則確定所述用戶問句的所對應標準問與匹配的樣例擴展問的所對應樣例標準問是否相同包括:
確定是否有一個匹配的樣例擴展問的所對應樣例標準問與所述用戶問句的所對應標準問相同。
7.如權(quán)利要求4所述的信息處理的方法,其特征在于,對所述知識庫的優(yōu)化包括:
基于所述語義相似度計算的結(jié)果,推薦與所述用戶問句的語義相似度大于第二閾值的樣例擴展問的所對應樣例標準問;
將從所推薦的樣例標準問中人工選擇出的樣例標準問與所述用戶問句相關(guān)聯(lián)地添加入所述知識庫。
8.如權(quán)利要求7所述的信息處理的方法,其特征在于,所述方法還包括:
將所述從所推薦的樣例標準問中人工選擇出的樣例標準問與所述用戶問句相關(guān)聯(lián)地添加入所述模型樣例庫。
9.如權(quán)利要求1所述的信息處理的方法,其特征在于,若所述模型樣例庫中不存在與所述用戶問句相匹配的樣例擴展問,則在知識庫中創(chuàng)建與所述用戶問句對應的知識點,所述知識點包括:知識庫標準問、知識庫擴展問和答案。
10.如權(quán)利要求9所述的信息處理的方法,其特征在于,所述方法還包括:將在知識庫中創(chuàng)建的知識點同時添加到所述模型樣例庫。
11.如權(quán)利要求3所述的信息處理的方法,其特征在于,將所述用戶問句與樣例擴展問執(zhí)行語義相似度計算包括:
對樣例擴展問進行分詞,并計算詞和句子向量值;
對所述用戶問句進行分詞,并計算詞和句子向量值;
計算樣例擴展問的詞和句子向量值與所述用戶問句的詞和句子向量值的相關(guān)度,以得出所述用戶問句與樣例擴展問的語義相似度。
12.如權(quán)利要求1所述的信息處理的方法,其特征在于,在確定所述模型樣例庫中是否存在與所述用戶問句相匹配的樣例擴展問之前,所述方法還包括:
對所述人機交互日志中所有用戶問句進行預處理,以過濾人機交互日志用戶問句中的無效數(shù)據(jù)。
13.一種信息處理的裝置,包括:
第一分析模塊,用于確定模型樣例庫中是否存在與人機交互日志中的用戶問句相匹配的樣例擴展問;
第二分析模塊,用于響應于存在與所述用戶問句相匹配的樣例擴展問,則確定所述人機交互日志中所述用戶問句的所對應標準問與匹配的樣例擴展問的所對應樣例標準問是否相同;以及
優(yōu)化模塊,用于響應于所述用戶問句的所對應標準問與匹配的樣例擴展問的所對應樣例標準問不相同,則優(yōu)化知識庫。
14.如權(quán)利要求13所述的信息處理的裝置,其特征在于,所述第一分析模塊包括:
語義相似度計算模塊,用于將所述用戶問句與樣例擴展問執(zhí)行語義相似度計算,以確定所述模型樣例庫中是否存在至少一個與所述用戶問句的語義相似度大于第一閾值的樣例擴展問。
15.如權(quán)利要求14所述的信息處理的裝置,其特征在于,所述第二分析模塊包括:
比較模塊,用于比較所述用戶問句的所對應標準問與匹配的樣例擴展問的所對應樣例標準問文字是否完全一致。
16.如權(quán)利要求15所述的信息處理的裝置,其特征在于,所述第二分析模塊還包括:
添加模塊,用于響應于存在與所述用戶問句語義相似度大于所述第一閾值且小于100%的樣例擴展問,且所述用戶問句的所對應標準問與語義相似度大于所述第一閾值且小于100%的樣例擴展問的所對應樣例標準問句相同,則將所述用戶問句及所述用戶問句的所對應標準問相關(guān)聯(lián)地添加入所述模型樣例庫。
17.如權(quán)利要求14所述的信息處理的裝置,其特征在于,若存在多個匹配的樣例擴展問,則所述第二分析模塊確定是否有一個匹配的樣例擴展問的所對應樣例標準問與所述用戶問句的所對應標準問相同。
18.如權(quán)利要求14所述的信息處理的裝置,其特征在于,所述優(yōu)化模塊包括:
推薦模塊,用于基于所述語義相似度計算的結(jié)果,推薦與所述用戶問句的語義匹配度大于第二閾值的樣例擴展問的所對應樣例標準問;以及
添加模塊,用于將從所推薦的樣例標準問中人工選擇出的標準問與所述用戶問句相關(guān)聯(lián)地添加入所述知識庫。
19.如權(quán)利要求18所述的信息處理的裝置,其特征在于,所述添加模塊進一步用于將所述從所推薦的樣例標準問中人工選擇出的標準問與所述用戶問句相關(guān)聯(lián)地添加入所述模型樣例庫。
20.如權(quán)利要求18所述的信息處理的裝置,其特征在于,若所述模型樣例庫中不存在與所述用戶問句相匹配的樣例擴展問,則所述添加模塊在知識庫中創(chuàng)建與所述用戶問句對應的知識點,所述知識點包括:知識庫標準問、知識庫擴展問和答案。
21.如權(quán)利要求20所述的信息處理的裝置,其特征在于,所述添加模塊還將在知識庫中創(chuàng)建的知識點同時添加到所述模型樣例庫。
22.如權(quán)利要求14所述的信息處理的裝置,其特征在于,所述語義相似度計算模塊包括:
分詞及向量計算模塊,用于對樣例擴展問進行分詞,并計算詞和句子向量值,以及對所述用戶問句進行分詞,并計算詞和句子向量值;以及
相關(guān)度計算模塊,用于計算樣例擴展問的詞和句子向量值與所述用戶問句的詞和句子向量值的相關(guān)度,以得出所述用戶問句與樣例擴展問的語義相似度。
23.如權(quán)利要求13所述的信息處理的裝置,其特征在于,所述裝置還包括:
預處理模塊,用于在確定所述模型樣例庫中是否存在與所述用戶問句相匹配的樣例擴展問之前,對所述人機交互日志中所有用戶問句進行預處理,以過濾人機交互日志用戶問句中的無效數(shù)據(jù)。
24.一種信息處理的系統(tǒng),其特征在于,所述系統(tǒng)包括:
權(quán)利要求13-23中任一項的信息處理的裝置;
模型樣例庫,所述模型樣例庫包括樣例標準問以及與每個樣例標準問相對應的樣例擴展問;
知識庫,所述知識庫包括知識庫標準問以及與每個知識庫標準問相對應的知識庫擴展問和答案,所述知識庫用于為用戶問句提供答案。