1.一種人機(jī)交互系統(tǒng)知識庫的優(yōu)化方法,其特征在于,包括:
根據(jù)用戶輸入的問題信息獲取多個對應(yīng)的候選回答信息,將各個候選回答信息與所述用戶輸入的問題信息組成多個第一結(jié)果問題向量;
判斷知識庫中是否存在與用戶輸入的問題信息相匹配的已檢驗(yàn)的數(shù)據(jù)信息;
若存在,則將所述知識庫中的與用戶輸入的問題信息相匹配的已檢驗(yàn)的數(shù)據(jù)信息組成第二結(jié)果問題向量;
計(jì)算各個第一結(jié)果問題向量與第二結(jié)果問題向量的相似度,若所述相似度大于第一預(yù)設(shè)閾值,則將相應(yīng)的候選回答信息與所述用戶輸入的問題信息增加到知識庫中,并將該候選回答信息與所述用戶輸入的問題信息標(biāo)記為已檢驗(yàn)。
2.根據(jù)權(quán)利要求1所述的人機(jī)交互系統(tǒng)知識庫的優(yōu)化方法,其特征在于,所述方法還包括:
若所述知識庫中不存在與用戶輸入的問題信息相匹配的已檢驗(yàn)的數(shù)據(jù)信息,則將所述候選回答信息發(fā)送至多個用戶;
接收多個用戶反饋的候選回答信息正確與否的信息;
若各個用戶均反饋候選回答信息為正確,則將所述候選回答信息與用戶輸入的問題信息增加到知識庫中,并將該候選回答信息與所述用戶輸入的問題信息標(biāo)記為已檢驗(yàn)。
3.根據(jù)權(quán)利要求2所述的人機(jī)交互系統(tǒng)知識庫的優(yōu)化方法,其特征在于,所述方法還包括:
若存在至少一個用戶反饋候選回答信息為錯誤,則丟棄該候選回答信息與所述用戶輸入的問題信息。
4.根據(jù)權(quán)利要求1所述的人機(jī)交互系統(tǒng)知識庫的優(yōu)化方法,其特征在于,所述根據(jù)用戶輸入的問題信息獲取多個對應(yīng)的候選回答信息包括:
獲取所述用戶輸入的問題信息的至少一個關(guān)鍵詞;
根據(jù)所述關(guān)鍵詞查找所述知識庫,獲取知識庫中多個回答信息作為候選回答信息,所述回答信息對應(yīng)的問題信息包括與所述關(guān)鍵詞相匹配的詞語。
5.根據(jù)權(quán)利要求4所述的人機(jī)交互系統(tǒng)知識庫的優(yōu)化方法,其特征在于,所述回答信息對應(yīng)的問題信息包括所述關(guān)鍵詞。
6.根據(jù)權(quán)利要求1所述的人機(jī)交互系統(tǒng)知識庫優(yōu)化方法,其特征在于,所述相似度包括:Jaccard相似度、皮爾森相似度、余弦相似度。
7.根據(jù)權(quán)利要求1所述的人機(jī)交互系統(tǒng)知識庫的優(yōu)化方法,其特征在于,所述計(jì)算各個第一結(jié)果問題向量與第二結(jié)果問題向量的相似度包括:
計(jì)算各個第一結(jié)果問題向量與第二結(jié)果問題向量的向量距離,若所述向量距離小于第二預(yù)設(shè)閾值,則所述相似度大于第一預(yù)設(shè)閾值;
所述向量距離包括:歐式距離、漢明距離、編輯距離。
8.一種人機(jī)交互系統(tǒng)知識庫的優(yōu)化系統(tǒng),其特征在于,包括:
第一結(jié)果問題向量組成單元,用于根據(jù)用戶輸入的問題信息獲取多個對應(yīng)的候選回答信息,將各個候選回答信息與所述用戶輸入的問題信息組成多個第一結(jié)果問題向量;
判斷單元,用于判斷知識庫中是否存在與用戶輸入的問題信息相匹配的已檢驗(yàn)的數(shù)據(jù)信息;
第二結(jié)果問題向量組成單元,用于當(dāng)知識庫中存在與用戶輸入的問題信息相匹配的數(shù)據(jù)信息時,則將所述知識庫中的與用戶輸入的問題信息相匹配的已檢驗(yàn)的回答信息與對應(yīng)的問題信息組成第二結(jié)果問題向量;
第一優(yōu)化單元,用于計(jì)算各個第一結(jié)果問題向量與第二結(jié)果問題向量的相似度,若所述相似度大于第一預(yù)設(shè)閾值,則將相應(yīng)的候選回答信息與所述用戶輸入的問題信息增加到知識庫中,并將該候選回答信息與所述用戶輸入的問題信息標(biāo)記為已檢驗(yàn)。
9.根據(jù)權(quán)利要求8所述的人機(jī)交互系統(tǒng)知識庫的優(yōu)化系統(tǒng),其特征在于,還包括:
用戶反饋信息接收單元,用于當(dāng)所述知識庫中不存在與用戶輸入的問題信息相匹配的已檢驗(yàn)的數(shù)據(jù)信息時,將所述候選回答信息發(fā)送至多個用戶;接收多個用戶反饋的候選回答信息正確與否的信息;
第二優(yōu)化單元,用于當(dāng)各個用戶均反饋候選回答信息為正確時,則將所述候選回答信息與用戶輸入的問題信息增加到知識庫中,并將該候選回答信息與所述用戶輸入的問題信息標(biāo)記為已檢驗(yàn)。
10.根據(jù)權(quán)利要求9所述的人機(jī)交互系統(tǒng)知識庫的優(yōu)化系統(tǒng),其特征在于,還包括:
第三優(yōu)化單元,用于當(dāng)存在至少一個用戶反饋候選回答信息為錯誤時,丟棄該候選回答信息與所述用戶輸入的問題信息。
11.根據(jù)權(quán)利要求8所述的人機(jī)交互系統(tǒng)知識庫的優(yōu)化系統(tǒng),其特征在于,所述第一結(jié)果問題向量組成單元包括:
關(guān)鍵詞獲取模塊,用于獲取所述用戶輸入的問題信息的至少一個關(guān)鍵詞;
候選回答信息獲取模塊,用于根據(jù)所述關(guān)鍵詞查找所述知識庫,獲取知識庫中多個回答信息作為候選回答信息,所述回答信息對應(yīng)的問題信息包括與所述關(guān)鍵詞相匹配的詞語。
12.根據(jù)權(quán)利要求11所述的人機(jī)交互系統(tǒng)知識庫的優(yōu)化系統(tǒng),其特征在于,所述回答信息對應(yīng)的問題信息包括所述關(guān)鍵詞。
13.根據(jù)權(quán)利要求8所述的人機(jī)交互系統(tǒng)知識庫的優(yōu)化系統(tǒng),其特征在于,所述相似度包括:Jaccard相似度、皮爾森相似度、余弦相似度。
14.根據(jù)權(quán)利要求8所述的人機(jī)交互系統(tǒng)知識庫的優(yōu)化系統(tǒng),其特征在于,所述第一優(yōu)化單元進(jìn)一步用于:
計(jì)算各個第一結(jié)果問題向量與第二結(jié)果問題向量的向量距離,若所述向量距離小于第二預(yù)設(shè)閾值,則所述相似度大于第一預(yù)設(shè)閾值;
所述向量距離包括:歐式距離、漢明距離、編輯距離。