1.一種標(biāo)簽的生成方法,其特征在于,包括:
獲取應(yīng)用文本語料;
提取所述應(yīng)用文本語料中的詞項(xiàng);
根據(jù)預(yù)置訓(xùn)練參數(shù),按照主題模型訓(xùn)練所述詞項(xiàng);
根據(jù)所述主題模型的訓(xùn)練結(jié)果,生成標(biāo)簽。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取應(yīng)用文本語料,包括:
獲取會(huì)話日志中的查詢數(shù)據(jù);
如果查找到所述查詢數(shù)據(jù)對(duì)應(yīng)的下載數(shù)據(jù),則獲取所述下載數(shù)據(jù)的應(yīng)用程序APP摘要;
將所述查詢數(shù)據(jù)與所述APP摘要,確定為所述應(yīng)用文本語料。
3.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述提取所述應(yīng)用文本語料中的詞項(xiàng),包括:
對(duì)所述應(yīng)用文本語料分詞處理,生成所述應(yīng)用文本語料的分詞庫;
判斷所述詞項(xiàng)庫中分詞的詞性;
提取所述詞性為有效詞性的有效分詞,所述有效詞性包括動(dòng)詞和名詞;
確定所述有效分詞為所述詞項(xiàng)。
4.根據(jù)權(quán)利要求1-3任一項(xiàng)所述的方法,其特征在于,所述提取所述詞性為有效詞性的有效分詞,包括:
獲取所述詞性為動(dòng)詞的動(dòng)詞分詞;
獲取所述詞性為名詞的名詞分詞;
判斷每一個(gè)所述名詞分詞是否為無效名詞分詞,所述無效名詞分詞包括人名、地名或者機(jī)構(gòu)名稱;
如果判斷結(jié)果為否,則獲取所述名詞分詞的有效名詞分詞;
所述確定所述有效分詞為所述詞項(xiàng),包括:
確定所述動(dòng)詞分詞和所述有效名詞分詞為所述詞項(xiàng)。
5.根據(jù)權(quán)利要求1-3任一項(xiàng)所述的方法,其特征在于,所述確定所述有效分詞為所述詞項(xiàng),包括:
判斷所述有效分詞是否與所述應(yīng)用文本語料的題目分詞相同;
如果判斷結(jié)果相同,則按照第一預(yù)置次數(shù),重復(fù)添加所述有效分詞;
確定所述有效分詞為所述詞項(xiàng)。
6.一種標(biāo)簽的生成裝置,其特征在于,包括:
獲取單元,用于獲取應(yīng)用文本語料;
提取單元,用于提取所述應(yīng)用文本語料中的詞項(xiàng);
訓(xùn)練單元,用于根據(jù)預(yù)置訓(xùn)練參數(shù),按照主題模型訓(xùn)練所述詞項(xiàng);
生成單元,用于根據(jù)所述主題模型的訓(xùn)練結(jié)果,生成標(biāo)簽。
7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述獲取單元,包括:
第一獲取模塊,用于獲取會(huì)話日志中的查詢數(shù)據(jù);
所述第一獲取模塊,還用于如果查找到所述查詢數(shù)據(jù)對(duì)應(yīng)的下載數(shù)據(jù),則獲取所述下載數(shù)據(jù)的APP摘要;
第一確定模塊,用于將所述查詢數(shù)據(jù)與所述APP摘要,確定為所述應(yīng)用文本語料。
8.根據(jù)權(quán)利要求6或7所述的裝置,其特征在于,所述提取單元,包括:
生成模塊,用于對(duì)所述應(yīng)用文本語料分詞處理,生成所述應(yīng)用文本語料的分詞庫;
判斷模塊,用于判斷所述詞項(xiàng)庫中分詞的詞性;
提取模塊,用于提取所述詞性為有效詞性的有效分詞,所述有效詞性包括動(dòng)詞和名詞;
第二確定模塊,用于確定所述有效分詞為所述詞項(xiàng)。
9.根據(jù)權(quán)利要求6-8任一項(xiàng)所述的裝置,其特征在于,所述提取模塊,包括:
第一獲取子模塊,用于獲取所述詞性為動(dòng)詞的動(dòng)詞分詞;
所述第一獲取子模塊,還用于獲取所述詞性為名詞的名詞分詞;
第一判斷子模塊,用于判斷每一個(gè)所述名詞分詞是否為無效名詞分詞,所述無效名詞分詞包括人名、地名或者機(jī)構(gòu)名稱;
所述第一獲取子模塊,還用于如果判斷結(jié)果為否,則獲取所述名詞分詞的有效名詞分詞;
所述第二確定模塊,用于:
確定所述動(dòng)詞分詞和所述有效名詞分詞為所述詞項(xiàng)。
10.根據(jù)權(quán)利要求6-8任一項(xiàng)所述的裝置,其特征在于,所述第二確定模塊,包括:
第二判斷子模塊,用于判斷所述有效分詞是否與所述應(yīng)用文本語料的題目分詞相同;
第一添加子模塊,用于如果判斷結(jié)果為是,則按照第一預(yù)置次數(shù),重復(fù)添加所述有效分詞;
第一確定子模塊,用于確定所述有效分詞為所述詞項(xiàng)。