標準化評論詞“房間非常整潔”。
[0122]在獲得標準化評論詞后,可以直接拼接形成自然語言,也可以是調(diào)用預(yù)設(shè)的自然語言模板,生成自然語言。
[0123]例如,模板為:......,但是.......再例如,......,而且,......,但是.......
[0124]可以將標準化評論詞填充至匹配的模板后,獲得的自然語句。
[0125]本發(fā)明實施例通過基于信息點的評論數(shù)據(jù)獲得評論詞,并進一步對評論詞進行篩選獲得關(guān)鍵評論詞,然后依據(jù)關(guān)鍵評論詞生成了包含評價信息的自然語言,該方法避免了現(xiàn)有方法獲得的由一個個獨立標簽構(gòu)成的評價信息,通過生成包含評價信息的自然語言,提高了評價信息的可讀性。而且,通過對評論詞的篩選,使得評價信息更加簡單直接,減少了干擾信息。
[0126]參照圖2,示出了本發(fā)明的另一種評價信息生成方法實施例的步驟流程圖,具體可以包括如下步驟:
[0127]步驟201,抓取信息點的評論數(shù)據(jù)。
[0128]步驟202,對評論數(shù)據(jù)進行數(shù)據(jù)分析,獲得評論詞及其描述信息,描述信息至少包括評論詞的正負評價信息。
[0129]步驟203,根據(jù)預(yù)置規(guī)則及所述評論詞的描述信息,在評論詞中選擇關(guān)鍵評論詞。
[0130]步驟201?203與前述實施例中的步驟101?103類似,此處不再贅述。
[0131]步驟204,獲取與信息點關(guān)聯(lián)的用戶個性信息。
[0132]本實施例中,評價信息生成裝置可以生成與用戶個性信息匹配的評價信息。在本步驟中,該評價信息生成裝置首先獲取與信息點關(guān)聯(lián)的用戶個性信息,該用戶個性信息可以是用戶的需求或用戶關(guān)注的信息類型等。例如,如果信息點是某酒店,則與該信息點關(guān)聯(lián)的用戶個性信息就可以是與酒店關(guān)聯(lián)的用戶需求或關(guān)注信息,如該用戶的個性信息為喜好安靜、房間干凈等。
[0133]其中,該評價信息生成裝置獲取用戶個性信息的方法有多種,例如,該裝置可以直接接收用戶輸入的與信息點關(guān)聯(lián)的個性信息。具體的,用戶可以直接進行文字輸入,也可以是該裝置向用戶提供個性信息的選項,例如是否喜歡安靜,是否喜歡大房間,是否需要帶泳池,是否需要價格經(jīng)濟的房間等,由用戶選擇后提交,進而該裝置可以獲得用戶的個性信息。
[0134]另一實例中,該裝置獲取與信息點關(guān)聯(lián)的用戶個性信息的方法,如圖3所示,可以包括以下步驟:
[0135]步驟301,抓取用戶對信息點的關(guān)聯(lián)信息點的評論數(shù)據(jù)。
[0136]該步驟的方法與前述步驟101類似,該裝置可以基于用戶的標識信息,如登錄信息或賬號、郵箱等,抓取用戶對上述信息點的關(guān)聯(lián)信息點的評論數(shù)據(jù)。其中,上述信息點的關(guān)聯(lián)信息點可以是與上述信息點相關(guān)聯(lián)的同類別的信息點,例如上述信息點為某酒店,則相關(guān)聯(lián)的同類別的信息點就可以是名稱不同的其它酒店。
[0137]步驟302,對用戶的評論數(shù)據(jù)進行數(shù)據(jù)分析,獲得用戶個性信息。
[0138]在獲取用戶的評論數(shù)據(jù)后,可以進行數(shù)據(jù)分析獲得用戶個人信息,該方法可以與前述步驟202的方法類似,具體的可以提取評論數(shù)據(jù)中的用戶的評論詞,然后對評論詞按照該信息點對應(yīng)的評論詞類別進行歸類,統(tǒng)計評論詞類別下的詞頻,將詞頻達到閾值的該評論詞類別或評論詞作為用戶的個性信息。
[0139]例如,在從用戶的評論數(shù)據(jù)提取出的評論詞中“房間整潔度”類別的評論詞詞頻超過閾值,則可以把“房間整潔度”或其中某一評論詞如“房間干凈”作為用戶個性信息,表明用戶對房間整潔度的關(guān)注度比較高。
[0140]步驟205,在關(guān)鍵評論詞中選擇與用戶個性信息匹配的關(guān)鍵評論詞作為最終的關(guān)鍵評論詞。
[0141]評價信息生成裝置在獲得用戶個性信息后,即可在關(guān)鍵評論詞中挑選與用戶個性信息匹配的關(guān)鍵評論詞,該過程如圖4所示,可以包括以下步驟:
[0142]步驟401,確定用戶個性信息對應(yīng)的評論詞類別。
[0143]該評價信息生成裝置預(yù)先會針對信息點的屬性劃分評論詞類別,例如信息點屬于酒店類,則針對酒店會劃分多個評論詞類別,如房間整潔度、隔音效果、規(guī)格大小、服務(wù)質(zhì)量、交通便利情況等。在獲得用戶的個性信息后,可以利用分類模型來將這些用戶個性信息分到不同的評論詞類別。
[0144]步驟402,在關(guān)鍵評論詞中選擇屬于用戶個性信息對應(yīng)的評論詞類別的關(guān)鍵評論詞,作為最終的關(guān)鍵評論詞。
[0145]在本步驟中即可根據(jù)上步驟確定出的評論詞類別,在關(guān)鍵評論詞中確定出隸屬于這些評論詞類別的關(guān)鍵評論詞,作為最終的關(guān)鍵評論詞。
[0146]在另一實施例中,除了隸屬于上述評論詞類別的關(guān)鍵評論詞之外,也可以保留部分其他關(guān)鍵評論詞作為最終的關(guān)鍵評論詞,例如可以設(shè)定最終關(guān)鍵評論詞的數(shù)量,當依據(jù)用戶個性信息對應(yīng)的評論詞類別確定出的關(guān)鍵評論詞數(shù)量達不到該預(yù)設(shè)數(shù)量時,可以保留其它部分關(guān)鍵評論詞,例如可以保留詞頻最高的或正負評價比例最高的關(guān)鍵評論詞。
[0147]步驟206,將最終的關(guān)鍵評論詞生成自然語句。
[0148]該步驟與前述步驟104中生成自然語言的方法類似,區(qū)別只在于將上步驟確定出的最終的關(guān)鍵評論詞生成自然語句。具體的,可以按照預(yù)先獲得的語言生成模型將最終的關(guān)鍵評論詞進行組合串接,生成自然語句,獲得評價信息;也可以先將最終的關(guān)鍵評論詞通過過濾器過濾成標準化評論詞,然后再將標準化評論詞拼接成自然語句,生成評價信息。
[0149]進一步的,在生成自然語句時,還可以根據(jù)最終關(guān)鍵評論詞中的正負評價比例,給出用戶決策建議。
[0150]本發(fā)明實施例不僅可以生成包含評價信息的自然語言,提高了評價信息的可讀性,而且可以依據(jù)用戶的個性信息為用戶生成個性化評價信息,同時也可以為用戶屏蔽到大量用戶不關(guān)心的信息,降低用戶獲取所需信息的成本。
[0151]例如,A酒店:
[0152]評論I 酒店的房間很大,也很干凈,床單也很整潔,但衛(wèi)生間有點小,站在里面會有點局促。隔音一般,晚上略有點吵,但其他都很棒,推薦給大家! ”
[0153]評論2 酒店的房間比較干凈,周圍有點吵鬧,晚上略吵,但還可以忍受,酒店的大游泳池非常喜歡,早餐也很豐富,超級贊! ”
[0154]關(guān)鍵評論詞:房間大,房間干凈,床單整潔,衛(wèi)生間小,隔音差,游泳池好,早餐好。
[0155]對于用戶A,用戶個性信息為:衛(wèi)生,空間,早餐,則最終的關(guān)鍵評論詞為:房間大,房間干凈,隔音差,早餐好。生成的評價信息為:
[0156]非常推薦這家酒店,不但房間空間很大而且很干凈,早餐也是一級棒,唯一的缺點就是略有噪音,但還是在可以忍受的范圍內(nèi)。
[0157]對于用戶B,用戶個性信息為:安靜,早餐。生成的評價信息為:
[0158]不是很推薦這家酒店,雖然房間空間很大,且早餐也非常豐富,但晚上會有比較明顯的噪音,這個比較難忍受。
[0159]參照圖5,示出了本發(fā)明的另一種評價信息生成方法實施例的步驟流程圖,具體可以包括如下步驟:
[0160]步驟501,抓取信息點的評論數(shù)據(jù)。
[0161]步驟502,對評論數(shù)據(jù)進行數(shù)據(jù)分析,獲得評論詞及其描述信息,描述信息至少包括評論詞的正負評價信息。
[0162]步驟503,根據(jù)預(yù)置規(guī)則及評論詞的描述信息,在評論詞中選擇關(guān)鍵評論詞。
[0163]步驟501?503與前述實施例中的步驟101?103類似,此處不再贅述。
[0164]步驟504,將關(guān)鍵評論詞通過過濾器過濾成標準化評論詞。
[0165]在將關(guān)鍵評論詞通過過濾器過濾成標準化評論詞的過程中,該過濾過程可以將評論詞中的描述性詞匯根據(jù)預(yù)置標準進行替換,從而生成標準評論詞。例如,評論詞為“房間非常非常干凈整潔”,通過過濾器識別其中的描述性詞匯“非常非常干凈整潔”,并將其替換為預(yù)置的標準化語言“非常整潔”,從而形成標準化評論詞“房間非常整潔”。
[0166]步驟505,獲取與信息點關(guān)聯(lián)的用戶個性信息。
[0167]該獲取用戶個性信息的方法與前述實施例中步驟204類似,此處不再贅述。
[0168]步驟506,在標準化評論詞中選擇與用戶個性信息匹配的標準化評論詞。
[0169]在獲取標準化評論詞以及用戶個性信息后,在本步驟中即可根據(jù)用戶個性信息對標準評論詞進行篩選,該過程具體可以包括:
[0170]首先,確定用戶個性信息對應(yīng)的評論詞類別。該確定類別的過程與前述步驟401類似。
[0171