本發(fā)明涉及通信
技術(shù)領(lǐng)域:
,具體涉及一種基于共享語料庫主動(dòng)發(fā)起會(huì)話的方法。
背景技術(shù):
:隨著通信技術(shù)的日益進(jìn)步,人際溝通聯(lián)絡(luò)更加依賴網(wǎng)絡(luò)和電信通訊?,F(xiàn)有通訊雙方建立通訊的過程,往往需要先獲取通訊聯(lián)系人,然后再基于獲取的通訊聯(lián)系人進(jìn)行通訊。上述過程不僅需要通訊方手動(dòng)查找通訊錄或通訊記錄獲得通訊聯(lián)系人,而且還需通訊方人工構(gòu)思創(chuàng)建主動(dòng)會(huì)話內(nèi)容,費(fèi)時(shí)費(fèi)力且效率低。由于日常會(huì)話中,主動(dòng)會(huì)話內(nèi)容往往可以共享,例如企業(yè)員工與客戶開展商務(wù)會(huì)話的場景中,銷售經(jīng)理張三針對潛在客戶進(jìn)行銷售的主動(dòng)會(huì)話內(nèi)容,可以共享給銷售經(jīng)理李四乃至其他同事,基于此,本發(fā)明提出了一種基于共享語料庫主動(dòng)發(fā)起會(huì)話的方法。技術(shù)實(shí)現(xiàn)要素:本發(fā)明提供了一種基于共享語料庫主動(dòng)發(fā)起會(huì)話的方法,以解決現(xiàn)有通訊方向通訊對方發(fā)起會(huì)話時(shí),不僅需要通訊方手動(dòng)獲取通訊聯(lián)系人,而且還需通訊方人工構(gòu)思創(chuàng)建主動(dòng)會(huì)話內(nèi)容,費(fèi)時(shí)費(fèi)力且效率低的技術(shù)問題。本發(fā)明提供的基于共享語料庫主動(dòng)發(fā)起會(huì)話的方法,包括:建立與通訊方對應(yīng)的個(gè)人語料庫,其中,通訊方的數(shù)目大于一;將多個(gè)通訊方的個(gè)人語料庫進(jìn)行合并,獲得共享語料庫;根據(jù)預(yù)設(shè)的會(huì)話場景標(biāo)簽,采集獲得當(dāng)前與會(huì)話場景標(biāo)簽對應(yīng)的會(huì)話場景標(biāo)簽值;根據(jù)會(huì)話場景標(biāo)簽值,在共享語料庫中匹配獲得與會(huì)話場景標(biāo)簽值對應(yīng)的通訊聯(lián)系人;根據(jù)會(huì)話場景標(biāo)簽值,在共享語料庫中匹配獲得與會(huì)話場景標(biāo)簽值對應(yīng)的主動(dòng)會(huì)話內(nèi)容;將主動(dòng)會(huì)話內(nèi)容發(fā)送至通訊聯(lián)系人。進(jìn)一步地,建立與通訊方對應(yīng)的個(gè)人語料庫包括:采集通訊方的會(huì)話內(nèi)容;獲取會(huì)話內(nèi)容中的會(huì)話對;獲取與會(huì)話對對應(yīng)的歷史聯(lián)系人;根據(jù)預(yù)設(shè)的場景標(biāo)簽,采集獲得會(huì)話對與場景標(biāo)簽對應(yīng)的場景標(biāo)簽值;將會(huì)話對、歷史聯(lián)系人、場景標(biāo)簽值進(jìn)行匹配組合,從而生成個(gè)人專屬語料庫。進(jìn)一步地,獲取會(huì)話內(nèi)容中的會(huì)話對包括:根據(jù)會(huì)話內(nèi)容中會(huì)話句的語義,確定會(huì)話內(nèi)容中的發(fā)起句和回復(fù)句;根據(jù)預(yù)設(shè)的類型判斷規(guī)則,確定發(fā)起句和回復(fù)句的類型;根據(jù)發(fā)起句以及發(fā)起句與下一條發(fā)起句之間的回復(fù)句提取基礎(chǔ)會(huì)話對;根據(jù)基礎(chǔ)會(huì)話對、基礎(chǔ)會(huì)話對中發(fā)起句和回復(fù)句的類型,提取至少一個(gè)會(huì)話對。進(jìn)一步地,根據(jù)會(huì)話內(nèi)容中會(huì)話句的語義,確定會(huì)話內(nèi)容中的發(fā)起句和回復(fù)句包括:判斷會(huì)話內(nèi)容中的會(huì)話句在預(yù)設(shè)時(shí)間區(qū)間內(nèi)是否有通訊對方發(fā)送的上文,若無,則將會(huì)話句確定為發(fā)起句;若有,則判斷會(huì)話句是否與通訊對方發(fā)送的上文無語義關(guān)聯(lián),若是,則將會(huì)話句確定為發(fā)起句,否則將會(huì)話句確定為回復(fù)句。進(jìn)一步地,根據(jù)預(yù)設(shè)的類型判斷規(guī)則,確定發(fā)起句的類型包括:判斷發(fā)起句是否為具有完整獨(dú)立語義的語句,若是,則判斷發(fā)起句是否由多個(gè)具有完整獨(dú)立語義的單句組成,若是,則將發(fā)起句的類型確定為復(fù)句發(fā)起句類型,否則為單句發(fā)起句類型;若否,則判斷發(fā)起句是否包含具有完整獨(dú)立語義的單句,若包含,則將發(fā)起句的類型確定為非標(biāo)準(zhǔn)復(fù)句發(fā)起句類型,若不包含,則為非標(biāo)準(zhǔn)單句發(fā)起句類型;搜索非標(biāo)準(zhǔn)單句發(fā)起句類型的發(fā)起句是否有自己的上文和下文連續(xù)會(huì)話句,若無,則不進(jìn)行衍生擴(kuò)展,若有,則進(jìn)一步判斷非標(biāo)準(zhǔn)單句發(fā)起句類型的發(fā)起句是否可與自己的上文和下文連續(xù)會(huì)話句合并成具有完整獨(dú)立語義的語句,若能,則將非標(biāo)準(zhǔn)單句發(fā)起句類型的發(fā)起句的類型衍生擴(kuò)展為非標(biāo)準(zhǔn)句群發(fā)起句類型,若不能,則不進(jìn)行衍生擴(kuò)展;搜索非標(biāo)準(zhǔn)復(fù)句發(fā)起句類型的發(fā)起句是否有自己的上文和下文連續(xù)會(huì)話句,若無,則不進(jìn)行衍生擴(kuò)展,若有,則進(jìn)一步判斷非標(biāo)準(zhǔn)復(fù)句發(fā)起句類型的發(fā)起句是否可與自己的上文和下文連續(xù)會(huì)話句合并成具有完整獨(dú)立語義的語句,若能,則將非標(biāo)準(zhǔn)復(fù)句發(fā)起句類型的發(fā)起句的類型衍生擴(kuò)展為非標(biāo)準(zhǔn)句群發(fā)起句類型,若不能,則不進(jìn)行衍生擴(kuò)展;判斷單句、復(fù)句、非標(biāo)準(zhǔn)單句、非標(biāo)準(zhǔn)復(fù)句以及非標(biāo)準(zhǔn)句群類型的發(fā)起句是否有自己的上文和下文連續(xù)會(huì)話句,若有,則進(jìn)一步判斷發(fā)起句是否可與自己的上文和下文連續(xù)會(huì)話句合并成語義關(guān)聯(lián)的句群,若是,則將發(fā)起句的類型衍生擴(kuò)展為句群發(fā)起句類型,否則不進(jìn)行衍生擴(kuò)展。進(jìn)一步地,根據(jù)預(yù)設(shè)的類型判斷規(guī)則,確定回復(fù)句的類型包括:判斷回復(fù)句是否為具有完整獨(dú)立語義的語句,若是,則判斷回復(fù)句是否由多個(gè)具有完整獨(dú)立語義的單句組成,若是,則將回復(fù)句的類型確定為復(fù)句回復(fù)句類型,否則為單句回復(fù)句類型;若否,則判斷回復(fù)句是否包含具有完整獨(dú)立語義的單句,若包含,則將回復(fù)句的類型確定為非標(biāo)準(zhǔn)復(fù)句回復(fù)句類型,若不包含,則為非標(biāo)準(zhǔn)單句回復(fù)句類型;搜索非標(biāo)準(zhǔn)單句回復(fù)句類型的回復(fù)句是否有自己的上文和下文連續(xù)會(huì)話句,若無,則不進(jìn)行衍生擴(kuò)展,若有,則進(jìn)一步判斷非標(biāo)準(zhǔn)單句回復(fù)句類型的回復(fù)句是否可與自己的上文和下文連續(xù)會(huì)話句合并成具有完整獨(dú)立語義的語句,若能,則將非標(biāo)準(zhǔn)單句回復(fù)句類型的回復(fù)句的類型衍生擴(kuò)展為非標(biāo)準(zhǔn)句群回復(fù)句類型,若不能,則不進(jìn)行衍生擴(kuò)展;搜索非標(biāo)準(zhǔn)復(fù)句回復(fù)句類型的回復(fù)句是否有自己的上文和下文連續(xù)會(huì)話句,若無,則不進(jìn)行衍生擴(kuò)展,若有,則進(jìn)一步判斷非標(biāo)準(zhǔn)復(fù)句回復(fù)句類型的回復(fù)句是否可與自己的上文和下文連續(xù)會(huì)話句合并成具有完整獨(dú)立語義的語句,若能,則將非標(biāo)準(zhǔn)復(fù)句回復(fù)句類型的回復(fù)句的類型衍生擴(kuò)展為非標(biāo)準(zhǔn)句群回復(fù)句類型,若不能,則不進(jìn)行衍生擴(kuò)展;判斷單句、復(fù)句、非標(biāo)準(zhǔn)單句、非標(biāo)準(zhǔn)復(fù)句以及非標(biāo)準(zhǔn)句群類型的回復(fù)句是否有自己的上文和下文連續(xù)會(huì)話句,若有,則進(jìn)一步判斷回復(fù)句是否可與自己的上文和下文連續(xù)會(huì)話句合并成語義關(guān)聯(lián)的句群,若是,則將回復(fù)句的類型衍生擴(kuò)展為句群回復(fù)句類型,否則不進(jìn)行衍生擴(kuò)展。進(jìn)一步地,根據(jù)基礎(chǔ)會(huì)話對、基礎(chǔ)會(huì)話對中發(fā)起句的類型以及基礎(chǔ)會(huì)話對中回復(fù)句的類型,提取至少一個(gè)會(huì)話對包括:將基礎(chǔ)會(huì)話對中發(fā)起句的類型進(jìn)行衍生擴(kuò)展,獲得多種類型的發(fā)起句;將基礎(chǔ)會(huì)話對中回復(fù)句的類型進(jìn)行衍生擴(kuò)展,獲得多種類型的回復(fù)句;根據(jù)多種類型的發(fā)起句以及多種類型的回復(fù)句,組合至少一個(gè)語義關(guān)聯(lián)的會(huì)話對進(jìn)行提取。進(jìn)一步地,將多個(gè)通訊方的個(gè)人語料庫進(jìn)行合并,獲得共享語料庫包括:將多個(gè)通訊方的個(gè)人語料庫進(jìn)行組合,獲得組合語料庫;將組合語料庫中包含相同發(fā)起句的會(huì)話對進(jìn)行同類項(xiàng)合并,獲得共享語料庫。進(jìn)一步地,根據(jù)會(huì)話場景標(biāo)簽值,在共享語料庫中匹配獲得與會(huì)話場景標(biāo)簽值對應(yīng)的通訊聯(lián)系人包括:判斷是否能在共享語料庫中匹配到與會(huì)話場景標(biāo)簽值相同或接近的場景標(biāo)簽值,若是,則將共享語料庫中與場景標(biāo)簽值對應(yīng)的歷史聯(lián)系人作為通訊聯(lián)系人,否則,根據(jù)通訊方的通訊錄中的通訊用戶的基本信息,獲取與會(huì)話場景標(biāo)簽值關(guān)聯(lián)的通訊聯(lián)系人,其中通訊錄包括手機(jī)通訊錄、即時(shí)通訊通訊錄或電郵通訊錄。進(jìn)一步地,根據(jù)會(huì)話場景標(biāo)簽值,在共享語料庫中匹配獲得與會(huì)話場景標(biāo)簽值對應(yīng)的主動(dòng)會(huì)話內(nèi)容包括:判斷是否能在共享語料庫中匹配到與會(huì)話場景標(biāo)簽值相同的場景標(biāo)簽值,若是,則將共享語料庫中與場景標(biāo)簽值對應(yīng)的會(huì)話對中的發(fā)起句作為主動(dòng)會(huì)話內(nèi)容,否則,將與會(huì)話場景標(biāo)簽值的相似度大于預(yù)設(shè)相似度閾值的場景標(biāo)簽值對應(yīng)的會(huì)話對中的發(fā)起句作為主動(dòng)會(huì)話內(nèi)容。本發(fā)明具有以下有益效果:本發(fā)明提供的基于共享語料庫主動(dòng)發(fā)起會(huì)話的方法,通過建立與通訊方對應(yīng)的個(gè)人語料庫,將多個(gè)通訊方的個(gè)人語料庫進(jìn)行合并,獲得共享語料庫,根據(jù)預(yù)設(shè)的會(huì)話場景標(biāo)簽,采集獲得當(dāng)前與會(huì)話場景標(biāo)簽對應(yīng)的會(huì)話場景標(biāo)簽值,根據(jù)會(huì)話場景標(biāo)簽值,在共享語料庫中匹配獲得與會(huì)話場景標(biāo)簽值對應(yīng)的通訊聯(lián)系人,根據(jù)會(huì)話場景標(biāo)簽值,在共享語料庫中匹配獲得與會(huì)話場景標(biāo)簽值對應(yīng)的主動(dòng)會(huì)話內(nèi)容以及將主動(dòng)會(huì)話內(nèi)容發(fā)送至通訊聯(lián)系人,解決了現(xiàn)有通訊方向通訊對方發(fā)起會(huì)話時(shí),不僅需要通訊方手動(dòng)獲取通訊聯(lián)系人,而且還需通訊方人工構(gòu)思創(chuàng)建主動(dòng)會(huì)話內(nèi)容,費(fèi)時(shí)費(fèi)力且效率低的技術(shù)問題,不僅實(shí)現(xiàn)了根據(jù)會(huì)話場景標(biāo)簽值在共享語料庫中自動(dòng)匹配獲得通訊聯(lián)系人,而且實(shí)現(xiàn)了根據(jù)會(huì)話場景標(biāo)簽值在共享語料庫中智能匹配獲取向通訊聯(lián)系人發(fā)起會(huì)話的主動(dòng)會(huì)話內(nèi)容,且獲取的主動(dòng)會(huì)話內(nèi)容充分結(jié)合了當(dāng)前的會(huì)話場景標(biāo)簽值,具有較高的智能化和個(gè)性化水平。除了上面所描述的目的、特征和優(yōu)點(diǎn)之外,本發(fā)明還有其它的目的、特征和優(yōu)點(diǎn)。下面將參照圖,對本發(fā)明作進(jìn)一步詳細(xì)的說明。附圖說明構(gòu)建本申請的一部分的附圖用來提供對本發(fā)明的進(jìn)一步理解,本發(fā)明的示意性實(shí)施例及其說明用于解釋本發(fā)明,并不構(gòu)建對本發(fā)明的不當(dāng)限定。在附圖中:圖1是本發(fā)明優(yōu)選實(shí)施例基于共享語料庫主動(dòng)發(fā)起會(huì)話的方法流程圖;圖2是本發(fā)明優(yōu)選實(shí)施例針對的精簡實(shí)施例的基于共享語料庫主動(dòng)發(fā)起會(huì)話的方法流程圖。具體實(shí)施方式以下結(jié)合附圖對本發(fā)明的實(shí)施例進(jìn)行詳細(xì)說明,但是本發(fā)明可以由權(quán)利要求限定和覆蓋的多種不同方式實(shí)施。參照圖1,本發(fā)明的優(yōu)選實(shí)施例提供了一種基于共享語料庫主動(dòng)發(fā)起會(huì)話的方法,包括:步驟s101,建立與通訊方對應(yīng)的個(gè)人語料庫,其中,通訊方的數(shù)目大于一;步驟s102,將多個(gè)通訊方的個(gè)人語料庫進(jìn)行合并,獲得共享語料庫;步驟s103,根據(jù)預(yù)設(shè)的會(huì)話場景標(biāo)簽,采集獲得當(dāng)前與會(huì)話場景標(biāo)簽對應(yīng)的會(huì)話場景標(biāo)簽值;步驟s104,根據(jù)會(huì)話場景標(biāo)簽值,在共享語料庫中匹配獲得與會(huì)話場景標(biāo)簽值對應(yīng)的通訊聯(lián)系人;步驟s105,根據(jù)會(huì)話場景標(biāo)簽值,在共享語料庫中匹配獲得與會(huì)話場景標(biāo)簽值對應(yīng)的主動(dòng)會(huì)話內(nèi)容;步驟s106,將主動(dòng)會(huì)話內(nèi)容發(fā)送至通訊聯(lián)系人。本發(fā)明實(shí)施例提供的基于共享語料庫主動(dòng)發(fā)起會(huì)話的方法,通過建立與通訊方對應(yīng)的個(gè)人語料庫,將多個(gè)通訊方的個(gè)人語料庫進(jìn)行合并,獲得共享語料庫,根據(jù)預(yù)設(shè)的會(huì)話場景標(biāo)簽,采集獲得當(dāng)前與會(huì)話場景標(biāo)簽對應(yīng)的會(huì)話場景標(biāo)簽值,根據(jù)會(huì)話場景標(biāo)簽值,在共享語料庫中匹配獲得與會(huì)話場景標(biāo)簽值對應(yīng)的通訊聯(lián)系人,根據(jù)會(huì)話場景標(biāo)簽值,在共享語料庫中匹配獲得與會(huì)話場景標(biāo)簽值對應(yīng)的主動(dòng)會(huì)話內(nèi)容以及將主動(dòng)會(huì)話內(nèi)容發(fā)送至通訊聯(lián)系人,解決了現(xiàn)有通訊方向通訊對方發(fā)起會(huì)話時(shí),不僅需要通訊方手動(dòng)獲取通訊聯(lián)系人,而且還需通訊方人工構(gòu)思創(chuàng)建主動(dòng)會(huì)話內(nèi)容,費(fèi)時(shí)費(fèi)力且效率低的技術(shù)問題,不僅實(shí)現(xiàn)了根據(jù)會(huì)話場景標(biāo)簽值在共享語料庫中自動(dòng)匹配獲得通訊聯(lián)系人,而且實(shí)現(xiàn)了根據(jù)會(huì)話場景標(biāo)簽值在共享語料庫中智能匹配獲取向通訊聯(lián)系人發(fā)起會(huì)話的主動(dòng)會(huì)話內(nèi)容,且獲取的主動(dòng)會(huì)話內(nèi)容充分結(jié)合了當(dāng)前的會(huì)話場景標(biāo)簽值,具有較高的智能化和個(gè)性化水平。需要說明的是,由于本實(shí)施例是通過合并多個(gè)通訊方的個(gè)人語料庫獲得共享語料庫,故在建立與通訊方對應(yīng)的個(gè)人語料庫時(shí),通訊方的數(shù)目需大于一,也即需創(chuàng)建至少兩個(gè)通訊方的個(gè)人語料庫。此外,本方案中的通訊方并不限于通訊過程中的通訊發(fā)起人,例如通訊方還可以是其他任意可以主動(dòng)發(fā)起會(huì)話的發(fā)起端,例如人機(jī)會(huì)話系統(tǒng)中的機(jī)器人,且當(dāng)通訊方是人機(jī)會(huì)話系統(tǒng)中的機(jī)器人時(shí),其對通訊聯(lián)系人主動(dòng)發(fā)起會(huì)話的過程和方法與當(dāng)通訊方是通訊發(fā)起人時(shí)相同,故不再細(xì)述。可選地,建立與通訊方對應(yīng)的個(gè)人語料庫包括:采集通訊方的會(huì)話內(nèi)容;獲取會(huì)話內(nèi)容中的會(huì)話對;獲取與會(huì)話對對應(yīng)的歷史聯(lián)系人;根據(jù)預(yù)設(shè)的場景標(biāo)簽,采集獲得會(huì)話對與場景標(biāo)簽對應(yīng)的場景標(biāo)簽值;將會(huì)話對、歷史聯(lián)系人、場景標(biāo)簽值進(jìn)行匹配組合,從而生成個(gè)人語料庫。本發(fā)明實(shí)施例通過采集通訊方的會(huì)話內(nèi)容,獲取會(huì)話內(nèi)容中的會(huì)話對,獲取與會(huì)話對對應(yīng)的歷史聯(lián)系人,根據(jù)預(yù)設(shè)的場景標(biāo)簽,采集獲得會(huì)話對與場景標(biāo)簽對應(yīng)的場景標(biāo)簽值以及將會(huì)話對、歷史聯(lián)系人以及場景標(biāo)簽值進(jìn)行匹配組合,從而生成個(gè)人語料庫,不僅大大減少了人工建立會(huì)話語料庫的工作量,而且根據(jù)通訊方的會(huì)話內(nèi)容提取的會(huì)話對和與之對應(yīng)的歷史聯(lián)系人、場景標(biāo)簽值生成的個(gè)人語料庫具有個(gè)人專屬性和較強(qiáng)的針對性,從而使得根據(jù)會(huì)話場景標(biāo)簽值,不僅能在個(gè)人語料庫中匹配獲得通訊聯(lián)系人,而且還能匹配獲得智能化程度高且與通訊方息息相關(guān)的主動(dòng)會(huì)話內(nèi)容,實(shí)用價(jià)值高。此外,本發(fā)明實(shí)施例直接根據(jù)會(huì)話對、歷史聯(lián)系人以及場景標(biāo)簽值生成個(gè)人語料庫,完全模擬真實(shí)會(huì)話場景建立個(gè)人語料庫,使得建立的個(gè)人語料庫更精準(zhǔn)和實(shí)用,從而為基于個(gè)人語料庫匹配獲得通訊聯(lián)系人和主動(dòng)會(huì)話內(nèi)容奠定數(shù)據(jù)基礎(chǔ)。需要說明的是,本發(fā)明實(shí)施例將會(huì)話對、歷史聯(lián)系人以及場景標(biāo)簽值進(jìn)行匹配組合生成個(gè)人語料庫,也即按照“會(huì)話對+歷史聯(lián)系人+場景標(biāo)簽值”的內(nèi)容匹配組合規(guī)則,生成個(gè)人語料庫。此外,由于不同的會(huì)話內(nèi)容具有不同的歷史聯(lián)系人和場景特性,故本實(shí)施例獲取會(huì)話內(nèi)容中的會(huì)話對后,進(jìn)一步獲取與會(huì)話對對應(yīng)的歷史聯(lián)系人以及根據(jù)預(yù)設(shè)的場景標(biāo)簽,采集獲得會(huì)話對與場景標(biāo)簽對應(yīng)的場景標(biāo)簽值,并將會(huì)話對、歷史聯(lián)系人以及場景標(biāo)簽值進(jìn)行匹配組合,從而生成個(gè)人語料庫。由于對于場景標(biāo)簽組合中的一些場景標(biāo)簽(例如會(huì)話時(shí)間、會(huì)話地點(diǎn)等),系統(tǒng)可以對其進(jìn)行直接采集,而對于另外一些場景標(biāo)簽(例如會(huì)話內(nèi)容主題、會(huì)話雙方關(guān)系等),系統(tǒng)無法對其進(jìn)行直接采集,故本實(shí)施例將場景標(biāo)簽分為第一場景標(biāo)簽和第二場景標(biāo)簽,其中第一場景標(biāo)簽為能對其進(jìn)行直接采集的場景標(biāo)簽,例如時(shí)間、地點(diǎn)場景標(biāo)簽,第二場景標(biāo)簽為不能對其進(jìn)行直接采集的場景標(biāo)簽,例如會(huì)話內(nèi)容主題、會(huì)話雙方關(guān)系場景標(biāo)簽等等。且本實(shí)施例針對第二場景標(biāo)簽,可以通過搜索或匹配獲得第二會(huì)話場景標(biāo)簽值;根據(jù)所述第一會(huì)話場景標(biāo)簽值推理獲得第二會(huì)話場景標(biāo)簽值;通過對會(huì)話內(nèi)容進(jìn)行語義推理獲得第二會(huì)話場景標(biāo)簽值;通過獲取與會(huì)話內(nèi)容關(guān)聯(lián)的關(guān)聯(lián)詞獲得第二會(huì)話場景標(biāo)簽值;根據(jù)已訓(xùn)練好的分類器分類獲得第二會(huì)話場景標(biāo)簽值;通過已獲得的第二會(huì)話場景標(biāo)簽進(jìn)一步多層次推理計(jì)算獲得新的第二會(huì)話場景標(biāo)簽;或根據(jù)上述方法的任意組合獲得第二場景標(biāo)簽值。例如針對地點(diǎn)場景標(biāo)簽值,可以通過移動(dòng)終端的gps自動(dòng)采集獲得;針對通訊雙方關(guān)系場景標(biāo)簽值,可以通過第一場景標(biāo)簽值推理獲得;針對會(huì)話意圖采集標(biāo)簽值,可以通過計(jì)算與會(huì)話內(nèi)容關(guān)聯(lián)的詞向量獲得;針對心情場景標(biāo)簽值,可以通過將會(huì)話內(nèi)容和/或第一會(huì)話場景標(biāo)簽值輸入分類器,并根據(jù)分類器的輸出結(jié)果,獲得心情場景標(biāo)簽值。由此可見,本實(shí)施例針對不能直接進(jìn)行采集的場景標(biāo)簽,能實(shí)現(xiàn)對其進(jìn)行自動(dòng)獲取,體現(xiàn)了較高的智能化程度??蛇x地,獲取會(huì)話內(nèi)容中的會(huì)話對包括:根據(jù)會(huì)話內(nèi)容中會(huì)話句的語義,確定會(huì)話內(nèi)容中的發(fā)起句和回復(fù)句;根據(jù)預(yù)設(shè)的類型判斷規(guī)則,確定發(fā)起句和回復(fù)句的類型;根據(jù)發(fā)起句以及發(fā)起句與下一條發(fā)起句之間的回復(fù)句提取基礎(chǔ)會(huì)話對;根據(jù)基礎(chǔ)會(huì)話對、基礎(chǔ)會(huì)話對中發(fā)起句和回復(fù)句的類型,提取至少一個(gè)會(huì)話對?,F(xiàn)有從會(huì)話內(nèi)容中提取的會(huì)話對或問答對,往往是一問一答的會(huì)話對形式,而在實(shí)際的會(huì)話過程中,通訊雙方進(jìn)行會(huì)話并非完全符合一問一答的會(huì)話模式,例如針對通訊對方發(fā)送的會(huì)話句,通訊方可能回復(fù)了幾條會(huì)話句,或針對通訊對方發(fā)送的多條會(huì)話句,通訊方可能只回復(fù)了一條會(huì)話句。故如果僅僅采取一問一答的形式提取對話對,可能存在以下問題:(1)對于一些沒有以一問一答形式展現(xiàn)的會(huì)話內(nèi)容,從會(huì)話內(nèi)容中提取會(huì)話對的難度較大,且精度較低。例如對于多個(gè)發(fā)起句+多個(gè)回復(fù)句形式的會(huì)話內(nèi)容,從中提取會(huì)話對時(shí),需要分析與每一個(gè)發(fā)起句匹配的回復(fù)句,過程復(fù)雜,難度大,且精度較低。(2)由于現(xiàn)有根據(jù)會(huì)話內(nèi)容提取的問答對或會(huì)話對一般都是比較標(biāo)準(zhǔn)的會(huì)話句,或結(jié)構(gòu)比較簡單的會(huì)話句,這將導(dǎo)致針對一些復(fù)雜或非標(biāo)準(zhǔn)結(jié)構(gòu)的會(huì)話句不能精準(zhǔn)提取完整性好和實(shí)用性高的會(huì)話對,從而影響通過共享語料庫匹配獲得的主動(dòng)會(huì)話內(nèi)容的精準(zhǔn)性和實(shí)用性。(3)此外,由于以一問一答形式提取的會(huì)話對的完整性容易被破壞,這將導(dǎo)致提取的會(huì)話對不能準(zhǔn)確模擬真實(shí)會(huì)話,從而導(dǎo)致通過共享語料庫匹配獲得的主動(dòng)會(huì)話內(nèi)容不能準(zhǔn)確模擬真實(shí)會(huì)話。針對上述問題,本實(shí)施例通過根據(jù)會(huì)話內(nèi)容中會(huì)話句的語義,確定會(huì)話內(nèi)容中的發(fā)起句和回復(fù)句,根據(jù)預(yù)設(shè)的類型判斷規(guī)則,確定發(fā)起句和回復(fù)句的類型,根據(jù)發(fā)起句以及發(fā)起句與下一條發(fā)起句之間的回復(fù)句提取基礎(chǔ)會(huì)話對,以及根據(jù)基礎(chǔ)會(huì)話對、基礎(chǔ)會(huì)話對中發(fā)起句和回復(fù)句的類型,提取至少一個(gè)會(huì)話對,解決了現(xiàn)有技術(shù)提取會(huì)話對的難度較大、精度較低的技術(shù)問題,打破了傳統(tǒng)的一問一答的會(huì)話對形式的局限性,并且根據(jù)發(fā)起句和回復(fù)句的類型,不僅能快速有效地提取會(huì)話對,而且提取的會(huì)話對的精度和準(zhǔn)確度也大大提升,從而提高了通過共享語料庫匹配獲得的主動(dòng)會(huì)話內(nèi)容的精準(zhǔn)度。此外,針對一些復(fù)雜或非標(biāo)準(zhǔn)結(jié)構(gòu)的會(huì)話句,本發(fā)明實(shí)施例能精準(zhǔn)提取完整性好和實(shí)用性高的會(huì)話對,從而使得通過共享語料庫匹配獲得的主動(dòng)會(huì)話內(nèi)容能準(zhǔn)確模擬真實(shí)會(huì)話,智能化程度較高。進(jìn)一步地,本發(fā)明實(shí)施例提取的會(huì)話對形式多樣,有利于基于會(huì)話對精準(zhǔn)匹配主動(dòng)會(huì)話內(nèi)容,以及匹配獲得形式多樣的主動(dòng)會(huì)話內(nèi)容,實(shí)用性較高。需要說明的是,本實(shí)施例在確定發(fā)起句和回復(fù)句的類型之前,首先預(yù)設(shè)發(fā)起句和回復(fù)句的類型以及與類型對應(yīng)的類型判斷規(guī)則,從而根據(jù)預(yù)設(shè)的類型判斷規(guī)則,可以快速確定發(fā)起句和回復(fù)句的類型。且本實(shí)施例中的發(fā)起句具體是指無通訊對方發(fā)送上文的會(huì)話句或與通訊對方發(fā)送的上文無語義關(guān)聯(lián)的會(huì)話句。本實(shí)施例可以通過采集通訊方的即時(shí)通訊賬號、郵箱賬號、手機(jī)號的會(huì)話內(nèi)容獲得通訊方的會(huì)話內(nèi)容,其中會(huì)話內(nèi)容為文本、圖片、語音、視頻或動(dòng)漫格式,且當(dāng)會(huì)話內(nèi)容是語音、圖片、視頻或動(dòng)漫格式時(shí),還包括將語音、圖片、視頻或動(dòng)漫格式的會(huì)話內(nèi)容轉(zhuǎn)換為文本格式的會(huì)話內(nèi)容。可選地,根據(jù)會(huì)話內(nèi)容中會(huì)話句的語義,確定會(huì)話內(nèi)容中的發(fā)起句和回復(fù)句包括:判斷會(huì)話內(nèi)容中的會(huì)話句在預(yù)設(shè)時(shí)間區(qū)間內(nèi)是否有通訊對方發(fā)送的上文,若無,則將會(huì)話句確定為發(fā)起句;若有,則判斷會(huì)話句是否與通訊對方發(fā)送的上文無語義關(guān)聯(lián),若是,則將會(huì)話句確定為發(fā)起句,否則將會(huì)話句確定為回復(fù)句。為了精準(zhǔn)提取會(huì)話內(nèi)容中的會(huì)話對,本實(shí)施例首先根據(jù)會(huì)話內(nèi)容中會(huì)話句的語義,確定會(huì)話內(nèi)容中的發(fā)起句和回復(fù)句,然后再進(jìn)一步確定發(fā)起句和回復(fù)句的類型,從而根據(jù)發(fā)起句和回復(fù)句的類型精準(zhǔn)提取會(huì)話對。其中,本實(shí)施例所指的根據(jù)會(huì)話內(nèi)容中會(huì)話句的語義,確定會(huì)話內(nèi)容中的發(fā)起句和回復(fù)句的具體過程為:判斷會(huì)話內(nèi)容中的會(huì)話句在預(yù)設(shè)時(shí)間區(qū)間內(nèi)是否有通訊對方發(fā)送的上文,若無,則將會(huì)話句確定為發(fā)起句,若有,則判斷會(huì)話句是否與通訊對方發(fā)送的上文無語義關(guān)聯(lián),若是,則將會(huì)話句確定為發(fā)起句,否則將會(huì)話句確定為回復(fù)句。在實(shí)際的會(huì)話過程中,如果當(dāng)前會(huì)話句在預(yù)設(shè)時(shí)間區(qū)間內(nèi)無通訊對方發(fā)送的上文,一般將其認(rèn)為是發(fā)起會(huì)話的起始句,也即發(fā)起句。例如假設(shè)當(dāng)前會(huì)話句為12月3日發(fā)送的會(huì)話句,上一條會(huì)話句是通訊對方于12月1日發(fā)送的會(huì)話句,假設(shè)預(yù)設(shè)的時(shí)間區(qū)間為1天,則通過判斷可知,當(dāng)前會(huì)話句在預(yù)設(shè)時(shí)間區(qū)間內(nèi)無通訊對方發(fā)送的上文,則將當(dāng)前會(huì)話句認(rèn)為是發(fā)起會(huì)話的起始句,也即將當(dāng)前會(huì)話句判定為發(fā)起句。且本實(shí)施例預(yù)設(shè)的時(shí)間區(qū)間具體由用戶自定義,例如可以是1小時(shí)、半天、一天、一個(gè)月等等,也即當(dāng)判斷出當(dāng)前會(huì)話句在1小時(shí)、半天、一天、一個(gè)月內(nèi)無通訊對方發(fā)送的上文,則判定當(dāng)前會(huì)話句為發(fā)起句。此外,當(dāng)會(huì)話句有通訊對方發(fā)送的上文時(shí),根據(jù)實(shí)際會(huì)話內(nèi)容可判斷,會(huì)話句可能是回復(fù)通訊對方發(fā)送的上文的回復(fù)句;也可能不是回復(fù)通訊對方發(fā)送的上文,而是重新發(fā)起會(huì)話的發(fā)起句;或者同時(shí)是回復(fù)通訊對方發(fā)送的上文的回復(fù)句和重新發(fā)起會(huì)話的發(fā)起句。針對這種情況,本實(shí)施例通過判斷會(huì)話句是否與通訊對方發(fā)送的上文無語義關(guān)聯(lián)來確定會(huì)話句的類型。需要說明的是,本實(shí)施例中會(huì)話句是否與通訊對方發(fā)送的上文無語義關(guān)聯(lián),具體是指會(huì)話句是否包括與通訊對方發(fā)送的上文無語義關(guān)聯(lián)的語句。例如,當(dāng)會(huì)話句有通訊對方發(fā)送的上文,且通訊對方a發(fā)送的上文為“最近怎么樣?”,則針對第一種情況的會(huì)話句(通訊方b:“挺好的”),可判斷出該會(huì)話句不包括與通訊對方發(fā)送的上文無語義關(guān)聯(lián)的語句,此時(shí)確定該會(huì)話句為回復(fù)句;針對第二種情況的會(huì)話句(通訊方b:“幫我繳電話費(fèi)了嗎?”),可判斷出該會(huì)話句包括與通訊對方發(fā)送的上文無語義關(guān)聯(lián)的語句,此時(shí)確定該會(huì)話句為發(fā)起句;針對第三種情況的會(huì)話句(通訊方b:“挺好的,幫我繳電話費(fèi)了嗎?”),可判斷出該會(huì)話句同樣包括與通訊對方發(fā)送的上文無語義關(guān)聯(lián)的語句(“幫我繳電話費(fèi)了嗎?”),此時(shí)確定該會(huì)話句為發(fā)起句。本實(shí)施例通過判斷會(huì)話內(nèi)容中的會(huì)話句在預(yù)設(shè)時(shí)間區(qū)間內(nèi)是否有通訊對方發(fā)送的上文以及在有通訊對方發(fā)送的上文時(shí)判斷會(huì)話句是否與通訊對方發(fā)送的上文無語義關(guān)聯(lián),可以精準(zhǔn)確定會(huì)話內(nèi)容中的發(fā)起句和回復(fù)句,為后續(xù)根據(jù)精準(zhǔn)確定的發(fā)起句和回復(fù)句提取會(huì)話對,以及基于提取的會(huì)話對創(chuàng)建的共享語料庫匹配獲得精準(zhǔn)度高的主動(dòng)會(huì)話內(nèi)容奠定基礎(chǔ)。可選地,根據(jù)預(yù)設(shè)的類型判斷規(guī)則,確定發(fā)起句的類型包括:判斷發(fā)起句是否為具有完整獨(dú)立語義的語句,若是,則判斷發(fā)起句是否由多個(gè)具有完整獨(dú)立語義的單句組成,若是,則將發(fā)起句的類型確定為復(fù)句發(fā)起句類型,否則為單句發(fā)起句類型;若否,則判斷發(fā)起句是否包含具有完整獨(dú)立語義的單句,若包含,則將發(fā)起句的類型確定為非標(biāo)準(zhǔn)復(fù)句發(fā)起句類型,若不包含,則為非標(biāo)準(zhǔn)單句發(fā)起句類型;搜索非標(biāo)準(zhǔn)單句發(fā)起句類型的發(fā)起句是否有自己的上文和下文連續(xù)會(huì)話句,若無,則不進(jìn)行衍生擴(kuò)展,若有,則進(jìn)一步判斷非標(biāo)準(zhǔn)單句發(fā)起句類型的發(fā)起句是否可與自己的上文和下文連續(xù)會(huì)話句合并成具有完整獨(dú)立語義的語句,若能,則將非標(biāo)準(zhǔn)單句發(fā)起句類型的發(fā)起句的類型衍生擴(kuò)展為非標(biāo)準(zhǔn)句群發(fā)起句類型,若不能,則不進(jìn)行衍生擴(kuò)展;搜索非標(biāo)準(zhǔn)復(fù)句發(fā)起句類型的發(fā)起句是否有自己的上文和下文連續(xù)會(huì)話句,若無,則不進(jìn)行衍生擴(kuò)展,若有,則進(jìn)一步判斷非標(biāo)準(zhǔn)復(fù)句發(fā)起句類型的發(fā)起句是否可與自己的上文和下文連續(xù)會(huì)話句合并成具有完整獨(dú)立語義的語句,若能,則將非標(biāo)準(zhǔn)復(fù)句發(fā)起句類型的發(fā)起句的類型衍生擴(kuò)展為非標(biāo)準(zhǔn)句群發(fā)起句類型,若不能,則不進(jìn)行衍生擴(kuò)展;判斷單句、復(fù)句、非標(biāo)準(zhǔn)單句、非標(biāo)準(zhǔn)復(fù)句以及非標(biāo)準(zhǔn)句群類型的發(fā)起句是否有自己的上文和下文連續(xù)會(huì)話句,若有,則進(jìn)一步判斷發(fā)起句是否可與自己的上文和下文連續(xù)會(huì)話句合并成語義關(guān)聯(lián)的句群,若是,則將發(fā)起句的類型衍生擴(kuò)展為句群發(fā)起句類型,否則不進(jìn)行衍生擴(kuò)展。在實(shí)際的實(shí)施過程中,發(fā)起句可能以多種類型進(jìn)行呈現(xiàn),例如單句、復(fù)句、非標(biāo)準(zhǔn)句等等,且不同類型的發(fā)起句可能會(huì)影響或?qū)е绿崛〉臅?huì)話對不同。針對該問題,本實(shí)施例按照預(yù)設(shè)的類型判斷規(guī)則,確定發(fā)起句的類型。具體地,首先在發(fā)起句具有完整獨(dú)立語義的前提下,通過判斷發(fā)起句是由一個(gè)還是多個(gè)完整獨(dú)立語義的單句組成,確定發(fā)起句為單句還是復(fù)句發(fā)起句類型,以及在發(fā)起句不具有完整獨(dú)立語義的前提下,通過判斷發(fā)起句是否包含具有完整獨(dú)立語義的單句來確定發(fā)起句的類型為非標(biāo)準(zhǔn)復(fù)句還是非標(biāo)準(zhǔn)單句發(fā)起句類型;然后通過搜索非標(biāo)準(zhǔn)單句和非標(biāo)準(zhǔn)復(fù)句發(fā)起句類型的發(fā)起句是否有自己的上文和下文連續(xù)會(huì)話句,以及是否可與自己的上文和下文連續(xù)會(huì)話句合并成具有完整獨(dú)立語義的語句,確定是否將發(fā)起句的類型衍生擴(kuò)展為非標(biāo)準(zhǔn)句群發(fā)起句類型;最后通過判斷單句、復(fù)句、非標(biāo)準(zhǔn)單句、非標(biāo)準(zhǔn)復(fù)句以及非標(biāo)準(zhǔn)句群類型的發(fā)起句是否有自己的上文和下文連續(xù)會(huì)話句,確定發(fā)起句的類型是否可以衍生擴(kuò)展為句群發(fā)起句類型。具體地,本實(shí)施例確定發(fā)起句類型的過程本質(zhì)上分為三個(gè)判別過程,即第一個(gè)判別過程是對每一條發(fā)起句按照四種發(fā)起句類型(單句、復(fù)句、非標(biāo)準(zhǔn)單句以及非標(biāo)準(zhǔn)復(fù)句)進(jìn)行逐一判別;第二個(gè)判別過程是在進(jìn)行完第一個(gè)判別過程后,接著判別非標(biāo)準(zhǔn)單句和非標(biāo)準(zhǔn)復(fù)句發(fā)起句類型的發(fā)起句是否可進(jìn)一步衍生擴(kuò)展為非標(biāo)準(zhǔn)句群發(fā)起句類型;第三個(gè)判別過程是在進(jìn)行完第二個(gè)判別過程后,接著判別單句、復(fù)句、非標(biāo)準(zhǔn)單句、非標(biāo)準(zhǔn)復(fù)句以及非標(biāo)準(zhǔn)句群類型的發(fā)起句是否可進(jìn)一步衍生擴(kuò)展為句群發(fā)起句類型。本實(shí)施例通過確定發(fā)起句的類型,一方面有利于對發(fā)起句進(jìn)行句子結(jié)構(gòu)和成分的深度分析,另一方面,基于對發(fā)起句進(jìn)行類型判斷和結(jié)構(gòu)分析,有利于更精準(zhǔn)提取實(shí)用性高且形式多樣的會(huì)話對,為后續(xù)基于提取的會(huì)話對創(chuàng)建的共享語料庫匹配獲得精準(zhǔn)度高的主動(dòng)會(huì)話內(nèi)容奠定基礎(chǔ)。需要說明的是,本實(shí)施例中發(fā)起句是否有自己的上文和下文連續(xù)會(huì)話句具體是指發(fā)起句是否有發(fā)送發(fā)起句的發(fā)送方發(fā)送的上文和下文連續(xù)會(huì)話句??蛇x地,根據(jù)預(yù)設(shè)的類型判斷規(guī)則,確定回復(fù)句的類型包括:判斷回復(fù)句是否為具有完整獨(dú)立語義的語句,若是,則判斷回復(fù)句是否由多個(gè)具有完整獨(dú)立語義的單句組成,若是,則將回復(fù)句的類型確定為復(fù)句回復(fù)句類型,否則為單句回復(fù)句類型;若否,則判斷回復(fù)句是否包含具有完整獨(dú)立語義的單句,若包含,則將回復(fù)句的類型確定為非標(biāo)準(zhǔn)復(fù)句回復(fù)句類型,若不包含,則為非標(biāo)準(zhǔn)單句回復(fù)句類型;搜索非標(biāo)準(zhǔn)單句回復(fù)句類型的回復(fù)句是否有自己的上文和下文連續(xù)會(huì)話句,若無,則不進(jìn)行衍生擴(kuò)展,若有,則進(jìn)一步判斷非標(biāo)準(zhǔn)單句回復(fù)句類型的回復(fù)句是否可與自己的上文和下文連續(xù)會(huì)話句合并成具有完整獨(dú)立語義的語句,若能,則將非標(biāo)準(zhǔn)單句回復(fù)句類型的回復(fù)句的類型衍生擴(kuò)展為非標(biāo)準(zhǔn)句群回復(fù)句類型,若不能,則不進(jìn)行衍生擴(kuò)展;搜索非標(biāo)準(zhǔn)復(fù)句回復(fù)句類型的回復(fù)句是否有自己的上文和下文連續(xù)會(huì)話句,若無,則不進(jìn)行衍生擴(kuò)展,若有,則進(jìn)一步判斷非標(biāo)準(zhǔn)復(fù)句回復(fù)句類型的回復(fù)句是否可與自己的上文和下文連續(xù)會(huì)話句合并成具有完整獨(dú)立語義的語句,若能,則將非標(biāo)準(zhǔn)復(fù)句回復(fù)句類型的回復(fù)句的類型衍生擴(kuò)展為非標(biāo)準(zhǔn)句群回復(fù)句類型,若不能,則不進(jìn)行衍生擴(kuò)展;判斷單句、復(fù)句、非標(biāo)準(zhǔn)單句、非標(biāo)準(zhǔn)復(fù)句以及非標(biāo)準(zhǔn)句群類型的回復(fù)句是否有自己的上文和下文連續(xù)會(huì)話句,若有,則進(jìn)一步判斷回復(fù)句是否可與自己的上文和下文連續(xù)會(huì)話句合并成語義關(guān)聯(lián)的句群,若是,則將回復(fù)句的類型衍生擴(kuò)展為句群回復(fù)句類型,否則不進(jìn)行衍生擴(kuò)展。本實(shí)施例判斷回復(fù)句的類型和判斷發(fā)起句的類型的原理和過程基本相同,故不再詳述。且本實(shí)施例通過確定回復(fù)句的類型,一方面有利于對回復(fù)句進(jìn)行句子結(jié)構(gòu)和成分的深度分析,另一方面,基于對回復(fù)句進(jìn)行類型判斷和結(jié)構(gòu)分析,有利于更精準(zhǔn)提取實(shí)用性高且形式多樣的會(huì)話對,為后續(xù)基于提取的會(huì)話對創(chuàng)建的共享語料庫匹配獲得精準(zhǔn)度高的主動(dòng)會(huì)話內(nèi)容奠定基礎(chǔ)。需要說明的是,本實(shí)施例中回復(fù)句是否有自己的上文和下文連續(xù)會(huì)話句具體是指回復(fù)句是否有發(fā)送所述回復(fù)句的發(fā)送方發(fā)送的上文和下文連續(xù)會(huì)話句??蛇x地,根據(jù)基礎(chǔ)會(huì)話對、基礎(chǔ)會(huì)話對中發(fā)起句的類型以及基礎(chǔ)會(huì)話對中回復(fù)句的類型,提取至少一個(gè)會(huì)話對包括:將基礎(chǔ)會(huì)話對中發(fā)起句的類型進(jìn)行衍生擴(kuò)展,獲得多種類型的發(fā)起句;將基礎(chǔ)會(huì)話對中回復(fù)句的類型進(jìn)行衍生擴(kuò)展,獲得多種類型的回復(fù)句;根據(jù)多種類型的發(fā)起句以及多種類型的回復(fù)句,組合至少一個(gè)語義關(guān)聯(lián)的會(huì)話對進(jìn)行提取。由于本實(shí)施例中發(fā)起句和回復(fù)句的類型包括多種,例如單句、復(fù)句、非標(biāo)準(zhǔn)單句、非標(biāo)準(zhǔn)復(fù)句,非標(biāo)準(zhǔn)句群、句群發(fā)起句類型,以及單句、復(fù)句、非標(biāo)準(zhǔn)單句、非標(biāo)準(zhǔn)復(fù)句、非標(biāo)準(zhǔn)句群、句群回復(fù)句類型,故在提取到基礎(chǔ)會(huì)話對后,為了更精準(zhǔn)提取實(shí)用性高且形式多樣的會(huì)話對,本實(shí)施例首先將基礎(chǔ)會(huì)話對中發(fā)起句的類型進(jìn)行衍生擴(kuò)展,獲得多種類型的發(fā)起句,然后將基礎(chǔ)會(huì)話對中回復(fù)句的類型進(jìn)行衍生擴(kuò)展,獲得多種類型的回復(fù)句,最后根據(jù)多種類型的發(fā)起句以及多種類型的回復(fù)句,組合至少一個(gè)語義關(guān)聯(lián)的會(huì)話對進(jìn)行提取,從而可以組合獲得多個(gè)會(huì)話對。例如假設(shè)發(fā)起句類型為復(fù)句發(fā)起句類型,回復(fù)句為復(fù)句回復(fù)句類型,則通過類型衍生擴(kuò)展后,可以提取出單句發(fā)起句+單句回復(fù)句,復(fù)句發(fā)起句+單句回復(fù)句,單句發(fā)起句+復(fù)句回復(fù)句,復(fù)句發(fā)起句+復(fù)句回復(fù)句等多種形式的會(huì)話對。可選地,將多個(gè)通訊方的個(gè)人語料庫進(jìn)行合并,獲得共享語料庫包括:將多個(gè)通訊方的個(gè)人語料庫進(jìn)行組合,獲得組合語料庫;將組合語料庫中包含相同發(fā)起句的會(huì)話對進(jìn)行同類項(xiàng)合并,獲得共享語料庫。由于本實(shí)施例創(chuàng)建的通訊方的個(gè)人語料庫都是由會(huì)話對組成的,也即由會(huì)話發(fā)起句和與之對應(yīng)的會(huì)話回復(fù)句組成。故本實(shí)施例在將多個(gè)通訊方的個(gè)人語料庫進(jìn)行合并,獲得共享語料庫時(shí),首先將多個(gè)通訊方的個(gè)人語料庫進(jìn)行組合,獲得組合語料庫,然后將組合語料庫中包含相同發(fā)起句的會(huì)話對進(jìn)行同類項(xiàng)合并,獲得共享語料庫。需要說明的是,本實(shí)施例將組合語料庫中包含相同發(fā)起句的會(huì)話對進(jìn)行同類項(xiàng)合并,即將包含相同發(fā)起句的會(huì)話對中的答復(fù)句合并。例如假設(shè)通訊方a的個(gè)人語料庫包含會(huì)話對{發(fā)起句:最近怎么樣?/回復(fù)句:挺好的},通訊方b的個(gè)人語料庫包含會(huì)話對{發(fā)起句:最近怎么樣?/回復(fù)句:老樣子},則在將兩個(gè)個(gè)人語料庫組合后,將組合語料庫中包含相同發(fā)起句的會(huì)話對進(jìn)行同類項(xiàng)合并,也即可將上述兩個(gè)個(gè)人語料庫包含相同發(fā)起句(“最近怎么樣?”)的會(huì)話對,合并為{發(fā)起句:最近怎么樣?/回復(fù)句1:挺好的;回復(fù)句2:老樣子}。本實(shí)施例通過將組合語料庫中包含相同發(fā)起句的會(huì)話對進(jìn)行同類項(xiàng)合并,可以獲得精簡的共享語料庫,有利于后續(xù)根據(jù)共享語料庫快速匹配獲得主動(dòng)會(huì)話內(nèi)容??蛇x地,根據(jù)會(huì)話場景標(biāo)簽值,在共享語料庫中匹配獲得與會(huì)話場景標(biāo)簽值對應(yīng)的通訊聯(lián)系人包括:判斷是否能在共享語料庫中匹配到與會(huì)話場景標(biāo)簽值相同或接近的場景標(biāo)簽值,若是,則將共享語料庫中與場景標(biāo)簽值對應(yīng)的歷史聯(lián)系人作為通訊聯(lián)系人,否則,根據(jù)通訊方的通訊錄中的通訊用戶的基本信息,獲取與會(huì)話場景標(biāo)簽值關(guān)聯(lián)的通訊聯(lián)系人,其中通訊錄包括手機(jī)通訊錄、即時(shí)通訊通訊錄或電郵通訊錄。由于本實(shí)施例中的共享語料庫是根據(jù)通訊方的歷史會(huì)話內(nèi)容創(chuàng)建的,故在實(shí)際的實(shí)施過程中,可能無法在共享語料庫中匹配到與會(huì)話場景標(biāo)簽值相同或接近的場景標(biāo)簽值,從而無法在共享語料庫中匹配獲取到通訊聯(lián)系人。需要說明的是,本實(shí)施例所指的與會(huì)話場景標(biāo)簽值接近的場景標(biāo)簽值,具體是指與會(huì)話場景標(biāo)簽值的相似度大于或等于接近閾值的場景標(biāo)簽值,且本實(shí)施例的接近閾值由用戶自定義。針對該問題,本實(shí)施例通過判斷是否能在共享語料庫中匹配到與會(huì)話場景標(biāo)簽值相同或接近的場景標(biāo)簽值,判斷是否能在共享語料庫中匹配獲取到通訊聯(lián)系人,并在不能在共享語料庫中匹配到通訊聯(lián)系人時(shí),根據(jù)通訊方的通訊錄中的通訊用戶的基本信息,獲取與會(huì)話場景標(biāo)簽值關(guān)聯(lián)的通訊聯(lián)系人。由此可見,本實(shí)施例在共享語料庫中無法匹配到通訊聯(lián)系人時(shí),通過根據(jù)通訊方的通訊錄中的通訊用戶的基本信息,獲取與會(huì)話場景標(biāo)簽值關(guān)聯(lián)的通訊聯(lián)系人,從而更全面地自動(dòng)匹配通訊聯(lián)系人,實(shí)用性和智能化程度高。具體地,本實(shí)施例根據(jù)通訊方的通訊錄中的通訊用戶的基本信息,獲取與會(huì)話場景標(biāo)簽值關(guān)聯(lián)的通訊聯(lián)系人,主要通過計(jì)算會(huì)話場景標(biāo)簽值與通訊用戶的基本信息之間的關(guān)聯(lián)度獲得。具體地,首先將會(huì)話場景標(biāo)簽值轉(zhuǎn)換為第一詞向量,然后獲取通訊用戶的基本信息,并將基本信息轉(zhuǎn)換為第二詞向量,最后獲取與第一詞向量最相似的第二詞向量,并將與第一詞向量最相似的第二詞向量對應(yīng)的通訊用戶,作為與會(huì)話場景標(biāo)簽值關(guān)聯(lián)的通訊聯(lián)系人??蛇x地,根據(jù)會(huì)話場景標(biāo)簽值,在共享語料庫中匹配獲得與會(huì)話場景標(biāo)簽值對應(yīng)的主動(dòng)會(huì)話內(nèi)容包括:判斷是否能在共享語料庫中匹配到與會(huì)話場景標(biāo)簽值相同的場景標(biāo)簽值,若是,則將共享語料庫中與場景標(biāo)簽值對應(yīng)的會(huì)話對中的發(fā)起句作為主動(dòng)會(huì)話內(nèi)容,否則,將與會(huì)話場景標(biāo)簽值的相似度大于預(yù)設(shè)相似度閾值的場景標(biāo)簽值對應(yīng)的會(huì)話對中的發(fā)起句作為主動(dòng)會(huì)話內(nèi)容。由于本實(shí)施例中的共享語料庫是根據(jù)通訊方的歷史會(huì)話內(nèi)容創(chuàng)建的,故在實(shí)際的實(shí)施過程中,可能無法在共享語料庫中匹配到與會(huì)話場景標(biāo)簽值相同的場景標(biāo)簽值,從而無法在共享語料庫中匹配獲取到主動(dòng)會(huì)話內(nèi)容。針對該問題,本實(shí)施例通過判斷是否能在共享語料庫中匹配到與會(huì)話場景標(biāo)簽值相同的場景標(biāo)簽值,判斷是否能在共享語料庫中匹配獲取到主動(dòng)會(huì)話內(nèi)容,并在不能在共享語料庫中匹配獲取到主動(dòng)會(huì)話內(nèi)容時(shí),將與與會(huì)話場景標(biāo)簽值的相似度大于預(yù)設(shè)相似度閾值的場景標(biāo)簽值對應(yīng)的會(huì)話對中的發(fā)起句作為主動(dòng)會(huì)話內(nèi)容。需要說明的是,本實(shí)施例的預(yù)設(shè)相似度閾值由用戶自定義。可選地,場景標(biāo)簽包括:第一場景標(biāo)簽和第二場景標(biāo)簽,其中第一場景標(biāo)簽包括:會(huì)話通訊雙方的時(shí)間、地點(diǎn)、日期、天氣、季節(jié)、體感數(shù)據(jù),會(huì)話通訊雙方會(huì)話通訊的間隔時(shí)間、頻率、時(shí)間跨度場景標(biāo)簽中的一種或多種組合;第二場景標(biāo)簽包括:會(huì)話內(nèi)容主題,會(huì)話通訊雙方的會(huì)話意圖、性別、職業(yè)、職務(wù)、心情、興趣愛好、健康狀況、實(shí)時(shí)行為狀態(tài),會(huì)話內(nèi)容的句型、句類、句式結(jié)構(gòu)類型,以及總量場景標(biāo)簽中的一種或多種組合。需要說明的是,本實(shí)施例采集與會(huì)話意圖場景標(biāo)簽對應(yīng)的場景標(biāo)簽值時(shí),可以通過預(yù)先建立的用于識別通訊方和/或通訊對方的會(huì)話意圖的會(huì)話意圖識別模型實(shí)現(xiàn)。具體地,首先訓(xùn)練好與會(huì)話對樣本對應(yīng)的會(huì)話意圖識別模型,然后根據(jù)訓(xùn)練好的會(huì)話意圖識別模型識別通訊方和/或通訊對方針對會(huì)話對的會(huì)話意圖。下面針對一個(gè)精簡實(shí)施例對本發(fā)明的基于共享語料庫主動(dòng)發(fā)起會(huì)話的方法進(jìn)行更進(jìn)一步說明。參照圖2,本發(fā)明的精簡實(shí)施例提供的基于共享語料庫主動(dòng)發(fā)起會(huì)話的方法,包括:步驟s201,建立與通訊方對應(yīng)的個(gè)人語料庫,其中,通訊方的數(shù)目大于一。具體地,假設(shè)本實(shí)施例中的通訊方包括通訊方a1和通訊方a2,由于針對不同的通訊方建立個(gè)人語料庫的方法和過程相同,故本實(shí)施例僅對其中的一個(gè)通訊方,例如通訊方a1建立個(gè)人語料庫進(jìn)行具體說明。具體地,本實(shí)施例針對通訊方a1建立個(gè)人語料庫的方法包括:步驟s2001,采集通訊方的會(huì)話內(nèi)容。具體地,假設(shè)本實(shí)施例采集的會(huì)話內(nèi)容為通訊方a1的即時(shí)通訊賬號、郵箱賬號、手機(jī)號與通訊對方b進(jìn)行會(huì)話的會(huì)話內(nèi)容,其中,會(huì)話內(nèi)容為文本、圖片、語音、視頻或動(dòng)漫格式,且當(dāng)會(huì)話內(nèi)容是語音、圖片、視頻或動(dòng)漫格式時(shí),還包括將語音、圖片、視頻或動(dòng)漫格式的會(huì)話內(nèi)容轉(zhuǎn)換為文本格式的會(huì)話內(nèi)容。為了詳細(xì)描述本實(shí)施例從會(huì)話內(nèi)容中提取會(huì)話對的過程,本實(shí)施例以簡單的通訊方a1與通訊對方b的會(huì)話內(nèi)容進(jìn)行說明,具體如下:a1:吃了嗎?b:吃了。b:你呢?a1:幫我繳a1:費(fèi)了嗎?b:繳了總共100元。b:排隊(duì)的人可真多。步驟s2002,判斷會(huì)話內(nèi)容中的會(huì)話句在預(yù)設(shè)時(shí)間區(qū)間內(nèi)是否有通訊對方發(fā)送的上文,若無,則將會(huì)話句確定為發(fā)起句;若有,則判斷會(huì)話句是否與通訊對方發(fā)送的上文無語義關(guān)聯(lián),若是,則將會(huì)話句確定為發(fā)起句,否則將會(huì)話句確定為回復(fù)句。具體地,根據(jù)上述判斷規(guī)則,可以確定會(huì)話內(nèi)容中的發(fā)起句和回復(fù)句,假設(shè)本實(shí)施例通過判斷獲得會(huì)話內(nèi)容中的發(fā)起句和回復(fù)句具體見表1。表1步驟s2003,判斷發(fā)起句是否為具有完整獨(dú)立語義的語句,若是,則判斷發(fā)起句是否由多個(gè)具有完整獨(dú)立語義的單句組成,若是,則將發(fā)起句的類型確定為復(fù)句發(fā)起句類型,否則為單句發(fā)起句類型,若否,則判斷發(fā)起句是否包含具有完整獨(dú)立語義的單句,若包含,則將發(fā)起句的類型確定為非標(biāo)準(zhǔn)復(fù)句發(fā)起句類型,若不包含,則為非標(biāo)準(zhǔn)單句發(fā)起句類型;搜索非標(biāo)準(zhǔn)單句發(fā)起句類型的發(fā)起句是否有自己的上文和下文連續(xù)會(huì)話句,若無,則不進(jìn)行衍生擴(kuò)展,若有,則進(jìn)一步判斷非標(biāo)準(zhǔn)單句發(fā)起句類型的發(fā)起句是否可與自己的上文和下文連續(xù)會(huì)話句合并成具有完整獨(dú)立語義的語句,若能,則將非標(biāo)準(zhǔn)單句發(fā)起句類型的發(fā)起句的類型衍生擴(kuò)展為非標(biāo)準(zhǔn)句群發(fā)起句類型,若不能,則不進(jìn)行衍生擴(kuò)展;搜索非標(biāo)準(zhǔn)復(fù)句發(fā)起句類型的發(fā)起句是否有自己的上文和下文連續(xù)會(huì)話句,若無,則不進(jìn)行衍生擴(kuò)展,若有,則進(jìn)一步判斷非標(biāo)準(zhǔn)復(fù)句發(fā)起句類型的發(fā)起句是否可與自己的上文和下文連續(xù)會(huì)話句合并成具有完整獨(dú)立語義的語句,若能,則將非標(biāo)準(zhǔn)復(fù)句發(fā)起句類型的發(fā)起句的類型衍生擴(kuò)展為非標(biāo)準(zhǔn)句群發(fā)起句類型,若不能,則不進(jìn)行衍生擴(kuò)展;判斷單句、復(fù)句、非標(biāo)準(zhǔn)單句、非標(biāo)準(zhǔn)復(fù)句以及非標(biāo)準(zhǔn)句群類型的發(fā)起句是否有自己的上文和下文連續(xù)會(huì)話句,若有,則進(jìn)一步判斷發(fā)起句是否可與自己的上文和下文連續(xù)會(huì)話句合并成語義關(guān)聯(lián)的句群,若是,則將已確定類型的發(fā)起句的類型衍生擴(kuò)展為句群發(fā)起句類型,否則不進(jìn)行衍生擴(kuò)展。具體地,假設(shè)本實(shí)施例首先根據(jù)步驟s2003中的第一個(gè)判別過程,判斷出發(fā)起句的類型如下,具體見表2所示。表2序號發(fā)起句類型第一條發(fā)起句吃了嗎?單句第二條發(fā)起句你呢?單句第三條發(fā)起句幫我繳非標(biāo)準(zhǔn)單句第四條發(fā)起句費(fèi)了嗎?非標(biāo)準(zhǔn)單句然后,根據(jù)步驟s2003中的第二個(gè)判別過程,即通過判斷非標(biāo)準(zhǔn)單句和非標(biāo)準(zhǔn)復(fù)句發(fā)起句類型的發(fā)起句是否有自己的上文和下文連續(xù)會(huì)話句,以及是否可與自己的上文和下文連續(xù)會(huì)話句合并成具有完整獨(dú)立語義的語句,確定是否將非標(biāo)準(zhǔn)單句和非標(biāo)準(zhǔn)復(fù)句發(fā)起句的類型衍生擴(kuò)展為非標(biāo)準(zhǔn)句群發(fā)起句類型。通過具體判斷可知,本實(shí)施例的第三條和第四條發(fā)起句可以合并成具有完整獨(dú)立語義的語句,也即此時(shí)可以將第三條和第四條發(fā)起句的類型衍生擴(kuò)展為非標(biāo)準(zhǔn)句群發(fā)起句類型,具體見表3所示。表3最后,根據(jù)步驟s2003中的第三個(gè)判別過程,判斷單句、復(fù)句、非標(biāo)準(zhǔn)單句、非標(biāo)準(zhǔn)復(fù)句以及非標(biāo)準(zhǔn)句群類型的發(fā)起句是否可進(jìn)一步衍生擴(kuò)展為句群發(fā)起句類型。具體地,根據(jù)表3可知,本實(shí)施例不能將發(fā)起句進(jìn)一步合并成語義關(guān)聯(lián)的句群,也即在最后一個(gè)過程,不對發(fā)起句進(jìn)一步進(jìn)行衍生擴(kuò)展。故最終獲得發(fā)起句的類型如表3所示。步驟s2004,根據(jù)預(yù)設(shè)的類型判斷規(guī)則,確定回復(fù)句的類型。本實(shí)施例確定回復(fù)句的類型的原理和過程和確定發(fā)起句的類型的原理和過程基本相同,故不再詳述,假設(shè)本實(shí)施例判斷出回復(fù)句的類型具體如表4所示。表4步驟s2005,根據(jù)發(fā)起句以及發(fā)起句與下一條發(fā)起句之間的回復(fù)句提取基礎(chǔ)會(huì)話對。具體地,本實(shí)施例針對第一條發(fā)起句提取會(huì)話對時(shí),首先判斷第一條發(fā)起句與下一條發(fā)起句之間是否有回復(fù)句,若有,則根據(jù)所述發(fā)起句和所述回復(fù)句提取基礎(chǔ)會(huì)話對,由于第一條和第二條發(fā)起句之間有回復(fù)句,則根據(jù)第一條發(fā)起句和回復(fù)句提取基礎(chǔ)會(huì)話對。需要說明的是,本實(shí)施例在確定發(fā)起句與下一條發(fā)起句之間包含回復(fù)句后,還需計(jì)算發(fā)起句與回復(fù)句是否語義關(guān)聯(lián),且只有在語義關(guān)聯(lián)的情況下,才提取基礎(chǔ)會(huì)話對,否則不提取。本實(shí)施例假設(shè)第一條發(fā)起句和第一條回復(fù)句語義關(guān)聯(lián),則可以提取出基礎(chǔ)會(huì)話對,假設(shè)為基礎(chǔ)會(huì)話對1,基礎(chǔ)會(huì)話對1的具體內(nèi)容如表5所示。同理,本實(shí)施例針對第二條發(fā)起句提取基礎(chǔ)會(huì)話對時(shí),首先判斷第二條發(fā)起句與第三條發(fā)起句之間是否有回復(fù)句,通過判斷可知,第二條和第三條發(fā)起句之間不包含回復(fù)句,則放棄第二條發(fā)起句作為發(fā)起句。同樣地,根據(jù)第三條和第四條發(fā)起句,假設(shè)可以提取語義關(guān)聯(lián)的基礎(chǔ)會(huì)話對2,基礎(chǔ)會(huì)話對2的具體內(nèi)容如表5所示。表5步驟s2006,將基礎(chǔ)會(huì)話對中發(fā)起句的類型進(jìn)行衍生擴(kuò)展,獲得多種類型的發(fā)起句。具體地,由于本實(shí)施例中發(fā)起句的類型共有六種,分別為單句、復(fù)句、非標(biāo)準(zhǔn)單句、非標(biāo)準(zhǔn)復(fù)句、非標(biāo)準(zhǔn)句群以及句群發(fā)起句類型,故本實(shí)施例首先根據(jù)基礎(chǔ)會(huì)話對中發(fā)起句的類型進(jìn)行衍生擴(kuò)展,由于本實(shí)施例中基礎(chǔ)會(huì)話對1中的發(fā)起句的類型為單句發(fā)起句類型,其無法進(jìn)一步衍生擴(kuò)展成其他五種發(fā)起句類型,故此時(shí)只包含一種類型的發(fā)起句,即單句發(fā)起句類型的發(fā)起句,具體如表6所示。而根據(jù)基礎(chǔ)會(huì)話對2中的發(fā)起句的類型,可以進(jìn)一步衍生擴(kuò)展成其他類型的發(fā)起句,例如單句發(fā)起句類型,具體如表6所示。表6步驟s2007,將基礎(chǔ)會(huì)話對中回復(fù)句的類型進(jìn)行衍生擴(kuò)展,獲得多種類型的回復(fù)句。具體地,由于本實(shí)施例中回復(fù)句的類型共有六種,分別為單句、復(fù)句、非標(biāo)準(zhǔn)單句、非標(biāo)準(zhǔn)復(fù)句、非標(biāo)準(zhǔn)句群以及句群回復(fù)句類型。故本實(shí)施例首先根據(jù)基礎(chǔ)會(huì)話對中回復(fù)句的類型進(jìn)行衍生擴(kuò)展,由于本實(shí)施例中基礎(chǔ)會(huì)話對1中的回復(fù)句的類型為單句回復(fù)句類型,其無法進(jìn)一步衍生擴(kuò)展成其他五種回復(fù)句類型,故此時(shí)只包含一種類型的回復(fù)句,即單句回復(fù)句類型的回復(fù)句,具體如表7所示。而根據(jù)基礎(chǔ)會(huì)話對2中的回復(fù)句的類型,可以進(jìn)一步衍生擴(kuò)展成其他類型的回復(fù)句,例如復(fù)句回復(fù)句類型,具體如表7所示。表7步驟s2008,根據(jù)多種類型的發(fā)起句以及多種類型的回復(fù)句,組合至少一個(gè)語義關(guān)聯(lián)的會(huì)話對進(jìn)行提取。具體地,由于針對基礎(chǔ)會(huì)話對1,發(fā)起句和回復(fù)句的類型只有一種,故此時(shí)只能提取一個(gè)會(huì)話對,而針對基礎(chǔ)會(huì)話對2,由于發(fā)起句的類型和復(fù)句的類型為多種,故可組合獲得多個(gè)會(huì)話對,具體見表8,表8為根據(jù)基礎(chǔ)會(huì)話對2提取的6個(gè)會(huì)話對。表8步驟s2009,獲取與會(huì)話對對應(yīng)的歷史聯(lián)系人。具體地,根據(jù)通訊方a1的會(huì)話內(nèi)容以及提取的會(huì)話對,不難獲得與每一個(gè)會(huì)話對對應(yīng)的歷史聯(lián)系人,本實(shí)施例獲取的與會(huì)話對對應(yīng)的歷史聯(lián)系人具體見表10所示。表9會(huì)話對歷史聯(lián)系人基礎(chǔ)會(huì)話對1通訊對方b基礎(chǔ)會(huì)話對2(會(huì)話對1-會(huì)話對6)通訊對方b步驟s2010,根據(jù)預(yù)設(shè)的場景標(biāo)簽,采集獲得會(huì)話對與場景標(biāo)簽對應(yīng)的場景標(biāo)簽值。具體地,本實(shí)施例在采集與會(huì)話對對應(yīng)的且與預(yù)設(shè)的場景標(biāo)簽對應(yīng)的場景標(biāo)簽值時(shí),首先預(yù)設(shè)場景標(biāo)簽,然后針對每個(gè)會(huì)話對分別采集與預(yù)設(shè)的場景標(biāo)簽對應(yīng)的場景標(biāo)簽值。假設(shè)本實(shí)施例預(yù)設(shè)的場景標(biāo)簽包括會(huì)話地點(diǎn)、天氣、會(huì)話通訊雙方關(guān)系、通訊對象的年齡、職業(yè)的多種組合,則可以采集到與每一個(gè)會(huì)話對對應(yīng)的場景標(biāo)簽值,具體見表10所示。需要說明的是,本實(shí)施例中由于會(huì)話對1-會(huì)話對6均為基礎(chǔ)會(huì)話對2的衍生擴(kuò)展會(huì)話對,故與基礎(chǔ)會(huì)話對2的場景標(biāo)簽對應(yīng)的場景標(biāo)簽值相同。此外,本實(shí)施例針對不同的對話對可以設(shè)置不同的場景標(biāo)簽,且設(shè)置的場景標(biāo)簽的數(shù)目也可以不同。表10步驟s2011,將會(huì)話對、歷史聯(lián)系人以及場景標(biāo)簽值進(jìn)行匹配組合,從而生成個(gè)人語料庫。具體地,本實(shí)施例將會(huì)話對、歷史聯(lián)系人以及場景標(biāo)簽值進(jìn)行匹配組合,從而生成個(gè)人專屬語料庫,也即按照“會(huì)話對+歷史聯(lián)系人+場景標(biāo)簽值”的內(nèi)容組合規(guī)則,從而生成通訊方a1的個(gè)人語料庫。步驟s202,將多個(gè)通訊方的個(gè)人語料庫進(jìn)行合并,獲得共享語料庫。具體地,本實(shí)施例針對通訊方a2建立個(gè)人語料庫的方法和過程與通訊方a1的方法和過程相同。且本實(shí)施例將通訊方a1和通訊方a2的個(gè)人語料庫進(jìn)行合并的具體過程為:首先將通訊方a1和通訊方a2的個(gè)人語料庫進(jìn)行組合,獲得組合語料庫,然后將組合語料庫中包含相同發(fā)起句的會(huì)話對進(jìn)行同類項(xiàng)合并,獲得共享語料庫。步驟s203,根據(jù)預(yù)設(shè)的會(huì)話場景標(biāo)簽,采集獲得當(dāng)前與會(huì)話場景標(biāo)簽對應(yīng)的會(huì)話場景標(biāo)簽值。具體地,假設(shè)本實(shí)施例預(yù)設(shè)的會(huì)話場景標(biāo)簽為會(huì)話地點(diǎn)、天氣、會(huì)話通訊雙方關(guān)系、通訊對象的年齡以及通訊對象的職業(yè),且通過采集獲得當(dāng)前與會(huì)話場景標(biāo)簽對應(yīng)的會(huì)話場景標(biāo)簽值具體為:會(huì)話地點(diǎn)=公司、天氣=晴朗、會(huì)話通訊雙方關(guān)系=上下級、通訊對象的年齡=25、通訊對象的職業(yè)=it工程師。步驟s204,根據(jù)會(huì)話場景標(biāo)簽值,在共享語料庫中匹配獲得與會(huì)話場景標(biāo)簽值對應(yīng)的通訊聯(lián)系人。具體地,根據(jù)步驟s203獲得的會(huì)話場景標(biāo)簽值,不難在共享語料庫中匹配獲得與會(huì)話場景標(biāo)簽值對應(yīng)的會(huì)話對為基礎(chǔ)會(huì)話對2,且與基礎(chǔ)會(huì)話對2對應(yīng)的歷史聯(lián)系人為通訊聯(lián)系人b,也即本實(shí)施例根據(jù)會(huì)話場景標(biāo)簽值,在共享語料庫中匹配獲得與會(huì)話場景標(biāo)簽值對應(yīng)的通訊聯(lián)系人為通訊聯(lián)系人b。步驟s205,根據(jù)會(huì)話場景標(biāo)簽值,在共享語料庫中匹配與會(huì)話場景標(biāo)簽值對應(yīng)的主動(dòng)會(huì)話內(nèi)容。具體地,通過根據(jù)會(huì)話場景標(biāo)簽值,可以在共享語料庫中匹配獲得與會(huì)話場景標(biāo)簽值對應(yīng)的會(huì)話對,具體為基礎(chǔ)會(huì)話對2,且根據(jù)基礎(chǔ)會(huì)話對2不難獲得與會(huì)話場景標(biāo)簽值對應(yīng)的主動(dòng)會(huì)話內(nèi)容為“幫我繳費(fèi)了嗎?”。步驟s206,將主動(dòng)會(huì)話內(nèi)容發(fā)送至通訊聯(lián)系人。具體地,由于本實(shí)施例根據(jù)步驟s204匹配獲得通訊聯(lián)系人為通訊聯(lián)系人b,主動(dòng)會(huì)話內(nèi)容為“幫我繳費(fèi)了嗎?”,則將主動(dòng)會(huì)話內(nèi)容(“幫我繳費(fèi)了嗎?!”)發(fā)送給通訊聯(lián)系人b。本發(fā)明實(shí)施例提供的基于共享語料庫主動(dòng)發(fā)起會(huì)話的方法,通過建立與通訊方對應(yīng)的個(gè)人語料庫,將多個(gè)通訊方的個(gè)人語料庫進(jìn)行合并,獲得共享語料庫,根據(jù)預(yù)設(shè)的會(huì)話場景標(biāo)簽,采集獲得當(dāng)前與會(huì)話場景標(biāo)簽對應(yīng)的會(huì)話場景標(biāo)簽值,根據(jù)會(huì)話場景標(biāo)簽值,在共享語料庫中匹配獲得與會(huì)話場景標(biāo)簽值對應(yīng)的通訊聯(lián)系人,根據(jù)會(huì)話場景標(biāo)簽值,在共享語料庫中匹配獲得與會(huì)話場景標(biāo)簽值對應(yīng)的主動(dòng)會(huì)話內(nèi)容以及將主動(dòng)會(huì)話內(nèi)容發(fā)送至通訊聯(lián)系人,解決了現(xiàn)有通訊方向通訊對方發(fā)起會(huì)話時(shí),不僅需要通訊方手動(dòng)獲取通訊聯(lián)系人,而且還需通訊方人工構(gòu)思創(chuàng)建主動(dòng)會(huì)話內(nèi)容,費(fèi)時(shí)費(fèi)力且效率低的技術(shù)問題,不僅實(shí)現(xiàn)了根據(jù)會(huì)話場景標(biāo)簽值在共享語料庫中自動(dòng)匹配獲得通訊聯(lián)系人,而且實(shí)現(xiàn)了根據(jù)會(huì)話場景標(biāo)簽值在共享語料庫中智能匹配獲取向通訊聯(lián)系人發(fā)起會(huì)話的主動(dòng)會(huì)話內(nèi)容,且獲取的主動(dòng)會(huì)話內(nèi)容充分結(jié)合了當(dāng)前的會(huì)話場景標(biāo)簽值,具有較高的智能化和個(gè)性化水平。以上僅為本發(fā)明的優(yōu)選實(shí)施例而已,并不用于限制本發(fā)明,對于本領(lǐng)域的技術(shù)人員來說,本發(fā)明可以有各種更改和變化。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。當(dāng)前第1頁12