一種基于語(yǔ)義理解的表情輸入方法和裝置的制造方法
【專利說(shuō)明】
[0001] 本發(fā)明實(shí)施例要求在2014年6月6日提交中國(guó)專利局、申請(qǐng)?zhí)枮?201410251399.0、發(fā)明名稱為"一種基于語(yǔ)義理解的表情輸入方法和裝置"的中國(guó)專利申請(qǐng) 的優(yōu)先權(quán),其全部?jī)?nèi)容通過(guò)引用結(jié)合在本發(fā)明實(shí)施例中。
技術(shù)領(lǐng)域
[0002] 本發(fā)明涉及輸入法技術(shù)領(lǐng)域,具體涉及一種基于語(yǔ)義理解的表情輸入方法和裝 置。
【背景技術(shù)】
[0003] 輸入法是為將各種符號(hào)輸入計(jì)算機(jī)或其他設(shè)備(如手機(jī))而采用的編碼方法。常 見(jiàn)的輸入法包括搜狗輸入法,微軟輸入法等等。
[0004] 傳統(tǒng)的表情輸入大致有幾種情況:其一是平臺(tái)本身具有表情輸入模塊,比如qq等 聊天工具嵌入的表情輸入模塊,其自帶默認(rèn)的輸入表情,也可以安裝第三方表情包,用戶也 可以自定義圖片資源作為表情,當(dāng)用戶輸入表情時(shí),點(diǎn)擊表情的輸入按鈕,選擇表情進(jìn)行輸 入;但是該種情況與輸入法完全脫離,用戶在輸入過(guò)程中需要單獨(dú)點(diǎn)擊表情輸入按鈕,逐頁(yè) 翻找并點(diǎn)擊自己需要和喜歡的表情來(lái)完成輸入過(guò)程;
[0005] 其二,是輸入法自帶簡(jiǎn)單的符號(hào)表情,當(dāng)用戶輸入到相應(yīng)字符時(shí),比如("哈哈"對(duì) 應(yīng)的符號(hào)表情"〇( n _ n )〇~"),符號(hào)表情以候選項(xiàng)的形式供用戶選擇。但這種情況的候 選表情簡(jiǎn)單,無(wú)法給用戶提供豐富多彩的表情輸入。
[0006] 其三,是輸入法提供加載的第三方表情包,提供用戶表情輸入的入口,當(dāng)用戶有需 求輸入表情時(shí),需要點(diǎn)擊進(jìn)入該應(yīng)用程序表情輸入的入口,然后在大量的表情資源中,逐頁(yè) 翻找并點(diǎn)擊自己需要或喜歡的表情完成輸入過(guò)程。
[0007] 以按鈕接口的形式嵌入在應(yīng)用程序中,提供給用戶進(jìn)行表情輸入,這種方法存在 多種問(wèn)題:
[0008] 1.用戶的聊天行為屬于即時(shí)通信,時(shí)效性極強(qiáng)。因此,表情輸入的時(shí)效性非常重 要。如果用戶喜歡并安裝的各種主題表情庫(kù)有多個(gè)(包括阿貍、嘻哈猴、輕松熊、冷兔等 等),每個(gè)表情庫(kù)又包含上百種表情符號(hào)或圖片(如微笑、哈哈大笑、猥瑣的笑、抹眼淚、嚎 啕大哭等等)。那么,有限的時(shí)間內(nèi),在眾多表情庫(kù)中逐一翻找到合適的表情所花費(fèi)的時(shí)間 成本,會(huì)成為用戶有效使用各種表情增強(qiáng)溝通效果的瓶頸。
[0009] 2.因?yàn)榭紤]到用戶使用表情的操作成本,表情包制作方也會(huì)酌情精簡(jiǎn)表情內(nèi)容, 這也從某種程度上制約了聊天表情的發(fā)展和廣泛使用。
[0010] 3.大多數(shù)聊天工具只會(huì)提供默認(rèn)表情。默認(rèn)表情相對(duì)比較單調(diào),更多豐富的多元 化的主題聊天表情資源可以有效提高與朋友聊天的好感度,但是為了使用這些表情,用戶 需要經(jīng)過(guò)很多網(wǎng)上操作步驟,從各種渠道獲取表情包信息并將表情包下載到本地,有時(shí)還 需要進(jìn)行手工加載才可以正常使用表情包。對(duì)于操作生疏或者沒(méi)有足夠耐心的用戶,在網(wǎng) 絡(luò)資源中成功獲取并安裝合適的表情包所花費(fèi)的時(shí)間成本,可能會(huì)導(dǎo)致他們選擇放棄。
[0011] 4.對(duì)于下載好的表情包,如果用戶切換聊天平臺(tái)等輸入場(chǎng)景,表情包需要重新下 載或更新,用戶的常用表情收藏信息也同樣面臨移植的問(wèn)題。
[0012] 輸入的候選表情內(nèi)容僅限于第三方制作好的表情包。若非特意整理,很多明星人 物、政治人物的夸張表情照片、GIF等多媒體資源并不能夠及時(shí)的作為候選表情,輸入的內(nèi) 容過(guò)于單一,而且無(wú)法快速精準(zhǔn)契合用戶當(dāng)前的輸入,降低了用戶的輸入效率。
【發(fā)明內(nèi)容】
[0013] 鑒于上述問(wèn)題,本發(fā)明提供一種克服上述問(wèn)題或者至少部分地解決上述問(wèn)題的基 于語(yǔ)義理解的表情輸入方法和裝置。
[0014] 依據(jù)本發(fā)明的一個(gè)方面,提供了一種基于語(yǔ)義理解的表情輸入方法,包括:
[0015] 獲取輸入序列對(duì)應(yīng)的文本內(nèi)容;
[0016] 對(duì)所述文本內(nèi)容進(jìn)行分詞,并基于分詞的結(jié)果,提取文本特征;
[0017] 以所述文本特征構(gòu)建輸入向量,利用情感分類模型進(jìn)行分類,以確定所述文本內(nèi) 容所屬的情感標(biāo)簽;
[0018] 獲取表情資源數(shù)據(jù)中與所述情感標(biāo)簽對(duì)應(yīng)的第一表情;
[0019] 將獲取的所述第一表情排序后,作為候選項(xiàng)在客戶端展示。
[0020] 根據(jù)本發(fā)明的另一方面,提供了一種基于語(yǔ)義理解的表情輸入裝置,包括:
[0021] 內(nèi)容獲取模塊,配置為獲取輸入序列對(duì)應(yīng)的文本內(nèi)容;
[0022] 分詞特征提取模塊,配置為對(duì)所述文本內(nèi)容進(jìn)行分詞,并基于分詞的結(jié)果,提取文 本特征;
[0023] 情感標(biāo)簽確定模塊,配置為以所述文本特征構(gòu)建輸入向量,利用情感分類模型進(jìn) 行分類,以確定所述文本內(nèi)容所屬的情感標(biāo)簽;
[0024] 表情獲取模塊,配置為獲取表情資源數(shù)據(jù)中與所述情感標(biāo)簽對(duì)應(yīng)的第一表情;及
[0025] 展示模塊,配置為將獲取的所述第一表情排序后,作為候選項(xiàng)在客戶端展示。
[0026] 相對(duì)現(xiàn)有技術(shù),本發(fā)明實(shí)施例具有如下優(yōu)點(diǎn):
[0027] 本發(fā)明實(shí)施例將各種來(lái)源的表情資源數(shù)據(jù),利用語(yǔ)聊資源數(shù)據(jù),比如聊天日志 (如匿名獲取qq、微信等聊天工具有表情輸入的聊天日志)、社區(qū)評(píng)論(如京東、大眾點(diǎn)評(píng)等 有表情輸入的評(píng)論內(nèi)容)、社交內(nèi)容(如qq空間、新浪微博、人人網(wǎng)等有表情輸入的狀態(tài)或 評(píng)論內(nèi)容),對(duì)所有獲取的表情資源數(shù)據(jù)進(jìn)行分析,以構(gòu)建情感標(biāo)簽與各主題中的表情的對(duì) 應(yīng)關(guān)系。然后即可針對(duì)由用戶輸入序列得到的文本內(nèi)容,進(jìn)行語(yǔ)義理解,得到對(duì)應(yīng)的文本特 征,然后基于預(yù)先構(gòu)建的情感分類模型對(duì)所述文本特征進(jìn)行分類,以確定用戶輸入對(duì)應(yīng)的 情感標(biāo)簽,進(jìn)而根據(jù)情感標(biāo)簽和第一表情的對(duì)應(yīng)關(guān)系,從表情資源數(shù)據(jù)中提取對(duì)應(yīng)的第一 表情作為候選項(xiàng)以供用戶選擇。
[0028] 上述過(guò)程中,
[0029] 其一,將表情作為輸入法的詞庫(kù),可直接對(duì)由用戶的輸入序列得到的文本內(nèi)容進(jìn) 行語(yǔ)義理解,根據(jù)語(yǔ)義理解得到的情感標(biāo)簽與表情資源數(shù)據(jù)中的第一表情的對(duì)應(yīng)關(guān)系,獲 取表情資源數(shù)據(jù)中的第一表情作為候選項(xiàng)在輸入法中進(jìn)行展示,直接提供給用戶選擇;
[0030] 其二,上述過(guò)程能夠精確匹配用戶的表情輸入需求,因此能夠提高表情的使用效 率,從而能夠降低用戶在表情輸入過(guò)程中翻找待輸入的表情所花費(fèi)的時(shí)間成本;
[0031] 其三,該種方式不用考慮表情包的制作成本和內(nèi)容,可以任意發(fā)揮制作方的創(chuàng)造 力,降低對(duì)聊天表情的發(fā)展和廣泛使用的制約;
[0032] 其四,由于本發(fā)明實(shí)施例將各主題的表情進(jìn)行集中分類處理,用戶不用到處下載 各主題的表情包,因此能夠降低用戶尋找表情包的時(shí)間成本;
[0033] 其五,由于本發(fā)明實(shí)施例的第一表情是輸入法的候選項(xiàng),用戶在切換聊天平臺(tái)等 輸入場(chǎng)景時(shí),不需要重新下載或更新表情包,也避免用戶的常用表情收藏信息的移植問(wèn) 題;
[0034] 其六,本發(fā)明實(shí)施例表情資源數(shù)據(jù)中的第一表情范圍廣,覆蓋面積大,可以給用戶 提供更多、更豐富的輸入語(yǔ)料。
【附圖說(shuō)明】
[0035] 通過(guò)閱讀下文優(yōu)選實(shí)施方式的詳細(xì)描述,各種其他的優(yōu)點(diǎn)和益處對(duì)于本領(lǐng)域普通 技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實(shí)施方式的目的,而并不認(rèn)為是對(duì)本發(fā)明 的限制。而且在整個(gè)附圖中,用相同的參考符號(hào)表示相同的部件。在附圖中:
[0036] 圖1示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的一種基于語(yǔ)義理解的表情輸入方法的流程 示意圖;
[0037] 圖2示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的構(gòu)建情感標(biāo)簽與各主題中的表情之間對(duì)應(yīng) 關(guān)系的流程示意圖;
[0038] 圖3示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的語(yǔ)聊資源的示例;
[0039]圖4示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的構(gòu)建情感分類模型的流程示意圖;
[0040] 圖5示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的構(gòu)建情感分類模型的流程示意圖;
[0041] 圖6示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的表情展示示例;
[0042] 圖7示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的一種基于語(yǔ)義理解的表情輸入方法的流程 示意圖;
[0043] 圖8示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的一種基于語(yǔ)義理解的表情輸入方法的流程 示意圖;
[0044] 圖9示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的一種基于語(yǔ)義理解的表情輸入裝置的結(jié)構(gòu) 示意圖;
[0045] 圖10示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的一種基于語(yǔ)義理解的表情輸入裝置的結(jié)構(gòu) 示意圖;及
[0046] 圖11示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的一種基于語(yǔ)義理解的表情輸入系統(tǒng)的結(jié)構(gòu) 示意圖。
【具體實(shí)施方式】
[0047] 為使本發(fā)明的上述目的、特征和優(yōu)點(diǎn)能夠更加明顯易懂,下面結(jié)合附圖和具體實(shí) 施方式對(duì)本發(fā)明作進(jìn)一步詳細(xì)的說(shuō)明。
[0048] 本發(fā)明將收集的各種來(lái)源的表情資源數(shù)據(jù),比如互聯(lián)網(wǎng)中各主題的表情包資源 (如qq的阿貍、嘻哈猴、郭德綱真人夸張表情照片集等的表情包)、第三方合作的表情包資 源(輸入法直接與卡通表情生產(chǎn)方進(jìn)行合作并搭建獲取流程)、用戶產(chǎn)生的自定義的表情 內(nèi)容(輸入法直接開(kāi)放接口是用戶可以添加自定義表情并共享)等表情資源數(shù)據(jù),利用語(yǔ) 聊資源數(shù)據(jù),比如聊天日志(如匿名獲取qq、微信等聊天工具有表情輸入的聊天日志)、社 區(qū)評(píng)論(如京東、大眾點(diǎn)評(píng)等有表情輸入的評(píng)論內(nèi)容)、社交內(nèi)容(如qq空間、新浪微博、人 人網(wǎng)等有表情輸入的狀態(tài)或評(píng)論內(nèi)容),對(duì)所有獲取的表情資源數(shù)據(jù)進(jìn)行分析,確定表情類 別的情感標(biāo)簽與表情資源數(shù)據(jù)中的第一表情之間的對(duì)應(yīng)關(guān)系,并利用情感標(biāo)簽與表情資源 數(shù)據(jù)中的第一表情之間的對(duì)應(yīng)關(guān)系構(gòu)建情感分類模型,然后即可在用戶使用輸入法的過(guò)程 中,使用情感分類模型對(duì)用戶輸入的文本內(nèi)容進(jìn)行語(yǔ)義識(shí)別,然后基于識(shí)別結(jié)果直接提供 表情候選項(xiàng)給客戶端,給用戶提供更方便、更快捷、更豐富的表情輸入。
[0049] 實(shí)施例一
[0050] 首先,本發(fā)明實(shí)施例中,構(gòu)建用于語(yǔ)義分析的情感分類模型,以及情感標(biāo)簽與表情 的對(duì)應(yīng)關(guān)系;其中,上述情感標(biāo)簽可用于表示表情所能表達(dá)的語(yǔ)義情感,其包括但不限于快 樂(lè)情感標(biāo)簽、稱贊情感標(biāo)簽等;上述情感分類模型具有多種情感標(biāo)簽的分類能力,假設(shè)情感 標(biāo)簽的種類為N,則情感分類模型也可以輸出N種分類結(jié)果。
[0051] 即步驟S100,根據(jù)語(yǔ)聊資源數(shù)據(jù)和各主題的表情資源數(shù)據(jù)構(gòu)建表情資源數(shù)據(jù)中包 括的第一表情與情感標(biāo)簽之間的對(duì)應(yīng)關(guān)系。
[0052] 在本發(fā)明實(shí)施例中,情感標(biāo)簽與表情資源數(shù)據(jù)中的第一表情之間的對(duì)應(yīng)關(guān)系可以 通過(guò)收集語(yǔ)聊資源數(shù)據(jù)和表情資源數(shù)據(jù),并利用語(yǔ)聊資源數(shù)據(jù)對(duì)表情資源數(shù)據(jù)進(jìn)行分析得 到。在本