欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

信息處理方法和裝置的制造方法

文檔序號(hào):10513021閱讀:286來(lái)源:國(guó)知局
信息處理方法和裝置的制造方法
【專利摘要】本發(fā)明實(shí)施例提供一種信息處理方法和裝置,該方法從用戶已發(fā)表的文章信息中獲得包含預(yù)設(shè)詞匯的語(yǔ)句信息,再?gòu)恼Z(yǔ)句信息中獲得技能詞匯,將這些技能詞匯存儲(chǔ)至該用戶的列表中,由于目前對(duì)發(fā)布的文章的嚴(yán)格研究,所以獲得的技能詞匯是標(biāo)準(zhǔn)的、專業(yè)的,不存在現(xiàn)有技術(shù)中用戶自己填寫的五花八門的情況,且用戶發(fā)布的文章一般都是該用戶鉆研過(guò)的技術(shù),是比較細(xì)化的研究方向,所以咨詢者可以通過(guò)瀏覽用戶的列表來(lái)獲知向哪個(gè)用戶咨詢問(wèn)題,從而提高了交流的效率。
【專利說(shuō)明】
信息處理方法和裝置
技術(shù)領(lǐng)域
[0001]本發(fā)明實(shí)施例涉及通信技術(shù)領(lǐng)域,更具體的涉及一種信息處理方法和裝置。
【背景技術(shù)】
[0002]隨著網(wǎng)絡(luò)的不斷發(fā)展,越來(lái)越多的用戶通過(guò)學(xué)術(shù)社交網(wǎng)絡(luò)來(lái)進(jìn)行學(xué)術(shù)交流,學(xué)術(shù)社交網(wǎng)絡(luò)上對(duì)各個(gè)用戶都進(jìn)行了分類,但是目前用戶很難找到擅長(zhǎng)自己需要咨詢的技術(shù)領(lǐng)域的用戶,下面以醫(yī)學(xué)研究方向?yàn)槔M(jìn)行說(shuō)明。
[0003]心臟介入手術(shù)是一種新型診斷與治療心血管疾病技術(shù),它包括冠狀動(dòng)脈造影術(shù)、PTCA(Percutaneous transluminal coronary ang1plasty,經(jīng)皮冠狀動(dòng)脈腔內(nèi)血管成形術(shù))+支架術(shù)、二尖瓣球囊擴(kuò)張術(shù)、射頻消融術(shù)、起搏器植入術(shù)、先天性心臟病介入治療、冠狀動(dòng)脈腔內(nèi)溶栓術(shù)。如果一位咨詢者想針對(duì)冠狀動(dòng)脈腔內(nèi)溶栓術(shù)詢問(wèn)一些細(xì)節(jié)上的問(wèn)題,而目前學(xué)術(shù)社交網(wǎng)絡(luò)對(duì)于研究上述技術(shù)的用戶都標(biāo)明心內(nèi)科,沒(méi)有細(xì)化的研究方向,更沒(méi)有標(biāo)明哪些用戶掌握并擅長(zhǎng)這項(xiàng)技能,咨詢者不知道找哪個(gè)用戶詢問(wèn)這個(gè)學(xué)術(shù)技能,導(dǎo)致學(xué)術(shù)交流受阻礙,效率極大的降低。有些學(xué)術(shù)社交網(wǎng)絡(luò)讓用戶自己填寫擅長(zhǎng)的領(lǐng)域或技能,但是不同的用戶填寫領(lǐng)域或技能的習(xí)慣用語(yǔ)都不同,可能同一個(gè)技能或領(lǐng)域不同用戶填出來(lái)的都會(huì)五花八門,不利于學(xué)術(shù)社交網(wǎng)絡(luò)精確尋找和匹配。
[0004]綜上,現(xiàn)有技術(shù)中學(xué)術(shù)社交網(wǎng)絡(luò)上,對(duì)各個(gè)用戶劃分的技術(shù)領(lǐng)域范圍較大,導(dǎo)致用戶咨詢問(wèn)題受阻,降低交流效率。

【發(fā)明內(nèi)容】

[0005]為此本發(fā)明提供一種信信息處理方法和裝置,以解決現(xiàn)有技術(shù)中由于學(xué)術(shù)社交網(wǎng)絡(luò)上用戶的研究領(lǐng)域范圍較大而導(dǎo)致咨詢者不知道找哪個(gè)用戶咨詢問(wèn)題,導(dǎo)致交流效率較低的問(wèn)題。
[0006]為實(shí)現(xiàn)上述目的,本發(fā)明提供如下技術(shù)方案:
[0007]—種信息處理方法,包括:
[0008]從所述用戶已發(fā)表的文章信息中,獲取所述文章信息中包含預(yù)設(shè)詞匯的語(yǔ)句信息,所述文章信息包括論文信息、專利信息、圖書信息中的一種或多種;
[0009]獲取所述語(yǔ)句信息中的技能詞匯;
[0010]將所述技能詞匯存儲(chǔ)至所述用戶的列表中。
[0011 ]其中,所述獲取所述語(yǔ)句信息中的技能詞匯包括:
[0012]將所述語(yǔ)句信息切分出所有可能的第一詞匯;
[0013]將所述第一詞匯與智能詞匯庫(kù)中的標(biāo)準(zhǔn)技能詞匯進(jìn)行匹配;
[0014]從所述第一詞匯中獲得與所述標(biāo)準(zhǔn)技能詞匯相匹配的技能詞匯。
[0015]優(yōu)選地,還包括:
[0016]從已確定的包含技能詞匯的多個(gè)語(yǔ)句信息中獲得第二詞匯;
[0017]計(jì)算各個(gè)所述第二詞匯在所述多個(gè)語(yǔ)句信息中出現(xiàn)的頻率;
[0018]獲得出現(xiàn)頻率大于預(yù)設(shè)值的第三詞匯;
[0019]當(dāng)預(yù)設(shè)詞匯庫(kù)不包括所述第三詞匯時(shí),將所述第三詞匯存儲(chǔ)至所述預(yù)設(shè)詞匯庫(kù),所述預(yù)設(shè)詞匯庫(kù)存儲(chǔ)有所述預(yù)設(shè)詞匯。
[0020]其中,所述從已確定的包含技能詞匯的多個(gè)語(yǔ)句信息中獲得第二詞匯包括:
[0021]將已確定的包含技能詞匯的多個(gè)語(yǔ)句信息切分出所有可能的第一候選詞匯;
[0022]依據(jù)無(wú)用詞列表,去除所述第一候選詞匯中的無(wú)用詞匯,獲得第二候選詞匯;
[0023]從所述第二候選詞匯的各個(gè)詞匯中確定出完整詞組,獲得第二詞匯。
[0024]優(yōu)選的=地,還包括:
[0025]接收咨詢者的咨詢信息;
[0026]從所述咨詢信息中獲取咨詢技能詞匯;
[0027]將所述咨詢技能詞匯與各個(gè)用戶的列表中的技能詞匯相匹配;
[0028]獲得與所述咨詢技能詞匯相匹配的技能詞匯對(duì)應(yīng)的第一用戶,將所述咨詢信息發(fā)送至所述第一用戶,和/或?qū)⑺龅谝挥脩舻男畔l(fā)送至所述咨詢者。
[0029]一種信息處理裝置,包括:
[0030]第一獲取模塊,用于從所述用戶已發(fā)表的文章信息中,獲取所述文章信息中包含預(yù)設(shè)詞匯的語(yǔ)句信息,所述文章信息包括論文信息、專利信息、圖書信息中的一種或多種;[0031 ]第二獲取模塊,用于獲取所述語(yǔ)句信息中的技能詞匯;
[0032]第一存儲(chǔ)模塊,用于將所述技能詞匯存儲(chǔ)至所述用戶的列表中。
[0033]其中,所述第二獲取模塊包括:
[0034]第一切分單元,用于將所述語(yǔ)句信息切分出所有可能的第一詞匯;
[0035]匹配模塊,用于將所述第一詞匯與智能詞匯庫(kù)中的標(biāo)準(zhǔn)技能詞匯進(jìn)行匹配;
[0036]第一獲取單元,用于從所述第一詞匯中獲得與所述標(biāo)準(zhǔn)技能詞匯相匹配的技能詞匯。
[0037]優(yōu)選的,還包括:
[0038]第三獲取模塊,用于從已確定的包含技能詞匯的多個(gè)語(yǔ)句信息中獲得第二詞匯;
[0039]計(jì)算模塊,用于計(jì)算各個(gè)所述第二詞匯在所述多個(gè)語(yǔ)句信息中出現(xiàn)的頻率;
[0040]第四獲取模塊,用于獲得出現(xiàn)頻率大于預(yù)設(shè)值的第三詞匯;
[0041 ]第二存儲(chǔ)模塊,用于當(dāng)預(yù)設(shè)詞匯庫(kù)不包括所述第三詞匯時(shí),將所述第三詞匯存儲(chǔ)至所述預(yù)設(shè)詞匯庫(kù),所述預(yù)設(shè)詞匯庫(kù)存儲(chǔ)有所述預(yù)設(shè)詞匯。
[0042]其中,所述第三獲取模塊包括:
[0043]第二切分單元,用于將已確定的包含技能詞匯的多個(gè)語(yǔ)句信息切分出所有可能的第一候選詞匯;
[0044]去除單元,用于依據(jù)無(wú)用詞列表,去除所述第一候選詞匯中的無(wú)用詞匯,獲得第二候選詞匯;
[0045]第二獲取單元,用于從所述第二候選詞匯的各個(gè)詞匯中確定出完整詞組,獲得第二詞匯。
[0046]優(yōu)選的,還包括:
[0047]接收模塊,用于接收咨詢者的咨詢信息;
[0048]第一獲取模塊,用于從所述咨詢信息中獲取咨詢技能詞匯;
[0049]匹配模塊,用于將所述咨詢技能詞匯與各個(gè)用戶的列表中的技能詞匯相匹配;
[0050]第二獲取模塊,用于獲得與所述咨詢技能詞匯相匹配的技能詞匯對(duì)應(yīng)的第一用戶,將所述咨詢信息發(fā)送至所述第一用戶,和/或?qū)⑺龅谝挥脩舻男畔l(fā)送至所述咨詢者。
[0051]經(jīng)由上述的技術(shù)方案可知,與現(xiàn)有技術(shù)相比,本發(fā)明實(shí)施例提供的一種信息處理方法,從用戶已發(fā)表的文章信息中獲得包含預(yù)設(shè)詞匯的語(yǔ)句信息,再?gòu)恼Z(yǔ)句信息中獲得技能詞匯,將這些技能詞匯存儲(chǔ)至該用戶的列表中,由于目前對(duì)發(fā)布的文章具有嚴(yán)格研究,所以獲得的技能詞匯是標(biāo)準(zhǔn)的、專業(yè)的,不存在現(xiàn)有技術(shù)中用戶自己填寫的五花八門的情況,且用戶發(fā)布的文章一般都是該用戶鉆研過(guò)的技術(shù),是比較細(xì)化的研究方向,所以咨詢者可以通過(guò)瀏覽用戶的列表來(lái)獲知向哪個(gè)用戶咨詢問(wèn)題,從而提高了交流的效率。
【附圖說(shuō)明】
[0052]為了更清楚地說(shuō)明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本發(fā)明的實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)提供的附圖獲得其他的附圖。
[0053]圖1為本發(fā)明實(shí)施例提供一種應(yīng)用于學(xué)術(shù)社交網(wǎng)絡(luò)的信息處理方法的流程示意圖;
[0054]圖2為本發(fā)明實(shí)施例提供的一種信息處理方法中獲取語(yǔ)句信息中的技能詞匯的一種實(shí)現(xiàn)方式的方法流程示意圖;
[0055]圖3為本發(fā)明實(shí)施例提供的一種信息處理方法中對(duì)預(yù)設(shè)詞匯進(jìn)行更新的方法的流程不意圖;
[0056]圖4為本發(fā)明實(shí)施例提供的一種信息處理方法中從已確定的包含技能詞匯的多個(gè)語(yǔ)句信息中獲得第二詞匯一種實(shí)現(xiàn)方式的方法流程示意圖;
[0057]圖5為本發(fā)明實(shí)施例提供的一種信息處理方法的另一實(shí)現(xiàn)方式的方法流程示意圖;
[0058]圖6為本發(fā)明實(shí)施例提供的一種信息處理裝置的結(jié)構(gòu)示意圖;
[0059]圖7為本發(fā)明實(shí)施例提供的一種信息處理裝置中第二獲取模塊的結(jié)構(gòu)示意圖;
[0060]圖8為本發(fā)明實(shí)施例提供的一種信息處理裝置中對(duì)預(yù)設(shè)詞匯進(jìn)行更新的裝置的結(jié)構(gòu)示意圖;
[0061 ]圖9為本發(fā)明實(shí)施例提供的一種信息處理裝置中第三獲取模塊的結(jié)構(gòu)示意圖;
[0062]圖10為本發(fā)明實(shí)施例提供的一種信息處理裝置的另一實(shí)現(xiàn)方式的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0063]下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0064]請(qǐng)參閱圖1,為本發(fā)明實(shí)施例提供一種信息處理方法的流程示意圖,該方法包括:
[0065]步驟SlOl:從所述用戶已發(fā)表的文章信息中,獲取所述文章信息中包含預(yù)設(shè)詞匯的語(yǔ)句信息。
[0066]所述文章信息包括論文信息、專利信息、圖書信息中的一種或多種。
[0067]目前對(duì)發(fā)布的論文、專利、圖書要求比較嚴(yán)格,用戶在論文、專利或圖書中所描述的技能詞匯都是標(biāo)準(zhǔn)的、專業(yè)的,對(duì)于同一個(gè)技能詞匯不同的用戶的描述是相同的,不存在現(xiàn)有技術(shù)中在學(xué)術(shù)社交網(wǎng)絡(luò)上用戶填寫的五花八門的情況。具體的,可以從文章信息中的摘要、全文中獲得包含預(yù)設(shè)詞匯的語(yǔ)句信息。
[0068]用戶已發(fā)表的文章信息可以是預(yù)先存儲(chǔ)在數(shù)據(jù)庫(kù)中的,該數(shù)據(jù)庫(kù)可以包括海內(nèi)外各個(gè)用戶已經(jīng)發(fā)表的文章信息,也可以是利用網(wǎng)絡(luò)爬蟲技術(shù)從不同網(wǎng)站、不同數(shù)據(jù)庫(kù)中獲得的。具體的,可以通過(guò)該用戶的姓名、工作單位等等信息利用網(wǎng)絡(luò)爬蟲技術(shù)獲取用戶已發(fā)表的文章。
[0069]預(yù)設(shè)詞匯可以是整理者閱讀該用戶發(fā)表的文章,熟悉該用戶的描述方式獲得的。例如某一用戶經(jīng)常在摘要中Di scuss 1n、use、used、using、employed、employ等詞匯的后面描述技能詞匯,也就是說(shuō)Di scuss 1n、use、used、using、employed、employ這些詞匯與技能詞匯一般都同時(shí)出現(xiàn),由于技能詞匯種類較多,且可能是由多個(gè)字或字符組成,在并不確定當(dāng)前獲得的技能詞匯是由幾個(gè)字或字符組成的情況下,直接從文章信息中獲得技能詞匯,需要服務(wù)器具備強(qiáng)大的數(shù)據(jù)處理能力,而預(yù)設(shè)詞匯一般情況下的字或字符數(shù)比較小,且不同的研究人員的預(yù)設(shè)詞匯也比較統(tǒng)一,因此可以先從文章信息中獲得包含預(yù)設(shè)詞匯的語(yǔ)句信息。最初的預(yù)設(shè)詞匯是人為整理的,但是在整個(gè)方法運(yùn)行后,可以通過(guò)機(jī)器學(xué)習(xí),對(duì)預(yù)設(shè)詞匯進(jìn)行更新。
[0070]由于已知預(yù)設(shè)詞匯,可以利用詞匯搜索功能,對(duì)文章信息中包含該預(yù)設(shè)詞匯的語(yǔ)句進(jìn)行定位。在中文中,每一個(gè)語(yǔ)句結(jié)尾都有“?!?,在英文中,每一個(gè)語(yǔ)句的結(jié)尾都有可以依據(jù)上述兩個(gè)特征,來(lái)截取被定位的包含預(yù)設(shè)詞匯的語(yǔ)句信息。
[0071]步驟S102:獲取所述語(yǔ)句信息中的技能詞匯。
[0072]可以通過(guò)語(yǔ)義分析識(shí)別技術(shù)獲得語(yǔ)句信息中的技能詞匯。
[0073]步驟S103:將所述技能詞匯存儲(chǔ)至所述用戶的列表中。
[0074]上述列表可以是指與用戶的博客顯示的內(nèi)容對(duì)應(yīng)的列表,可以是學(xué)術(shù)社交網(wǎng)絡(luò)上用戶顯示的個(gè)人主頁(yè)對(duì)應(yīng)的列表。也可以是每一個(gè)用戶對(duì)應(yīng)一個(gè)數(shù)據(jù)庫(kù),該列表存儲(chǔ)在該數(shù)據(jù)庫(kù)中。
[0075]本發(fā)明實(shí)施例提供了一種信息處理方法方法,從用戶已發(fā)表的文章信息中獲得包含預(yù)設(shè)詞匯的語(yǔ)句信息,再?gòu)恼Z(yǔ)句信息中獲得技能詞匯,將這些技能詞匯存儲(chǔ)至該用戶的列表中,由于目前對(duì)發(fā)布的文章的嚴(yán)格研究,所以獲得的技能詞匯是標(biāo)準(zhǔn)的、專業(yè)的,不存在現(xiàn)有技術(shù)中用戶自己填寫的五花八門的情況,且用戶發(fā)布的文章一般都是該用戶鉆研過(guò)的技術(shù),是比較細(xì)化的研究方向,所以咨詢者可以通過(guò)瀏覽用戶的列表來(lái)獲知向哪個(gè)用戶咨詢問(wèn)題,從而提高了交流的效率。
[0076]請(qǐng)參閱圖2,為本發(fā)明實(shí)施例提供的一種信息處理方法中獲取語(yǔ)句信息中的技能詞匯的一種實(shí)現(xiàn)方式的方法流程示意圖,該方法包括:
[0077]步驟S201:將所述語(yǔ)句信息切分出所有可能的第一詞匯。
[0078]假設(shè)預(yù)設(shè)詞匯為Discuss1n,語(yǔ)句信息為“Discuss1n rad1 frequencyablat1n technique patient’s nursing method.,,
[0079]該語(yǔ)句信息且分出所有可能的第一詞匯如下:
[0080]Discuss1n、rad1、frequency、ablat1n、technique、patient’ s、nursing、method、Discuss1n rad1、rad1 frequency、frequency ablat1n、ablat1ntechnique、technique patient’s、patient’s nursingsnursing methodsDiscuss1nrad1 frequency、rad1 frequency ablat1n、frequency ablat1n technique、ablat1n technique patient’s、technique patient’s nursingspatient? s nursingmethod、Discuss1n rad1 frequency abIat1n、rad1 frequency ablat1ntechnique>frequency ablat1n technique patient’s、ablat1n technique patient’snursing、technique patient’s nursing method、Discuss1n rad1 frequencyablat1n technique、rad1 frequency ablat1n technique patient’ s、frequencyablat1n technique patient’s nursing^ablat1n technique patient’s nursingmethod、Discuss1n rad1 frequency ablat1n technique patient’s、rad1frequency ablat1n technique patient’s nursingsfrequency ablat1n techniquepatient’s nursing method>Discuss1n rad1 frequency ablat1n techniquepatient’s nursing、rad1 frequency ablat1n technique patient ’ s nursingmethod、rad1 frequency ablat1n technique patient’s nursing methodo
[0081]由于每個(gè)單詞或者幾個(gè)單詞的組合都有可能是技能詞匯,因此需要將語(yǔ)句信息中切分出所有可能的第一詞匯。
[0082]步驟S202:將所述第一詞匯與智能詞匯庫(kù)中的標(biāo)準(zhǔn)技能詞匯進(jìn)行匹配。
[0083]智能詞匯庫(kù)中存儲(chǔ)有所有的標(biāo)準(zhǔn)技能詞匯,假設(shè)智能詞匯庫(kù)中包括rad1frequency ablat1n technique,將第一詞匯與智能詞匯庫(kù)中的標(biāo)準(zhǔn)技術(shù)詞匯進(jìn)行匹配,則京尤會(huì)石角定出rad1 frequency ablat1n technique。
[0084]步驟S203:從所述第一詞匯中獲得與所述標(biāo)準(zhǔn)技能詞匯相匹配的技能詞匯。
[0085]最初的預(yù)設(shè)詞匯是人為整理的,但是在整個(gè)方法運(yùn)行后,可以通過(guò)機(jī)器學(xué)習(xí),對(duì)預(yù)設(shè)詞匯進(jìn)行更新。請(qǐng)參閱圖3,為本發(fā)明實(shí)施例提供的一種信息處理方法中對(duì)預(yù)設(shè)詞匯進(jìn)行更新的方法的流程示意圖,該方法包括:
[0086]步驟S301:從已確定的包含技能詞匯的多個(gè)語(yǔ)句信息中獲得第二詞匯。
[0087]由于人為整理預(yù)設(shè)詞匯是整理者閱讀用戶的多篇文章獲得的,其他整理者未閱讀的文章中可能也有預(yù)設(shè)詞匯,為了獲得這些預(yù)設(shè)詞匯,可以通過(guò)分析已知的包含技能詞匯的多個(gè)語(yǔ)句信息,獲得整理者未發(fā)現(xiàn)的預(yù)設(shè)詞匯。
[0088]可以將多個(gè)語(yǔ)句信息切分為所有可能的第二詞匯。例如,已經(jīng)確定射頻消融是一個(gè)技能詞匯,多個(gè)語(yǔ)句信息分別包括:研究射頻消融療效;研究射頻消融目的;研究射頻消融反應(yīng);研究射頻消融方法。
[0089]第二詞匯可能包括:“研究”、“研究”、“研究”、“研究”、“療效”、“目的,,、“反應(yīng)”、“方法”。
[0090]步驟S302:計(jì)算各個(gè)所述第二詞匯在所述多個(gè)語(yǔ)句信息中出現(xiàn)的頻率。
[0091]仍以步驟S301中的例子進(jìn)行說(shuō)明,可以計(jì)算出第二詞匯中各個(gè)詞匯出現(xiàn)的頻率,具體的計(jì)算方法可以為:該詞匯出現(xiàn)的個(gè)數(shù)/語(yǔ)句信息個(gè)數(shù)。
[0092]P(研究)=4/4 = 1,P(療效)=P(目的)=P(反應(yīng))=P(方法)= 1/4。
[0093]P(*)表示*的出現(xiàn)頻率。
[0094]步驟S303:獲得出現(xiàn)頻率大于預(yù)設(shè)值的第三詞匯。
[0095]預(yù)設(shè)值可以根據(jù)實(shí)際情況而定,在上述例子中,預(yù)設(shè)值可以為3/4,則第三詞匯為“研究”。
[0096]步驟S304:當(dāng)預(yù)設(shè)詞匯庫(kù)不包括所述第三詞匯時(shí),將所述第三詞匯存儲(chǔ)至所述預(yù)設(shè)詞匯庫(kù),所述預(yù)設(shè)詞匯庫(kù)存儲(chǔ)有所述預(yù)設(shè)詞匯。
[0097]可以理解的是,如果第三預(yù)設(shè)詞匯已經(jīng)存儲(chǔ)在預(yù)設(shè)詞匯庫(kù)中,則不用再進(jìn)行存儲(chǔ),如果未存儲(chǔ)在預(yù)設(shè)詞匯庫(kù)中,則需要存儲(chǔ),從而對(duì)預(yù)設(shè)詞匯庫(kù)進(jìn)行了更新。
[0098]請(qǐng)參閱圖4,為本發(fā)明實(shí)施例提供的一種信息處理方法中從已確定的包含技能詞匯的多個(gè)語(yǔ)句信息中獲得第二詞匯一種實(shí)現(xiàn)方式的方法流程示意圖,該方法包括:
[0099]步驟S401:將已確定的包含技能詞匯的多個(gè)語(yǔ)句信息切分出所有可能的第一候選詞匯。
[0100]可以將多個(gè)語(yǔ)句信息切分為所有可能的詞匯。例如,已經(jīng)確定射頻消融是一個(gè)技能詞匯,多個(gè)語(yǔ)句信息分別包括:研究射頻消融療效;研究射頻消融目的;研究射頻消融反應(yīng);研究射頻消融方法。
[0101]將“研究射頻消融的療效”切分為“研、研究、治、的、效、的遼、的療效、遼、療效、”等等;將“研究射頻消融目的”切分為“研、研究、目、的、目的”;將“研究射頻消融反應(yīng)”切分為“研、研究、反、應(yīng)、反應(yīng)”;將“研究射頻消融方法”切分為“研、研究、方、法、方法”。
[0102]第一候選詞匯包括:研、研究、治、的、效、的遼、的療效、遼、療效、研、研究、目、的、目的、研、研究、反、應(yīng)、反應(yīng)、研、研究、方、法、方法。
[0103]步驟S402:依據(jù)無(wú)用詞列表,去除所述第一候選詞匯中的無(wú)用詞匯,獲得第二候選詞匯。
[0104]第一候選詞匯中可能包括很多無(wú)用詞匯,例如英語(yǔ)中的冠詞the,代詞和介詞,中文中的“的、你、我、他、P自、什么”等,可以將這寫無(wú)用詞進(jìn)行無(wú)用詞過(guò)濾,可以為這無(wú)用詞建立無(wú)用詞列表。
[0105]依據(jù)無(wú)用詞列表,去除所述第一候選詞匯中的無(wú)用詞匯,可以是將與無(wú)用詞列表中相匹配的詞匯刪除。
[0106]去除無(wú)用詞匯后,第二候選詞包括:研、研究、治、效、的遼、的療效、遼、療效、研、研究、目、目的、研、研究、反、應(yīng)、反應(yīng)、研、研究、方、法、方法。
[0107]步驟S403:從所述第二候選詞匯的各個(gè)詞匯中確定出完整詞組,獲得第二詞匯。
[0108]第二候選詞匯中包括單個(gè)字或字符組成的詞匯、多個(gè)字或字符組成的詞匯,但是“的遼”、“的療效”、“研”等等并不是一個(gè)詞組,那么需要確定第二候選詞匯中到底哪些詞組是多個(gè)字組成的詞組,哪些詞組是單個(gè)字組成的詞組。
[0109]需要從第二候選詞匯獲得能夠構(gòu)成詞組的第二詞匯??梢酝ㄟ^(guò)計(jì)算第二候選詞匯中各個(gè)詞匯的離散度獲得。離散度是指每一個(gè)字與其左側(cè)或與其右側(cè)的字能夠組成一個(gè)詞匯的概率。
[0110]具體的,可以根據(jù)某一個(gè)詞匯的左鄰字或右鄰字在所有語(yǔ)句中整體出現(xiàn)的概率,例如,“的療”,“的”字右側(cè)出現(xiàn)“療”的概率=“的”字右側(cè)出現(xiàn)“療”的詞匯個(gè)數(shù)/所有語(yǔ)句個(gè)數(shù)=1/4,假設(shè)離散度閾值為3/4,顯然“的療”不是一個(gè)詞匯。按照此種方法,可以確定出“研”不是一個(gè)詞組,從而確定出第二候選詞匯中包括的詞組有“研究”、“研究”、“研究”、“研究,,、“療效”、“目的,,、“反應(yīng)”、“方法” O
[0111]第二詞匯包括:“研究”、“研究”、“研究”、“研究”、“療效”、“目的,,、“反應(yīng)”、“方法”O(jiān)
[0112]請(qǐng)參閱圖5,為本發(fā)明實(shí)施例提供的一種信息處理方法的另一實(shí)現(xiàn)方式的方法流程示意圖,該方法包括:
[0113]步驟SlOl:從所述用戶已發(fā)表的文章信息中,獲取所述文章信息中包含預(yù)設(shè)詞匯的語(yǔ)句信息。
[0114]步驟S102:獲取所述語(yǔ)句信息中的技能詞匯。
[0115]步驟S103:將所述技能詞匯存儲(chǔ)至所述用戶的列表中。
[0116]步驟S501:接收咨詢者的咨詢信息。
[0117]咨詢者在向用戶咨詢問(wèn)題時(shí),往往會(huì)對(duì)要咨詢的問(wèn)題進(jìn)行描述,咨詢信息可以為對(duì)問(wèn)題的描述信息。
[0118]步驟S502:從所述咨詢信息中獲取咨詢技能詞匯。
[0119]具體的,可以將咨詢信息切分成可能的所有詞匯,然后在智能詞匯庫(kù)中匹配出咨詢技能詞匯。也可以通過(guò)語(yǔ)義分析識(shí)別技術(shù)獲得咨詢信息中的咨詢技能詞匯。
[0120]步驟S503:將所述咨詢技能詞匯與各個(gè)用戶的列表中的技能詞匯相匹配。
[0121]所述列表中的技能詞匯是從所述用戶已發(fā)表的文章信息中獲得的。
[0122]步驟S504:獲得與所述咨詢技能詞匯相匹配的技能詞匯對(duì)應(yīng)的第一用戶,將所述咨詢信息發(fā)送至所述第一用戶,或?qū)⑺龅谝挥脩舻男畔l(fā)送至所述咨詢者。
[0123]第一用戶可能包括多個(gè)人,也可以包括一個(gè)人。
[0124]步驟SlOl至步驟S103是步驟S501至步驟S504的準(zhǔn)備操作,每次執(zhí)行步驟S501至步驟S504時(shí),不必都執(zhí)行步驟SlOl至S103。
[0125]請(qǐng)參閱圖6,為本發(fā)明實(shí)施例提供的一種信息處理裝置的結(jié)構(gòu)示意圖,該裝置包括:第一獲取模塊601、第二獲取模塊602和第一存儲(chǔ)模塊603,其中:
[0126]第一獲取模塊601,用于從所述用戶已發(fā)表的文章信息中,獲取所述文章信息中包含預(yù)設(shè)詞匯的語(yǔ)句信息。
[0127]所述文章信息包括論文信息、專利信息、圖書信息中的一種或多種。
[0128]目前對(duì)發(fā)布的論文、專利、圖書要求比較嚴(yán)格,用戶在論文、專利或圖書中所描述的技能詞匯都是標(biāo)準(zhǔn)的、專業(yè)的,對(duì)于同一個(gè)技能詞匯不同的用戶的描述是相同的,不存在現(xiàn)有技術(shù)中在學(xué)術(shù)社交網(wǎng)絡(luò)上用戶填寫的五花八門的情況。具體的,可以從文章信息中的摘要、全文中獲得包含預(yù)設(shè)詞匯的語(yǔ)句信息。
[0129]用戶已發(fā)表的文章信息可以是預(yù)先存儲(chǔ)在數(shù)據(jù)庫(kù)中的,該數(shù)據(jù)庫(kù)可以包括海內(nèi)外各個(gè)用戶已經(jīng)發(fā)表的文章信息,也可以是利用網(wǎng)絡(luò)爬蟲技術(shù)從不同網(wǎng)站、不同數(shù)據(jù)庫(kù)中獲得的。具體的,可以通過(guò)該用戶的姓名、工作單位等等信息利用網(wǎng)絡(luò)爬蟲技術(shù)獲取用戶已發(fā)表的文章。
[0130]預(yù)設(shè)詞匯可以是整理者閱讀該用戶發(fā)表的文章,熟悉該用戶的描述方式獲得的。例如某一用戶經(jīng)常在摘要中Di scuss 1n、use、used、using、employed、employ等詞匯的后面描述技能詞匯,也就是說(shuō)Di scuss 1n、use、used、using、employed、employ這些詞匯與技能詞匯一般都同時(shí)出現(xiàn),由于技能詞匯種類較多,且可能是由多個(gè)字或字符組成,在并不確定當(dāng)前獲得的技能詞匯是由幾個(gè)字或字符組成的情況下,直接從文章信息中獲得技能詞匯,需要服務(wù)器具備強(qiáng)大的數(shù)據(jù)處理能力,而預(yù)設(shè)詞匯一般情況下的字或字符數(shù)比較小,且不同的研究人員的預(yù)設(shè)詞匯也比較統(tǒng)一,因此可以先從文章信息中獲得包含預(yù)設(shè)詞匯的語(yǔ)句信息。最初的預(yù)設(shè)詞匯是人為整理的,但是在整個(gè)方法運(yùn)行后,可以通過(guò)機(jī)器學(xué)習(xí),對(duì)預(yù)設(shè)詞匯進(jìn)行更新。
[0131]由于已知預(yù)設(shè)詞匯,可以利用詞匯搜索功能,對(duì)文章信息中包含該預(yù)設(shè)詞匯的語(yǔ)句進(jìn)行定位。在中文中,每一個(gè)語(yǔ)句結(jié)尾都有“?!保谟⑽闹?,每一個(gè)語(yǔ)句的結(jié)尾都有可以依據(jù)上述兩個(gè)特征,來(lái)截取被定位的包含預(yù)設(shè)詞匯的語(yǔ)句信息。
[0132]第二獲取模塊602,用于獲取所述語(yǔ)句信息中的技能詞匯。
[0133]可以通過(guò)語(yǔ)義分析識(shí)別技術(shù)獲得語(yǔ)句信息中的技能詞匯。
[0134]第一存儲(chǔ)模塊603,用于將所述技能詞匯存儲(chǔ)至所述用戶的列表中。
[0135]上述列表可以是指與用戶的博客顯示的內(nèi)容對(duì)應(yīng)的列表,可以是學(xué)術(shù)社交網(wǎng)絡(luò)上用戶顯示的個(gè)人主頁(yè)對(duì)應(yīng)的列表。也可以是每一個(gè)用戶對(duì)應(yīng)一個(gè)數(shù)據(jù)庫(kù),該列表存儲(chǔ)在該數(shù)據(jù)庫(kù)中。
[0136]本發(fā)明實(shí)施例提供了一種信息處理裝置,第一獲取模塊601從用戶已發(fā)表的文章信息中獲得包含預(yù)設(shè)詞匯的語(yǔ)句信息,第二獲取模塊602再?gòu)恼Z(yǔ)句信息中獲得技能詞匯,第一存儲(chǔ)模塊603將這些技能詞匯存儲(chǔ)至該用戶的列表中,由于目前發(fā)布的文章的嚴(yán)格研究,所以獲得的技能詞匯是標(biāo)準(zhǔn)的、專業(yè)的,不存在現(xiàn)有技術(shù)中用戶自己填寫的五花八門的情況,且用戶發(fā)布的文章一般都是該用戶鉆研過(guò)的技術(shù),是比較細(xì)化的研究方向,所以咨詢者可以通過(guò)瀏覽用戶的列表來(lái)獲知向哪個(gè)用戶咨詢問(wèn)題,從而提高了交流的效率。
[0137]請(qǐng)參閱圖7,為本發(fā)明實(shí)施例提供的一種信息處理裝置中第二獲取模塊的結(jié)構(gòu)示意圖,該獲取模塊包括:第一切分單元701、匹配模塊702以及第一獲取單元703,其中:
[0138]第一切分單元701,用于將所述語(yǔ)句信息切分出所有可能的第一詞匯。
[0139]假設(shè)預(yù)設(shè)詞匯為Discuss1n,語(yǔ)句信息為“Discuss1n rad1 frequencyablat1n technique patient’s nursing method.,,
[0140]該語(yǔ)句信息且分出所有可能的第一詞匯如下:
[0141 ] Discuss1n、rad1、frequency、ablat1n、technique、patient ’ s、nursing、method、Discuss1n rad1、rad1 frequency、frequency ablat1n、ablat1ntechnique、technique patient’s、patient’s nursingsnursing methodsDiscuss1nrad1 frequency、rad1 frequency ablat1n、frequency ablat1n technique、ablat1n technique patient’s、technique patient’s nursingspatient? s nursingmethod、Discuss1n rad1 frequency abIat1n、rad1 frequency ablat1ntechnique>frequency ablat1n technique patient’s、ablat1n technique patient’snursing、technique patient’s nursing method、Discuss1n rad1 frequencyablat1n technique、rad1 frequency ablat1n technique patient’ s、frequencyablat1n technique patient’s nursing^ablat1n technique patient’s nursingmethod、Discuss1n rad1 frequency ablat1n technique patient’s、rad1frequency ablat1n technique patient’s nursingsfrequency ablat1n techniquepatient’s nursing method>Discuss1n rad1 frequency ablat1n techniquepatient’s nursing、rad1 frequency ablat1n technique patient ’ s nursingmethod、rad1 frequency ablat1n technique patient’s nursing methodo
[0142]由于每個(gè)單詞或者幾個(gè)單詞的組合都有可能是技能詞匯,因此需要將語(yǔ)句信息中切分出所有可能的第一詞匯。
[0143]匹配模塊702,用于將所述第一詞匯與智能詞匯庫(kù)中的標(biāo)準(zhǔn)技能詞匯進(jìn)行匹配。
[0144]智能詞匯庫(kù)中存儲(chǔ)有所有的標(biāo)準(zhǔn)技能詞匯,假設(shè)智能詞匯庫(kù)中包括rad1frequency ablat1n technique,將第一詞匯與智能詞匯庫(kù)中的標(biāo)準(zhǔn)技術(shù)詞匯進(jìn)行匹配,則京尤會(huì)石角定出rad1 frequency ablat1n technique。
[0145]第一獲取單元703,用于從所述第一詞匯中獲得與所述標(biāo)準(zhǔn)技能詞匯相匹配的技能詞匯。
[0146]最初的預(yù)設(shè)詞匯是人為整理的,但是在整個(gè)裝置運(yùn)行一段時(shí)間后,可以通過(guò)機(jī)器學(xué)習(xí),對(duì)預(yù)設(shè)詞匯進(jìn)行更新。請(qǐng)參閱圖8,為本發(fā)明實(shí)施例提供的一種信息處理裝置中對(duì)預(yù)設(shè)詞匯進(jìn)行更新的裝置的結(jié)構(gòu)示意圖,該裝置包括:第三獲取模塊801、計(jì)算模塊802、第四獲取模塊803以及第二存儲(chǔ)模塊804,其中:
[0147]第三獲取模塊801,用于從已確定的包含技能詞匯的多個(gè)語(yǔ)句信息中獲得第二詞匯。
[0148]由于人為整理預(yù)設(shè)詞匯是整理者閱讀用戶的多篇文章獲得的,其他整理者未閱讀的文章中可能也有預(yù)設(shè)詞匯,為了獲得這些預(yù)設(shè)詞匯,可以通過(guò)分析已知的包含技能詞匯的多個(gè)語(yǔ)句信息,獲得整理者未發(fā)現(xiàn)的預(yù)設(shè)詞匯。
[0149]可以將多個(gè)語(yǔ)句信息切分為所有可能的第二詞匯。例如,已經(jīng)確定射頻消融是一個(gè)技能詞匯,多個(gè)語(yǔ)句信息分別包括:研究射頻消融療效;研究射頻消融目的;研究射頻消融反應(yīng);研究射頻消融方法。
[0150]第二詞匯可能包括:“研究”、“研究”、“研究”、“研究”、“療效”、“目的,,、“反應(yīng)”、“方法”。
[0151]計(jì)算模塊802,用于計(jì)算各個(gè)所述第二詞匯在所述多個(gè)語(yǔ)句信息中出現(xiàn)的頻率。
[0152]仍以上述例子進(jìn)行說(shuō)明,可以計(jì)算出第二詞匯中各個(gè)詞匯出現(xiàn)的頻率,具體的計(jì)算方法可以為:該詞匯出現(xiàn)的個(gè)數(shù)/語(yǔ)句信息個(gè)數(shù)。
[0153]P(研究)=4/4 = 1,P(療效)=P(目的)=P(反應(yīng))=P(方法)= 1/4。
[0154]P(*)表示*的出現(xiàn)頻率。
[0155]第四獲取模塊803,用于獲得出現(xiàn)頻率大于預(yù)設(shè)值的第三詞匯。
[0156]預(yù)設(shè)值可以根據(jù)實(shí)際情況而定,在上述例子中,預(yù)設(shè)值可以為3/4,則第三詞匯為“研究” O
[0157]第二存儲(chǔ)模塊804,用于當(dāng)預(yù)設(shè)詞匯庫(kù)不包括所述第三詞匯時(shí),將所述第三詞匯存儲(chǔ)至所述預(yù)設(shè)詞匯庫(kù),所述預(yù)設(shè)詞匯庫(kù)存儲(chǔ)有所述預(yù)設(shè)詞匯。
[0158]可以理解的是,如果第三預(yù)設(shè)詞匯已經(jīng)存儲(chǔ)在預(yù)設(shè)詞匯庫(kù)中,則不用再進(jìn)行存儲(chǔ),如果未存儲(chǔ)在預(yù)設(shè)詞匯庫(kù)中,則需要存儲(chǔ),從而對(duì)預(yù)設(shè)詞匯庫(kù)進(jìn)行了更新。
[0159]請(qǐng)參閱圖9,為本發(fā)明實(shí)施例提供的一種信息處理裝置中第三獲取模塊的結(jié)構(gòu)示意圖,該第三獲取模塊包括:第二切分單元901、去除單元902和第二獲取單元903,其中:
[0160]第二切分單元901,用于將已確定的包含技能詞匯的多個(gè)語(yǔ)句信息切分出所有可能的第一候選詞匯。
[0161]可以將多個(gè)語(yǔ)句信息切分為所有可能的詞匯。例如,已經(jīng)確定射頻消融是一個(gè)技能詞匯,多個(gè)語(yǔ)句信息分別包括:研究射頻消融療效;研究射頻消融目的;研究射頻消融反應(yīng);研究射頻消融方法。
[0162]將“研究射頻消融的療效”切分為“研、研究、治、的、效、的遼、的療效、遼、療效、”等等;將“研究射頻消融目的”切分為“研、研究、目、的、目的”;將“研究射頻消融反應(yīng)”切分為“研、研究、反、應(yīng)、反應(yīng)”;將“研究射頻消融方法”切分為“研、研究、方、法、方法”。
[0163]第一候選詞匯包括:研、研究、治、的、效、的遼、的療效、遼、療效、研、研究、目、的、目的、研、研究、反、應(yīng)、反應(yīng)、研、研究、方、法、方法。
[0164]去除單元902,用于依據(jù)無(wú)用詞列表,去除所述第一候選詞匯中的無(wú)用詞匯,獲得第二候選詞匯。
[0165]第一候選詞匯中可能包括很多無(wú)用詞匯,例如英語(yǔ)中的冠詞the,代詞和介詞,中文中的“的、你、我、他、P自、什么”等,可以將這寫無(wú)用詞進(jìn)行無(wú)用詞過(guò)濾,可以為這無(wú)用詞建立無(wú)用詞列表。
[0166]依據(jù)無(wú)用詞列表,去除所述第一候選詞匯中的無(wú)用詞匯,可以是將與無(wú)用詞列表中相匹配的詞匯刪除。
[0167]去除無(wú)用詞匯后,第二候選詞包括:研、研究、治、效、的遼、的療效、遼、療效、研、研究、目、目的、研、研究、反、應(yīng)、反應(yīng)、研、研究、方、法、方法。
[0168]第二獲取單元903,用于從所述第二候選詞匯的各個(gè)詞匯中確定出完整詞組,獲得第二詞匯。
[0169]第二候選詞匯中包括單個(gè)字或字符組成的詞匯、多個(gè)字或字符組成的詞匯,但是“的遼”、“的療效”、“研”等等并不是一個(gè)詞組,那么需要確定第二候選詞匯中到底哪些詞組是多個(gè)字組成的詞組,哪些詞組是單個(gè)字組成的詞組。
[0170]需要從第二候選詞匯獲得能夠構(gòu)成詞組的第二詞匯??梢酝ㄟ^(guò)計(jì)算第二候選詞匯中各個(gè)詞匯的離散度獲得。離散度是指每一個(gè)字與其左側(cè)或與其右側(cè)的字能夠組成一個(gè)詞匯的概率。
[0171]具體的,可以根據(jù)某一個(gè)詞匯的左鄰字或右鄰字在所有語(yǔ)句中整體出現(xiàn)的概率,例如,“的療”,“的”字右側(cè)出現(xiàn)“療”的概率=“的”字右側(cè)出現(xiàn)“療”的詞匯個(gè)數(shù)/所有語(yǔ)句個(gè)數(shù)=1/4,假設(shè)離散度閾值為3/4,顯然“的療”不是一個(gè)詞匯。按照此種方法,可以確定出“研”不是一個(gè)詞組,從而確定出第二候選詞匯中包括的詞組有“研究”、“研究”、“研究”、“研究,,、“療效”、“目的,,、“反應(yīng)”、“方法” O
[0172]第二詞匯包括:“研究”、“研究”、“研究”、“研究”、“療效”、“目的,,、“反應(yīng)”、“方法”O(jiān)
[0173]請(qǐng)參閱圖10,為本發(fā)明實(shí)施例提供的一種信息處理裝置的另一實(shí)現(xiàn)方式的結(jié)構(gòu)示意圖,該裝置包括:第一獲取模塊601、第二獲取模塊602和第一存儲(chǔ)模塊603、接收模塊1001、第一獲取模塊1002、匹配模塊1003以及第二獲取模塊1004,其中:
[0174]第一獲取模塊601,用于從所述用戶已發(fā)表的文章信息中,獲取所述文章信息中包含預(yù)設(shè)詞匯的語(yǔ)句信息。
[0175]第二獲取模塊602,用于獲取所述語(yǔ)句信息中的技能詞匯。
[0176]第一存儲(chǔ)模塊603,用于將所述技能詞匯存儲(chǔ)至所述用戶的列表中。
[0177]接收模塊1001,用于接收咨詢者的咨詢信息。
[0178]咨詢者在向用戶咨詢問(wèn)題時(shí),往往會(huì)對(duì)要咨詢的問(wèn)題進(jìn)行描述,咨詢信息可以為對(duì)問(wèn)題的描述信息。
[0179]第一獲取模塊1002,用于從所述咨詢信息中獲取咨詢技能詞匯。
[0180]具體的,可以將咨詢信息切分成可能的所有詞匯,然后在智能詞匯庫(kù)中匹配出咨詢技能詞匯。也可以通過(guò)語(yǔ)義分析識(shí)別技術(shù)獲得咨詢信息中的咨詢技能詞匯。
[0181]匹配模塊1003,用于將所述咨詢技能詞匯與各個(gè)用戶的列表中的技能詞匯相匹配,所述列表中的技能詞匯是從所述用戶已發(fā)表的論文中獲得的。
[0182]所述列表中的技能詞匯是從所述用戶已發(fā)表的文章信息中獲得的。具體的過(guò)程可以參見(jiàn)信息處理方法裝置實(shí)施例。
[0183]第二獲取模塊1004,用于獲得與所述咨詢技能詞匯相匹配的技能詞匯對(duì)應(yīng)的第一用戶,將所述咨詢信息發(fā)送至所述第一用戶,或?qū)⑺龅谝挥脩舻男畔l(fā)送至所述咨詢者。
[0184]第一用戶可能包括多個(gè)人,也可以包括一個(gè)人。
[0185]第一獲取模塊601、第二獲取模塊602、第一存儲(chǔ)模塊603是第一獲取模塊1002、匹配模塊1003以及第二獲取模塊1004準(zhǔn)備操作,每次觸發(fā)執(zhí)行第一獲取模塊1002、匹配模塊1003以及第二獲取模塊1004時(shí),不必觸發(fā)執(zhí)行第一獲取模塊601、第二獲取模塊602、第一存儲(chǔ)模塊603。
[0186]需要說(shuō)明的是,本說(shuō)明書中的各個(gè)實(shí)施例均采用遞進(jìn)的方式描述,每個(gè)實(shí)施例重點(diǎn)說(shuō)明的都是與其他實(shí)施例的不同之處,各個(gè)實(shí)施例之間相同相似的部分互相參見(jiàn)即可。
[0187]對(duì)所公開(kāi)的實(shí)施例的上述說(shuō)明,使本領(lǐng)域?qū)I(yè)技術(shù)人員能夠?qū)崿F(xiàn)或使用本發(fā)明。對(duì)這些實(shí)施例的多種修改對(duì)本領(lǐng)域的專業(yè)技術(shù)人員來(lái)說(shuō)將是顯而易見(jiàn)的,本文中所定義的一般原理可以在不脫離本發(fā)明的精神或范圍的情況下,在其它實(shí)施例中實(shí)現(xiàn)。因此,本發(fā)明將不會(huì)被限制于本文所示的這些實(shí)施例,而是要符合與本文所公開(kāi)的原理和新穎特點(diǎn)相一致的最寬的范圍。
【主權(quán)項(xiàng)】
1.一種信息處理方法,其特征在于,包括: 從所述用戶已發(fā)表的文章信息中,獲取所述文章信息中包含預(yù)設(shè)詞匯的語(yǔ)句信息,所述文章信息包括論文信息、專利信息、圖書信息中的一種或多種; 獲取所述語(yǔ)句信息中的技能詞匯; 將所述技能詞匯存儲(chǔ)至所述用戶的列表中。2.根據(jù)權(quán)利要求1所述信息處理方法,其特征在于,所述獲取所述語(yǔ)句信息中的技能詞匯包括: 將所述語(yǔ)句信息切分出所有可能的第一詞匯; 將所述第一詞匯與智能詞匯庫(kù)中的標(biāo)準(zhǔn)技能詞匯進(jìn)行匹配; 從所述第一詞匯中獲得與所述標(biāo)準(zhǔn)技能詞匯相匹配的技能詞匯。3.根據(jù)權(quán)利要求1或2所述信息處理方法,其特征在于,還包括: 從已確定的包含技能詞匯的多個(gè)語(yǔ)句信息中獲得第二詞匯; 計(jì)算各個(gè)所述第二詞匯在所述多個(gè)語(yǔ)句信息中出現(xiàn)的頻率; 獲得出現(xiàn)頻率大于預(yù)設(shè)值的第三詞匯; 當(dāng)預(yù)設(shè)詞匯庫(kù)不包括所述第三詞匯時(shí),將所述第三詞匯存儲(chǔ)至所述預(yù)設(shè)詞匯庫(kù),所述預(yù)設(shè)詞匯庫(kù)存儲(chǔ)有所述預(yù)設(shè)詞匯。4.根據(jù)權(quán)利要求3所述信息處理方法,其特征在于,所述從已確定的包含技能詞匯的多個(gè)語(yǔ)句信息中獲得第二詞匯包括: 將已確定的包含技能詞匯的多個(gè)語(yǔ)句信息切分出所有可能的第一候選詞匯; 依據(jù)無(wú)用詞列表,去除所述第一候選詞匯中的無(wú)用詞匯,獲得第二候選詞匯; 從所述第二候選詞匯的各個(gè)詞匯中確定出完整詞組,獲得第二詞匯。5.根據(jù)權(quán)利要求1所述信息處理方法,其特征在于,還包括: 接收咨詢者的咨詢信息; 從所述咨詢信息中獲取咨詢技能詞匯; 將所述咨詢技能詞匯與各個(gè)用戶的列表中的技能詞匯相匹配; 獲得與所述咨詢技能詞匯相匹配的技能詞匯對(duì)應(yīng)的第一用戶,將所述咨詢信息發(fā)送至所述第一用戶,和/或?qū)⑺龅谝挥脩舻男畔l(fā)送至所述咨詢者。6.一種信息處理裝置,其特征在于,包括: 第一獲取模塊,用于從所述用戶已發(fā)表的文章信息中,獲取所述文章信息中包含預(yù)設(shè)詞匯的語(yǔ)句信息,所述文章信息包括論文信息、專利信息、圖書信息中的一種或多種;第二獲取模塊,用于獲取所述語(yǔ)句信息中的技能詞匯; 第一存儲(chǔ)模塊,用于將所述技能詞匯存儲(chǔ)至所述用戶的列表中。7.根據(jù)權(quán)利要求6所述信息處理方法裝置,其特征在于,所述第二獲取模塊包括: 第一切分單元,用于將所述語(yǔ)句信息切分出所有可能的第一詞匯; 匹配模塊,用于將所述第一詞匯與智能詞匯庫(kù)中的標(biāo)準(zhǔn)技能詞匯進(jìn)行匹配; 第一獲取單元,用于從所述第一詞匯中獲得與所述標(biāo)準(zhǔn)技能詞匯相匹配的技能詞匯。8.根據(jù)權(quán)利要求6或7所述信息處理裝置,其特征在于,還包括: 第三獲取模塊,用于從已確定的包含技能詞匯的多個(gè)語(yǔ)句信息中獲得第二詞匯; 計(jì)算模塊,用于計(jì)算各個(gè)所述第二詞匯在所述多個(gè)語(yǔ)句信息中出現(xiàn)的頻率; 第四獲取模塊,用于獲得出現(xiàn)頻率大于預(yù)設(shè)值的第三詞匯; 第二存儲(chǔ)模塊,用于當(dāng)預(yù)設(shè)詞匯庫(kù)不包括所述第三詞匯時(shí),將所述第三詞匯存儲(chǔ)至所述預(yù)設(shè)詞匯庫(kù),所述預(yù)設(shè)詞匯庫(kù)存儲(chǔ)有所述預(yù)設(shè)詞匯。9.根據(jù)權(quán)利要求8所述信息處理裝置,其特征在于,所述第三獲取模塊包括: 第二切分單元,用于將已確定的包含技能詞匯的多個(gè)語(yǔ)句信息切分出所有可能的第一候選詞匯; 去除單元,用于依據(jù)無(wú)用詞列表,去除所述第一候選詞匯中的無(wú)用詞匯,獲得第二候選詞匯; 第二獲取單元,用于從所述第二候選詞匯的各個(gè)詞匯中確定出完整詞組,獲得第二詞匯。10.根據(jù)權(quán)利要求6所述信息處理裝置,其特征在于,還包括: 接收模塊,用于接收咨詢者的咨詢信息; 第一獲取模塊,用于從所述咨詢信息中獲取咨詢技能詞匯; 匹配模塊,用于將所述咨詢技能詞匯與各個(gè)用戶的列表中的技能詞匯相匹配; 第二獲取模塊,用于獲得與所述咨詢技能詞匯相匹配的技能詞匯對(duì)應(yīng)的第一用戶,將所述咨詢信息發(fā)送至所述第一用戶,和/或?qū)⑺龅谝挥脩舻男畔l(fā)送至所述咨詢者。
【文檔編號(hào)】G06Q50/00GK105869056SQ201610203247
【公開(kāi)日】2016年8月17日
【申請(qǐng)日】2016年3月31日
【發(fā)明人】王斐, 吳勇
【申請(qǐng)人】比美特醫(yī)護(hù)在線(北京)科技有限公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
洪洞县| 茂名市| 卫辉市| 东城区| 广宁县| 乌什县| 龙南县| 砚山县| 永安市| 新龙县| 江阴市| 凌云县| 林周县| 兴化市| 怀宁县| 宜兴市| 阿克苏市| 洛隆县| 古蔺县| 新乡县| 望奎县| 民丰县| 水城县| 兰西县| 漳平市| 翁源县| 象山县| 巢湖市| 合肥市| 金塔县| 景宁| 盐山县| 潮安县| 茂名市| 昌图县| 高碑店市| 聂拉木县| 米林县| 黑水县| 行唐县| 诸暨市|