欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

特征詞匯提取方法及裝置與流程

文檔序號(hào):11276293閱讀:334來(lái)源:國(guó)知局
特征詞匯提取方法及裝置與流程

【技術(shù)領(lǐng)域】

本申請(qǐng)涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,尤其涉及一種特征詞匯提取方法及裝置。



背景技術(shù):

隨著互聯(lián)網(wǎng)的高速發(fā)展,網(wǎng)上的信息量急劇增加,用戶需要從中搜索所需的信息。例如,在電子商務(wù)領(lǐng)域,用戶需要在成千上萬(wàn)的商品中搜索心儀的商品。

在現(xiàn)有技術(shù)中,電子商務(wù)網(wǎng)站除了收集商品的結(jié)構(gòu)化信息,例如類目、標(biāo)題、價(jià)格等之外,還需要收集其它能體現(xiàn)商品特點(diǎn)的詞匯,例如款式(中袖、無(wú)袖、長(zhǎng)袖、v領(lǐng)、圓領(lǐng)等)、樣式(波點(diǎn)、千鳥(niǎo)格等)、材料(滌綸、絲等)等,豐富商品的基礎(chǔ)特征數(shù)據(jù)。這些體現(xiàn)商品特點(diǎn)的詞匯稱為特征詞匯。

目前,電子商務(wù)網(wǎng)站獲取商品的特征詞匯的常用方法是:在商家發(fā)布商品時(shí),引導(dǎo)商家自己填寫(xiě)最能反映商品特點(diǎn)的詞匯。由于不是每個(gè)商家都愿意且有能力填寫(xiě)每個(gè)商品的特征詞匯,所以采用這種方法獲取商品的特征詞匯,存在詞組數(shù)量不足,詞組質(zhì)量較差等問(wèn)題。



技術(shù)實(shí)現(xiàn)要素:

本申請(qǐng)的多個(gè)方面提供一種特征詞匯提取方法及裝置,用以保證特征詞匯的數(shù)量,提高特征詞匯的質(zhì)量。

本申請(qǐng)的一方面,提供一種特征詞匯提取方法,包括:

獲取網(wǎng)絡(luò)資源的描述信息作為提取語(yǔ)料;

對(duì)所述提取語(yǔ)料進(jìn)行詞組標(biāo)記,以獲得詞組標(biāo)記結(jié)果;

從所述詞組標(biāo)記結(jié)果中,提取可以反映所述網(wǎng)絡(luò)資源特征的特征詞匯。

本申請(qǐng)的另一方面,提供一種特征詞匯提取裝置,包括:

獲取模塊,用于獲取網(wǎng)絡(luò)資源的描述信息作為提取語(yǔ)料;

標(biāo)記模塊,用于對(duì)所述提取語(yǔ)料進(jìn)行詞組標(biāo)記,以獲得詞組標(biāo)記結(jié)果;

提取模塊,用于從所述詞組標(biāo)記結(jié)果中,提取可以反映所述網(wǎng)絡(luò)資源特征的特征詞匯。

在本申請(qǐng)中,使用網(wǎng)絡(luò)資源的描述信息作為提取語(yǔ)料,對(duì)提取語(yǔ)料進(jìn)行詞組標(biāo)記,然后從中提取可以反映網(wǎng)絡(luò)資源特征的特征詞匯,與現(xiàn)有技術(shù)中引導(dǎo)網(wǎng)絡(luò)資源提供者手動(dòng)填寫(xiě)特征詞匯的方案相比,消除了網(wǎng)絡(luò)資源提供者主觀因素的影響,不僅可以提取足夠數(shù)量的特征詞匯,而且可以保證特征詞匯的質(zhì)量。

【附圖說(shuō)明】

為了更清楚地說(shuō)明本申請(qǐng)實(shí)施例中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作一簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖是本申請(qǐng)的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。

圖1為本申請(qǐng)一實(shí)施例提供的特征詞匯提取方法的流程示意圖;

圖2為本申請(qǐng)另一實(shí)施例提供的特征詞匯提取方法的流程示意圖;

圖3為本申請(qǐng)又一實(shí)施例提供的特征詞匯提取方法的流程示意圖;

圖4為本申請(qǐng)又一實(shí)施例提供的特征詞匯提取裝置的結(jié)構(gòu)示意圖;

圖5為本申請(qǐng)又一實(shí)施例提供的特征詞匯提取裝置的結(jié)構(gòu)示意圖。

【具體實(shí)施方式】

為使本申請(qǐng)實(shí)施例的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本申請(qǐng)實(shí)施例中的附圖,對(duì)本申請(qǐng)實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例是本申請(qǐng)一部分實(shí)施例,而不是全部的實(shí)施例?;诒旧暾?qǐng)中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本申請(qǐng)保護(hù)的范圍。

圖1為本申請(qǐng)一實(shí)施例提供的特征詞匯提取方法的流程示意圖。如圖1所示,該方法包括:

101、獲取網(wǎng)絡(luò)資源的描述信息作為提取語(yǔ)料。

102、對(duì)上述提取語(yǔ)料進(jìn)行詞組標(biāo)記,以獲得詞組標(biāo)記結(jié)果。

103、從上述詞組標(biāo)記結(jié)果中,提取可以反映網(wǎng)絡(luò)資源特征的特征詞匯。

本實(shí)施例提供一種特征詞匯提取方法,可由特征詞匯提取裝置來(lái)執(zhí)行,用以從網(wǎng)絡(luò)資源的描述信息中,提取可以反映網(wǎng)絡(luò)資源特征的特征詞匯,從而保證所提取的特征詞匯的數(shù)量和質(zhì)量。

在詳細(xì)介紹本實(shí)施例的流程之前,首先對(duì)本申請(qǐng)中的特征詞匯進(jìn)行解釋說(shuō)明:

網(wǎng)絡(luò)資源的特征詞匯也可以稱為網(wǎng)絡(luò)資源的亮點(diǎn)詞匯,是最能描述網(wǎng)絡(luò)資源的風(fēng)格、特點(diǎn)等特征的詞匯,甚至可以作為網(wǎng)絡(luò)資源的標(biāo)簽。特征詞匯可以表達(dá)一個(gè)完整的意思,其可以是單詞,也可以是詞組。其中,詞組比單詞具有更加有效的表述力,因此詞組更加適合成為特征詞匯,但不限于此。對(duì)用戶而言,通過(guò)網(wǎng)絡(luò)資源的特征詞匯可以快速的了解到該網(wǎng)絡(luò)資源的內(nèi)容以及相關(guān)特征。舉例說(shuō)明,假設(shè)網(wǎng)絡(luò)資源為服裝,則詞組long-sleeve(長(zhǎng)袖),描述這件衣服是長(zhǎng)袖的,可以作為服裝的一個(gè)特征詞匯。

提取特征詞匯的第一步是:準(zhǔn)備提取語(yǔ)料。本實(shí)施例獲取網(wǎng)絡(luò)資源的描述信息作為提取語(yǔ)料。

網(wǎng)絡(luò)資源的描述信息主要是一些與網(wǎng)絡(luò)資源相關(guān)的信息,例如可以包括 但不限于:網(wǎng)絡(luò)資源的標(biāo)題、屬性信息、關(guān)鍵詞、詳情信息以及評(píng)論信息中的至少一種。值得說(shuō)明的是,網(wǎng)絡(luò)資源的描述信息優(yōu)選是文本信息,但不限于此。

上述網(wǎng)絡(luò)資源的屬性信息可以是網(wǎng)絡(luò)資源提供者在發(fā)布網(wǎng)絡(luò)資源時(shí)手動(dòng)填寫(xiě)的,例如包括但不限于:長(zhǎng)度、大小、產(chǎn)地、款式、飾品等。

上述網(wǎng)絡(luò)資源的標(biāo)題和關(guān)鍵詞也是網(wǎng)絡(luò)資源提供者在發(fā)布網(wǎng)絡(luò)資源時(shí)手動(dòng)填寫(xiě)的。

在電子商務(wù)領(lǐng)域,上述網(wǎng)絡(luò)資源可以是商品或服務(wù)。以商品為例,網(wǎng)絡(luò)資源的標(biāo)題、屬性信息和標(biāo)題實(shí)際上也就是商品的標(biāo)題、屬性信息和關(guān)鍵詞。

一種商品的標(biāo)題的示例如下:

sexystylegirls’blackdressespackage-hip-dressoneshouder’longsleeve++greenflowers+v-neck%oneckcockaildr-ess+wholesaleandretail+freeshipping100%cotton

一種商品的屬性信息的示例如下:

length:floor-length|decoration:beading|gender:woman|season:summer|patterntype:print|sleevestyle:offtheshoulder|neckline:o-neck|style:casual|placeoforigin:fujian,chinamainland|number:lc2132-1lc2132-2lc2132-3

一種商品的關(guān)鍵詞(逗號(hào)分隔)的示例如下:

bluedressparty,fashionladiesbluedressparty,fashionladiesbluedressparty

值得說(shuō)明的是,由于是大數(shù)據(jù)處理,本實(shí)施例提取的網(wǎng)絡(luò)資源的描述信息是非常多的,甚至可以達(dá)到億級(jí)別。

在一可選實(shí)施方式中,可以從數(shù)據(jù)倉(cāng)庫(kù)中,獲取網(wǎng)絡(luò)資源的原始描述信息,將原始描述信息直接作為提取語(yǔ)料。

在另一可選實(shí)施方式中,考慮到網(wǎng)絡(luò)資源的原始描述信息存在一些不規(guī)范和錯(cuò)誤的地方,例如使用奇怪的符號(hào)連接單詞,多個(gè)單詞寫(xiě)在一起無(wú)法區(qū)分,單詞的拼寫(xiě)錯(cuò)誤,同一個(gè)單詞或者詞組在多個(gè)地方的寫(xiě)法不一致等,若 直接采用原始描述信息,會(huì)為后面的處理帶來(lái)一定困難,降低所提取的特征詞匯的質(zhì)量?;诖耍鐖D2所示,上述步驟101包括:

101a、從數(shù)據(jù)倉(cāng)庫(kù)中,獲取網(wǎng)絡(luò)資源的原始描述信息。

101b、對(duì)原始描述信息進(jìn)行文本預(yù)處理,以獲得標(biāo)準(zhǔn)化描述信息作為提取語(yǔ)料。

簡(jiǎn)單來(lái)說(shuō),就是在獲取原始描述信息之后,對(duì)原始描述信息進(jìn)行文本預(yù)處理,執(zhí)行數(shù)據(jù)清洗,得到清晰可用的數(shù)據(jù)。圖2中其它步驟與圖1所示相同,下面一并詳細(xì)描述。

值得說(shuō)明的是,上述網(wǎng)絡(luò)資源的原始描述信息包括:網(wǎng)絡(luò)資源的標(biāo)題、屬性信息、關(guān)鍵詞、詳情信息以及評(píng)論信息中的至少一種;而網(wǎng)絡(luò)資源的標(biāo)準(zhǔn)化描述信息包括:經(jīng)過(guò)文本處理后網(wǎng)絡(luò)資源的標(biāo)題、屬性信息、關(guān)鍵詞、詳情信息以及評(píng)論信息中的至少一種。

進(jìn)一步,對(duì)原始描述信息進(jìn)行文本預(yù)處理包括但不限于:

對(duì)原始描述信息進(jìn)行連接符號(hào)預(yù)留處理、大小寫(xiě)轉(zhuǎn)換處理、拼寫(xiě)一致性檢查處理、單詞分割處理、拼寫(xiě)糾錯(cuò)處理以及名詞詞形還原處理中的至少一種。

連接符號(hào)預(yù)留處理:

在原始描述信息中,可能存在一些奇怪的連接符號(hào),例如加號(hào)“+”,去除這些奇怪的連接符號(hào),原始描述信息就變得比較規(guī)范,方便后續(xù)處理。但是,有一些特殊的連接符號(hào),可能能夠表達(dá)特殊或更加豐富的含義。

例如,短線“-”,通過(guò)分析發(fā)現(xiàn),這個(gè)符號(hào)一般是網(wǎng)絡(luò)資源提供者在填寫(xiě)網(wǎng)絡(luò)資源的描述信息的過(guò)程中主動(dòng)加上去的,往往連接著兩個(gè)或多個(gè)相關(guān)的詞,網(wǎng)絡(luò)資源提供者可能希望將這些詞連接在一起,表達(dá)一個(gè)更加豐富的語(yǔ)義。以o-neck為例,是一個(gè)正確的拼寫(xiě),表達(dá)“圓領(lǐng)”的意義,若將短線“-”去掉,則變成oneck,這是一個(gè)錯(cuò)誤拼寫(xiě),有可能在后續(xù)糾錯(cuò)過(guò)程中被糾正為neck,使其喪失原本的意義。

又例如,百分號(hào)“%”,在某些情況下可能會(huì)用于表示成分含量,例如“100%cotton”中的百分號(hào)表示含棉量百分百,所以應(yīng)該保留。當(dāng)然,對(duì)于不 需要保留的情況,可以將其去掉,例如“v-neck%”中的百分號(hào)則是不需要保留的,將其刪除。

又例如,單引號(hào)“’”,在某些情況下可能會(huì)表達(dá)所屬關(guān)系,例如girls’中的單引號(hào)表示所屬關(guān)系,需要保留。當(dāng)然,對(duì)于不需要保留的情況,可以將其去掉,例如shoulder’中的單引號(hào)就是多余的,將其刪除。

基于上述,對(duì)于短線、單引號(hào)或百分號(hào),可以預(yù)先指定需要保留的格式。在對(duì)原始描述信息進(jìn)行連接符號(hào)預(yù)留處理時(shí),可以判斷原始描述信息中是否包含符合指定格式的短線、單引號(hào)或百分號(hào),若判斷結(jié)果為存在,則保留原始描述信息中符合指定格式的短線、單引號(hào)或百分號(hào)。對(duì)于原始描述信息中存在的不符合指定格式的短線、單引號(hào)和百分號(hào)以及其它連接符號(hào),均刪除。

以上述商品的標(biāo)題為例:

連接符號(hào)預(yù)留處理之前如下:

sexystylegirls’blackdressespackage-hip-dressoneshouder’longsleeve++greenflowers+v-neck%oneckcockaildr-ess+wholesaleandretail+freeshipping100%cotton

連接符號(hào)預(yù)留處理之后如下:

sexystylegirls’blackdressespackage-hip-dressoneshouderlongsleevegreenflowersv-neckoneckcockaildr-esswholesaleandretailfreeshipping100%cotton

值得說(shuō)明的是,在處理百分號(hào)時(shí),當(dāng)發(fā)現(xiàn)需要保留時(shí),若在百分號(hào)與后面的單詞之間沒(méi)有空格,則可以加一個(gè)空格,例如上面的“100%cotton”,變成了“100%cotton”,使得預(yù)處理后的信息更加規(guī)范。

大小寫(xiě)轉(zhuǎn)換處理:

這里主要是進(jìn)行大小寫(xiě)之間的統(tǒng)一。根據(jù)具體應(yīng)用需求,可以將大寫(xiě)統(tǒng)一轉(zhuǎn)換為小寫(xiě),也可以將小寫(xiě)統(tǒng)一轉(zhuǎn)換為大寫(xiě)。

以上述商品的標(biāo)題為例,在進(jìn)行連接符號(hào)預(yù)留處理之后,大小寫(xiě)轉(zhuǎn)換處理之前的標(biāo)題示例如下:

sexystylegirls’blackdressespackage-hip-dressoneshouderlongsleevegreenflowersv-neckoneckcockaildr-esswholesaleandretailfreeshipping100%cotton

經(jīng)過(guò)連接符號(hào)預(yù)留處理和大小寫(xiě)轉(zhuǎn)換處理之后的標(biāo)題示例如下:

sexystylegirls’blackdressespackage-hip-dressoneshouderlongsleevegreenflowersv-neckoneckcockaildr-esswholesale-retailfreeshipping100%cotton

拼寫(xiě)一致性檢查處理:

經(jīng)過(guò)分析發(fā)現(xiàn),同樣一個(gè)單詞,在不同的地方可能會(huì)以不同的拼寫(xiě)方式出現(xiàn)。例如,dresses這個(gè)單詞,就存在著如下不同的拼寫(xiě)方法(不完全統(tǒng)計(jì)):dresses、dr-esses、dress-es等。這種拼寫(xiě)的不一致性,也會(huì)給后面的分析帶來(lái)困難,影響所提取到的特征詞匯的質(zhì)量?;诖?,這里預(yù)先對(duì)原始描述信息進(jìn)行拼寫(xiě)一致性檢查處理,將這些拼寫(xiě)不一致的單詞轉(zhuǎn)換為一致的拼寫(xiě)方式。

具體的,對(duì)于原始描述信息中的每個(gè)單詞或詞組,若該單詞或詞組在原始描述信息中出現(xiàn)多種拼寫(xiě)方式,統(tǒng)計(jì)每種拼寫(xiě)方式在數(shù)據(jù)倉(cāng)庫(kù)中重復(fù)出現(xiàn)的次數(shù);根據(jù)每種拼寫(xiě)方式在數(shù)據(jù)倉(cāng)庫(kù)中重復(fù)出現(xiàn)的次數(shù),從多種拼寫(xiě)方式中,選擇重復(fù)出現(xiàn)的次數(shù)最多且大于預(yù)設(shè)閾值的拼寫(xiě)方式作為目標(biāo)拼寫(xiě)方式,將該單詞或詞組在原始描述信息中出現(xiàn)的其它拼寫(xiě)方式替換為目標(biāo)拼寫(xiě)方式。

例如,假設(shè)dresses這個(gè)單詞,在原始描述信息中共出現(xiàn)了dresses、dr-esses和dress-es三種拼寫(xiě)方式,經(jīng)過(guò)統(tǒng)計(jì)發(fā)現(xiàn)dresses在數(shù)據(jù)倉(cāng)庫(kù)中出現(xiàn)的次數(shù)最多且大于預(yù)設(shè)的次數(shù)閾值,則可以將dresses作為目標(biāo)拼寫(xiě)方式,將dr-esses和dress-es這兩種拼寫(xiě)方式替換為dresses。

仍以上述商品的標(biāo)題為例,則上面經(jīng)過(guò)連接符號(hào)預(yù)留處理和大小寫(xiě)轉(zhuǎn)換處理的標(biāo)題示例,進(jìn)一步經(jīng)過(guò)拼寫(xiě)一致性檢查處理之后轉(zhuǎn)化為:

sexystylegirls’blackdressespackage-hip-dressoneshouder longsleevegreenflowersv-necko-neckcockaildresswholesale-retailfreeshipping100%cotton

單詞分割處理:

經(jīng)過(guò)分析發(fā)現(xiàn),原始描述信息中經(jīng)常出現(xiàn)多個(gè)單詞寫(xiě)在了一起的情況,比如上面標(biāo)題中的“l(fā)ongsleeve”,還有單詞拼寫(xiě)錯(cuò)誤的情況,比如上面標(biāo)題中的“shouder”(應(yīng)該是shoulder)和“cockail”(應(yīng)該是cocktail)。這些錯(cuò)誤會(huì)嚴(yán)重影響后續(xù)處理過(guò)程,所以需要訂正。

針對(duì)上述問(wèn)題,一種具體訂正方式是:對(duì)原始描述信息進(jìn)行單詞分割處理,即識(shí)別出原始描述信息中存在的連寫(xiě)在一起的單詞,對(duì)所識(shí)別出的連寫(xiě)在一起的單詞進(jìn)行分割。

舉例說(shuō)明,單詞分割處理的結(jié)果示例如下:

longsleevefloorlengthdress->longsleevefloorlengthdress

dgdhlongsleevekl->dgdhlongsleevekl

swearskirt->swearskirt

在上述示例中,“->”左側(cè)的是連寫(xiě)在一起的單詞,“->”右側(cè)的是分割后的結(jié)果。在上述第一個(gè)示例中,待處理字符串是由單詞組成的,經(jīng)過(guò)單詞分割之后,每個(gè)單詞都分割出來(lái)了。在上述第二個(gè)示例中,前面有幾個(gè)干擾字符,后面也有干擾字符,經(jīng)過(guò)單詞分割之后,不僅分割出了確定的單詞(longsleeve),而且也將干擾字符識(shí)別出來(lái)了。在上述第三個(gè)示例中,通過(guò)采用最優(yōu)的分割策略,使分割出來(lái)的單詞更加符合上下文的語(yǔ)義。

綜上所述,單詞分割處理的過(guò)程,就是盡可能的排除前后的干擾字符,識(shí)別出單詞,并結(jié)合上下文確定最優(yōu)分割策略,使得語(yǔ)義上更加順暢。

拼寫(xiě)糾錯(cuò)處理:

拼寫(xiě)糾錯(cuò),就是將錯(cuò)誤的拼寫(xiě)形式,訂正為正確的形式。例如,將sleve修改為sleeve。值得說(shuō)明的是,這里的拼寫(xiě)糾錯(cuò)是針對(duì)任意字符串(token)的,這里的字符串可以是單詞,也可以是多個(gè)單詞,這樣,拼寫(xiě)糾錯(cuò)不僅可以糾正拼寫(xiě)錯(cuò)誤的單詞,還可以糾正由多個(gè)單詞形成但拼寫(xiě)錯(cuò)誤的詞組。

舉例說(shuō)明,拼寫(xiě)糾錯(cuò)處理的結(jié)果示例如下:

sleve->sleeve

dres->dress

wholesle->wholesale

shouder->shoulder

saikaaadffdsaf->saikaaadffdsaf

sleevc->sleeve

sleever->sleeve

sleeev->sleeve

sleeevt->sleeve

longsleve->longsleeve

在上述示例中,“->”左側(cè)的錯(cuò)誤的拼寫(xiě)形式,“->”右側(cè)的是訂正后正確的拼寫(xiě)形式。

上面單獨(dú)對(duì)單詞分割處理和拼寫(xiě)糾錯(cuò)處理進(jìn)行了說(shuō)明。在實(shí)際應(yīng)用中,兩者也可以結(jié)合使用。由于某些單詞寫(xiě)在了一起,但是也有可能寫(xiě)錯(cuò),比如上面標(biāo)題示例中的“l(fā)ongsleve”,這種錯(cuò)誤的拼寫(xiě)形式,無(wú)法直接被單詞分割,所以需要首先被訂正,例如會(huì)被訂正為“l(fā)ongsleeve”。在訂正之后,就可以對(duì)其進(jìn)行單詞分割處理,將單詞分割為正確的形式“l(fā)ongsleeve”。這里將單詞分割和拼寫(xiě)糾錯(cuò)結(jié)合起來(lái)使用,可以解決很多只靠單一技術(shù)無(wú)法解決的問(wèn)題,提高了數(shù)據(jù)預(yù)處理的效果。

仍以上述商品的標(biāo)題為例,則上面經(jīng)過(guò)連接符號(hào)預(yù)留處理、大小寫(xiě)轉(zhuǎn)換處理以及拼寫(xiě)一致性檢查處理的標(biāo)題示例,進(jìn)一步經(jīng)過(guò)單詞分割和拼寫(xiě)糾錯(cuò)之后轉(zhuǎn)化為:

sexystylegirls’blackdressespackage-hip-dressoneshoulderlongsleevegreenflowersv-necko-neckcocktaildresswholesale-retailfreeshipping100%cotton

名詞詞形還原:

名詞詞形還原主要是指將原始描述信息中的名詞進(jìn)行詞形還原,即名詞 復(fù)數(shù)變單數(shù)。

值得說(shuō)明的是,本實(shí)施例考慮到動(dòng)名詞或者動(dòng)詞的過(guò)去式可能是形容詞,有可能表達(dá)特定的意思,所以暫不考慮對(duì)動(dòng)詞和形容詞進(jìn)行詞形還原。

在本實(shí)施例中,可以根據(jù)詞典和預(yù)設(shè)單復(fù)數(shù)變換規(guī)則中的至少一種,對(duì)原始描述信息中的名詞進(jìn)行詞形還原。

其中,基于詞典的名詞詞形還原方式,比較暴力,但是比較可靠。具體的做法是:從詞典中獲取了所有名詞及其復(fù)數(shù)形式,構(gòu)建名詞和其復(fù)數(shù)形式之間的映射關(guān)系,后續(xù)基于該映射關(guān)系,識(shí)別原始描述信息中的名詞復(fù)數(shù),并將其還原為名詞單數(shù)。

基于預(yù)設(shè)單復(fù)數(shù)變換規(guī)則的名詞詞形還原方式,預(yù)先設(shè)定名詞單復(fù)數(shù)變換規(guī)則,例如名詞變成復(fù)數(shù)形式的方法一般有后面加“s”,末尾字符是“y”的變成“ies”等,后續(xù)基于該變換規(guī)則,識(shí)別原始描述信息中的名詞復(fù)數(shù),并按照變換規(guī)則對(duì)識(shí)別出的名詞復(fù)數(shù)進(jìn)行逆向處理,以還原為名詞單數(shù)。

在實(shí)際應(yīng)用上,可以優(yōu)先基于詞典進(jìn)行名詞詞形還原處理,如果基于詞典無(wú)法還原為名詞單數(shù),進(jìn)一步,基于單復(fù)數(shù)變換規(guī)則進(jìn)行名詞詞形還原處理。一般來(lái)說(shuō),詞典的準(zhǔn)確率比較高,而規(guī)則的覆蓋面比較廣泛,將兩者結(jié)合使用,既可以保證名詞詞形還原的準(zhǔn)確率,又可以保證名詞復(fù)數(shù)盡可能被還原為名詞單數(shù)。當(dāng)然,也可以使用上述兩種名詞詞形還原方式中的一種。

仍以上述商品的標(biāo)題為例,則上面經(jīng)過(guò)連接符號(hào)預(yù)留處理、大小寫(xiě)轉(zhuǎn)換處理、拼寫(xiě)一致性檢查處理、單詞分割和拼寫(xiě)糾錯(cuò)的標(biāo)題示例,進(jìn)一步經(jīng)過(guò)名詞詞形還原之后轉(zhuǎn)化為:

sexystylegirls’blackdresspackage-hip-dressoneshoulderlongsleevegreenflowerv-necko-neckcocktaildresswholesale-retailfreeshipping100%cotton

值得說(shuō)明的是,上面單獨(dú)對(duì)每種文本預(yù)處理方式進(jìn)行了說(shuō)明。在實(shí)際應(yīng)用中,各種文本預(yù)處理方式可以單獨(dú)使用,也可以相互結(jié)合使用。

原始描述信息在經(jīng)過(guò)上述各種文本預(yù)處理之后,將變得規(guī)范化,為便于 區(qū)分,將現(xiàn)在的描述信息稱為標(biāo)準(zhǔn)化描述信息。

之后,可以將標(biāo)準(zhǔn)化描述信息作為提取語(yǔ)料,進(jìn)行特征詞匯的提取處理。

具體的,考慮到單個(gè)單詞往往在意義表達(dá)上不夠完整,例如“sleeve”沒(méi)有意義,但是“l(fā)ongsleeve”就是一個(gè)特征詞匯,即“長(zhǎng)袖的”。也就是說(shuō),詞組成為特征詞匯的概率更高,所以為了提取更多高質(zhì)量的特征詞匯,在獲得提取語(yǔ)料之后,首先需要將提取語(yǔ)料中的詞組標(biāo)記出來(lái),然后,基于標(biāo)記結(jié)果進(jìn)行特征詞匯的提取。

在一可選實(shí)施方式中,上述對(duì)提取語(yǔ)料進(jìn)行詞組標(biāo)記的實(shí)施方式包括:

對(duì)提取語(yǔ)料分別執(zhí)行顯示詞組提取流程和模式詞組提取流程,以從提取語(yǔ)料中提取顯示詞組和隱式詞組;

根據(jù)顯示詞組和隱式詞組的出現(xiàn)頻次,確定提取語(yǔ)料中的待標(biāo)記詞組;

在提取語(yǔ)料中對(duì)待標(biāo)記詞組進(jìn)行標(biāo)記,以獲得詞組標(biāo)記結(jié)果。

在本實(shí)施例中,為了更加全面的從提取語(yǔ)料中提取詞組,從兩方面進(jìn)行詞組提取,一方面是對(duì)提取語(yǔ)料執(zhí)行顯示詞組提取流程,以從提取語(yǔ)料中提取顯示詞組,另一方面是對(duì)提取語(yǔ)料執(zhí)行模式詞組提取流程,以從提取語(yǔ)料中提取隱式詞組。

其中,顯示詞組是指容易發(fā)現(xiàn)的詞組,隱式詞組是指不容易發(fā)現(xiàn)的詞組。由此可見(jiàn),本實(shí)施例既能提取顯示詞組,又能提取隱式詞組,所以能夠更加全面的提取詞組。另外,本實(shí)施例基于海量描述信息進(jìn)行詞組提取,不依賴于人工,因此可以避免人工帶來(lái)的錯(cuò)誤,保證詞組的質(zhì)量。

值得說(shuō)明的是,本實(shí)施例并不限制提取顯示詞組的操作與提取隱式詞組的操作之間的執(zhí)行順序,可以按照任意先后順序執(zhí)行,也可以并行執(zhí)行。

進(jìn)一步,上述顯示詞組提取流程包括:加載預(yù)設(shè)的顯示詞組規(guī)則的步驟和根據(jù)顯示詞組規(guī)則從提取語(yǔ)料中提取顯示詞組的步驟。基于此,上述對(duì)提取語(yǔ)料執(zhí)行顯示詞組提取流程,以從提取語(yǔ)料中提取顯示詞組的實(shí)施方式包括:

加載預(yù)設(shè)的顯示詞組規(guī)則;

從提取語(yǔ)料中,提取符合顯示詞組規(guī)則的信息片段作為顯示詞組。

在一可選實(shí)施方式中,上述顯示詞組規(guī)則包括但不限于:指定字符串條件規(guī)則、領(lǐng)域詞典規(guī)則以及屬性值規(guī)則中的至少一個(gè)規(guī)則。

上述指定字符串條件規(guī)則用于指示符合指定字符串條件的字符串可以作為顯示詞組。

上述領(lǐng)域詞典規(guī)則用于指示屬于領(lǐng)域詞典中的詞組可以作為顯示詞組。根據(jù)領(lǐng)域的不同,領(lǐng)域詞典也會(huì)有所不同。例如,在服裝領(lǐng)域,《英漢紡織大辭典》可以算作一種領(lǐng)域詞典。

上述屬性值規(guī)則用于指示網(wǎng)絡(luò)資源的屬性信息中的屬性值可以作為顯示詞組。

基于上述具體的顯示詞組規(guī)則,從提取語(yǔ)料中,提取符合顯示詞組規(guī)則的信息片段作為顯示詞組,具體可以包括以下至少一種操作:

從提取語(yǔ)料中,提取滿足指定字符串條件的字符串作為顯示詞組;

從提取語(yǔ)料中,提取屬于領(lǐng)域詞典中的詞組作為所述顯示詞組;

在提取語(yǔ)料包括網(wǎng)絡(luò)資源的屬性信息時(shí),提取屬性信息中的屬性值作為顯示詞組。

下面對(duì)提取滿足指定字符串條件的字符串作為顯示詞組的方案進(jìn)行詳細(xì)說(shuō)明。

具體的,考慮到網(wǎng)絡(luò)資源的提取語(yǔ)料中存在短線“-”連接的字符串,例如,package-hip-dress、v-neck、o-neck、wholesale-retail、one-shoulder、long-sleeve等均屬于通過(guò)短線“-”連接的字符串。以短線“-”連接的字符串一般是將多個(gè)單詞連接在一起,能夠表達(dá)更加豐富的含義,所以短線“-”連接的字符串是詞組的概率較大。當(dāng)然,也有一些以短線“-”連接的字符串由于不具有實(shí)際含義,所以不能作為詞組,例如a-b,v-neck-half-sleeve-dress等不屬于詞組。

基于上述,可以設(shè)定一些條件,用于限定能夠作為詞組的以短線“-”連接的字符串,這些限制條件稱為字符串條件,具體包括但不限于以下條件:

字符串以短線“-”連接:這個(gè)條件用于限定必須是以短線“-”連接的字符串才能成為詞組,其中,以短線“-”連接的字符串可以稱為token;

字符串的出現(xiàn)次數(shù)大于預(yù)設(shè)次數(shù)閾值:這個(gè)條件要求字符串的出現(xiàn)次數(shù)大于預(yù)設(shè)次數(shù)閾值,例如大于500次;這里字符串的出現(xiàn)次數(shù)是指統(tǒng)計(jì)出的該字符串在數(shù)據(jù)倉(cāng)庫(kù)中的出現(xiàn)次數(shù);

字符串不是英文單詞:這個(gè)條件用于排除單詞,即單詞不是詞組;

字符串的最后一個(gè)單詞不是以s、es、ex、ed、d、ing、ings、ry、ies、ves、y或a結(jié)束:這個(gè)條件主要用于避免詞組中包含名詞復(fù)數(shù)、動(dòng)詞過(guò)去式、現(xiàn)在進(jìn)行時(shí)等;

字符串中不含有連詞:這個(gè)條件主要用于避免詞組中含有連詞(如and、but、or、for、so、nor等);

字符串中不含有停用詞:這個(gè)條件主要用于避免詞組中出現(xiàn)停用詞(如of、a等);

字符串包含指定個(gè)數(shù)的單詞:這個(gè)條件的意思是字符串必須包含指定個(gè)數(shù)的單詞才能成為詞組,否則不能成為詞組;

字符串中不含有數(shù)字(百分?jǐn)?shù)除外):這個(gè)條件的意思是含有數(shù)字的字符串不能成為詞組;

字符串中單詞長(zhǎng)度小于指定長(zhǎng)度(例如小于20個(gè)字母):這個(gè)條件的意思是字符串中單詞的長(zhǎng)度要小于指定長(zhǎng)度才能成為詞組,反之不能成為詞組;

字符串的長(zhǎng)度大于字符串包含的單詞的個(gè)數(shù):這個(gè)條件的意思是指字符串的長(zhǎng)度要大于字符串包含的單詞的個(gè)數(shù)才能成為詞組,反之不能成為詞組;

字符串不滿足指定的正則規(guī)則:這個(gè)條件的意思是不滿足指定的正則規(guī)則的字符串才能成為詞組,反之,滿足正則規(guī)則的不能成為詞組。例如,這里的正則規(guī)則包括但不限于:“as-\w+”,表示以“as-”開(kāi)頭的字符串,“so-\w+”,表示以“so-”開(kāi)頭的字符串。

基于上述字符串條件可以確定哪些字符串是顯示詞組,哪些字符串不是 顯示詞組。舉例說(shuō)明:

不是詞組的字符串:

sleeve-less:最后一個(gè)單詞以s結(jié)束;

dress-es:最后一個(gè)單詞以s或es結(jié)束;

sleeve-s:最后一個(gè)單詞以s結(jié)束;

full-sleevevneckdresssexyclubwear:字符串中單詞長(zhǎng)度超過(guò)了指定長(zhǎng)度;

a-b:字符串的長(zhǎng)度不大于字符串包含的單詞的個(gè)數(shù);

half-3sleeve:字符串中含有數(shù)字3;

v-neck-half-sleeve-dress:字符串包含的單詞過(guò)多;

fashion-ladies-blue-dress-party:字符串包含的單詞過(guò)多;

as-picture:字符串滿足了指定的正則規(guī)則;

so-good:字符串滿足了指定的正則規(guī)則。

是詞組的字符串:

v-neck

deep-v-neck

green-flower

floor-length

100%-silk

考慮到上述提取語(yǔ)料可以包括但不限于:網(wǎng)絡(luò)資源的標(biāo)題、屬性信息以及關(guān)鍵詞等。在提取滿足指定字符串條件的字符串作為顯示詞組的實(shí)施過(guò)程中,可以將網(wǎng)絡(luò)資源的標(biāo)題、屬性信息以及關(guān)鍵詞等整合為一個(gè)信息集合,然后從該信息集合中提取滿足指定字符串條件的字符串作為顯示詞組?;蛘撸谔崛M足指定字符串條件的字符串作為顯示詞組的實(shí)施過(guò)程中,可以單獨(dú)從網(wǎng)絡(luò)資源的標(biāo)題中提取滿足指定字符串條件的字符串作為顯示詞組,單獨(dú)從網(wǎng)絡(luò)資源的屬性信息中提取滿足指定字符串條件的字符串作為顯示詞組,以及單獨(dú)從網(wǎng)絡(luò)資源的關(guān)鍵詞中提取滿足指定字符串條件的字符串作為顯示 詞組,等等。

對(duì)于網(wǎng)絡(luò)資源來(lái)說(shuō),一般具有多個(gè)屬性,但不是每個(gè)屬性對(duì)詞組提取都有用?;诖耍梢愿鶕?jù)具體應(yīng)用場(chǎng)景,預(yù)先配置篩選規(guī)則,用于從所有屬性中篩選出對(duì)詞組提取有用的屬性,稱為關(guān)鍵屬性。然后,以關(guān)鍵屬性為語(yǔ)料,進(jìn)行詞組提取。

以電子商務(wù)領(lǐng)域?yàn)槔W(wǎng)絡(luò)資源為商品。用戶預(yù)先配置篩選規(guī)則,通過(guò)篩選規(guī)則選擇關(guān)鍵屬性。其中,不同資源類目對(duì)應(yīng)的篩選規(guī)則不同,篩選出的關(guān)鍵屬性也不相同。假設(shè)id為3的類目為apparel,則按照預(yù)設(shè)的篩選規(guī)則篩選出的關(guān)鍵屬性包括但不限于表1所示。

表1

下面對(duì)提取屬于領(lǐng)域詞典中的詞組作為顯示詞組的方案進(jìn)行詳細(xì)說(shuō)明。

具體的,領(lǐng)域詞典中存儲(chǔ)有本領(lǐng)域的詞組,因此,可以直接判斷提取語(yǔ)料中是否包括屬于領(lǐng)域詞典中的詞組,若包括,則可以直接確定該詞組屬于顯示詞組。這種方式實(shí)現(xiàn)相對(duì)簡(jiǎn)單,效率較高,尤其適合發(fā)現(xiàn)比較明顯的詞組。

下面對(duì)上述提取屬性信息中的屬性值作為顯示詞組的方案進(jìn)行詳細(xì)說(shuō)明。

具體的,屬性信息一般包括屬性名和屬性值,一般實(shí)現(xiàn)結(jié)構(gòu)為屬性名:屬性值。在這種實(shí)現(xiàn)結(jié)構(gòu)中,屬性值多為語(yǔ)義明確的詞組,所以可以直接從 提取語(yǔ)料中發(fā)現(xiàn)屬性信息,然后提取屬性信息中的屬性值作為顯示詞組。

在上述實(shí)施例或?qū)嵤┓绞街?,可以采用上述幾種方式提取到顯示詞組。值得說(shuō)明的是,上述提取顯示詞組的幾種方式可以單獨(dú)使用,也可以以任意組合結(jié)合使用。

進(jìn)一步,上述模式詞組提取流程包括:加載預(yù)設(shè)的模式組合規(guī)則的步驟和根據(jù)模式組合規(guī)則從提取語(yǔ)料中提取隱式詞組的步驟。基于此,上述對(duì)提取語(yǔ)料執(zhí)行模式詞組提取流程,以從提取語(yǔ)料中提取隱式詞組的實(shí)施方式包括:

加載預(yù)設(shè)的模式組合規(guī)則;

從提取語(yǔ)料中,提取符合模式組合規(guī)則的信息片段作為隱式詞組。

在一可選實(shí)施方式中,上述模式組合規(guī)則包括但不限于:詞性組合規(guī)則、正則表達(dá)式規(guī)則以及屬性表達(dá)規(guī)則中的至少一個(gè)規(guī)則。

上述詞性組合規(guī)則用于指示符合指定詞性組合條件的單詞組合可以作為隱式詞組。

上述正則表達(dá)式規(guī)則用于指示滿足指定正則表達(dá)式的單詞組合可以作為隱式詞組。

上述屬性表達(dá)規(guī)則用于指示按照預(yù)設(shè)生成規(guī)則,根據(jù)屬性信息生成隱式詞組。

基于上述具體的模式詞組規(guī)則,從提取語(yǔ)料中,提取符合模式詞組規(guī)則的信息片段作為隱式詞組,具體可以包括以下至少一種操作:

從提取語(yǔ)料中,提取滿足指定詞性組合條件的單詞組合作為隱式詞組;

從提取語(yǔ)料中,提取滿足指定正則表達(dá)式的單詞組合作為隱式詞組;

在提取語(yǔ)料包括網(wǎng)絡(luò)資源的屬性信息時(shí),按照預(yù)設(shè)生成規(guī)則,根據(jù)屬性信息,生成隱式詞組。

下面對(duì)上述從提取語(yǔ)料中,提取滿足指定詞性組合條件的單詞組合作為隱式詞組的方案進(jìn)行詳細(xì)說(shuō)明。

具體的,經(jīng)過(guò)研究分析發(fā)現(xiàn),有些詞性組合模式往往是詞組,例如,形容詞+名詞("^jj\\s+nns{0,1}$")、形容詞+形容詞+名詞("^jj\\s+jj\\s+nns{0,1}$")等構(gòu)成的單詞組合,一般是詞組?;诖?,詞性組合條件可以包括:形容詞+名詞模式、形容詞+形容詞+名詞模式。當(dāng)然,除了這兩種詞性組合模式之外,還有其它詞性組合模式。例如,greenflowers,natural-color,hooded-collar等屬于形容詞+名詞模式的單詞組合,屬于詞組。又例如,smallgreenflowers等屬于形容詞+形容詞+名詞模式的單詞組合,也屬于詞組。

在具體實(shí)現(xiàn)上,可以按照詞組包括的單詞個(gè)數(shù)設(shè)置窗口長(zhǎng)度,按照設(shè)定的窗口長(zhǎng)度對(duì)提取語(yǔ)料依次采樣,然后判斷采樣到的單詞組合在詞性上是否符合詞性組合條件,若判斷結(jié)果為是,則確定該單詞組合為隱式詞組;若判斷結(jié)果為否,則丟棄,并繼續(xù)下一次采樣。

其中,若設(shè)置詞組包括2或3個(gè)單詞,則可以設(shè)置兩個(gè)窗口長(zhǎng)度,分別為2和3,用于采樣長(zhǎng)度為2和3的單詞組合。

下面對(duì)上述從提取語(yǔ)料中,提取滿足指定正則表達(dá)式的單詞組合作為隱式詞組的方案進(jìn)行詳細(xì)說(shuō)明。

具體的,考慮到有些詞組,既不是固定搭配形成的詞組,也不符合詞性組合模式,即無(wú)法通過(guò)正常的語(yǔ)法手段來(lái)得到,但是這些詞組符合一定的構(gòu)詞方式,比如都以style結(jié)尾,或者有百分?jǐn)?shù)開(kāi)頭等。針對(duì)這些詞組,預(yù)先設(shè)定正則表達(dá)式,符合預(yù)設(shè)正則表達(dá)式的單詞組合,也是詞組。

列舉幾個(gè)表示詞組的正則表達(dá)式:

"^[a-z]*?\\s+style$"表示xxxstyle,即單詞+style形式的單詞組合,可能是詞組,需要獲取,例如"sexystyle","bohemiastyle";

"^[0-9]+%\\s+[a-z]+$"表示xx%xxx,即百分?jǐn)?shù)+單詞的單詞組合,可能是詞組,需要獲取,例如"100%cotton";

"^%[0-9]+\\s+[a-z]+$"表示%xxxxx,即百分?jǐn)?shù)+單詞的單詞組合,可能 是詞組,需要獲取,例如"%100cotton"。

在具體實(shí)現(xiàn)上,可以根據(jù)正則表達(dá)式中的標(biāo)識(shí)部分(例如style、%),在提取語(yǔ)料中進(jìn)行查找,當(dāng)確定該標(biāo)識(shí)部分后,按照正則表達(dá)式的格式判斷該標(biāo)識(shí)部分之前或之后的單詞是否符合正則表達(dá)式的要求,若判斷結(jié)果為是,則獲取由該標(biāo)識(shí)部分以及該標(biāo)識(shí)部分之前或之后的單詞形成的單詞組合作為隱式詞組。

下面對(duì)上述按照預(yù)設(shè)生成規(guī)則,根據(jù)屬性信息,生成隱式詞組的方案進(jìn)行詳細(xì)說(shuō)明。

具體的,網(wǎng)絡(luò)資源的屬性信息包括屬性名和屬性值。在提取語(yǔ)料包括網(wǎng)絡(luò)資源的屬性信息時(shí),可以按照預(yù)設(shè)生成規(guī)則,根據(jù)屬性信息,生成隱式詞組。

進(jìn)一步,上述生成規(guī)則用于指示將屬性名轉(zhuǎn)換為展示屬性名,將屬性值和展示屬性名進(jìn)行組合,以生成隱式詞組。

基于上述,按照預(yù)設(shè)生成規(guī)則,根據(jù)屬性信息,生成隱式詞組包括:

根據(jù)屬性信息中的屬性名生成展示屬性名,將屬性信息中的屬性值和展示屬性名進(jìn)行組合,以生成隱式詞組。

其中,可以預(yù)先設(shè)定屬性名到展示屬性名之間的轉(zhuǎn)換規(guī)則,然后基于該轉(zhuǎn)換規(guī)則生成展示屬性名。根據(jù)不同應(yīng)用場(chǎng)景,該轉(zhuǎn)換規(guī)則可以適應(yīng)性設(shè)置。以電子商務(wù)領(lǐng)域中的服裝類目為例,一種屬性名到展示屬性名之間的轉(zhuǎn)換規(guī)則的示例如下所示:

dresseslength/dress

sleevelength/sleeve

sleevestyle/sleeve

sleevetype/sleeve

sleeve/sleeve

hooded/hooded

material/null

neckline/neckline

waistline/waistline

decoration/decoration

style/style

silhouette/silhouette

fabrictype/fabric

season/null

forseason/null

fortheseason/null

patterntype/pattern

color/null

colorstyle/null

technics/technics

itemtype/null

itemname/null

productcategory/null

outerweartype/outerwear

eyeweartype/null

scarvestype/null

clothinglength/clothing

collar/collar

closuretype/closure

thickness/thickness

backdesign/back

built-inbra/built-inbra

waistline/waistline

weddingdressfabric/null

在上述示例中,每個(gè)示例包含三部分,屬性名、斜線和展示屬性名。斜線用以分割屬性名和展示屬性名,斜線左側(cè)是屬性名,斜線右側(cè)是展示屬性名。

基于上述示例,一種生成隱式詞組的方式為:屬性值+展示屬性名。在具體實(shí)現(xiàn)上,可以獲取屬性信息,根據(jù)上述轉(zhuǎn)換規(guī)則,將屬性信息中的屬性名轉(zhuǎn)換為展示屬性名,再按照上述方式將屬性值與展示屬性名組合在一起,形成隱式詞組。

例如,假設(shè)一屬性信息為sleevelength:half,其中,屬性名是“sleevelength”,屬性值是“half”,可以將屬性名“sleevelength”轉(zhuǎn)換為展示屬性名“sleeve”,將屬性值“half”和展示屬性名“sleeve”進(jìn)行組合,生成隱式詞組“half-sleeve”。

又例如,假設(shè)一屬性信息為sleevestyle:batwing,其中,屬性名是“sleevestyle”,屬性值是“batwing”,可以將屬性名“sleevestyle”轉(zhuǎn)換為展示屬性名“sleeve”,將屬性值“batwing”和展示屬性名“sleeve”進(jìn)行組合,生成隱式詞組“bat-wing-sleeve”。

值得說(shuō)明的是,上述展示屬性名可以為“null”,即生成隱式詞組時(shí),展示屬性名為空,不使用屬性名。

另外,對(duì)于一些屬性值是布爾類型的,例如一屬性信息為“build-in-bra:yes”(一般在婚紗類目的商品中,用以表達(dá)婚紗是否內(nèi)置了文胸),如果是屬性值是“yes”或“y”等表示“是”,則形成隱式詞組時(shí)可以直接省略屬性值,否則不省略。例如,根據(jù)屬性信息“build-in-bra:yes”,形成的隱式詞組為“build-in-bra”。例如,根據(jù)屬性信息“build-in-bra:not”,形成的隱式詞組“not-build-in-bra”。

由此可見(jiàn),經(jīng)過(guò)上述幾種操作可以提取到隱式詞組。值得說(shuō)明的是,上述提取隱式詞組的幾種方式可以單獨(dú)使用,也可以以任意組合結(jié)合使用。

在從提取語(yǔ)料中提取到顯示詞組和隱式詞組之后,可以統(tǒng)計(jì)顯示詞組和隱式詞組中各詞組的出現(xiàn)頻次,即統(tǒng)計(jì)各詞組在數(shù)據(jù)倉(cāng)庫(kù)這個(gè)語(yǔ)料庫(kù)中出現(xiàn)的頻次,用于指導(dǎo)詞組標(biāo)記。一種具體統(tǒng)計(jì)各詞組的出現(xiàn)頻次的方法是:判斷各詞組是否出現(xiàn)在數(shù)據(jù)倉(cāng)庫(kù)中,如果判斷結(jié)果為是,則將相應(yīng)詞組的頻次 加1,否則將相應(yīng)詞組的頻次保持不變。這樣可以得到各詞組的出現(xiàn)頻次。

詞組標(biāo)記的原則是將最可能是詞組的單詞組合標(biāo)記出來(lái)?;诖?,若識(shí)別出的某個(gè)詞組的出現(xiàn)頻次越高,說(shuō)明是詞組的概率就越高,因此,可以根據(jù)各詞組的出現(xiàn)頻次,確定提取語(yǔ)料中的待標(biāo)記詞組,例如,將出現(xiàn)頻次最高的詞組作為待標(biāo)記詞組,然后在提取語(yǔ)料中對(duì)待標(biāo)記詞組進(jìn)行標(biāo)記,以獲得詞組標(biāo)記結(jié)果。

舉例說(shuō)明,假設(shè)一待標(biāo)記詞組的句子如下所示:

newarriveminidressclubweardressdeepvneckoffshoulderantiwinkledressliveleopardprintdressfreeshipping

經(jīng)過(guò)詞組提取和頻次統(tǒng)計(jì),可以得到以下詞組及其頻次:

上述mini-dress和dress-club以及club-wear-dress都可以作為詞組,但是明顯有沖突,于是根據(jù)頻次最大原則,得到了如下的詞組標(biāo)記結(jié)果:

newarrivemini-dressclub-wear-dressdeep-v-neckoff-shoulderanti-winkle-dressliveleopard-print-dressfreeshipping

在上述標(biāo)記結(jié)果中,短線連接的詞組為待標(biāo)記詞組。

另外,以上述商品的標(biāo)題為例,在經(jīng)過(guò)文本預(yù)處理之后,對(duì)其進(jìn)行詞組標(biāo)記可得到如下結(jié)果:

sexy-stylegirls’black-dresspackage-hip-dressone-shoulderlong-sleevegreen-flowerv-necko-neckcocktail-dresswholesale-retailfree-shipping100%-cotton

值得說(shuō)明的是,詞組標(biāo)記的作用是巨大的,實(shí)現(xiàn)了英文的詞組分詞,通過(guò)詞組分詞,可以得到一個(gè)個(gè)語(yǔ)義上最小粒度的文本處理單元,接下來(lái),就可以基于詞組標(biāo)記結(jié)果提取特征詞匯了。

一種具體從詞組標(biāo)記結(jié)果中,提取特征詞匯的實(shí)施方式包括:

從詞組標(biāo)記結(jié)果中,提取候選詞匯;

根據(jù)候選詞匯的出現(xiàn)頻次,計(jì)算候選詞匯的權(quán)重;

根據(jù)候選詞匯的權(quán)重,選擇權(quán)重位于預(yù)設(shè)權(quán)重區(qū)間范圍內(nèi)的候選詞匯作為網(wǎng)絡(luò)資源的特征詞匯。

可選的,上述從詞組標(biāo)記結(jié)果中,提取候選詞匯具體包括:去除詞組標(biāo)記結(jié)果中的無(wú)用詞,以獲得候選詞匯,即將剩余的單詞或詞組作為候選詞匯。

上述無(wú)用詞包括但不限于:停用詞、量詞、方向詞以及符合正則表達(dá)式規(guī)則的詞。

停用詞:是自然語(yǔ)言處理中無(wú)用的詞。在英文中,有標(biāo)準(zhǔn)的停用詞列表,例如英文中的標(biāo)準(zhǔn)停用詞有:

[u'i',u'me',u'my',u'myself',u'we',u'our',u'ours',u'ourselves',u'you',u'your',u'yours',u'yourself',u'yourselves',u'he',u'him',u'his',u'himself',u'she',u'her',u'hers',u'herself',u'it',u'its',u'itself',u'they',u'them',u'their',u'theirs',u'themselves',u'what',u'which',u'who',u'whom',u'this',u'that',u'these',u'those',u'am',u'is',u'are',u'was',u'were',u'be',u'been',u'being',u'have',u'has',u'had',u'having',u'do',u'does',u'did',u'doing',u'a',u'an',u'the',u'and',u'but',u'if',u'or',u'because',u'as',u'until',u'while',u'of',u'at',u'by',u'for',u'with',u'about',u'against',u'between',u'into',u'through',u'during',u'before',u'after',u'above',u'below',u'to',u'from',u'up',u'down',u'in',u'out',u'on',u'off',u'over',u'under',u'again',u'further',u'then',u'once',u'here',u'there',u'when',u'where',u'why',u'how',u'all',u'any',u'both',u'each',u'few',u'more',u'most',u'other',u'some',u'such',u'no',u'nor',u'not',u'only',u'own',u'same',u'so',u'than',u'too',u'very',u's',u't',u'can',u'will',u'just',u'don',u'should',u'now']

在本實(shí)施例中,對(duì)上述標(biāo)準(zhǔn)停用詞進(jìn)行了一些處理,去除了其中一些對(duì)于詞組來(lái)說(shuō)有用的詞,例如with,between,under,over等,另外,結(jié)合網(wǎng)絡(luò)資源所屬領(lǐng)域,添加了一些新的無(wú)用詞或者詞組,比如wholesale,retail,shipping,free-shipping,fashion,price,offer,none,quantity,shipment等,生成了停用詞列表。

值得說(shuō)明的是,上述在停用詞列表中添加新的無(wú)用詞或者詞組時(shí),這些無(wú)用詞或詞組是經(jīng)過(guò)數(shù)據(jù)分詞之后,確定對(duì)于描述網(wǎng)絡(luò)資源的特征無(wú)用且容易造成干擾的詞。這詞或詞組可由人工分析發(fā)現(xiàn),也可以是自動(dòng)化分析發(fā)現(xiàn)。

具體的,可以將詞組標(biāo)記結(jié)果中的每個(gè)單詞或詞組,在上述停用詞列表中進(jìn)行匹配,若在停用詞列表中匹配到相同的單詞或詞組,則確定該單詞或詞組為停用詞,于是將其從詞組標(biāo)記結(jié)果中刪除。

量詞:以英文為例,常見(jiàn)的量詞包括one、two、three、width、thin、thick等。具體的,可以形成量詞表。在實(shí)際應(yīng)用時(shí),將詞組標(biāo)記結(jié)果中的每個(gè)單詞或詞組,在上述量詞表中進(jìn)行匹配,若在量詞表中匹配到相同的單詞或詞組,則確定該單詞或詞組為量詞,于是將其從詞組標(biāo)記結(jié)果中刪除。

方向詞:以英文為例,常見(jiàn)的方向詞包括front、back、left、right、up、down等。具體的,可以形成方向詞表。在實(shí)際應(yīng)用時(shí),將詞組標(biāo)記結(jié)果中的每個(gè)單詞或詞組,在上述方向詞表中進(jìn)行匹配,若在方向詞表中匹配到相同的單詞或詞組,則確定該單詞或詞組為方向詞,于是將其從詞組標(biāo)記結(jié)果中刪除。

符合正則表達(dá)式規(guī)則的詞:例如,類似"^[sxlm-]+$","^\\d+%$","^%\\d+$"等。第一個(gè)表示去除某些型號(hào)詞,比如xl,xxxl等,第二個(gè)和第三個(gè)去除單個(gè)的百分?jǐn)?shù),如果是有意義的百分?jǐn)?shù),則會(huì)被標(biāo)記為詞組。

以上述商品的標(biāo)題為例,可以從詞組標(biāo)記結(jié)果中提取到的候選詞匯如下:

sexy-stylegirls’black-dresspackage-hip-dressone-shoulderlong-sleevegreen-flowerv-necko-neckcocktail-dress100%-cotton

進(jìn)一步,以商品的屬性信息為例,則可以從詞組標(biāo)記結(jié)果中提取到的候選詞匯如下:

floor-lengthbeading-decorationwomansummerprint-patternoff-shouldero-neckcasual-style

更進(jìn)一步,若同時(shí)以商品的標(biāo)題和屬性信息為例,則可以從詞組標(biāo)記結(jié)果中提取到的候選詞匯如下:

sexy-stylegirls’black-dresspackage-hip-dressone-shoulderlong-sleevegreen-flowerv-necko-neckcocktail-dress100%-cottonfloor-lengthbeading-decorationwomansummerprint-patternoff-shouldero-neckcasual-style

在獲得候選詞匯之后,可以計(jì)算每個(gè)候選詞匯的權(quán)重。在一種實(shí)施方式中,可以用tf-idf值表示候選詞匯的權(quán)重。

具體的,將每個(gè)網(wǎng)絡(luò)資源的候選詞匯形成一個(gè)文檔,記為d,大量網(wǎng)絡(luò)資源的候選詞匯形成的文檔組成了一個(gè)文檔的集合;

對(duì)每個(gè)網(wǎng)絡(luò)資源,計(jì)算其候選詞匯的詞頻(即該候選詞匯在當(dāng)前網(wǎng)絡(luò)資源的候選詞匯列表當(dāng)中的重復(fù)次數(shù),假設(shè)網(wǎng)絡(luò)資源的某個(gè)候選詞匯a在文檔d中的頻率為tfd-a;

計(jì)算所有文檔中候選詞匯的逆文檔頻率,假設(shè)候選詞匯a的逆文檔頻率計(jì)算公式為:idfa=log(ndoc/(ndocin+1));

其中,ndoc為所有文檔的總數(shù),ndocin為出現(xiàn)候選詞匯a的文檔的個(gè)數(shù)。值得說(shuō)明的是,候選詞匯的逆文檔頻率是唯一的;

對(duì)每個(gè)網(wǎng)絡(luò)資源,計(jì)算其候選詞匯的tf-idf值,例如計(jì)算候選詞匯a的tf-idf值的公式為:tf-idf(a)=tfd-a×idfa。

對(duì)每個(gè)網(wǎng)絡(luò)資源的各候選詞匯,都計(jì)算出了一個(gè)權(quán)重,即tf-idf值。通過(guò)比較,可以看出類似fashion、sexy等詞其tf-idf值很低,說(shuō)明這些詞匯出現(xiàn)的極少,其覆蓋的商品量極低,對(duì)于表達(dá)網(wǎng)絡(luò)資源特征也沒(méi)有用處;當(dāng)然,也有一些詞匯其tf-idf值異常高,這說(shuō)明這個(gè)詞匯可能是錯(cuò)誤的, 對(duì)于表達(dá)網(wǎng)絡(luò)資源特征也是沒(méi)有用處的。

基于上述分析,可以預(yù)先定義一個(gè)權(quán)重區(qū)間范圍,選擇權(quán)重位于預(yù)設(shè)權(quán)重區(qū)間范圍內(nèi)的候選詞匯作為特征詞匯。例如,具體可以定義兩個(gè)變量,即tf-idfhigh,tf-idflow,來(lái)分別過(guò)濾極高和極低的tf-idf值。經(jīng)過(guò)過(guò)濾之后,剩下的是tf-idf值位于預(yù)設(shè)tf-idf區(qū)間范圍內(nèi)的候選詞匯,也就是最終選擇出的特征詞匯。

由上述可見(jiàn),本申請(qǐng)首先以網(wǎng)絡(luò)資源的描述信息作為提取語(yǔ)料,通過(guò)組詞標(biāo)記,從中提取特征詞匯,實(shí)現(xiàn)了一種自動(dòng)提取特征詞匯的方法,無(wú)需人工干預(yù),效率較高,進(jìn)一步由于無(wú)需人工干預(yù),可以處理海量數(shù)據(jù),有利于可以保證特征詞匯的數(shù)量和質(zhì)量。進(jìn)一步,在提取過(guò)程中,對(duì)描述信息進(jìn)行各種文本預(yù)處理,以及從候選詞匯中選擇權(quán)重位于權(quán)重區(qū)間范圍內(nèi)的特征詞匯,有利于進(jìn)一步提高特征詞匯的質(zhì)量。

在獲得特征詞匯之后,可以將上述獲得的特征詞匯應(yīng)用于個(gè)性化推薦系統(tǒng),用以提高推薦效率和精度。另外,也可以將上述獲得的特征詞匯用于網(wǎng)絡(luò)資源的展示頁(yè)面,便于用戶更加快速、直觀的了解網(wǎng)絡(luò)資源。

例如,在個(gè)性化推薦系統(tǒng)中使用特征詞匯的具體方式包括:根據(jù)用戶以往關(guān)注(例如瀏覽、加購(gòu)物車、收藏等)的網(wǎng)絡(luò)資源(例如商品),給用戶打上相應(yīng)的標(biāo)簽;當(dāng)用戶再次瀏覽網(wǎng)絡(luò)資源時(shí),可以根據(jù)用戶的標(biāo)簽,與網(wǎng)絡(luò)資源的特征詞匯進(jìn)行關(guān)聯(lián),將關(guān)聯(lián)到的網(wǎng)絡(luò)資源推薦給用戶。以電子商務(wù)領(lǐng)域?yàn)槔?,與商品類目相比,特征詞匯具有一定的發(fā)散性,因此基于特征詞匯進(jìn)行商品推薦,往往可以讓用戶發(fā)現(xiàn)更加新奇并中意的商品。

更進(jìn)一步,在特征詞匯應(yīng)用過(guò)程中,往往會(huì)涉及特征詞匯的選擇或排序。在獲得特征詞匯的同時(shí),可以得到特征詞匯的權(quán)重,特征詞匯的權(quán)重在一定程度上可以體現(xiàn)特征詞匯的重要性,因此可以基于特征詞匯的權(quán)重對(duì)特征詞匯進(jìn)行排序。但是,考慮到之前計(jì)算在計(jì)算特征詞匯的權(quán)重時(shí),主要考慮的是特征詞匯的頻次,沒(méi)有考慮其他因素?;诖耍鐖D3所示,在提取到特征詞匯之后,所述方法還包括:

104、根據(jù)指定的修正因素,對(duì)特征詞匯的權(quán)重進(jìn)行修正;其中,修正后的權(quán)重能夠從更多方面反映特征詞匯的重要性。

105、基于修正后的權(quán)重,對(duì)特征詞匯進(jìn)行排序。在實(shí)際應(yīng)用中,可以優(yōu)選選擇排序靠前的特征詞匯。

可選的,上述指定因素包括但不限于以下表2中所列舉幾種:

表2

本申請(qǐng)?jiān)讷@得特征詞匯之后,還可以綜合考慮各種因素,例如詞匯的搜索熱度、搜索熱度的變化趨勢(shì)、新興程度、表達(dá)力等,對(duì)特征詞匯的權(quán)重進(jìn)行修正,使得修正后的權(quán)重能夠從更多方面反映特征詞匯的重要性,為特征詞匯的應(yīng)用提供便利條件。

需要說(shuō)明的是,對(duì)于前述的各方法實(shí)施例,為了簡(jiǎn)單描述,故將其都表 述為一系列的動(dòng)作組合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本申請(qǐng)并不受所描述的動(dòng)作順序的限制,因?yàn)橐罁?jù)本申請(qǐng),某些步驟可以采用其他順序或者同時(shí)進(jìn)行。其次,本領(lǐng)域技術(shù)人員也應(yīng)該知悉,說(shuō)明書(shū)中所描述的實(shí)施例均屬于優(yōu)選實(shí)施例,所涉及的動(dòng)作和模塊并不一定是本申請(qǐng)所必須的。

在上述實(shí)施例中,對(duì)各個(gè)實(shí)施例的描述都各有側(cè)重,某個(gè)實(shí)施例中沒(méi)有詳述的部分,可以參見(jiàn)其他實(shí)施例的相關(guān)描述。

圖4為本申請(qǐng)又一實(shí)施例提供的特征詞匯提取裝置的結(jié)構(gòu)示意圖。如圖4所示,該裝置包括:獲取模塊41、標(biāo)記模塊42和提取模塊43。

獲取模塊41,用于獲取網(wǎng)絡(luò)資源的描述信息作為提取語(yǔ)料。

標(biāo)記模塊42,用于對(duì)提取語(yǔ)料進(jìn)行詞組標(biāo)記,以獲得詞組標(biāo)記結(jié)果。

提取模塊43,用于從詞組標(biāo)記結(jié)果中,提取可以反映網(wǎng)絡(luò)資源特征的特征詞匯。

在一可選實(shí)施方式中,獲取模塊41具體可用于:

從數(shù)據(jù)倉(cāng)庫(kù)中,獲取網(wǎng)絡(luò)資源的原始描述信息;

對(duì)原始描述信息進(jìn)行文本預(yù)處理,以獲得標(biāo)準(zhǔn)化描述信息作為提取語(yǔ)料。

可選的,上述網(wǎng)絡(luò)資源的原始描述信息包括:網(wǎng)絡(luò)資源的標(biāo)題、屬性信息、關(guān)鍵詞、詳情信息以及評(píng)論信息中的至少一種。

進(jìn)一步,獲取模塊41在對(duì)原始描述信息進(jìn)行文本預(yù)處理,以獲得標(biāo)準(zhǔn)化描述信息作為提取語(yǔ)料時(shí),具體用于:

對(duì)原始描述信息進(jìn)行連接符號(hào)預(yù)留處理、大小寫(xiě)轉(zhuǎn)換處理、拼寫(xiě)一致性檢查處理、單詞分割處理、拼寫(xiě)糾錯(cuò)處理以及名詞詞形還原處理中的至少一種。

更進(jìn)一步,獲取模塊41在對(duì)原始描述信息進(jìn)行連接符號(hào)預(yù)留處理時(shí),具體用于:

保留原始描述信息中符合指定格式的短線、單引號(hào)或百分號(hào),將原始描述信息中存在的不符合指定格式的短線、單引號(hào)和百分號(hào)以及其它連接符號(hào)刪除。

更進(jìn)一步,獲取模塊41在對(duì)原始描述信息進(jìn)行拼寫(xiě)一致性檢查處理時(shí), 具體用于:

對(duì)于原始描述信息中的每個(gè)單詞或詞組,若單詞或詞組在原始描述信息中出現(xiàn)多種拼寫(xiě)方式,統(tǒng)計(jì)每種拼寫(xiě)方式在數(shù)據(jù)倉(cāng)庫(kù)中重復(fù)出現(xiàn)的次數(shù);

從多種拼寫(xiě)方式中,選擇重復(fù)出現(xiàn)的次數(shù)最多且大于預(yù)設(shè)次數(shù)閾值的拼寫(xiě)方式作為目標(biāo)拼寫(xiě)方式,將單詞或詞組在原始描述信息中出現(xiàn)的其它拼寫(xiě)方式替換為目標(biāo)拼寫(xiě)方式。

更進(jìn)一步,獲取模塊41在對(duì)原始描述信息進(jìn)行名詞詞形還原處理時(shí),具體用于:

根據(jù)詞典和預(yù)設(shè)單復(fù)數(shù)變換規(guī)則中的至少一種,對(duì)原始描述信息中的名詞進(jìn)行詞形還原。

進(jìn)一步,標(biāo)記模塊42具體用于:

對(duì)提取語(yǔ)料分別執(zhí)行顯示詞組提取流程和模式詞組提取流程,以從提取語(yǔ)料中提取顯示詞組和隱式詞組;

根據(jù)顯示詞組和隱式詞組的出現(xiàn)頻次,確定提取語(yǔ)料中的待標(biāo)記詞組;

在提取語(yǔ)料中對(duì)待標(biāo)記詞組進(jìn)行標(biāo)記,以獲得詞組標(biāo)記結(jié)果。

進(jìn)一步,提取模塊43具體用于:

從詞組標(biāo)記結(jié)果中,提取候選詞匯;

計(jì)算候選詞匯的權(quán)重;

根據(jù)候選詞匯的權(quán)重,選擇權(quán)重位于預(yù)設(shè)權(quán)重區(qū)間范圍內(nèi)的候選詞匯作為特征詞匯。

更進(jìn)一步,提取模塊43在從詞組標(biāo)記結(jié)果中,提取候選詞匯時(shí),具體用于:

去除詞組標(biāo)記結(jié)果中的無(wú)用詞,以獲得候選詞匯。

進(jìn)一步,如圖5所示,該裝置還包括:修正模塊44和排序模塊45。

修正模塊44,用于根據(jù)指定的修正因素,對(duì)特征詞匯的權(quán)重進(jìn)行修正;

排序模塊45,用于根據(jù)修正后的權(quán)重,對(duì)特征詞匯進(jìn)行排序。

本實(shí)施例提供的特征詞匯提取裝置,使用網(wǎng)絡(luò)資源的描述信息作為提取 語(yǔ)料,對(duì)提取語(yǔ)料進(jìn)行詞組標(biāo)記,然后從中提取可以反映網(wǎng)絡(luò)資源特征的特征詞匯,與現(xiàn)有技術(shù)中引導(dǎo)網(wǎng)絡(luò)資源提供者手動(dòng)填寫(xiě)特征詞匯的方案相比,消除了網(wǎng)絡(luò)資源提供者主觀因素的影響,不僅可以提取足夠數(shù)量的特征詞匯,而且可以保證特征詞匯的質(zhì)量。

所屬領(lǐng)域的技術(shù)人員可以清楚地了解到,為描述的方便和簡(jiǎn)潔,上述描述的系統(tǒng),裝置和單元的具體工作過(guò)程,可以參考前述方法實(shí)施例中的對(duì)應(yīng)過(guò)程,在此不再贅述。

在本申請(qǐng)所提供的幾個(gè)實(shí)施例中,應(yīng)該理解到,所揭露的系統(tǒng),裝置和方法,可以通過(guò)其它的方式實(shí)現(xiàn)。例如,以上所描述的裝置實(shí)施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實(shí)際實(shí)現(xiàn)時(shí)可以有另外的劃分方式,例如多個(gè)單元或組件可以結(jié)合或者可以集成到另一個(gè)系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點(diǎn),所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過(guò)一些接口,裝置或單元的間接耦合或通信連接,可以是電性,機(jī)械或其它的形式。

所述作為分離部件說(shuō)明的單元可以是或者也可以不是物理上分開(kāi)的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個(gè)地方,或者也可以分布到多個(gè)網(wǎng)絡(luò)單元上??梢愿鶕?jù)實(shí)際的需要選擇其中的部分或者全部單元來(lái)實(shí)現(xiàn)本實(shí)施例方案的目的。

另外,在本申請(qǐng)各個(gè)實(shí)施例中的各功能單元可以集成在一個(gè)處理單元中,也可以是各個(gè)單元單獨(dú)物理存在,也可以兩個(gè)或兩個(gè)以上單元集成在一個(gè)單元中。上述集成的單元既可以采用硬件的形式實(shí)現(xiàn),也可以采用硬件加軟件功能單元的形式實(shí)現(xiàn)。

上述以軟件功能單元的形式實(shí)現(xiàn)的集成的單元,可以存儲(chǔ)在一個(gè)計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中。上述軟件功能單元存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)中,包括若干指令用以使得一臺(tái)計(jì)算機(jī)設(shè)備(可以是個(gè)人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)或處理器(processor)執(zhí)行本申請(qǐng)各個(gè)實(shí)施例所述方法的部分步驟。而前述的存儲(chǔ)介質(zhì)包括:u盤、移動(dòng)硬盤、只讀存儲(chǔ)器(read-onlymemory,rom)、 隨機(jī)存取存儲(chǔ)器(randomaccessmemory,ram)、磁碟或者光盤等各種可以存儲(chǔ)程序代碼的介質(zhì)。

最后應(yīng)說(shuō)明的是:以上實(shí)施例僅用以說(shuō)明本申請(qǐng)的技術(shù)方案,而非對(duì)其限制;盡管參照前述實(shí)施例對(duì)本申請(qǐng)進(jìn)行了詳細(xì)的說(shuō)明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對(duì)前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或者對(duì)其中部分技術(shù)特征進(jìn)行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本申請(qǐng)各實(shí)施例技術(shù)方案的精神和范圍。

當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
玛纳斯县| 景洪市| 灵宝市| 罗平县| 成安县| 鹿泉市| 峨山| 临泉县| 临安市| 确山县| 汕头市| 华安县| 济阳县| 德保县| 成安县| 拉萨市| 苏州市| 静宁县| 平昌县| 东乡族自治县| 佛山市| 吐鲁番市| 稻城县| 上林县| 会理县| 广西| 巴青县| 富阳市| 宣威市| 多伦县| 改则县| 台北市| 凭祥市| 开远市| 广河县| 游戏| 波密县| 平顶山市| 年辖:市辖区| 霍城县| 丹凤县|