一種節(jié)目關(guān)鍵詞的提取與統(tǒng)計(jì)方法及裝置的制造方法
【專利摘要】本發(fā)明公開了一種節(jié)目關(guān)鍵詞的提取與統(tǒng)計(jì)方法及裝置,用于自節(jié)目相關(guān)信息中精確提取節(jié)目的關(guān)鍵詞。所述方法包括:獲取各節(jié)目的節(jié)目相關(guān)信息,所述節(jié)目相關(guān)信息包括節(jié)目字幕、節(jié)目標(biāo)簽和節(jié)目語音信息;從所述節(jié)目的相關(guān)信息中,每隔一個預(yù)設(shè)時長提取一組關(guān)鍵詞;根據(jù)預(yù)設(shè)統(tǒng)計(jì)規(guī)則,自所述節(jié)目的節(jié)目時長之內(nèi)的多組關(guān)鍵詞中提取所述節(jié)目的關(guān)鍵詞。該方案可以自節(jié)目相關(guān)信息中精確提取節(jié)目的關(guān)鍵詞,從而使得廣告主可以在自主選擇的情況下,通過該節(jié)目的關(guān)鍵詞投放廣告,其操作過程簡便,提升了用戶體驗(yàn)。
【專利說明】
一種節(jié)目關(guān)鍵詞的提取與統(tǒng)計(jì)方法及裝置
技術(shù)領(lǐng)域
[0001]本發(fā)明涉及節(jié)目關(guān)鍵詞領(lǐng)域,特別涉及一種節(jié)目關(guān)鍵詞的提取與統(tǒng)計(jì)方法及裝置。
【背景技術(shù)】
[0002]隨著科學(xué)技術(shù)的發(fā)展及人民生活水平的提高,觀賞各種類型的節(jié)目已經(jīng)成為人們工作、學(xué)習(xí)、社交以及休閑娛樂不可替代的重要方式。隨著用戶使用頻率的增多以及用戶要求的提高,為各類用戶提供的節(jié)目信息和內(nèi)容也越來越廣泛,服務(wù)商針對不同的頻道的節(jié)目會提供不同的關(guān)鍵詞以供用戶進(jìn)行參考,比如,令想要在節(jié)目中投放廣告的廣告主根據(jù)該關(guān)鍵詞進(jìn)行廣告投放。但在目前尚缺少一種簡單快捷且準(zhǔn)確的關(guān)鍵詞提取方法。
【發(fā)明內(nèi)容】
[0003]本發(fā)明提供一種節(jié)目關(guān)鍵詞的提取與統(tǒng)計(jì)方法及裝置,可以自節(jié)目相關(guān)信息中精確提取節(jié)目的關(guān)鍵詞,從而使得廣告主可以在自主選擇的情況下,通過該節(jié)目的關(guān)鍵詞投放廣告,其操作過程簡便,提升了用戶體驗(yàn)。
[0004]根據(jù)本發(fā)明實(shí)施例的第一方面,提供一種節(jié)目關(guān)鍵詞的提取與統(tǒng)計(jì)方法,包括:
[0005]獲取各節(jié)目的節(jié)目相關(guān)信息,所述節(jié)目相關(guān)信息包括節(jié)目字幕、節(jié)目標(biāo)簽和節(jié)目語音信息;
[0006]從所述節(jié)目的相關(guān)信息中,每隔一個預(yù)設(shè)時長提取一組關(guān)鍵詞;
[0007]根據(jù)預(yù)設(shè)統(tǒng)計(jì)規(guī)則,自所述節(jié)目的節(jié)目時長之內(nèi)的多組關(guān)鍵詞中提取所述節(jié)目的關(guān)鍵詞。
[0008]在一個實(shí)施例中,所述根據(jù)預(yù)設(shè)統(tǒng)計(jì)規(guī)則,自所述節(jié)目的節(jié)目時長之內(nèi)的多組關(guān)鍵詞中提取所述節(jié)目的關(guān)鍵詞,包括:
[0009]統(tǒng)計(jì)所述節(jié)目的節(jié)目時長之內(nèi)的多組關(guān)鍵詞中,每個關(guān)鍵詞重復(fù)出現(xiàn)的總次數(shù);
[0010]統(tǒng)計(jì)每個關(guān)鍵詞與其他關(guān)鍵詞同時出現(xiàn)的次數(shù);
[0011]將每個關(guān)鍵詞重復(fù)出現(xiàn)的總次數(shù)與每個關(guān)鍵詞與其他關(guān)鍵詞同時出現(xiàn)的次數(shù)進(jìn)行加權(quán)求和并進(jìn)行排序;
[0012]獲取排序后名次在預(yù)設(shè)名次之內(nèi)的關(guān)鍵詞,并將其記錄為所述節(jié)目的關(guān)鍵詞。
[0013]在一個實(shí)施例中,所述節(jié)目標(biāo)簽包括節(jié)目名稱、節(jié)目簡介、節(jié)目類型和節(jié)目相關(guān)人員。
[0014]在一個實(shí)施例中,所述根據(jù)預(yù)設(shè)統(tǒng)計(jì)規(guī)則,自所述節(jié)目的節(jié)目時長之內(nèi)的多組關(guān)鍵詞中提取所述節(jié)目的關(guān)鍵詞之后,包括:
[0015]根據(jù)提取的所述關(guān)鍵詞的特征對所述關(guān)鍵詞進(jìn)行分類之后將其存儲;其中,所述關(guān)鍵詞的特征包括文本特征、語言特征、統(tǒng)計(jì)特征、標(biāo)注特征中的至少一個。
[0016]在一個實(shí)施例中,所述從所述節(jié)目的相關(guān)信息中,每隔一個預(yù)設(shè)時長提取一組關(guān)鍵詞,包括:
[0017]每隔一個預(yù)設(shè)時長,采用Tf-1df算法從所述節(jié)目的相關(guān)信息中篩選出一組所述預(yù)設(shè)時長之內(nèi)的關(guān)鍵詞。
[0018]根據(jù)本發(fā)明實(shí)施例的第二方面,還提供一種節(jié)目關(guān)鍵詞的提取與統(tǒng)計(jì)裝置,包括:
[0019]獲取模塊,用于獲取各節(jié)目的節(jié)目相關(guān)信息,所述節(jié)目相關(guān)信息包括節(jié)目字幕、節(jié)目標(biāo)簽和節(jié)目語音信息;
[0020]提取模塊,用于從所述節(jié)目的相關(guān)信息中,每隔一個預(yù)設(shè)時長提取一組關(guān)鍵詞;[0021 ]統(tǒng)計(jì)模塊,用于根據(jù)預(yù)設(shè)統(tǒng)計(jì)規(guī)則,自所述節(jié)目的節(jié)目時長之內(nèi)的多組關(guān)鍵詞中提取所述節(jié)目的關(guān)鍵詞。
[0022]在一個實(shí)施例中,所述統(tǒng)計(jì)模塊包括:
[0023]第一統(tǒng)計(jì)子模塊,用于統(tǒng)計(jì)所述節(jié)目的節(jié)目時長之內(nèi)的多組關(guān)鍵詞中,每個關(guān)鍵詞重復(fù)出現(xiàn)的總次數(shù);
[0024]第二統(tǒng)計(jì)子模塊,用于統(tǒng)計(jì)每個關(guān)鍵詞與其他關(guān)鍵詞同時出現(xiàn)的次數(shù);
[0025]排序子模塊,用于將每個關(guān)鍵詞重復(fù)出現(xiàn)的總次數(shù)與每個關(guān)鍵詞與其他關(guān)鍵詞同時出現(xiàn)的次數(shù)進(jìn)行加權(quán)求和并進(jìn)行排序;
[0026]關(guān)鍵詞獲取子模塊,用于獲取排序后名次在預(yù)設(shè)名次之內(nèi)的關(guān)鍵詞,并將其記錄為所述節(jié)目的關(guān)鍵詞。
[0027]在一個實(shí)施例中,所述節(jié)目標(biāo)簽包括節(jié)目名稱、節(jié)目簡介、節(jié)目類型和節(jié)目相關(guān)人員。
[0028]在一個實(shí)施例中,所述裝置還包括:
[0029]分類模塊,用于根據(jù)提取的所述關(guān)鍵詞的特征對所述關(guān)鍵詞進(jìn)行分類之后將其存儲;其中,所述關(guān)鍵詞的特征包括文本特征、語言特征、統(tǒng)計(jì)特征、標(biāo)注特征中的至少一個。
[0030]在一個實(shí)施例中,所述提取模塊包括:
[0031]篩選子模塊,用于每隔一個預(yù)設(shè)時長,采用Tf-1df算法從所述節(jié)目的相關(guān)信息中篩選出一組所述預(yù)設(shè)時長之內(nèi)的關(guān)鍵詞。
[0032]本發(fā)明實(shí)施例提供的技術(shù)方案可產(chǎn)生以下有益效果:獲取各節(jié)目的節(jié)目相關(guān)信息,所述節(jié)目相關(guān)信息包括節(jié)目字幕、節(jié)目標(biāo)簽和節(jié)目語音信息;從所述節(jié)目的相關(guān)信息中,每隔一個預(yù)設(shè)時長提取一組關(guān)鍵詞;根據(jù)預(yù)設(shè)統(tǒng)計(jì)規(guī)則,自所述節(jié)目的節(jié)目時長之內(nèi)的多組關(guān)鍵詞中提取所述節(jié)目的關(guān)鍵詞。該方案可以自節(jié)目相關(guān)信息中精確提取節(jié)目的關(guān)鍵詞,從而使得廣告主可以在自主選擇的情況下,通過該節(jié)目的關(guān)鍵詞投放廣告,其操作過程簡便,提升了用戶體驗(yàn)。
[0033]本發(fā)明的其它特征和優(yōu)點(diǎn)將在隨后的說明書中闡述,并且,部分地從說明書中變得顯而易見,或者通過實(shí)施本發(fā)明而了解。本發(fā)明的目的和其他優(yōu)點(diǎn)可通過在所寫的說明書、權(quán)利要求書、以及附圖中所特別指出的結(jié)構(gòu)來實(shí)現(xiàn)和獲得。
[0034]下面通過附圖和實(shí)施例,對本發(fā)明的技術(shù)方案做進(jìn)一步的詳細(xì)描述。
【附圖說明】
[0035]附圖用來提供對本發(fā)明的進(jìn)一步理解,并且構(gòu)成說明書的一部分,與本發(fā)明的實(shí)施例一起用于解釋本發(fā)明,并不構(gòu)成對本發(fā)明的限制。
[0036]在附圖中:
[0037]圖1為本發(fā)明根據(jù)一示例性實(shí)施例示出的一種節(jié)目關(guān)鍵詞的提取與統(tǒng)計(jì)方法的流程圖。
[0038]圖2為本發(fā)明根據(jù)一示例性實(shí)施例示出的一種節(jié)目關(guān)鍵詞的提取與統(tǒng)計(jì)方法的步驟S30的流程圖。
[0039]圖3為本發(fā)明根據(jù)一示例性實(shí)施例示出的另一種節(jié)目關(guān)鍵詞的提取與統(tǒng)計(jì)方法的流程圖。
[0040]圖4為本發(fā)明根據(jù)一示例性實(shí)施例示出的一種節(jié)目關(guān)鍵詞的提取與統(tǒng)計(jì)裝置的框圖。
[0041]圖5為本發(fā)明根據(jù)一示例性實(shí)施例示出的一種節(jié)目關(guān)鍵詞的提取與統(tǒng)計(jì)裝置的統(tǒng)計(jì)模塊63的框圖。
[0042]圖6為本發(fā)明根據(jù)一示例性實(shí)施例示出的一種節(jié)目關(guān)鍵詞的提取與統(tǒng)計(jì)裝置的框圖。
[0043]圖7為本發(fā)明根據(jù)一示例性實(shí)施例示出的一種節(jié)目關(guān)鍵詞的提取與統(tǒng)計(jì)裝置中提取模塊62的框圖。
【具體實(shí)施方式】
[0044]以下結(jié)合附圖對本發(fā)明的優(yōu)選實(shí)施例進(jìn)行說明,應(yīng)當(dāng)理解,此處所描述的優(yōu)選實(shí)施例僅用于說明和解釋本發(fā)明,并不用于限定本發(fā)明。
[0045]本公開實(shí)施例提供了一種節(jié)目關(guān)鍵詞的提取與統(tǒng)計(jì)方法,用于自節(jié)目相關(guān)信息中精確提取節(jié)目的關(guān)鍵詞,從而使得廣告主可以在自主選擇的情況下,通過該節(jié)目的關(guān)鍵詞投放廣告,其操作過程簡便,提升了用戶體驗(yàn)。如圖1所示,該方法包括步驟S10-S30:
[0046]在步驟SlO中,獲取各節(jié)目的節(jié)目相關(guān)信息,所述節(jié)目相關(guān)信息包括節(jié)目字幕、節(jié)目標(biāo)簽和節(jié)目語音信息;可理解的,所述節(jié)目的相關(guān)信息還可以包括節(jié)目中人物的配飾、穿戴等物品或者節(jié)目中出現(xiàn)的其他物品和觀眾關(guān)注的名詞等相關(guān)信息,只要與廣告主想要投放的廣告相關(guān)即可。
[0047]在一個實(shí)施例中,所述節(jié)目標(biāo)簽包括節(jié)目名稱、節(jié)目簡介、節(jié)目類型和節(jié)目相關(guān)人員??衫斫獾模龉?jié)目標(biāo)簽還可以根據(jù)用戶需要進(jìn)行設(shè)定。
[0048]在一個實(shí)施例中,所述獲取各節(jié)目的節(jié)目相關(guān)信息,包括:獲取已經(jīng)轉(zhuǎn)換為文字的節(jié)目語音信息。也即,獲取節(jié)目的相關(guān)信息時,所述節(jié)目相關(guān)信息中的節(jié)目語音信息需要先轉(zhuǎn)換為文字,之后再在后續(xù)步驟中進(jìn)行關(guān)鍵詞的提取,可理解的,可以先獲取該節(jié)目語音信息之后再將其轉(zhuǎn)換為文字,也可以等待該節(jié)目語音信息轉(zhuǎn)換為文字之后再進(jìn)行獲取。
[0049]在步驟S20中,從所述節(jié)目的相關(guān)信息中,每隔一個預(yù)設(shè)時長提取一組關(guān)鍵詞;其中,所述預(yù)設(shè)時長可以根據(jù)用戶需要進(jìn)行設(shè)定,比如,設(shè)定為一分鐘,此時,每隔一分鐘就會從所述節(jié)目的相關(guān)信息中獲取一組關(guān)鍵詞,以便于后續(xù)進(jìn)行統(tǒng)計(jì)。且一組關(guān)鍵詞中關(guān)鍵詞最后保留的數(shù)量也可以根據(jù)用戶需求進(jìn)行設(shè)定,也可以根據(jù)預(yù)設(shè)的條件獲取所有的關(guān)鍵
Τ.κ| ο
[0050]在一個實(shí)施例中,所述從步驟S20包括:每隔一個預(yù)設(shè)時長,采用Tf-1df算法(一種用于信息檢索與數(shù)據(jù)挖掘的加權(quán)統(tǒng)計(jì)方法)從所述節(jié)目的相關(guān)信息中篩選出一組所述預(yù)設(shè)時長之內(nèi)的關(guān)鍵詞。當(dāng)然,可理解的,所述Tf-1df算法也可以用其他適用的算法來進(jìn)行替換,只要能達(dá)到提取關(guān)鍵詞的需求即可。其中,所述預(yù)設(shè)時長可以根據(jù)用戶需要進(jìn)行設(shè)定,比如,設(shè)定為一分鐘,此時,每隔一分鐘就會采用Tf-1df算法從所述節(jié)目的相關(guān)信息中獲取一組關(guān)鍵詞,以便于后續(xù)進(jìn)行統(tǒng)計(jì)。
[0051 ]在步驟S30中,根據(jù)預(yù)設(shè)統(tǒng)計(jì)規(guī)則,自所述節(jié)目的節(jié)目時長之內(nèi)的多組關(guān)鍵詞中提取所述節(jié)目的關(guān)鍵詞??衫斫獾?,當(dāng)所述節(jié)目的節(jié)目時長比所述預(yù)設(shè)時長還短時,所述關(guān)鍵詞可能只有一組。所述預(yù)設(shè)的統(tǒng)計(jì)規(guī)則可以根據(jù)用戶需求進(jìn)行設(shè)定。
[0052]在一個實(shí)施例中,如圖2所示,所述步驟S30包括:
[0053]步驟S301、統(tǒng)計(jì)所述節(jié)目的節(jié)目時長之內(nèi)的多組關(guān)鍵詞中,每個關(guān)鍵詞重復(fù)出現(xiàn)的總次數(shù);可理解的,當(dāng)所述節(jié)目的節(jié)目時長比所述預(yù)設(shè)時長還短時,所述關(guān)鍵詞可能只有一組。在該步驟中,會統(tǒng)計(jì)多組關(guān)鍵詞中每個關(guān)鍵詞重復(fù)出現(xiàn)的總次數(shù),出現(xiàn)的次數(shù)越多,說明該關(guān)鍵詞的越受觀眾關(guān)注,對于廣告主來說該關(guān)鍵詞價值越高。
[0054]步驟S302、統(tǒng)計(jì)每個關(guān)鍵詞與其他關(guān)鍵詞同時出現(xiàn)的次數(shù);在該步驟中,會統(tǒng)計(jì)每個關(guān)鍵詞與其他關(guān)鍵詞同時出現(xiàn)的次數(shù),同時出現(xiàn)的次數(shù)越多,說明該關(guān)鍵詞與其他關(guān)鍵詞的聯(lián)系越緊密。
[0055]步驟S303、將每個關(guān)鍵詞重復(fù)出現(xiàn)的總次數(shù)與每個關(guān)鍵詞與其他關(guān)鍵詞同時出現(xiàn)的次數(shù)進(jìn)行加權(quán)求和并進(jìn)行排序;可理解的,兩者加權(quán)的權(quán)值可以根據(jù)需要進(jìn)行定義。
[0056]步驟S304、獲取排序后名次在預(yù)設(shè)名次之內(nèi)的關(guān)鍵詞,并將其記錄為所述節(jié)目的關(guān)鍵詞。其中,所述預(yù)設(shè)名次可以根據(jù)需要進(jìn)行設(shè)定,比如設(shè)定預(yù)設(shè)名次為前十,那么,排序在前十的關(guān)鍵詞為該節(jié)目的關(guān)鍵詞。
[0057]在一個實(shí)施例中,如圖3所示,所述步驟S30之后還包括步驟S40:根據(jù)提取的所述關(guān)鍵詞的特征對所述關(guān)鍵詞進(jìn)行分類之后將其存儲;其中,所述關(guān)鍵詞的特征包括文本特征、語言特征、統(tǒng)計(jì)特征、標(biāo)注特征中的至少一個。其中,所述文本特征是指所述關(guān)鍵詞本身和/或所述關(guān)鍵詞提取的來源,比如,所述關(guān)鍵詞是從節(jié)目相關(guān)信息中的字段信息和/或位置信息,其來源于字幕、節(jié)目標(biāo)簽還是來源于轉(zhuǎn)換為文字之后的語音信息等。所述語言特征是指所述關(guān)鍵詞自身的語言特性。例如,詞性(例如,名詞、動詞、形容詞)、是否是專有名詞(例如,商品名、品牌名、地名、人名)、被自然語言處理后的各種語言特征信息(例如,是否是主成分、是否是主干信息、主干信息分析的具體屬性信息等)等中的至少一個。所述統(tǒng)計(jì)特征是指所述關(guān)鍵詞的統(tǒng)計(jì)特性。例如,所述關(guān)鍵詞在所述節(jié)目相關(guān)信息中出現(xiàn)的次數(shù)等??衫斫獾?,所述關(guān)鍵詞的特征并不限定于為上述特征,也可以是其他可以對其進(jìn)行分類的特征,對以上關(guān)鍵詞提取并進(jìn)行分類之后,可以將其存儲在關(guān)鍵詞列表中,且將所述關(guān)鍵詞與分類特征進(jìn)行關(guān)聯(lián),在廣告主想要進(jìn)行廣告投放時,也可以直接點(diǎn)擊節(jié)目播放的屏幕上的特定按鈕,進(jìn)而單獨(dú)顯示所述關(guān)鍵詞的分類之后再進(jìn)行進(jìn)一步選擇所述關(guān)鍵詞,或同時顯示所述關(guān)鍵詞的分類以及所述關(guān)鍵詞,以方便廣告主通過點(diǎn)擊所述關(guān)鍵詞進(jìn)行廣告投放。
[0058]本發(fā)明實(shí)施例提供的上述方法,獲取各節(jié)目的節(jié)目相關(guān)信息,所述節(jié)目相關(guān)信息包括節(jié)目字幕、節(jié)目標(biāo)簽和節(jié)目語音信息;從所述節(jié)目的相關(guān)信息中,每隔一個預(yù)設(shè)時長提取一組關(guān)鍵詞;根據(jù)預(yù)設(shè)統(tǒng)計(jì)規(guī)則,自所述節(jié)目的節(jié)目時長之內(nèi)的多組關(guān)鍵詞中提取所述節(jié)目的關(guān)鍵詞。該方案可以自節(jié)目相關(guān)信息中精確提取節(jié)目的關(guān)鍵詞,從而使得廣告主可以在自主選擇的情況下,通過該節(jié)目的關(guān)鍵詞投放廣告,其操作過程簡便,提升了用戶體驗(yàn)。
[0059]對應(yīng)本發(fā)明實(shí)施例提供的節(jié)目關(guān)鍵詞的提取與統(tǒng)計(jì)方法,本發(fā)明還提供節(jié)目關(guān)鍵詞的提取與統(tǒng)計(jì)裝置,如圖4所示,該裝置可包括:
[0060]獲取模塊61,用于獲取各節(jié)目的節(jié)目相關(guān)信息,所述節(jié)目相關(guān)信息包括節(jié)目字幕、節(jié)目標(biāo)簽和節(jié)目語音信息;可理解的,所述節(jié)目的相關(guān)信息還可以包括節(jié)目中人物的配飾、穿戴等物品或者節(jié)目中出現(xiàn)的其他物品和觀眾關(guān)注的名詞等相關(guān)信息,只要與廣告主想要投放的廣告相關(guān)即可。所述獲取模塊61包括:語音獲取子模塊(圖未示),用于獲取已經(jīng)轉(zhuǎn)換為文字的節(jié)目語音信息。也即,獲取節(jié)目的相關(guān)信息時,所述節(jié)目相關(guān)信息中的節(jié)目語音信息需要先轉(zhuǎn)換為文字,之后再在后續(xù)步驟中進(jìn)行關(guān)鍵詞的提取,可理解的,可以先獲取該節(jié)目語音信息之后再將其轉(zhuǎn)換為文字,也可以等待該節(jié)目語音信息轉(zhuǎn)換為文字之后再進(jìn)行獲取。
[0061 ]提取模塊62,用于從所述節(jié)目的相關(guān)信息中,每隔一個預(yù)設(shè)時長提取一組關(guān)鍵詞;其中,所述預(yù)設(shè)時長可以根據(jù)用戶需要進(jìn)行設(shè)定,比如,設(shè)定為一分鐘,此時,每隔一分鐘就會從所述節(jié)目的相關(guān)信息中獲取一組關(guān)鍵詞,以便于后續(xù)進(jìn)行統(tǒng)計(jì)。且一組關(guān)鍵詞中關(guān)鍵詞最后保留的數(shù)量也可以根據(jù)用戶需求進(jìn)行設(shè)定,也可以根據(jù)預(yù)設(shè)的條件獲取所有的關(guān)鍵
Τ.κ| ο
[0062]統(tǒng)計(jì)模塊63,用于根據(jù)預(yù)設(shè)統(tǒng)計(jì)規(guī)則,自所述節(jié)目的節(jié)目時長之內(nèi)的多組關(guān)鍵詞中提取所述節(jié)目的關(guān)鍵詞。可理解的,當(dāng)所述節(jié)目的節(jié)目時長比所述預(yù)設(shè)時長還短時,所述關(guān)鍵詞可能只有一組。所述預(yù)設(shè)的統(tǒng)計(jì)規(guī)則可以根據(jù)用戶需求進(jìn)行設(shè)定。
[0063]在一個實(shí)施例中,如圖5所示,所述統(tǒng)計(jì)模塊63包括:
[0064]第一統(tǒng)計(jì)子模塊631,用于統(tǒng)計(jì)所述節(jié)目的節(jié)目時長之內(nèi)的多組關(guān)鍵詞中,每個關(guān)鍵詞重復(fù)出現(xiàn)的總次數(shù);可理解的,當(dāng)所述節(jié)目的節(jié)目時長比所述預(yù)設(shè)時長還短時,所述關(guān)鍵詞可能只有一組。也即,多組關(guān)鍵詞中每個關(guān)鍵詞重復(fù)出現(xiàn)的總次數(shù)出現(xiàn)的次數(shù)越多,說明該關(guān)鍵詞的越受觀眾關(guān)注,對于廣告主來說該關(guān)鍵詞價值越高。
[0065]第二統(tǒng)計(jì)子模塊632,用于統(tǒng)計(jì)每個關(guān)鍵詞與其他關(guān)鍵詞同時出現(xiàn)的次數(shù);也即,每個關(guān)鍵詞與其他關(guān)鍵詞同時出現(xiàn)的次數(shù)同時出現(xiàn)的次數(shù)越多,說明該關(guān)鍵詞與其他關(guān)鍵詞的聯(lián)系越緊密。
[0066]排序子模塊633,用于將每個關(guān)鍵詞重復(fù)出現(xiàn)的總次數(shù)與每個關(guān)鍵詞與其他關(guān)鍵詞同時出現(xiàn)的次數(shù)進(jìn)行加權(quán)求和并進(jìn)行排序;可理解的,兩者加權(quán)的權(quán)值可以根據(jù)需要進(jìn)行定義。
[0067]關(guān)鍵詞獲取子模塊634,用于獲取排序后名次在預(yù)設(shè)名次之內(nèi)的關(guān)鍵詞,并將其記錄為所述節(jié)目的關(guān)鍵詞。其中,所述預(yù)設(shè)名次可以根據(jù)需要進(jìn)行設(shè)定,比如設(shè)定預(yù)設(shè)名次為前十,那么,排序在前十的關(guān)鍵詞為該節(jié)目的關(guān)鍵詞。
[0068]在一個實(shí)施例中,所述節(jié)目標(biāo)簽包括節(jié)目名稱、節(jié)目簡介、節(jié)目類型和節(jié)目相關(guān)人員??衫斫獾?,所述節(jié)目標(biāo)簽還可以根據(jù)用戶需要進(jìn)行設(shè)定。
[0069]在一個實(shí)施例中,如圖6所示,所述裝置還包括:
[0070]分類模塊64,用于根據(jù)提取的所述關(guān)鍵詞的特征對所述關(guān)鍵詞進(jìn)行分類之后將其存儲;其中,所述關(guān)鍵詞的特征包括文本特征、語言特征、統(tǒng)計(jì)特征、標(biāo)注特征中的至少一個。其中,所述文本特征是指所述關(guān)鍵詞本身和/或所述關(guān)鍵詞提取的來源,比如,所述關(guān)鍵詞是從節(jié)目相關(guān)信息中的字段信息和/或位置信息,其來源于字幕、節(jié)目標(biāo)簽還是來源于轉(zhuǎn)換為文字之后的語音信息等。所述語言特征是指所述關(guān)鍵詞自身的語言特性。例如,詞性(例如,名詞、動詞、形容詞)、是否是專有名詞(例如,商品名、品牌名、地名、人名)、被自然語言處理后的各種語言特征信息(例如,是否是主成分、是否是主干信息、主干信息分析的具體屬性信息等)等中的至少一個。所述統(tǒng)計(jì)特征是指所述關(guān)鍵詞的統(tǒng)計(jì)特性。例如,所述關(guān)鍵詞在所述節(jié)目相關(guān)信息中出現(xiàn)的次數(shù)等??衫斫獾?,所述關(guān)鍵詞的特征并不限定于為上述特征,也可以是其他可以對其進(jìn)行分類的特征,對以上關(guān)鍵詞提取并進(jìn)行分類之后,可以將其存儲在關(guān)鍵詞列表中,且將所述關(guān)鍵詞與分類特征進(jìn)行關(guān)聯(lián),在廣告主想要進(jìn)行廣告投放時,也可以直接點(diǎn)擊節(jié)目播放的屏幕上的特定按鈕,進(jìn)而單獨(dú)顯示所述關(guān)鍵詞的分類之后再進(jìn)行進(jìn)一步選擇所述關(guān)鍵詞,或同時顯示所述關(guān)鍵詞的分類以及所述關(guān)鍵詞,以方便廣告主通過點(diǎn)擊所述關(guān)鍵詞進(jìn)行廣告投放。
[0071]在一個實(shí)施例中,如圖7所示,所述提取模塊62包括:
[0072]篩選子模塊621,用于每隔一個預(yù)設(shè)時長,采用Tf-1df算法從所述節(jié)目的相關(guān)信息中篩選出一組所述預(yù)設(shè)時長之內(nèi)的關(guān)鍵詞??衫斫獾?,所述Tf-1df算法也可以用其他適用的算法來進(jìn)行替換,只要能達(dá)到提取關(guān)鍵詞的需求即可。其中,所述預(yù)設(shè)時長可以根據(jù)用戶需要進(jìn)行設(shè)定,比如,設(shè)定為一分鐘,此時,每隔一分鐘就會采用Tf-1df算法從所述節(jié)目的相關(guān)信息中獲取一組關(guān)鍵詞,以便于后續(xù)進(jìn)行統(tǒng)計(jì)。
[0073]本發(fā)明實(shí)施例提供的上述裝置,可以自節(jié)目相關(guān)信息中精確提取節(jié)目的關(guān)鍵詞,從而使得廣告主可以在自主選擇的情況下,通過該節(jié)目的關(guān)鍵詞投放廣告,其操作過程簡便,提升了用戶體驗(yàn)。
[0074]本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白,本發(fā)明的實(shí)施例可提供為方法、系統(tǒng)、或計(jì)算機(jī)程序產(chǎn)品。因此,本發(fā)明可采用完全硬件實(shí)施例、完全軟件實(shí)施例、或結(jié)合軟件和硬件方面的實(shí)施例的形式。而且,本發(fā)明可采用在一個或多個其中包含有計(jì)算機(jī)可用程序代碼的計(jì)算機(jī)可用存儲介質(zhì)(包括但不限于磁盤存儲器和光學(xué)存儲器等)上實(shí)施的計(jì)算機(jī)程序產(chǎn)品的形式。
[0075]本發(fā)明是參照根據(jù)本發(fā)明實(shí)施例的方法、設(shè)備(系統(tǒng))、和計(jì)算機(jī)程序產(chǎn)品的流程圖和/或方框圖來描述的。應(yīng)理解可由計(jì)算機(jī)程序請求實(shí)現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合??商峁┻@些計(jì)算機(jī)程序請求到通用計(jì)算機(jī)、專用計(jì)算機(jī)、嵌入式處理機(jī)或其他可編程信息處理設(shè)備的處理器以產(chǎn)生一個機(jī)器,使得通過計(jì)算機(jī)或其他可編程信息處理設(shè)備的處理器執(zhí)行的請求產(chǎn)生用于實(shí)現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。
[0076]這些計(jì)算機(jī)程序請求也可存儲在能引導(dǎo)計(jì)算機(jī)或其他可編程信息處理設(shè)備以特定方式工作的計(jì)算機(jī)可讀存儲器中,使得存儲在該計(jì)算機(jī)可讀存儲器中的請求產(chǎn)生包括請求裝置的制造品,該請求裝置實(shí)現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。
[0077]這些計(jì)算機(jī)程序請求也可裝載到計(jì)算機(jī)或其他可編程信息處理設(shè)備上,使得在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計(jì)算機(jī)實(shí)現(xiàn)的處理,從而在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行的請求提供用于實(shí)現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。
[0078]顯然,本領(lǐng)域的技術(shù)人員可以對本發(fā)明進(jìn)行各種改動和變型而不脫離本發(fā)明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其等同技術(shù)的范圍之內(nèi),則本發(fā)明也意圖包含這些改動和變型在內(nèi)。
【主權(quán)項(xiàng)】
1.一種節(jié)目關(guān)鍵詞的提取與統(tǒng)計(jì)方法,其特征在于,包括: 獲取各節(jié)目的節(jié)目相關(guān)信息,所述節(jié)目相關(guān)信息包括節(jié)目字幕、節(jié)目標(biāo)簽和節(jié)目語音信息; 從所述節(jié)目的相關(guān)信息中,每隔一個預(yù)設(shè)時長提取一組關(guān)鍵詞; 根據(jù)預(yù)設(shè)統(tǒng)計(jì)規(guī)則,自所述節(jié)目的節(jié)目時長之內(nèi)的多組關(guān)鍵詞中提取所述節(jié)目的關(guān)鍵Τ.κ| ο2.如權(quán)利要求1所述的方法,其特征在于,所述根據(jù)預(yù)設(shè)統(tǒng)計(jì)規(guī)則,自所述節(jié)目的節(jié)目時長之內(nèi)的多組關(guān)鍵詞中提取所述節(jié)目的關(guān)鍵詞,包括: 統(tǒng)計(jì)所述節(jié)目的節(jié)目時長之內(nèi)的多組關(guān)鍵詞中,每個關(guān)鍵詞重復(fù)出現(xiàn)的總次數(shù); 統(tǒng)計(jì)每個關(guān)鍵詞與其他關(guān)鍵詞同時出現(xiàn)的次數(shù); 將每個關(guān)鍵詞重復(fù)出現(xiàn)的總次數(shù)與每個關(guān)鍵詞與其他關(guān)鍵詞同時出現(xiàn)的次數(shù)進(jìn)行加權(quán)求和并進(jìn)行排序; 獲取排序后名次在預(yù)設(shè)名次之內(nèi)的關(guān)鍵詞,并將其記錄為所述節(jié)目的關(guān)鍵詞。3.如權(quán)利要求1或2所述的方法,其特征在于,所述節(jié)目標(biāo)簽包括節(jié)目名稱、節(jié)目簡介、節(jié)目類型和節(jié)目相關(guān)人員。4.如權(quán)利要求1或2所述的方法,其特征在于,所述根據(jù)預(yù)設(shè)統(tǒng)計(jì)規(guī)則,自所述節(jié)目的節(jié)目時長之內(nèi)的多組關(guān)鍵詞中提取所述節(jié)目的關(guān)鍵詞之后,包括: 根據(jù)提取的所述關(guān)鍵詞的特征對所述關(guān)鍵詞進(jìn)行分類之后將其存儲;其中,所述關(guān)鍵詞的特征包括文本特征、語言特征、統(tǒng)計(jì)特征、標(biāo)注特征中的至少一個。5.如權(quán)利要求1或2所述的方法,其特征在于,所述從所述節(jié)目的相關(guān)信息中,每隔一個預(yù)設(shè)時長提取一組關(guān)鍵詞,包括: 每隔一個預(yù)設(shè)時長,采用Tf-1df算法從所述節(jié)目的相關(guān)信息中篩選出一組所述預(yù)設(shè)時長之內(nèi)的關(guān)鍵詞。6.一種節(jié)目關(guān)鍵詞的提取與統(tǒng)計(jì)裝置,其特征在于,包括: 獲取模塊,用于獲取各節(jié)目的節(jié)目相關(guān)信息,所述節(jié)目相關(guān)信息包括節(jié)目字幕、節(jié)目標(biāo)簽和節(jié)目語音信息; 提取模塊,用于從所述節(jié)目的相關(guān)信息中,每隔一個預(yù)設(shè)時長提取一組關(guān)鍵詞; 統(tǒng)計(jì)模塊,用于根據(jù)預(yù)設(shè)統(tǒng)計(jì)規(guī)則,自所述節(jié)目的節(jié)目時長之內(nèi)的多組關(guān)鍵詞中提取所述節(jié)目的關(guān)鍵詞。7.如權(quán)利要求6所述的裝置,其特征在于,所述統(tǒng)計(jì)模塊包括: 第一統(tǒng)計(jì)子模塊,用于統(tǒng)計(jì)所述節(jié)目的節(jié)目時長之內(nèi)的多組關(guān)鍵詞中,每個關(guān)鍵詞重復(fù)出現(xiàn)的總次數(shù); 第二統(tǒng)計(jì)子模塊,用于統(tǒng)計(jì)每個關(guān)鍵詞與其他關(guān)鍵詞同時出現(xiàn)的次數(shù); 排序子模塊,用于將每個關(guān)鍵詞重復(fù)出現(xiàn)的總次數(shù)與每個關(guān)鍵詞與其他關(guān)鍵詞同時出現(xiàn)的次數(shù)進(jìn)行加權(quán)求和并進(jìn)行排序; 關(guān)鍵詞獲取子模塊,用于獲取排序后名次在預(yù)設(shè)名次之內(nèi)的關(guān)鍵詞,并將其記錄為所述節(jié)目的關(guān)鍵詞。8.如權(quán)利要求6所述的裝置,其特征在于,所述節(jié)目標(biāo)簽包括節(jié)目名稱、節(jié)目簡介、節(jié)目類型和節(jié)目相關(guān)人員。9.如權(quán)利要求7或8所述的裝置,其特征在于,所述裝置還包括: 分類模塊,用于根據(jù)提取的所述關(guān)鍵詞的特征對所述關(guān)鍵詞進(jìn)行分類之后將其存儲;其中,所述關(guān)鍵詞的特征包括文本特征、語言特征、統(tǒng)計(jì)特征、標(biāo)注特征中的至少一個。10.如權(quán)利要求6所述的裝置,其特征在于,所述提取模塊包括: 篩選子模塊,用于每隔一個預(yù)設(shè)時長,采用Tf-1df算法從所述節(jié)目的相關(guān)信息中篩選出一組所述預(yù)設(shè)時長之內(nèi)的關(guān)鍵詞。
【文檔編號】H04N21/435GK105979287SQ201610378332
【公開日】2016年9月28日
【申請日】2016年5月31日
【發(fā)明人】章杰
【申請人】無錫天脈聚源傳媒科技有限公司