專利名稱:選擇用于顯示的高質(zhì)量評(píng)論的制作方法
技術(shù)領(lǐng)域:
公開(kāi)的實(shí)施例一般涉及搜索引擎。更加具體地,公開(kāi)的實(shí)施例涉 及用于選擇評(píng)論和用于表示的來(lái)自評(píng)論的內(nèi)容的方法和系統(tǒng)。
背景技術(shù):
許多互聯(lián)網(wǎng)用戶在獲得產(chǎn)品或服務(wù)之前對(duì)產(chǎn)品或服務(wù)進(jìn)行調(diào)查。 許多互聯(lián)網(wǎng)用戶還在光顧產(chǎn)品或服務(wù)的供應(yīng)商之前調(diào)查該供應(yīng)商。當(dāng) 前,許多用戶遵循的方法是利用提供產(chǎn)品、服務(wù)和/或其供應(yīng)商的評(píng)級(jí) 禾口評(píng)論的網(wǎng)站。例如,諸如 www.pricegrabber.com、 www.bizrate.com 和www.resellerratings.com之類的網(wǎng)站提供了產(chǎn)品及其供應(yīng)商的評(píng)級(jí)和 評(píng)論。
為了獲得對(duì)于產(chǎn)品、服務(wù)或供應(yīng)商的評(píng)論和評(píng)級(jí)的全面了解,用戶可以訪問(wèn)許多提供評(píng)論和評(píng)級(jí)的網(wǎng)站,并且閱讀那些網(wǎng)站提供的多 個(gè)評(píng)級(jí)和評(píng)論。然而,這個(gè)過(guò)程相當(dāng)耗時(shí)并且麻煩。為了避免花費(fèi)時(shí) 間瀏覽各種網(wǎng)站上的評(píng)論和評(píng)級(jí),用戶可能滿足于評(píng)級(jí)和評(píng)論的簡(jiǎn)單 概述。這樣以來(lái),將會(huì)高度希望的是,使用戶能夠更加有效地對(duì)他們有 興趣獲得(例如通過(guò)購(gòu)買、出租、租借或其它類似交易)的產(chǎn)品和服 務(wù)以及他們有興趣光顧的產(chǎn)品和服務(wù)的供應(yīng)商進(jìn)行調(diào)查。發(fā)明內(nèi)容在本發(fā)明的一些實(shí)施例中,處理評(píng)論的方法包括識(shí)別多個(gè)評(píng)論; 基于至少預(yù)定的質(zhì)量標(biāo)準(zhǔn)選擇多個(gè)評(píng)論的子集;以及生成包括所選擇的子集的內(nèi)容的響應(yīng)。
圖1圖示了根據(jù)本發(fā)明的一些實(shí)施例的網(wǎng)絡(luò)。圖2是根據(jù)本發(fā)明的一些實(shí)施例的用于接收和響應(yīng)用于評(píng)論概要 的請(qǐng)求的過(guò)程的流程圖。圖3是根據(jù)本發(fā)明的一些實(shí)施例的用于選擇代表性評(píng)論的過(guò)程的 流程圖。圖4是根據(jù)本發(fā)明的一些實(shí)施例的用于選擇高質(zhì)量評(píng)論的過(guò)程的 流程圖。圖5是根據(jù)本發(fā)明的一些實(shí)施例的用于聚類評(píng)論并且從群集中選 擇評(píng)論的過(guò)程的流程圖。圖6是根據(jù)本發(fā)明的一些實(shí)施例的用于生成來(lái)自評(píng)論內(nèi)高質(zhì)量?jī)?nèi) 容的摘錄的過(guò)程的流程圖。圖7圖示了根據(jù)本發(fā)明的一些實(shí)施例的用于處理評(píng)論的系統(tǒng)。相同的參考標(biāo)記指示附圖中的相應(yīng)部分。
具體實(shí)施例方式
對(duì)主題(諸如產(chǎn)品、服務(wù)或其供應(yīng)商)進(jìn)行調(diào)查的用戶可能不想 通過(guò)幾個(gè)網(wǎng)站花費(fèi)時(shí)間閱讀眾多評(píng)論和評(píng)級(jí),并且可能滿足于主題的 評(píng)論和評(píng)級(jí)的概述。概述可以包括主題的評(píng)論的樣本。然而,僅僅隨 機(jī)選擇評(píng)論用于包括在樣本中對(duì)用戶來(lái)說(shuō)不是很有幫助。公開(kāi)的實(shí)施 例基于預(yù)定的非隨機(jī)標(biāo)準(zhǔn)選擇評(píng)論用于包括在評(píng)論樣本中,并且選擇 來(lái)自評(píng)論的文本,用于在評(píng)論的摘錄中使用。
圖1圖示了根據(jù)本發(fā)明的一些實(shí)施例的網(wǎng)絡(luò)。網(wǎng)絡(luò)100包括一個(gè)
或多個(gè)客戶端102、一個(gè)或多個(gè)文件主機(jī)104和評(píng)論引擎106。網(wǎng)絡(luò)100 還包括連接這些組建的網(wǎng)絡(luò)108。
文件主機(jī)104存儲(chǔ)文件并且提供到文件的訪問(wèn)。文件可以是任何 機(jī)器可讀數(shù)據(jù),包括文本、圖形、多媒體內(nèi)容等等的任何組合。在一 些實(shí)施例中,文件可以是超文本標(biāo)記語(yǔ)言(HTML)亦即網(wǎng)頁(yè)中寫入的 文本、圖形和其它可能形式的信息的組合。文件可以包括一個(gè)或多個(gè) 到其它文件的超鏈接。文件主機(jī)102中存儲(chǔ)的文件可以通過(guò)統(tǒng)一資源 定位符(URL)或網(wǎng)址或任何其它適當(dāng)形式的標(biāo)識(shí)和/或位置來(lái)定位和/ 或識(shí)別。文件主機(jī)104還存儲(chǔ)用戶向它們提交的評(píng)論,并且經(jīng)由諸如 網(wǎng)頁(yè)之類的文件提供到評(píng)論的訪問(wèn)。
客戶端102包括客戶端應(yīng)用程序,用戶能夠從該客戶端應(yīng)用程序 訪問(wèn)諸如網(wǎng)頁(yè)之類的文件。在一些實(shí)施例中,客戶端應(yīng)用程序包括網(wǎng) 絡(luò)瀏覽器。網(wǎng)絡(luò)瀏覽器的例子包括Firefox、 Internet Explorer和Opera 。 在一些實(shí)施例中,用戶還能夠經(jīng)由客戶端102向文件主機(jī)104或評(píng)論 引擎106提交評(píng)論。
評(píng)論包括關(guān)于主題或主題的類的內(nèi)容(例如評(píng)語(yǔ)、評(píng)估、意見(jiàn)等 等)。在一些實(shí)施例中,內(nèi)容是文本的。在其它實(shí)施例中,內(nèi)容還可 以包括音頻、視頻或文本、音頻和視頻的任何組合。評(píng)論的主題是特定實(shí)體或?qū)ο螅u(píng)論中的內(nèi)容向該實(shí)體或?qū)ο筇?供評(píng)語(yǔ)、評(píng)估、意見(jiàn)等。在一些實(shí)施例中,可以根據(jù)主題的類型對(duì)評(píng) 論的主題進(jìn)行分類。主題類型的例子包括產(chǎn)品、服務(wù)、產(chǎn)品的供應(yīng)商、 服務(wù)的供應(yīng)商等等。評(píng)論可以指向主題的類。主題的類包括多個(gè)特定 實(shí)體或?qū)ο?,它們共享共同的品質(zhì)、特性或特征。例如,特定的產(chǎn)品 線可以是主題的類,該主題可以是評(píng)論的主題。作為另一個(gè)例子,具 有特定品牌的全部產(chǎn)品可以是主題的類,該主題可以是評(píng)論的主題。
評(píng)級(jí)可以與評(píng)論相關(guān)聯(lián),并且和評(píng)論一起存儲(chǔ)。評(píng)級(jí)(或"評(píng)級(jí) 分值")表示評(píng)論的主題(或主題的類)的分值(在預(yù)定范圍內(nèi))。 評(píng)級(jí)的格式可以是數(shù)字值或是能夠映射到數(shù)字值的任何非數(shù)字格式。 例如,非數(shù)字的贊成或反對(duì)評(píng)級(jí)可以分別映射到二進(jìn)制值1或0。評(píng)級(jí) 形式的例子包括符號(hào)或描述格式(正/負(fù)、贊成/反對(duì)等等)和數(shù)字格式
(1 — 3、 l一5、 1 — 10、 1 —100等等)。在一些實(shí)施例中,除評(píng)級(jí)之外, 評(píng)論還可以與用于主題的特定方面的子評(píng)級(jí)相關(guān)聯(lián)。子評(píng)級(jí)可以是用 于主題的具體方面的分值。
評(píng)論引擎106包括評(píng)論服務(wù)器110、評(píng)論儲(chǔ)存庫(kù)112、評(píng)論收集器 114和文件儲(chǔ)存庫(kù)116。評(píng)論服務(wù)器110生成包括評(píng)論和/或評(píng)論摘錄的 響應(yīng),以便向客戶端102傳送。評(píng)論服務(wù)器110還向客戶端102的用 戶提供接口,用于向評(píng)論引擎106提交評(píng)論和評(píng)級(jí)。
評(píng)論收集器114收集來(lái)自文件的評(píng)論。評(píng)論收集器114分析文件, 并且提取來(lái)自文件的評(píng)論、評(píng)級(jí)和其它相關(guān)信息(諸如評(píng)論的作者、 評(píng)論日期、評(píng)論主題等等)。將所提取的評(píng)論傳送到評(píng)論儲(chǔ)存庫(kù)112 以便存儲(chǔ)。評(píng)論收集器114從中提取評(píng)論的文件可以存儲(chǔ)在文件主機(jī) 104和/或文件儲(chǔ)存庫(kù)116中。
文件儲(chǔ)存庫(kù)116是在文件主機(jī)104中存儲(chǔ)的文件的至少一個(gè)子集
9的副本的存儲(chǔ)器。存儲(chǔ)在文件儲(chǔ)存庫(kù)116中的文件可以從文件主機(jī)104
中收集并且通過(guò)評(píng)論引擎106存儲(chǔ)在那里。在一些實(shí)施例中,文件儲(chǔ) 存庫(kù)116可以位于搜索引擎(未示出),該搜索引擎對(duì)于評(píng)論引擎106 是可訪問(wèn)的,并且該搜索引擎負(fù)責(zé)搜集來(lái)自文件主機(jī)104的文件并且 將它們存儲(chǔ)在文件儲(chǔ)存庫(kù)116中。
存儲(chǔ)在評(píng)論引擎106中的評(píng)論由客戶端102的用戶寫入并且被提 交到文件主機(jī)104或評(píng)論引擎106。提交到文件主機(jī)104的評(píng)論可以從 存儲(chǔ)在文件主機(jī)104的文件或存儲(chǔ)在文件儲(chǔ)存庫(kù)116中的文件的副本 中提取。評(píng)論還可以由用戶提交到評(píng)論引擎106。從文件提取的評(píng)論和 提交到評(píng)論引擎106的評(píng)論都被傳遞到評(píng)論儲(chǔ)存庫(kù)112以便存儲(chǔ)。
文件主機(jī)104或評(píng)論引擎106可以為用戶提供向它們提交評(píng)論的 能力。例如,文件主機(jī)104或評(píng)論引擎106可以提供在線表格,用戶 能夠填寫他們的評(píng)論和評(píng)級(jí)然后提交。在提交和存儲(chǔ)后,評(píng)論可以被 其它用戶通過(guò)諸如網(wǎng)頁(yè)之類的文件來(lái)訪問(wèn)。
評(píng)論的源是將評(píng)論向其提交的實(shí)體。源可以通過(guò)向其提交評(píng)論的 文件主機(jī)104的位置和/或標(biāo)識(shí)符來(lái)識(shí)別。在一些實(shí)施例中,評(píng)論的源 可以通過(guò)向其提交評(píng)論的文件主機(jī)104的域來(lái)識(shí)別。例如,如果評(píng)論 被提交給在域www.xyz.com之下的文件主機(jī),那么所提取的評(píng)論的源 可以是"xyz.com"。在用戶向評(píng)論引擎106提交評(píng)論的情況下,評(píng)論 引擎106可以被認(rèn)為是源。
評(píng)論儲(chǔ)存庫(kù)112存儲(chǔ)評(píng)論和相關(guān)的評(píng)級(jí)。評(píng)論儲(chǔ)存庫(kù)112還存儲(chǔ) 用于每個(gè)評(píng)論的主題或主題的類和主題類型(即,主題或主題的類是 否是產(chǎn)品、產(chǎn)品提供商等等)。評(píng)論儲(chǔ)存庫(kù)112還可以存儲(chǔ)用于每個(gè) 評(píng)論的源、作者和日期。在一些實(shí)施例中,評(píng)論和評(píng)級(jí)可以在評(píng)論儲(chǔ) 存庫(kù)112中與評(píng)論和評(píng)級(jí)自身的一個(gè)或多個(gè)評(píng)估相關(guān)聯(lián)。評(píng)論和評(píng)級(jí) 的評(píng)估可以評(píng)估評(píng)論和評(píng)級(jí)的有幫助性和/或可信性。例如,評(píng)論和評(píng)級(jí)的評(píng)估可以包括有幫助/無(wú)幫助評(píng)級(jí)。作為另一個(gè)例子,評(píng)論和評(píng)級(jí) 可以與度量值相關(guān)聯(lián),所述度量值基于對(duì)其作者的名聲的衡量?;?br>
名聲的度量值的例子記載在2005年9月30提交的名稱為"System and Methods for Reputation Management"的美國(guó)專利申請(qǐng)中,其申請(qǐng)?zhí)枮?11/241,693,其內(nèi)容通過(guò)引用結(jié)合于此。
應(yīng)當(dāng)意識(shí)到的是,評(píng)論引擎106的組件中的每一個(gè)可以分布在多 個(gè)計(jì)算機(jī)之上。例如,評(píng)論儲(chǔ)存庫(kù)112可以配置(deploy)在M個(gè)服 務(wù)器之上,其中映射函數(shù)如"模M"函數(shù)用于確定在M個(gè)服務(wù)器的每 一個(gè)中存儲(chǔ)哪些評(píng)論。類似地,評(píng)論服務(wù)器110可以分布在多個(gè)服務(wù) 器之上,并且評(píng)論收集器114和文件儲(chǔ)存庫(kù)116可以各自分布在多個(gè) 計(jì)算機(jī)之上。然而,為了便于說(shuō)明起見(jiàn),我們將會(huì)討論評(píng)論引擎106 的組件,如同它們?cè)趩蝹€(gè)計(jì)算機(jī)上實(shí)現(xiàn)一樣。
圖2是根據(jù)本發(fā)明的一些實(shí)施例的用于接收和響應(yīng)用于評(píng)論概要 的請(qǐng)求的過(guò)程的流程圖。如上所述,評(píng)論引擎106收集并存儲(chǔ)由用戶 向文件主機(jī)104提交的評(píng)論以及用戶向評(píng)論引擎106提交的評(píng)論。用 戶可以通過(guò)客戶端102向評(píng)論引擎請(qǐng)求關(guān)于主題如產(chǎn)品、服務(wù)或提供 商的評(píng)論信息。例如,用戶可以在客戶端102上顯示的網(wǎng)頁(yè)中的鏈接 上進(jìn)行點(diǎn)擊,這觸發(fā)向評(píng)論引擎106傳送請(qǐng)求。下面描述用于處理這 樣的請(qǐng)求的示范性過(guò)程。
經(jīng)由客戶端102,用戶可以向評(píng)論引擎106請(qǐng)求關(guān)于主題或主題的 類的評(píng)論概要。評(píng)論引擎106從客戶端102接收關(guān)于主題的評(píng)論概要 的請(qǐng)求(202)。識(shí)別關(guān)于存儲(chǔ)在評(píng)論儲(chǔ)存庫(kù)112中的主題的評(píng)論(204)。 選擇所識(shí)別的評(píng)論的子集(206)。生成包括來(lái)自所選擇的子集的內(nèi)容 的響應(yīng)(208)。將響應(yīng)傳送到客戶端102 (210)。客戶端102在接收 到響應(yīng)之后,在客戶端應(yīng)用程序如網(wǎng)絡(luò)瀏覽器中呈現(xiàn)該響應(yīng),以便展 示給用戶。生成的響應(yīng)是傳送到客戶端102以便呈現(xiàn)和展示給用戶的文件。 響應(yīng)文件可以包括關(guān)于主題的評(píng)論概要。評(píng)論概要包括諸如關(guān)于主題 的總體評(píng)級(jí)的信息,其進(jìn)一步的細(xì)節(jié)將參考圖3在下面描述。評(píng)論概 要還可以包括則由評(píng)論源給出的關(guān)于主題的集體評(píng)級(jí)(如果可得到的 話)。由評(píng)論源給予主題的集體評(píng)級(jí)是基于與提交給該源的主題的評(píng)論 相關(guān)聯(lián)的評(píng)級(jí)由評(píng)論源所確定的評(píng)級(jí)。集體評(píng)級(jí)如何被確定可以根據(jù) 評(píng)論源而變化,但在此沒(méi)有關(guān)系。由于各種原因,不是所有的評(píng)論源 都可以具有關(guān)于主題的集體評(píng)級(jí)。例如, 一些評(píng)論源可以決定根本不 具有集體評(píng)級(jí),而其它評(píng)論源則可以要求在確定和給出集體評(píng)級(jí)之前, 關(guān)于主題的評(píng)級(jí)的數(shù)目達(dá)到預(yù)定最小值。在評(píng)論概要中包括集體評(píng)級(jí) 是可選的。
評(píng)論概要還包括評(píng)論樣本。在一些實(shí)施例中,評(píng)論樣本可以包括 所選擇的評(píng)論中的至少一部分的全部?jī)?nèi)容。對(duì)于基于文本的評(píng)論,評(píng) 論的全部?jī)?nèi)容是評(píng)論的整個(gè)文本。對(duì)基于視頻的評(píng)論,評(píng)論的全部?jī)?nèi) 容是評(píng)論的全部視頻剪輯。在其它一些實(shí)施例中,評(píng)論樣本可以包括
選擇的評(píng)論中的至少一部分的摘錄,其進(jìn)一步的細(xì)節(jié)將參考圖6在下
面描述。然而,應(yīng)當(dāng)意識(shí)到的是,在一些實(shí)施例中,評(píng)論樣本可以既 包括一部分所選擇的評(píng)論的全部?jī)?nèi)容又包括其它所選擇的評(píng)論的摘 錄。評(píng)論樣本還可以包括一個(gè)或多個(gè)到評(píng)論的源的鏈接,其中,評(píng)論 的全部?jī)?nèi)容或摘錄包括在評(píng)論樣本中。
圖3是根據(jù)本發(fā)明的一些實(shí)施例的用于選擇代表性評(píng)論的過(guò)程的
流程圖。在接收到來(lái)自用戶的關(guān)于主題的評(píng)論概要的請(qǐng)求之后,評(píng)論
引擎106能夠選擇許多評(píng)論以便包括在主題的評(píng)論樣本中,使得樣本 中的評(píng)論代表關(guān)于主題的總體評(píng)級(jí)。
識(shí)別關(guān)于特定主題的評(píng)論和評(píng)論的源(302)。為了與特定主題相 關(guān)的所有評(píng)論而搜索評(píng)論儲(chǔ)存庫(kù)112,可以從評(píng)論儲(chǔ)存庫(kù)112中識(shí)別評(píng) 論。所識(shí)別的評(píng)論形成關(guān)于特定主題的評(píng)論的全集。如果可得到的話,從每個(gè)所識(shí)別的源中識(shí)別關(guān)于主題的集體評(píng)級(jí)(304)。對(duì)于每個(gè)所識(shí)別的評(píng)論源,識(shí)別出在各個(gè)源中的全集中評(píng)論的數(shù)目(306)。這是在 全集中有多少個(gè)評(píng)論包括在每個(gè)源中的簡(jiǎn)單計(jì)數(shù)。為主題確定總體評(píng)級(jí)分值(308)??傮w評(píng)級(jí)分值可以是評(píng)論源給 出的關(guān)于主題的集體評(píng)級(jí)的數(shù)學(xué)組合。在一些實(shí)施例中,總體評(píng)級(jí)分 值是集體評(píng)級(jí)的加權(quán)平均。權(quán)重是基于包括在每個(gè)源中的全集中的評(píng) 論的數(shù)目。這樣,在全集中具有更多評(píng)論的源的集體評(píng)級(jí)在加權(quán)平均 中是有利的。用于計(jì)算總體評(píng)級(jí)的示范性公式為其中,OR為總體評(píng)級(jí),S是具有至少一個(gè)全集中的評(píng)論(亦即至 少一個(gè)關(guān)于主題的評(píng)論)和關(guān)于主題的聚合評(píng)級(jí)的評(píng)論源的數(shù)目,r; 是來(lái)自源i的集體評(píng)級(jí),并且iii是處在源i中的全集中的評(píng)論的數(shù)目。 如果評(píng)論源各自為它們的集體評(píng)級(jí)使用不同的規(guī)格和/或形式,則集體 評(píng)級(jí)首先被轉(zhuǎn)換成和/或歸一化成與用于總體評(píng)級(jí)的規(guī)格/形式相同的 規(guī)格和形式。在一些實(shí)施例中,總體評(píng)級(jí)基于l-5數(shù)字評(píng)級(jí)規(guī)格,這樣 集體評(píng)級(jí)就被轉(zhuǎn)換成和/或歸一化成該規(guī)格。然而,應(yīng)當(dāng)意識(shí)到的是, 其他評(píng)級(jí)規(guī)格也可以用于總體評(píng)級(jí)。在一些實(shí)施例中,如上面的公式 所示,集體評(píng)級(jí)通過(guò)處在每個(gè)評(píng)論源中的全集中的評(píng)論的數(shù)目的對(duì)數(shù) 而被加權(quán)。對(duì)數(shù)可以有任何適合的底數(shù),諸如底數(shù)2、底數(shù)IO或底數(shù) e。在其它一些實(shí)施例中,集體評(píng)級(jí)通過(guò)處在每個(gè)評(píng)論源中的全集中的 評(píng)論的數(shù)目而被加權(quán),如下式所示 <formula>formula see original document page 13</formula>在確定了總體評(píng)級(jí)之后,識(shí)別總體評(píng)級(jí)落在其中的評(píng)級(jí)范圍 (310)。評(píng)級(jí)規(guī)格可以分成兩個(gè)或更多評(píng)級(jí)范圍。例如,1-5規(guī)格可
以分成3個(gè)范圍。3.66和5之間的評(píng)級(jí)(包括邊界)可以指示關(guān)于主 題方面的經(jīng)驗(yàn)已總體為正。1和2.33之間的評(píng)級(jí)(包括邊界)可以指 示關(guān)于主題方面的經(jīng)驗(yàn)已總體為負(fù)。2.34至3.65之間的評(píng)級(jí)(包括邊 界)可以指示關(guān)于主題方面的經(jīng)驗(yàn)已總體被混合。作為另一個(gè)例子, 相同的l-5規(guī)格可以分成4個(gè)范圍。4.1和5之間的評(píng)級(jí)(包括邊界) 可以指示優(yōu)秀評(píng)級(jí)。3.1和4之間的評(píng)級(jí)(包括邊界)可以表示良好評(píng) 級(jí)。2.1和3之間的評(píng)級(jí)(包括邊界)可以表示一般評(píng)級(jí)。l和2之間 的評(píng)級(jí)(包括邊界)可以表示差評(píng)級(jí)。應(yīng)當(dāng)意識(shí)到的是,上面的評(píng)級(jí) 范圍例子僅僅是示范性的,并且可以使用劃分評(píng)級(jí)規(guī)格的其他方式。 然而,為了便于說(shuō)明起見(jiàn),我們將會(huì)討論圖3中圖示的過(guò)程,如同評(píng) 級(jí)規(guī)格分成了3個(gè)范圍高/正范圍、低/負(fù)范圍和中間/混合范圍。
如果總體評(píng)級(jí)落在低范圍內(nèi)(310-低),則選擇與低范圍內(nèi)的評(píng) 級(jí)相關(guān)聯(lián)的全集中的評(píng)論(312)。評(píng)論可以在每個(gè)源的基礎(chǔ)上進(jìn)行選 擇,或者全部從全集中選擇。如果評(píng)論在每個(gè)源的基礎(chǔ)上被選擇,則 可以從每個(gè)源中選擇與低范圍內(nèi)的評(píng)級(jí)相關(guān)聯(lián)的達(dá)到第一預(yù)定數(shù)目的
評(píng)論。如果全部從全集中選擇評(píng)論,則可以從全集中選擇達(dá)到第二預(yù) 定數(shù)目的評(píng)論,而不考慮評(píng)論源。
如果總體評(píng)級(jí)落在中間范圍內(nèi)(310-中間),則選擇與高范圍內(nèi) 的評(píng)級(jí)相關(guān)聯(lián)的全集中的評(píng)論和與低范圍內(nèi)的評(píng)級(jí)相關(guān)聯(lián)的全集中的 評(píng)論(314)。換言之,在所選擇的評(píng)論之中的是與高范圍內(nèi)的評(píng)級(jí)相 關(guān)聯(lián)的評(píng)論以及與低范圍內(nèi)的評(píng)級(jí)相關(guān)聯(lián)的評(píng)論。在其他實(shí)施例中, 選擇與中間范圍內(nèi)的評(píng)級(jí)相關(guān)聯(lián)的全集中的評(píng)論。如上所述,評(píng)論可
以在每個(gè)源的基礎(chǔ)上或者全部從全集中進(jìn)行選擇。
如果總體評(píng)級(jí)落在高范圍內(nèi)(310-高),則選擇與高范圍內(nèi)的評(píng) 級(jí)相關(guān)聯(lián)的全集中的評(píng)論(316)。如上所述,評(píng)論可以在每個(gè)源的基礎(chǔ)上或者作為整體從評(píng)論的集合中進(jìn)行選擇。在一些實(shí)施例中,可以包括另外的選擇標(biāo)準(zhǔn)。例如,另外的標(biāo)準(zhǔn)可以是待選擇的評(píng)論不具有引起反對(duì)(objectionable)的內(nèi)容如褻瀆或 明顯與性有關(guān)的內(nèi)容。作為另一個(gè)例子,另外的標(biāo)準(zhǔn)可以是待選擇的 評(píng)論必須具有超過(guò)預(yù)定閾值的基于名聲的度量值。更一般地,可以選 擇與總體評(píng)級(jí)落在其中的評(píng)級(jí)范圍內(nèi)的和也滿足零或更多其它預(yù)定標(biāo) 準(zhǔn)的評(píng)級(jí)范圍內(nèi)的評(píng)級(jí)相關(guān)聯(lián)的評(píng)論。生成包括所選擇的評(píng)論的內(nèi)容的響應(yīng)(318)。生成的響應(yīng)是被傳 送到客戶端102以便呈現(xiàn)并展示給用戶的文件。響應(yīng)文件包括關(guān)于主 題的評(píng)論概要。評(píng)論概要可以包括信息如關(guān)于主題的總體評(píng)級(jí)和可選 的由評(píng)論源給出的關(guān)于主題的集體評(píng)級(jí)。如上所述,評(píng)論概要還包括 評(píng)論樣本,所述評(píng)論樣本包括所選擇的評(píng)論或其摘錄中的至少一部分。圖4是根據(jù)本發(fā)明的一些實(shí)施例的用于選擇高質(zhì)量評(píng)論的過(guò)程的 流程圖。在接收到來(lái)自用戶的請(qǐng)求關(guān)于主題的評(píng)論概要之后,評(píng)論引 擎106能夠選擇許多評(píng)論以便包括在主題的評(píng)論樣本中,使得評(píng)論包 括高質(zhì)量?jī)?nèi)容。識(shí)別關(guān)于特定主題的評(píng)論和評(píng)論的源(402)。為了與特定主題相 關(guān)聯(lián)的所有評(píng)論而搜索評(píng)論儲(chǔ)存庫(kù)112,可以從評(píng)論儲(chǔ)存庫(kù)112中識(shí)別 評(píng)論。所識(shí)別的評(píng)論形成關(guān)于特定主題的評(píng)論的全集。在一些實(shí)施例 中,初始識(shí)別的評(píng)論在402被過(guò)濾,或者在過(guò)程的稍后階段被過(guò)濾, 以便去除包含引起反對(duì)的內(nèi)容的任何評(píng)論。為每個(gè)識(shí)別的評(píng)論確定質(zhì)量分值(404)。質(zhì)量分值是評(píng)論內(nèi)容質(zhì) 量的量度。質(zhì)量分值提供了用于在評(píng)論的質(zhì)量方面相互比較評(píng)論的基 礎(chǔ)。質(zhì)量分值可以基于一個(gè)或多個(gè)預(yù)定因素。在一些實(shí)施例中,預(yù)定 因素包括評(píng)論的長(zhǎng)度、評(píng)論中句子的長(zhǎng)度、與評(píng)論中的詞相關(guān)聯(lián)的值以及評(píng)論的語(yǔ)法質(zhì)量??梢曰诿總€(gè)因素為評(píng)論確定次分值,并且將 次分值進(jìn)行組合以便為評(píng)論確定質(zhì)量分值。然而,應(yīng)當(dāng)意識(shí)到的是, 可以包括另外的和/或可替代的因素。關(guān)于評(píng)論的語(yǔ)法質(zhì)量,具有合適的語(yǔ)法和大寫字母(例如實(shí)際地 使用句子,評(píng)論沒(méi)有全部大寫)的評(píng)論是有利的。這樣,具有"合適" 的語(yǔ)法和大寫字母的評(píng)論就得到針對(duì)這個(gè)因素的較高次分值。具有糟 糕語(yǔ)法和不合適的大寫字母的評(píng)論趨向于較不可讀。進(jìn)而,整個(gè)用大 寫的評(píng)論常常被認(rèn)為是粗魯?shù)摹T谝恍?shí)施例中,評(píng)論中句子的檢測(cè) 可以基于句子分界符如評(píng)論中句號(hào)的檢測(cè)。在一些實(shí)施例中,可以針 對(duì)附著到語(yǔ)法質(zhì)量的另外標(biāo)記如主語(yǔ)-動(dòng)詞的一致性、缺乏語(yǔ)意連貫的 句子或段落等等來(lái)評(píng)估評(píng)論。在一些實(shí)施例中,可以在語(yǔ)法檢驗(yàn)器的 輔助下執(zhí)行對(duì)評(píng)論的語(yǔ)法和大寫字母的評(píng)估,所述語(yǔ)法檢驗(yàn)器在本領(lǐng) 域中是眾所周知的,不需要進(jìn)一步地描述。關(guān)于評(píng)論的長(zhǎng)度,不太長(zhǎng)也不太短的評(píng)論是有利的。短的評(píng)論(例 如幾個(gè)詞)趨向于不提供信息,而長(zhǎng)的評(píng)論(例如許多段落)趨向于 不如較短的評(píng)論那樣可讀。在一些實(shí)施例中,評(píng)論長(zhǎng)度可以基于詞計(jì) 數(shù)。在其它一些實(shí)施例中,評(píng)論長(zhǎng)度可以基于字符計(jì)數(shù)或句子計(jì)數(shù)。 評(píng)論長(zhǎng)度次分值可以基于評(píng)論的長(zhǎng)度與預(yù)定"最優(yōu)"評(píng)論長(zhǎng)度之間的 差。在一些實(shí)施例中,還可以考慮評(píng)論中句子的長(zhǎng)度。評(píng)論引擎可以 優(yōu)選"合理"長(zhǎng)度的句子而不是極長(zhǎng)或極短的句子。在一些實(shí)施例中, 用于評(píng)論的句子長(zhǎng)度次分值可以基于評(píng)論中句子的長(zhǎng)度和預(yù)定"最優(yōu)" 句子長(zhǎng)度之間的差的平均值。關(guān)于與評(píng)論中的詞相關(guān)聯(lián)的值,具有高值詞的評(píng)論相對(duì)于具有低 值詞的評(píng)論是有利的。在一些實(shí)施例中,詞值基于與詞相關(guān)聯(lián)的反向文件頻率(IDF)值。具有高IDF值的詞一般被認(rèn)為是更"有價(jià)值"。詞的IDF基于一組文本中文本的數(shù)目除以包括至少一次出現(xiàn)該詞的集中的文本的數(shù)目。評(píng)論引擎106可以確定跨越評(píng)論儲(chǔ)存庫(kù)112中的評(píng) 論的IDF值,并且將值存儲(chǔ)在一個(gè)或多個(gè)表中。在一些實(shí)施例中,為 每種類型的評(píng)論生成IDF值的表。例如,為全部產(chǎn)品評(píng)論生成IDF值 的表;為全部產(chǎn)品提供商評(píng)論生成表,等等。亦即,用于為產(chǎn)品評(píng)論 確定IDF值的表的文本集是評(píng)論儲(chǔ)存庫(kù)112中的所有產(chǎn)品評(píng)論;用于 為產(chǎn)品提供商評(píng)論確定IDF值的表的文本集是評(píng)論儲(chǔ)存庫(kù)112中的所 有產(chǎn)品提供商評(píng)論,等等。每個(gè)主題類型具有它自己的IDF值表,因 為在關(guān)于一個(gè)主題類型的評(píng)論中有價(jià)值的詞可能不像關(guān)于另一個(gè)主題 類型的評(píng)論中一樣有價(jià)值。對(duì)于任何識(shí)別的評(píng)論,針對(duì)評(píng)論中每個(gè)不同詞的頻率被確定并乘 以針對(duì)該詞的IDF。針對(duì)評(píng)論的詞值次分值為^ 《we及其中,WVR為針對(duì)評(píng)論R的詞值次分值,fw,R為不同的詞w在評(píng) 論R中出現(xiàn)的次數(shù)(檢索詞頻率或"TF"),并且log IDFw為針對(duì)詞 w的IDF值的對(duì)數(shù)。針對(duì)詞w的IDF值取自適合于評(píng)論的主題類型的 IDF值的表。例如,如果評(píng)論R的主題為產(chǎn)品,則IDFw值取自針對(duì)產(chǎn) 品評(píng)論的IDF值表。在其它一些實(shí)施例中,詞值基于在評(píng)論環(huán)境中被認(rèn)為有價(jià)值的詞 的預(yù)定詞典??梢詾椴煌闹黝}類型限定分開(kāi)的詞典,因?yàn)椴煌脑~ 可能對(duì)于在關(guān)于不同主題類型的評(píng)論中使用有價(jià)值。例如,可能存在 對(duì)于其中主題為產(chǎn)品的評(píng)論有價(jià)值的詞的詞典和對(duì)于其中主題為提供 商的評(píng)論有價(jià)值的詞的另一個(gè)詞典。在這些實(shí)施例中,詞值次分值可 以基于有多少預(yù)定詞典中的詞包括在各個(gè)評(píng)論中的計(jì)數(shù)。評(píng)論引擎106基于每個(gè)預(yù)定因素評(píng)估每個(gè)所識(shí)別的評(píng)論,并且基 于其評(píng)估為每個(gè)因素確定次分值。使用下面的示范性公式可以將針對(duì) 因素中的每一個(gè)的次分值組合成質(zhì)量分值-F其中,Q是針對(duì)評(píng)論的質(zhì)量分值,F(xiàn)是進(jìn)入質(zhì)量分值的因素的數(shù) 目,qj是針對(duì)因素j的次分值,而weightj則是針對(duì)因素j的權(quán)重。在一 些實(shí)施例中,權(quán)重全都等于1,在這種情況下質(zhì)量分值Q為針對(duì)因素 的分值之和。在其它一些實(shí)施例中,可以為每個(gè)因素不同地限定權(quán)重。 一般地,可以基于每個(gè)因素對(duì)質(zhì)量分值的重要性以及因素對(duì)評(píng)論的質(zhì) 量是正面貢獻(xiàn)還是負(fù)面貢獻(xiàn)來(lái)限定權(quán)重。在一些實(shí)施例中,評(píng)論的年齡可以被認(rèn)為是評(píng)論的質(zhì)量分值中的 因素。 一般地,較新的評(píng)論是有利的,因?yàn)樗鼈兏嗟胤从沉岁P(guān)于評(píng) 論主題的最近經(jīng)驗(yàn),這比更遠(yuǎn)過(guò)去的經(jīng)驗(yàn)更加重要。增加質(zhì)量分值的 加分點(diǎn)可以應(yīng)用于基于評(píng)論年齡的評(píng)論的質(zhì)量分值。例如, 一天前的 評(píng)論可以得到其質(zhì)量分值方面的增加(無(wú)論是相加還是相乘),而一 年前的評(píng)論則得不到加分?;谫|(zhì)量分值選擇評(píng)論(406)。選擇具有最高質(zhì)量分值的評(píng)論。 評(píng)論可以在每個(gè)源的基礎(chǔ)上或者作為整體從全集中進(jìn)行選擇。如果評(píng) 論在每個(gè)源的基礎(chǔ)上被選擇,則選擇用于每個(gè)源的多個(gè)最高分值評(píng)論。 例如,每個(gè)源可以選擇IO個(gè)最高分值評(píng)論。在一些實(shí)施例中,通過(guò)用 質(zhì)量分值對(duì)評(píng)論進(jìn)行排序來(lái)執(zhí)行選擇,并且評(píng)論取自最高分值評(píng)論, 直到預(yù)期數(shù)目的評(píng)論已被選擇為止。在一些實(shí)施例中,預(yù)定內(nèi)容標(biāo)準(zhǔn)也可以是用于選擇評(píng)論的另外標(biāo) 準(zhǔn)。關(guān)于滿足預(yù)定標(biāo)準(zhǔn)的內(nèi)容,可以定義標(biāo)準(zhǔn),以便使具有可能冒犯 用戶的評(píng)論中的內(nèi)容如褻瀆或明顯與性有關(guān)的內(nèi)容的評(píng)論不利;這樣 的詞或短語(yǔ)常常很少或無(wú)助于對(duì)主題的理解并且能夠使閱讀評(píng)論的用 戶不舒服。通過(guò)定義與冒犯的或引起反對(duì)的內(nèi)容通常相關(guān)聯(lián)的內(nèi)容的 詞典并且將評(píng)論中的內(nèi)容與該詞典相匹配,可以進(jìn)行針對(duì)內(nèi)容滿足預(yù) 定標(biāo)準(zhǔn)的評(píng)論的評(píng)估。從考慮的選擇之中去除具有引起反對(duì)的內(nèi)容如褻瀆或明顯與性有關(guān)的語(yǔ)言的評(píng)論。可以在分值確定期間(404)或者 在評(píng)論選擇時(shí)(406)進(jìn)行針對(duì)內(nèi)容滿足預(yù)定內(nèi)容標(biāo)準(zhǔn)的評(píng)論內(nèi)容評(píng)估;何時(shí)進(jìn)行評(píng)估是設(shè)計(jì)選擇的問(wèn)題。在一些實(shí)施例中,評(píng)級(jí)分值標(biāo)準(zhǔn)可以是用于評(píng)論選擇的另外標(biāo)準(zhǔn)。 例如,用于選擇代表性評(píng)論的過(guò)程,如上所述可以與當(dāng)前過(guò)程相結(jié)合, 以便選擇代表主題總體評(píng)級(jí)的高質(zhì)量評(píng)論。這樣一來(lái),就可以選擇與 總體評(píng)級(jí)落在其中的評(píng)級(jí)范圍內(nèi)的評(píng)級(jí)相關(guān)聯(lián)的并且具有高質(zhì)量分值 的評(píng)論。應(yīng)當(dāng)意識(shí)到的是,上述另外的標(biāo)準(zhǔn)僅僅是示范性的,并且上述標(biāo) 準(zhǔn)和其它標(biāo)準(zhǔn)的任何組合都可以另外考慮用于評(píng)論選擇。更一般地, 評(píng)論引擎可以選擇滿足零或更多其它預(yù)定標(biāo)準(zhǔn)的最高分值(根據(jù)質(zhì)量 分值)的評(píng)論。生成包括選擇的評(píng)論的響應(yīng)(408)。生成的響應(yīng)是被傳送到客戶 端102以便呈現(xiàn)并展示給用戶的文件。響應(yīng)文件包括關(guān)于主題的評(píng)論 概要。評(píng)論概要可以包括信息如關(guān)于主題的總體評(píng)級(jí)和可選的由評(píng)論 源給出的關(guān)于主題的集體評(píng)級(jí)。評(píng)論概要還包括評(píng)論樣本,所述評(píng)論 樣本包括來(lái)自選擇的評(píng)論的內(nèi)容,如參考圖2在上面描述的那樣。圖5是根據(jù)本發(fā)明的一些實(shí)施例的用于聚類評(píng)論并且選擇來(lái)自群 集的評(píng)論的過(guò)程的流程圖。識(shí)別關(guān)于特殊主題的評(píng)論(502)。通過(guò)為了與特定主題相關(guān)聯(lián)的所有評(píng)論而搜索評(píng)論儲(chǔ)存庫(kù)112,可以從評(píng)論儲(chǔ) 存庫(kù)112中識(shí)別評(píng)論。識(shí)別的評(píng)論形成關(guān)于主題的評(píng)論的全集。
生成評(píng)論的詞值矢量(504)。詞值矢量包括關(guān)于評(píng)論中的詞的檢 索詞頻率一反向文件頻率值。檢索詞頻率一反向文件頻率(也被稱為
"TF-IDF"或"TFIDF")是一種用于評(píng)估詞在文件中或者在這些實(shí)施 例的情況下詞在評(píng)論中的重要性的技術(shù)。關(guān)于評(píng)論的詞的值隨著該詞 在評(píng)論中出現(xiàn)的次數(shù)而增加,但是該次數(shù)由包括該詞的評(píng)論的全集中 的評(píng)論數(shù)目進(jìn)行偏移。對(duì)于識(shí)別的評(píng)論的全集中的任何評(píng)論,可以生 成詞值的矢量。例如,評(píng)論R可以具有以下權(quán)重矢量
其中,力到Vn是評(píng)論全集中所有不同詞關(guān)于評(píng)論T的詞值。在一 些實(shí)施例中,詞及其相關(guān)形式被一起計(jì)數(shù)。例如,動(dòng)詞的動(dòng)詞時(shí)態(tài)可 以作為相同動(dòng)詞的出現(xiàn)而被計(jì)數(shù),而不是僅僅因?yàn)槠磳懣赡懿煌?為不同的詞被計(jì)數(shù)。
可以通過(guò)以下示范性公式確定關(guān)于評(píng)論R的詞W的值 ,/ 《i^Og碼
其中,Vw,R是關(guān)于評(píng)論R的詞w的值,fw,R是詞w在評(píng)論R之內(nèi) 出現(xiàn)的次數(shù)(檢索詞頻率),而logIDFw則是關(guān)于詞w的IDF值的對(duì) 數(shù),如上所述。如果評(píng)論R不具有詞w (fw,R = 0),則詞值Vw,R為0。 詞值Vw,R能夠永不為負(fù),因?yàn)閒w,R》0 (出現(xiàn)的次數(shù)永不為負(fù))并且log IDFw>0。
在為全集中的每個(gè)評(píng)論生成詞值矢量之后,基于詞值矢量將全集 中的評(píng)論組織成群集(506)。詞值矢量被嵌入矢量空間中,其中每個(gè)
20詞值矢量為該矢量空間中的"點(diǎn)"。使用聚類算法可以將"點(diǎn)"分組 成一個(gè)或多個(gè)群集。 一個(gè)示范性聚類算法是K均值聚類算法。K均值 聚類算法在本領(lǐng)域中是眾所周知的。然而,為便于理解公開(kāi)的實(shí)施例 起見(jiàn),在下面描述K均值算法
以下偽代碼說(shuō)明了 K平均算法的基本步驟: 隨機(jī)生成與k個(gè)群集相關(guān)聯(lián)的k個(gè)質(zhì)心 將每個(gè)矢量分配給k個(gè)群集中的一個(gè) 重復(fù)直到結(jié)束條件滿足 重新確定群集質(zhì)心 將每個(gè)矢量重新分配給群集
在K均值算法中,預(yù)定義任意數(shù)k。在一些實(shí)施例中k為2和16 之間的值,而在其它一些實(shí)施例中k為2和50之間的值。生成詞值矢 量的矢量空間中的K個(gè)隨機(jī)矢量。k個(gè)隨機(jī)矢量是用于矢量空間的初 始質(zhì)心。每個(gè)初始質(zhì)心表示群集的"中心"。換言之,任意定義k個(gè) 初始群集和它們的中心?;诟鱾€(gè)詞值矢量和每個(gè)質(zhì)心之間的相似性 (距離),將每個(gè)詞值矢量分配給k個(gè)群集中的一個(gè)。將詞值矢量分 配給與其最相似(距離最短)的質(zhì)心。
在一些實(shí)施例中,詞值矢量和質(zhì)心之間的相似性(距離)是余弦 相似性(也被稱為"余弦距離")
COS0 =
其中,X,Y為矢量X和Y的點(diǎn)積,l閃IXIIYII為矢量X的長(zhǎng)度乘 以矢量Y的長(zhǎng)度,而cos8則為余弦相似性。如果矢量X和Y恰好相 同,則余弦相似性值為1。在這些實(shí)施例中用于余弦相似性的值的范圍 在0和1之間,包括邊界(余弦相似性能夠永不為負(fù),因?yàn)樵~值能夠 永不為負(fù))。因此,余弦相似性更加接近于1的評(píng)論更加相似(較短距離),而余弦相似性更加接近于0的評(píng)論則更加不相似(較長(zhǎng)距離)。 在其它一些實(shí)施例中,可以使用確定距離或相似性的可替選的方式。
在一些實(shí)施例中,若干預(yù)定規(guī)范評(píng)論可以用作初始質(zhì)心。規(guī)范評(píng) 論是這樣的預(yù)定評(píng)論集,其充當(dāng)對(duì)主題的特定方面進(jìn)行評(píng)論的評(píng)論的 范本。規(guī)范評(píng)論集可以取決于評(píng)論全集的主題是什么而變化。例如, 可以包括關(guān)于諸如易于使用和性能之類方面的規(guī)范評(píng)論的關(guān)于主題是 產(chǎn)品的規(guī)范評(píng)論集,可以不同于可以包括諸如客戶服務(wù)和貨運(yùn)時(shí)間性 之類方面的規(guī)范評(píng)論的關(guān)于主題是產(chǎn)品提供商的規(guī)范評(píng)論集。
在將詞值矢量分配給k個(gè)群集之后,重新確定用于k個(gè)群集的質(zhì) 心。亦即,為每個(gè)群集重新確定質(zhì)心。通過(guò)取詞值矢量在群集中的"平 均值"(不包括初始質(zhì)心;初始質(zhì)心僅對(duì)于初始群集分配是相關(guān)的), 可以確定用于群集的質(zhì)心。用于確定質(zhì)心C的公式為
<formula>formula see original document page 22</formula>
其中,CS為群集的大小(群集中詞值矢量的數(shù)目),而Vi則是 群集中詞值矢量的歸一化矢量(轉(zhuǎn)換成單位長(zhǎng)度的矢量)。
在確定新的質(zhì)心之后,詞矢量值被重新分配到群集中,這次是基 于與新質(zhì)心的相似性。將詞值矢量分配給與其最相似的質(zhì)心。在每個(gè) 詞值矢量被重新分配給群集之后,重復(fù)重新確定質(zhì)心和重新分配詞值 矢量的迭代。迭代重復(fù)直到滿足結(jié)束條件為止。在一些實(shí)施例中,結(jié) 束條件是何時(shí)滿足收斂準(zhǔn)則。收斂準(zhǔn)則可以是在完成迭代之后,沒(méi)有 詞值矢量被重新分配給不同的群集。在其它一些實(shí)施例中,結(jié)束條件 是已進(jìn)行了預(yù)定次數(shù)的迭代。應(yīng)當(dāng)意識(shí)到的是,可以使用可替選的聚類方式,諸如分級(jí)聚類、 模糊C均值算法以及其它。
在將評(píng)論分組成群集之后,識(shí)別評(píng)論群集的大小(508)。這簡(jiǎn)單
地為每個(gè)群集中評(píng)論的數(shù)目(用詞值矢量表示,不包括質(zhì)心)。
從每個(gè)群集中選擇評(píng)論(510)。在一些實(shí)施例中,與群集大小成 比例地從每個(gè)群集中選擇評(píng)論。從評(píng)論全集中選擇預(yù)定總數(shù)的評(píng)論, 以充當(dāng)評(píng)論全集的樣本。與群集大小成比例地從群集中選擇樣本中的 評(píng)論。與從較小的群集中選擇的樣本相比,從較大的群集中選擇的樣 本具有更多評(píng)論。在一些實(shí)施例中,極小的群集(例如少于預(yù)定數(shù)目
的評(píng)論或少于全集中總體評(píng)論數(shù)目的預(yù)定百分比)可以從評(píng)論選擇中 排除;沒(méi)有來(lái)自該群集的評(píng)論將會(huì)被選擇以包括在樣本中。如果群集 被排除,那么可以從其它群集中選擇一個(gè)或多個(gè)評(píng)論,使得樣本中評(píng) 論的數(shù)目達(dá)到預(yù)定的總數(shù)。
在一些實(shí)施例中,可以基于另外的預(yù)定標(biāo)準(zhǔn)從群集中選擇評(píng)論。 例如,可以基于評(píng)論的質(zhì)量從群集中選擇評(píng)論,如參考圖4在上面描 述的那樣。與低質(zhì)量的評(píng)論相比,高質(zhì)量的評(píng)論一般更富有信息并更 易于閱讀。這樣,例如,如果要從群集中選擇IO個(gè)評(píng)論,那么使用另 外的質(zhì)量標(biāo)準(zhǔn),可以選擇來(lái)自該群集的IO個(gè)最高質(zhì)量的評(píng)論。作為另 一個(gè)例子,可以基于與評(píng)論相關(guān)聯(lián)的評(píng)級(jí)從群集中選擇評(píng)論,如參考 圖3在上面描述的選擇過(guò)程那樣。更一般地,只要群集向評(píng)論樣本提 供與群集大小成比例的多個(gè)評(píng)論,就可以基于零或更多預(yù)定標(biāo)準(zhǔn)選擇
來(lái)自該群集的評(píng)論。
生成包括選擇的評(píng)論的響應(yīng)(512)。生成的響應(yīng)是被傳送到客戶 端102以便呈現(xiàn)并展示給用戶的文件。響應(yīng)文件包括關(guān)于主題的評(píng)論 概要。評(píng)論概要可以包括信息如關(guān)于主題的總體評(píng)級(jí)和可選的由評(píng)論 源給出的關(guān)于主題的集體評(píng)級(jí)。評(píng)論概要還包括評(píng)論樣本,所述評(píng)論樣本包括來(lái)自所選擇的評(píng)論的內(nèi)容,如參考圖2在上面描述的那樣。
通過(guò)聚類評(píng)論并且從群集中選擇評(píng)論,選擇表示評(píng)論的專題焦點(diǎn) 的評(píng)論樣本。聚類幫助評(píng)論引擎識(shí)別聚焦在主題的特殊方面的評(píng)論。 通過(guò)用評(píng)論聚焦在其上的方面分開(kāi)評(píng)論(成為群集)并且從群集中選 擇評(píng)論以便包括在評(píng)論樣本中,用戶在被顯示評(píng)論樣本之后,能夠更 好地理解主題的哪個(gè)方面特別值得注意,或者對(duì)于已具有關(guān)于主題方 面的經(jīng)驗(yàn)的其它用戶具有特殊的關(guān)注。
圖6是根據(jù)本發(fā)明的一些實(shí)施例的用于生成來(lái)自評(píng)論內(nèi)高質(zhì)量?jī)?nèi) 容的摘錄的過(guò)程的流程圖。為了節(jié)省時(shí)間,用戶可能優(yōu)選只閱讀部分 評(píng)論而不是評(píng)論的全部?jī)?nèi)容。評(píng)論引擎可以選擇評(píng)論內(nèi)的特定內(nèi)容以 包括在評(píng)論樣本中作為評(píng)論摘錄。
識(shí)別評(píng)論(602)。將所識(shí)別的評(píng)論分成區(qū)塊(604)。在一些實(shí) 施例中,區(qū)塊是評(píng)論的句子。亦即,評(píng)論的每個(gè)句子是評(píng)論的區(qū)塊。
可以基于句子分界符如句號(hào)來(lái)識(shí)別評(píng)論中的句子??赡苡羞@樣的情況 評(píng)論可能只有一個(gè)區(qū)塊,諸如當(dāng)評(píng)論只有一個(gè)句子時(shí)。為了便于說(shuō)明, 下面來(lái)描述圖5的過(guò)程,仿佛評(píng)論的區(qū)塊是評(píng)論的句子一樣。然而,
應(yīng)當(dāng)意識(shí)到的是,可以使用對(duì)評(píng)論進(jìn)行分區(qū)的可替選的方式(諸如z 個(gè)詞的區(qū)塊,其中z為預(yù)定的整數(shù))。
為評(píng)論的每個(gè)句子確定質(zhì)量分值(606)。關(guān)于評(píng)論句子的質(zhì)量分 值類似于關(guān)于評(píng)論的質(zhì)量分值,如參考圖4在上面描述的那樣。句子 質(zhì)量分值提供了評(píng)論的句子關(guān)于它們質(zhì)量的相對(duì)排序的基礎(chǔ)。質(zhì)量分 值可以基于一個(gè)或多個(gè)因素。可以基于因素中的每一個(gè)確定次分值。 使用類似于參考圖3在上面描述的權(quán)重求和方程,可以將次分值組合 成句子的質(zhì)量分值。在一些實(shí)施例中,預(yù)定因素包括句子的長(zhǎng)度、與 句子中的詞相關(guān)聯(lián)的值以及句子在評(píng)論之內(nèi)的位置。關(guān)于評(píng)論句子的長(zhǎng)度,不太長(zhǎng)也不太短的句子(亦即"合理長(zhǎng)度" 的句子)是有利的。極其短的句子可能不包括很多信息,而極其長(zhǎng)的 句子則可能難以閱讀。在一些實(shí)施例中,基于句子長(zhǎng)度的次分值可以 基于評(píng)論中的句子從預(yù)定"最優(yōu)"句子長(zhǎng)度的偏離。句子長(zhǎng)度可以基 于詞計(jì)數(shù)或字符計(jì)數(shù)。
關(guān)于與句子中的詞相關(guān)聯(lián)的值,具有高值詞的句子相對(duì)于具有低
值詞的句子是有利的。在一些實(shí)施例中,詞值基于與詞相關(guān)聯(lián)的反向 文件頻率(IDF)值,類似于參考圖4在上面描述的計(jì)分評(píng)論中使用的
詞值因素。對(duì)于句子,每個(gè)不同的詞在句子中的頻率被確定并乘以關(guān) 于該詞的IDF。針對(duì)評(píng)論的詞值次分值為
ws尸
其中,WVp為針對(duì)句子P的詞值次分值,4,p為詞w在句子P中 出現(xiàn)的次數(shù),并且log IDFw為針對(duì)詞w的IDF值的對(duì)數(shù)。
在其它一些實(shí)施例中,詞值基于在評(píng)論上下文中被認(rèn)為有價(jià)值的 詞的預(yù)定詞典??梢詾椴煌闹黝}類型限定分開(kāi)的詞典,因?yàn)椴煌?詞可能對(duì)于在關(guān)于不同主題類型的評(píng)論中的使用是有價(jià)值的。例如, 可能存在對(duì)于其中主題為產(chǎn)品的評(píng)論有價(jià)值的詞的詞典和對(duì)于其中主 題為提供商的評(píng)論有價(jià)值的詞的另一個(gè)詞典。在這些實(shí)施例中,詞值 次分值可以基于有多少預(yù)定詞典中的詞包括在各個(gè)句子中的計(jì)數(shù)。
關(guān)于句子在評(píng)論之內(nèi)的位置,在一些實(shí)施例中評(píng)論引擎可能偏好
在評(píng)論的開(kāi)頭出現(xiàn)的句子。這樣,基于位置的次分值就可以基于為評(píng)
論中的句子數(shù)目進(jìn)行歸一化的句子在評(píng)論中的位置。例如,對(duì)于具有 10個(gè)句子的評(píng)論中的第4個(gè)句子,關(guān)于該句子的位置次分值可以為4/10
=0.2。在確定關(guān)于句子的次分值之后,使用類似于參考圖4在上面描述 的公式,可以將次分值在數(shù)學(xué)上組合成關(guān)于句子的質(zhì)量分值。
識(shí)別評(píng)論句子的組合(608)。每個(gè)組合包括滿足預(yù)定長(zhǎng)度標(biāo)準(zhǔn)的
評(píng)論的一個(gè)或多個(gè)連續(xù)句子。在一些實(shí)施例中,長(zhǎng)度標(biāo)準(zhǔn)為組合的長(zhǎng)
度等于預(yù)定最大摘錄長(zhǎng)度(其可以基于詞計(jì)數(shù)或字符計(jì)數(shù))或者超過(guò)
最大摘錄長(zhǎng)度達(dá)組合中最后句子的一部分。下面通過(guò)偽代碼來(lái)說(shuō)明用
于識(shí)別組合的示范性算法
For each sentence i in the review: integer j = i combination i - sentence j
while (length(combination i) < max—snippet—length) combination i = combination i + sentence (++j)
如上面的偽代碼所示,組合作為評(píng)論中的一個(gè)句子開(kāi)始,并且隨 后的句子附加到組合中, 一直到并且包括使組合的長(zhǎng)度等于或大于最 大摘錄長(zhǎng)度的第一個(gè)句子。這樣,組合就是評(píng)論的盡可能多的連續(xù)句 子的拼接,而沒(méi)有使組合的長(zhǎng)度超過(guò)最大摘錄長(zhǎng)度,可能加上一個(gè)另 外的句子,其當(dāng)被添加到組合時(shí),使組合的長(zhǎng)度等于或大于最大摘錄長(zhǎng)度。
在其它一些實(shí)施例中,該算法可以被改進(jìn)以還考慮有多少要被附 加的句子將會(huì)在最大摘錄長(zhǎng)度之內(nèi),亦即,有多少"空間"保留在組 合內(nèi)以容納另外的句子。例如,可能更加值得的是,當(dāng)組合只比最大 摘錄長(zhǎng)度短一兩個(gè)詞時(shí),不將另外的句子附加到組合。
選擇具有最高組合質(zhì)量分值的組合(610)。在一些實(shí)施例中,關(guān) 于組合的組合質(zhì)量分值是組合之內(nèi)句子質(zhì)量分值的簡(jiǎn)單求和。在其它 一些實(shí)施例中,組合質(zhì)量分值可以是組合之內(nèi)句子質(zhì)量分值的加權(quán)求 和、簡(jiǎn)單平均或加權(quán)平均。
使用所選擇的組合生成摘錄(612)。摘錄包括所選擇的組合,直 到最大摘錄長(zhǎng)度。如果組合超過(guò)了最大摘錄長(zhǎng)度,則從組合的末尾截短內(nèi)容,直到組合的長(zhǎng)度等于最大摘錄長(zhǎng)度為止。在一些實(shí)施例中, 如果在截短到最大摘錄長(zhǎng)度之后,組合中的最后句子只有小部分(例 如一或兩個(gè)詞)保留,則組合可以被截短到比最大摘錄長(zhǎng)度短。換言 之,可能更加值得的是,如果在將組合截短到最大摘錄長(zhǎng)度之后,組 合中的最后句子只有幾個(gè)詞會(huì)保留,則通過(guò)去除該句子來(lái)進(jìn)行截短。
生成包括摘錄的響應(yīng)(614)。生成的響應(yīng)是被傳送到客戶端102 以便呈現(xiàn)并展示給用戶的文件。響應(yīng)文件包括關(guān)于主題的評(píng)論概要。 評(píng)論概要可以包括信息如關(guān)于主題的總體評(píng)級(jí)和可選的由評(píng)論源給出 的關(guān)于主題的集體評(píng)級(jí)。評(píng)論概要還包括評(píng)論樣本,所述評(píng)論樣本包
括來(lái)自所選擇的評(píng)論的內(nèi)容,如參考圖2在上面描述的那樣。
評(píng)論引擎106從它的評(píng)論儲(chǔ)存庫(kù)中選擇評(píng)論并且生成包括來(lái)自所 選擇的評(píng)論的內(nèi)容的響應(yīng)(諸如全部評(píng)論和/或摘錄)以便傳送到客戶 端102。圖3、 4和5圖示了用于選擇關(guān)于樣本的評(píng)論的三個(gè)過(guò)程。圖 6圖示了用于生成評(píng)論的摘錄的過(guò)程,該評(píng)論可以是在圖3、 4和/或5 的過(guò)程中選擇的評(píng)論。應(yīng)當(dāng)意識(shí)到的是可以將上述過(guò)程進(jìn)行組合。例 如,評(píng)論引擎106可以選擇對(duì)應(yīng)于總體分值落在其中的評(píng)級(jí)范圍并且 具有高質(zhì)量分值的多個(gè)評(píng)論。作為另一個(gè)例子,評(píng)論引擎106可以聚 類關(guān)于主題的評(píng)論,并且與群集大小成比例地從每個(gè)群集中選擇對(duì)應(yīng) 于總體分值落在其中的評(píng)級(jí)范圍并且具有高質(zhì)量分值的評(píng)論。生成這 些所選擇的評(píng)論的摘錄,并且生成包括摘錄的響應(yīng)。更一般地,可以 基于一個(gè)或多個(gè)預(yù)定標(biāo)準(zhǔn)選擇評(píng)論,并且這些評(píng)論的摘錄可以被生成 并包括在向客戶端102發(fā)送的響應(yīng)中。
圖7是圖示根據(jù)本發(fā)明的一些實(shí)施例的評(píng)論處理系統(tǒng)700的框圖。 系統(tǒng)700典型地包括一個(gè)或多個(gè)處理單元(CPU) 702、 一個(gè)或多個(gè)網(wǎng) 絡(luò)或其它通信接口 710、存儲(chǔ)器712以及用于互連這些部件的一個(gè)或多 個(gè)通信總線714。系統(tǒng)700可選地可以包括用戶接口 704,該用戶接口 704包括顯示裝置706和鍵盤/鼠標(biāo)708。存儲(chǔ)器712包括高速隨機(jī)存取存儲(chǔ)器如DRAM、 SRAM、 DDR RAM或其它隨機(jī)存取固態(tài)存儲(chǔ)裝置, 并且可以包括非易失性存儲(chǔ)器如一個(gè)或多個(gè)磁盤存儲(chǔ)裝置、光盤存儲(chǔ) 裝置、快閃存儲(chǔ)裝置或其它非易失性固態(tài)存儲(chǔ)裝置。存儲(chǔ)器712可以 可選地包括遠(yuǎn)離(一個(gè)或多個(gè))CPU702設(shè)置的一個(gè)或多個(gè)存儲(chǔ)裝置。 在一些實(shí)施例中,存儲(chǔ)器712存儲(chǔ)以下程序、模塊和數(shù)據(jù)結(jié)構(gòu)或其子 集
,操作系統(tǒng)716,其包括用于處理各種基本系統(tǒng)服務(wù)和用于執(zhí)行硬
件相關(guān)任務(wù)的過(guò)程;
*網(wǎng)絡(luò)通信模塊718,其用于經(jīng)由一個(gè)或多個(gè)通信網(wǎng)絡(luò)接口 710(有 線或無(wú)線)如因特網(wǎng)、其它廣域網(wǎng)、局域網(wǎng)、城域網(wǎng)等等將評(píng)論處理 系統(tǒng)700連接到其它計(jì)算機(jī);
評(píng)論存儲(chǔ)接口 720,其與評(píng)論存儲(chǔ)系統(tǒng)對(duì)接;
源識(shí)別模塊722,其識(shí)別評(píng)論的源;
評(píng)論識(shí)別模塊724,其識(shí)別來(lái)自評(píng)論源的評(píng)論和相關(guān)評(píng)級(jí); *總體評(píng)級(jí)模塊726,其確定關(guān)于主題的總體評(píng)級(jí),并且確定總體 評(píng)級(jí)落在哪個(gè)評(píng)級(jí)范圍之下;
評(píng)論質(zhì)量計(jì)分模塊728,其確定關(guān)于評(píng)論的質(zhì)量分值; 評(píng)論群集模塊730,其將評(píng)論組織成群集;
-評(píng)論區(qū)塊模塊732,其將評(píng)論分成區(qū)塊,確定關(guān)于區(qū)塊的質(zhì)量分 值,識(shí)別區(qū)塊的組合,并且選擇具有最高組合質(zhì)量分值的組合;
評(píng)論選擇模塊734,其基于一個(gè)或多個(gè)預(yù)定標(biāo)準(zhǔn)選擇評(píng)論;
,內(nèi)容過(guò)濾器736,其評(píng)估關(guān)于內(nèi)容滿足預(yù)定內(nèi)容標(biāo)準(zhǔn)如引起反對(duì) 的內(nèi)容的評(píng)論和評(píng)論區(qū)塊;以及
響應(yīng)生成模塊738,其生成包括評(píng)論和/或評(píng)論的摘錄的響應(yīng)。
系統(tǒng)700還包括評(píng)論存儲(chǔ)系統(tǒng)740。評(píng)論存儲(chǔ)系統(tǒng)740存儲(chǔ)評(píng)論和 相關(guān)評(píng)級(jí)。評(píng)論存儲(chǔ)系統(tǒng)740包括生成評(píng)論的摘錄的摘錄生成器742。 在一些實(shí)施例中,摘錄生成器742可以位于存儲(chǔ)器712中而不是評(píng)論 存儲(chǔ)系統(tǒng)740中。上述識(shí)別的元件中的每一個(gè)可以存儲(chǔ)在前面提到的存儲(chǔ)裝置中的 一個(gè)或多個(gè)中,并且對(duì)應(yīng)于用于執(zhí)行上述功能的指令集。上述識(shí)別的 模塊或程序(亦即指令集)不需要作為分開(kāi)的軟件程序、過(guò)程或模塊 來(lái)實(shí)現(xiàn),從而在各種實(shí)施例中這些模塊的不同子集可以組合或另外重 新布置。在一些實(shí)施例中,存儲(chǔ)器712可以存儲(chǔ)上述識(shí)別的模塊和數(shù) 據(jù)結(jié)構(gòu)的子集。進(jìn)而,存儲(chǔ)器712可以存儲(chǔ)在上面沒(méi)有描述的另外的 模塊和數(shù)據(jù)結(jié)構(gòu)。
盡管圖7示出了 "評(píng)論處理系統(tǒng)",但是圖7打算更多是作為各 種特征的功能描述,與作為在此描述的實(shí)施例的結(jié)構(gòu)示意相比,所述 特征可以存在于一組服務(wù)器中。實(shí)際上,并且如本領(lǐng)域技術(shù)人員認(rèn)識(shí) 到的那樣,分開(kāi)示出的項(xiàng)目能夠組合,而一些項(xiàng)目則能夠分開(kāi)。例如, 在圖7中分開(kāi)示出的一些項(xiàng)目能夠在單個(gè)服務(wù)器上實(shí)現(xiàn),而單個(gè)項(xiàng)目 則能夠由一個(gè)或多個(gè)服務(wù)器實(shí)現(xiàn)。用于實(shí)現(xiàn)評(píng)論處理系統(tǒng)的服務(wù)器的 實(shí)際數(shù)目和特征如何在它們之間進(jìn)行分配將會(huì)根據(jù)實(shí)施例的不同而改 變,并且可以部分地取決于該系統(tǒng)在峰值使用期期間以及平均使用期 期間必須處理的數(shù)據(jù)流量。
應(yīng)當(dāng)意識(shí)到的是,上面的描述不在它們的應(yīng)用方面被限制到純粹 文本的亦即由字符串組成的評(píng)論。該描述能夠適用于包括音頻、視頻 或其它形式的媒體的評(píng)論。例如,對(duì)于包括音頻的評(píng)論(諸如僅有音 頻的評(píng)論或者具有音頻軌道的視頻評(píng)論),可以使用本領(lǐng)域眾所周知 的語(yǔ)音到文本轉(zhuǎn)換將音頻轉(zhuǎn)換成文本。轉(zhuǎn)換的文本可以用作用于上述 選擇和摘錄生成過(guò)程的"評(píng)論"。音頻或視頻評(píng)論的摘錄會(huì)成為具有 如下語(yǔ)音的音頻或視頻的部分,所述語(yǔ)音具有基于評(píng)論的轉(zhuǎn)換文本為 摘錄選擇的詞。如果評(píng)論質(zhì)量是用于選擇音頻/視頻評(píng)論的標(biāo)準(zhǔn),則語(yǔ) 法質(zhì)量因素可以適用于媒體。例如,字母大寫在評(píng)論的內(nèi)容是語(yǔ)言而 不是文本時(shí)并不非常相關(guān),并從而能夠忽略不計(jì)。
為了說(shuō)明的目的,己參考特定實(shí)施例描述了前述說(shuō)明書(shū)。然而,示意性的上述討論不打算窮舉或?qū)⒈景l(fā)明限制到公開(kāi)的精確形式???慮到上述教導(dǎo),許多修改和改變都是可能的。實(shí)施例被選擇并描述, 以便最好地說(shuō)明本發(fā)明的原理及其實(shí)際應(yīng)用,以從而使得本領(lǐng)域技術(shù) 人員能夠最好地使用本發(fā)明和具有各種修改的各種實(shí)施例,如適于預(yù) 期特殊用途的那樣。
權(quán)利要求
1. 一種處理評(píng)論的方法,包括 識(shí)別多個(gè)評(píng)論;基于至少預(yù)定的質(zhì)量標(biāo)準(zhǔn)選擇所述多個(gè)評(píng)論的子集;以及 生成包括來(lái)自所選擇的子集的內(nèi)容的響應(yīng)。
2. 根據(jù)權(quán)利要求l所述的方法,其中,選擇包括基于至少所述 預(yù)定質(zhì)量標(biāo)準(zhǔn)和預(yù)定年齡標(biāo)準(zhǔn),選擇所述多個(gè)評(píng)論的子集。
3. 根據(jù)權(quán)利要求l所述的方法,其中,選擇包括基于至少所述 預(yù)定質(zhì)量標(biāo)準(zhǔn)和預(yù)定內(nèi)容標(biāo)準(zhǔn),選擇所述多個(gè)評(píng)論的子集。
4. 根據(jù)權(quán)利要求l所述的方法,其中,選擇包括基于至少所述 預(yù)定質(zhì)量標(biāo)準(zhǔn)和預(yù)定評(píng)級(jí)分值標(biāo)準(zhǔn),選擇所述多個(gè)評(píng)論的子集。
5. 根據(jù)權(quán)利要求1所述的方法,其中,選擇包括 基于由以下組成的組中的至少一個(gè)確定所述多個(gè)評(píng)論中的每一個(gè)的質(zhì)量分值各個(gè)評(píng)論的長(zhǎng)度、各個(gè)評(píng)論中句子的長(zhǎng)度、與各個(gè)評(píng)論 中的一個(gè)或多個(gè)詞相關(guān)聯(lián)的值以及各個(gè)評(píng)論的語(yǔ)法質(zhì)量;以及基于至少各個(gè)質(zhì)量分值選擇所述多個(gè)評(píng)論的子集。
6. 根據(jù)權(quán)利要求l所述的方法,其中,生成響應(yīng)包括生成所選 擇的子集中的多個(gè)評(píng)論的摘錄。
7. 根據(jù)權(quán)利要求6所述的方法,其中,生成評(píng)論的摘錄包括將所述評(píng)論區(qū)分成一個(gè)或多個(gè)區(qū)塊; 基于預(yù)定標(biāo)準(zhǔn)選擇所述區(qū)塊的子集;以及 生成包括來(lái)自所選擇的所述區(qū)塊的子集的內(nèi)容的摘錄。
8. —種用于處理評(píng)論的系統(tǒng),包括 一個(gè)或多個(gè)模塊,其包括以下指令-用于識(shí)別多個(gè)評(píng)論;用于基于至少預(yù)定的質(zhì)量標(biāo)準(zhǔn)選擇所述多個(gè)評(píng)論的子集;以及 用于生成包括來(lái)自所選擇子集的內(nèi)容的響應(yīng)。
9. 根據(jù)權(quán)利要求8所述的系統(tǒng),其中,所述一個(gè)或多個(gè)模塊包括以下指令用于基于至少所述預(yù)定質(zhì)量標(biāo)準(zhǔn)和預(yù)定年齡標(biāo)準(zhǔn),選擇所述多個(gè)評(píng)論的子集。
10. 根據(jù)權(quán)利要求8所述的系統(tǒng),其中,所述一個(gè)或多個(gè)模塊包括以下指令用于基于至少所述預(yù)定質(zhì)量標(biāo)準(zhǔn)和預(yù)定內(nèi)容標(biāo)準(zhǔn),選擇所述多個(gè)評(píng)論的子集。
11. 根據(jù)權(quán)利要求8所述的系統(tǒng),其中,所述一個(gè)或多個(gè)模塊包括以下指令用于基于至少所述預(yù)定質(zhì)量標(biāo)準(zhǔn)和預(yù)定評(píng)級(jí)分值標(biāo)準(zhǔn), 選擇所述多個(gè)評(píng)論的子集。
12. 根據(jù)權(quán)利要求8所述的系統(tǒng),其中,所述一個(gè)或多個(gè)模塊包括以下指令用于基于由以下組成的組中的至少一個(gè)確定關(guān)于所述多個(gè)評(píng)論中 的每一個(gè)的質(zhì)量分值各個(gè)評(píng)論的長(zhǎng)度、各個(gè)評(píng)論中句子的長(zhǎng)度、與 各個(gè)評(píng)論中的一個(gè)或多個(gè)詞相關(guān)聯(lián)的值以及各個(gè)評(píng)論的語(yǔ)法質(zhì)量;以及用于基于至少各個(gè)質(zhì)量分值選擇所述多個(gè)評(píng)論的子集。
13. 根據(jù)權(quán)利要求8所述的系統(tǒng),其中,所述一個(gè)或多個(gè)模塊包括以下指令用于生成所選擇的子集中的多個(gè)評(píng)論的摘錄。
14. 根據(jù)權(quán)利要求13所述的系統(tǒng),其中,所述一個(gè)或多個(gè)模塊包括以下指令用于將所述評(píng)論區(qū)分成一個(gè)或多個(gè)區(qū)塊; 用于基于預(yù)定標(biāo)準(zhǔn)選擇所述區(qū)塊的子集;以及 用于生成包括來(lái)自所述區(qū)塊的所選擇的子集的內(nèi)容的摘錄。
15. —種用于與計(jì)算機(jī)系統(tǒng)結(jié)合使用的計(jì)算機(jī)程序產(chǎn)品,所述計(jì) 算機(jī)程序產(chǎn)品包括計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)和嵌入其中的計(jì)算機(jī)程序機(jī) 制,所述計(jì)算機(jī)程序機(jī)制包括指令,所述指令用于識(shí)別多個(gè)評(píng)論;基于至少預(yù)定的質(zhì)量標(biāo)準(zhǔn)選擇所述多個(gè)評(píng)論的子集;以及 生成包括來(lái)自所選擇的子集的內(nèi)容的響應(yīng)。
16. 根據(jù)權(quán)利要求15所述的計(jì)算機(jī)程序產(chǎn)品,其中,用于選擇的 所述指令包括指令用于基于由以下組成的組中的至少一個(gè)確定關(guān)于所述多個(gè)評(píng)論中的每 一個(gè)的質(zhì)量分值各個(gè)評(píng)論的長(zhǎng)度、各個(gè)評(píng)論中句子的長(zhǎng)度、與各個(gè) 評(píng)論中的一個(gè)或多個(gè)詞相關(guān)聯(lián)的值以及各個(gè)評(píng)論的語(yǔ)法質(zhì)量;以及基于至少各個(gè)質(zhì)量分值選擇所述多個(gè)評(píng)論的子集。
17. 根據(jù)權(quán)利要求15所述的計(jì)算機(jī)程序產(chǎn)品,其中,用于生成響 應(yīng)的所述指令包括用于生成所選擇的子集中的多個(gè)評(píng)論的摘錄的指 令。
18. 根據(jù)權(quán)利要求n所述的計(jì)算機(jī)程序產(chǎn)品,其中,用于生成評(píng)論的摘錄的所述指令包括指令用于將所述評(píng)論區(qū)分成一個(gè)或多個(gè)區(qū)塊; 基于預(yù)定標(biāo)準(zhǔn)選擇所述區(qū)塊的子集;以及 生成包括來(lái)自所述區(qū)塊的所選擇的子集的內(nèi)容的摘錄。
19. 一種用于處理評(píng)論的系統(tǒng),包括用于識(shí)別多個(gè)評(píng)論的裝置;用于基于至少預(yù)定的質(zhì)量標(biāo)準(zhǔn)選擇所述多個(gè)評(píng)論的子集的裝置;以及用于生成包括來(lái)自所選擇的子集的內(nèi)容的響應(yīng)的裝置。
全文摘要
描述了選擇用于顯示的評(píng)論的方法和系統(tǒng)。識(shí)別關(guān)于主題的評(píng)論?;陬A(yù)定質(zhì)量標(biāo)準(zhǔn)選擇所識(shí)別評(píng)論的子集。選擇還可以基于零或更多其它預(yù)定標(biāo)準(zhǔn)。生成包括來(lái)自所選擇的評(píng)論的內(nèi)容的響應(yīng)。內(nèi)容可以包括選擇的評(píng)論中的至少一些的全部?jī)?nèi)容或摘錄。
文檔編號(hào)G06Q99/00GK101313330SQ200680043620
公開(kāi)日2008年11月26日 申請(qǐng)日期2006年9月29日 優(yōu)先權(quán)日2005年9月30日
發(fā)明者庫(kù)沙爾·B·戴夫, 杰里米·A·希爾頓 申請(qǐng)人:谷歌公司