欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

基于用戶意圖的信息搜索方法以及信息提供方法

文檔序號:6595769閱讀:308來源:國知局
專利名稱:基于用戶意圖的信息搜索方法以及信息提供方法
技術(shù)領(lǐng)域
本發(fā)明涉及能夠基于自然語言的作為關(guān)鍵字的單詞、短語以及句子來提供并搜索信息以及能夠基于用戶的意圖來更為精確地提供并搜索信息的多功能搜索方法及系統(tǒng)。
背景技術(shù)
近年來,開發(fā)對信息及內(nèi)容提供者、消費者的擴大以及各種信息提供媒體進行融合的技術(shù)的需求正在加大。典型的融合技術(shù)的示例可包括對有線和無線廣播及通信技術(shù)、 綜合信息網(wǎng)絡(luò)服務(wù)技術(shù)以及便于各個用戶層的用戶接口技術(shù)開發(fā)進行融合的融合技術(shù)。在該技術(shù)的詳細(xì)內(nèi)容中,期望開發(fā)信息市場技術(shù),以滿足信息內(nèi)容的用戶的口味和意圖,并通過自動分析特性以及對所提供的內(nèi)容及信息或?qū)⒂捎嬎銠C提供的內(nèi)容及信息進行語意分析,通過方便和不同的方法來建議和提供信息內(nèi)容。例如,公開號為10-2006-0043333 的韓國專利申請(SYSTEM AND METHOD FOR DETERMINING INTENTION OF DATA AND RESPONDING TO DATA BASED ON INTENTION)公開了一種便于數(shù)據(jù)處理的系統(tǒng)。該系統(tǒng)是包括數(shù)據(jù)管理器和用于接收數(shù)據(jù)的組件的系統(tǒng),所述數(shù)據(jù)管理器用于確定所述數(shù)據(jù)的意圖、基于該意圖來至少對數(shù)據(jù)子集進行重新系統(tǒng)化以及將重新系統(tǒng)化后的數(shù)據(jù)自動提供給用戶。該數(shù)據(jù)管理器為用于分析所述數(shù)據(jù)、將所述數(shù)據(jù)分類成具有相關(guān)特征的至少一個組、從至少一個數(shù)據(jù)組中提取特征以形成數(shù)據(jù)子集的系統(tǒng)。可選地,所述數(shù)據(jù)管理器是使用元數(shù)據(jù)、屬性、內(nèi)容、上下文、關(guān)鍵字、歷史、試探法、推理、規(guī)則、劃分(damarcation)、時間、日期、相關(guān)處理成本、相關(guān)處理收益以及數(shù)據(jù)源中的至少一者來促成數(shù)據(jù)分析的系統(tǒng),其中至少部分地基于語法結(jié)構(gòu)、語法屬性、語言結(jié)構(gòu)以及語言屬性來提取所述特征。所述語言特征是包括根據(jù)句子生成的單詞、根據(jù)句子生成的雙單詞(word bigram)以及根據(jù)句子生成的三單詞(word trigram)中的至少一者的系統(tǒng)。公開號為2002-0028593 的韓國專利申請(METHOD FOR ISOLATING HARMFUL WORD) 公開了一種用于隔離有害單詞(harmful word)的方法,該方法包括允許計算機用戶輸入會員信息并訪問管理服務(wù)器,允許計算機用戶輸入用于注冊/傳送的信息至所述管理服務(wù)器所顯示的信息輸入屏幕,允許用于將有害單詞與管理服務(wù)器相隔離的模塊確定有害單詞是否包含在計算機用戶輸入的信息中,以及允許管理服務(wù)器根據(jù)用于隔離有害單詞的模塊的判斷結(jié)果來隔離與計算機用戶的連接或注冊/傳送信息。假定所述有害單詞指的是行話(jargon)、俚語、涉及性隔離或性格隔離的單詞,則公開號為2002-0028593的韓國專利申請包括在所傳送的消息不包括這些有害單詞時連續(xù)執(zhí)行聊天的處理模塊。公開號為的 2002-0028593的韓國專利申請是以聊天中的消息是否包括有害單詞為基礎(chǔ)的。公開號為10-2006-0062300 的韓國專利申請(MULTISTAGE TEXT FILTERING METHOD FOR ISOLATING HARMFUL SITE)公開了一種用于隔離有害站點的多級文本過濾方法,該方法包括根據(jù)淫穢程度及文本將要被用作用于隔離色情站點的數(shù)據(jù)的所述文本劃分為至少一個組,之后對所述文本進行數(shù)據(jù)庫處理;從訪問網(wǎng)站收集所述文本;以及通過將所述文本與所述組內(nèi)的文本進行比較以確定所述訪問網(wǎng)站是否被隔離,來執(zhí)行至少一個多級過濾,從而根據(jù)所述文本中的淫穢程度對有害站點進行隔離。公開號為10-2006-0062300 的韓國專利申請(A SYSTEM AND METHOD FOR PROVIDING IMPROVED SPAM MESSAGE FILTERING)公開了一種用于提供垃圾消息過濾的方法,該方法包括無線網(wǎng)絡(luò)服務(wù)器接收將從呼叫方終端傳送到用戶終端的消息;語料庫DB 存儲自然語言句子及其附屬信息的使用示例,且為大型語言DB(數(shù)據(jù)庫);詞匯分析單元檢測所述無線網(wǎng)絡(luò)服務(wù)器內(nèi)的消息的接收,并從包含在接收到的消息中的句子中提取至少一個名詞型關(guān)鍵字;語料庫搜索裝置選擇被提取的名詞型關(guān)鍵字中的至少一個名詞型關(guān)鍵字,并搜索在包含在所述語料庫DB的每個用戶類別中的每個句子內(nèi)的垃圾信息使用頻率以及在包含在用戶類別之外的類別中的句子中的基本使用頻率;當(dāng)至少一個垃圾信息使用頻率以及基本使用頻率被輸入時,概率計算單元計算包含所選名詞型關(guān)鍵字的句子被包含于用戶類別中的概率;以及過濾控制器控制所述詞匯分析單元和語料庫搜索裝置以使得所述概率計算單元計算每一名詞型關(guān)鍵字被包含于垃圾消息內(nèi)的概率,判斷接收到的消息是否為垃圾消息,并將判斷結(jié)果傳送至無線電網(wǎng)絡(luò)服務(wù)器。公開號為10-2008-0000416 的韓國專利申請(FILTERING SYSTEM FOR HARMFUL MES SAGE AND METHOD THEREOF AND RECORDING MEDIUM THEREOF)公開了一種利用用于對網(wǎng)絡(luò)社區(qū)上的有害消息進行過濾的過濾系統(tǒng)來對有害消息進行分類的技術(shù)領(lǐng)域。該專利申請?zhí)峁┑姆椒軌蛲ㄟ^提供智能垃圾過濾技術(shù),來在反垃圾市場內(nèi)實現(xiàn)高的適銷性。針對有害消息的過濾系統(tǒng)包括數(shù)據(jù)庫,用于存儲接收自客戶端的消息;消息接收器,用于接收所述消息;單詞提取單元,用于從接收到的消息中提取多個單詞;以及評估單元,用于通過使用所提取的單詞來判斷所述消息是否有害,并將其存儲于數(shù)據(jù)庫中,并且所述評估單元使用存儲在所述數(shù)據(jù)庫中的單詞評估值來判斷所述消息是否為有害消息,之后該消息被分類為多個有害消息。注冊號為10-0484944 的韓國專禾U (SYSTEM FOR AUTOMATICALLY TAGGING SEMANTICS OF MORPHEME BASED ON LOCAL SYNTAX RELATION AND SEMANTIC CO-OCCURRENCE DICTIONARY)公開了一種基于本地短語關(guān)系以及語義共現(xiàn)(cooccurrence)目錄的自動語素語義標(biāo)記系統(tǒng),該系統(tǒng)包括短句識別器,用于通過使用基本語法生成規(guī)則、從屬語法規(guī)則、電子語素語意目錄、語義框架以及經(jīng)由對原始句子的語素分析生成的可變格短語共現(xiàn)目錄,來對短句進行識別;助詞格恢復(fù)模塊,用于通過使用語義框架以及可變格短語語義共現(xiàn)目錄,來執(zhí)行針對助詞的格恢復(fù);爭議名詞(argument noun)語意確定模塊,用于通過使用可變格短語語義共現(xiàn)目錄來確定爭議名詞的語意;名詞短語語意確定模塊,用于通過使用名詞短語語意共現(xiàn)目錄(由名詞/介詞/名詞以及名詞/名詞共現(xiàn)信息配置而成)來確定名詞短語和復(fù)合名詞內(nèi)的名詞的語意。自動語素語義標(biāo)記系統(tǒng)使用語言方面的語法結(jié)構(gòu)信息來使用語法上下文信息(其是比現(xiàn)有的其他語義歧義裝置更為精確的共現(xiàn)信息),從而提出了一種用于解決名詞的語意歧義的方法。注冊號為10-0757951 的韓國專利(SEARCH METHOD USING MORPHEME ANALYZING IN WEB PAGE)公開了一種通過對網(wǎng)頁進行語素分析的搜索方法,該方法包括如果客戶端用戶通過分頁式瀏覽器(tab browser)連接至網(wǎng)站,則將所連接的網(wǎng)站的內(nèi)容顯示給該分頁式瀏覽器;通過由分析服務(wù)器對顯示至客戶端的分頁式瀏覽器的內(nèi)容執(zhí)行上下文語素分析,來辨別重復(fù)句子或單詞的頻率;從被識別的單詞中選擇具有預(yù)定頻率值或更高頻率值的句子及單詞作為關(guān)鍵字(即,很重要的單詞);輸出所選的重要單詞作為每一分頁式瀏覽器的標(biāo)題;對將每一分頁式瀏覽器的標(biāo)題作為入口網(wǎng)站的查詢字進行搜索,并將搜索結(jié)果作為每一分頁式瀏覽器的內(nèi)容進行輸出;在分析服務(wù)器中,提供信息至客戶端(諸如,筆記本、移動電話、PDA等)。該專利利用搜索系統(tǒng)的一種方法論,通過語素處理,來計算句子及單詞出現(xiàn)于文本內(nèi)的次數(shù),將分頁式瀏覽器標(biāo)題作為關(guān)鍵字進行輸出。注冊號為10-0691400 的韓國專利(METHOD FOR ANALYZING MORPHEME USING ADDITIONAL INFORMATION AND MORPHEME ANALYZER FOR EXECUTING THE METHOD)公開了一種用于分析語素的方法,該方法包括從索引數(shù)據(jù)中獲取語素分析對象以及與該語素分析對象相關(guān)聯(lián)的附加信息;基于該附加信息,生成關(guān)鍵點(key);以及使用該關(guān)鍵點對語素分析對象執(zhí)行語素分析。公開號為10-2007-0029389 的韓國專利申請(METHOD AND SYSTEM FOR PROVIDING ADVERTISEMENT SERVICE USING CORE KEYWORD AND RECORD MEDIA RECORDED PROGRAM FOR REALIZING THE SAME)公開了一種記錄介質(zhì),該記錄介質(zhì)可由數(shù)字處理裝置讀取,且其上實施有命令字,該命令字可由數(shù)字處理裝置執(zhí)行以通過使用核心關(guān)鍵字來提供關(guān)鍵字廣告服務(wù),包括通過分析內(nèi)容文本的語素來提取關(guān)鍵字;通過與廣告關(guān)鍵字DB服務(wù)器進行交互, 確定核心關(guān)鍵字;通過與廣告DB服務(wù)器進行交互,接收與所述核心關(guān)鍵字相匹配的廣告列表;以及將包含于該廣告列表內(nèi)的至少一廣告插入至所述內(nèi)容文本中。公開號為10-2006-0011333 的韓國專利申請(SYSTEM AND METHOD FOR PROVIDING LOCAL INFORMATION BY MESSAGE ANALYSIS)公開了一種用于提供本地信息的系統(tǒng),該系統(tǒng)包括數(shù)據(jù)庫,用于存儲每一區(qū)域及商業(yè)類型的廣告信息;消息識別單元,用于分析存儲的短消息或存儲的文本消息;語音識別單元,用于分析存儲的語音消息;位置信息收集單元, 用于檢查訂閱者終端的當(dāng)前位置;服務(wù)控制器,用于向消息識別單元及語音識別單元請求與服務(wù)訂閱者相關(guān)的消息是否已被存儲,檢查接收到的消息分析結(jié)果,向位置信息收集單元請求訂閱者終端的當(dāng)前位置信息,以及根據(jù)消息分析結(jié)果向訂閱者終端提供期望的商業(yè)類型及區(qū)域信息;以及SMS生成單元,用于從數(shù)據(jù)庫搜索信息,將搜索結(jié)果添加至短消息中,并將其傳送至訂閱者終端。公開號為10-2007-0015752 的韓國專利申請(SYSTEM AND METHOD FOR AD TRIGGERING MESSAGING SERVICE BASED ON MOBILE MESSAGING SERVICE)公開了一種用于 AD觸發(fā)消息服務(wù)的系統(tǒng),該系統(tǒng)包括消息服務(wù)器,用于在通過對傳送自呼叫方終端的消息進行分析而檢測到AD觸發(fā)標(biāo)識符時,在將預(yù)定AD消息傳送至呼叫方終端之后,傳送消息內(nèi)容至接收終端。注冊號為10-0775680 的韓國專禾U (METHOD AND SYSTEM FOR PROVIDING ADVERTISEMENT CONTENTS BY USING CHATTING IN MOBILE TERMINAL)公開了一種用于通過無線通信網(wǎng)絡(luò)來在移動通信終端與服務(wù)器之間通過messager (—種聊天軟件)收發(fā)消息的方法,該方法包括判斷連接至服務(wù)器的移動通信終端是否從聊天伙伴中選擇任何虛擬聊天伙伴;根據(jù)移動通信終端的用戶偏好信息來在服務(wù)器中提取AD內(nèi)容產(chǎn)品的聊天場景,以根據(jù)場景規(guī)則來將消息傳送至移動通信終端;傳送移動通信終端中的針對所述服務(wù)器的消息的響應(yīng)消息;對在服務(wù)器內(nèi)接收到的移動通信終端的消息進行分析,并根據(jù)用戶的意圖以及場景規(guī)則來傳送請求AD內(nèi)容信息推薦許可的消息至移動通信終端;當(dāng)從所述移動通信終端向服務(wù)器傳送允許AD內(nèi)容信息推薦的消息時,傳送AD內(nèi)容信息至移動通信終端;以及在服務(wù)器內(nèi),在傳送消息至移動通信終端之前,通過對移動通信終端的消息進行分析,來將messager的特征狀態(tài)調(diào)整成與用戶的意圖相對應(yīng)。注冊號為10-05974 的韓國專禾U (SYSTEM AND METHOD FOR CLASSIFYING QUESTION BASED ON HYBRID OF INFORMATION SEARCH AND QUESTION ANSWER SYSTEM)公開了一種基于信息搜索及問答系統(tǒng)的混合來對問題進行分類的系統(tǒng)及方法,其包括被問化名(questioned work name)處理器,用于識別包含于所輸入問題內(nèi)的化名;問題語言分析器,用于通過語素分析過程、對象名稱識別過程以及單詞語意標(biāo)記過程,來將每一單詞轉(zhuǎn)換為語義代碼;基于規(guī)則的問題分類器,用于通過使用問題的LSP(詞匯語法模式)代碼以及預(yù)定義問題分類規(guī)則,來對問題所請求的答案類型進行分類;基于統(tǒng)計的問題分類器,用于通過使用在標(biāo)記答案類型的學(xué)習(xí)文檔中構(gòu)建的統(tǒng)計信息,來對問題的LSP代碼進行分類; 以及被問答案類型確定器,用于通過使用上述兩個分類器的結(jié)果,來最終確定用戶問題的答案類型。注冊號為10-0361166 的韓國專禾U (SYSTEM AND METHOD FOR SEARCHING INFORMATION)公開了一種用于搜索信息的系統(tǒng)及方法,其包括處理裝置,該處理裝置在數(shù)據(jù)庫(該數(shù)據(jù)庫根據(jù)領(lǐng)域來對多個信息進行分類,將代碼分配至每一分類領(lǐng)域,并結(jié)合每一領(lǐng)域的代碼來對表示包含于相應(yīng)領(lǐng)域內(nèi)的多個信息的單詞進行編碼)通過使用通信裝置、經(jīng)由網(wǎng)絡(luò)訪問用戶搜索數(shù)據(jù)之后,當(dāng)輸入表明待搜索的信息或相應(yīng)信息所屬的領(lǐng)域的單詞時,對輸入單詞進行編碼,并基于編碼后的單詞來對數(shù)據(jù)庫進行搜索以搜索與該編碼單詞相對應(yīng)的信息。其中存儲于數(shù)據(jù)庫內(nèi)的信息被分類為多個信息區(qū),每一信息區(qū)被分配有信息分類代碼,該信息分類代碼被分類至至少一個詳細(xì)信息區(qū)中,結(jié)合相應(yīng)信息區(qū)的信息分類代碼來對該詳細(xì)信息區(qū)進行編碼,表示相應(yīng)信息的多個單詞內(nèi)相互之間具有相同或類似語意的單詞由同一代碼進行存儲,以系序(set order)來對每一字代碼進行排列。公開號為10-2005-00擬955 的韓國專利申請(SYSTEM AND METHOD FOR ONLINE AD INCLUDING COPY OF ADVERTISER FIT FOR CONTENTS)公開了一種用于進行在線廣告的系統(tǒng)及方法,其包括第一存儲裝置,用于存儲將被廣告的信息;第二存儲裝置,用于存儲原始內(nèi)容;至少一個服務(wù)器,用于從所述第二存儲裝置獲取原始內(nèi)容,通過自然語言處理機制對該原始內(nèi)容進行分析,從所述第一存儲裝置獲取與分析結(jié)果相對應(yīng)的將被廣告的信息,并將廣告信息中的詞性(part)信息插入所述原始內(nèi)容中;以及第三存儲裝置,用于通過所述至少一個服務(wù)器來對插有廣告信息的內(nèi)容進行存儲。注冊號為10-0669534 的韓國專利(METHOD AND SYSTEM FOR EXTRACTING SUMMARY OF DOCUMENT BY UTILIZING SENTENCE ABSTRACTION AND ABDUCTION RULES)公開了一種通過使用句子抽象及逆推規(guī)則來對文檔進行概括的方法,其包括句子輸入,用于輸入并存儲將被概括的文檔內(nèi)容;語法分析,用于對所述步驟內(nèi)存儲的數(shù)據(jù)的語法進行分析并存儲; 句子主要成分提取,用于在該步驟處順序讀取語法數(shù)據(jù),并存儲本體數(shù)據(jù);句子抽象化,用于通過將所述步驟處的本體數(shù)據(jù)值與識別上限信息(該識別上限信息為針對包含于每一所選主要成分內(nèi)的語意的預(yù)定分類參考)進行比較,將每一所選主要成分理解為抽象語意;主題句選擇,用于在所述步驟處讀取被存儲的值,并將讀取的存儲值輸入至逆推規(guī)則程序可移動裝置單元中,以選擇語法之間具有逆推性的多個主題句,并存儲該多個所選主題句的每一識別值;概要寫入,用于在所述步驟處讀取針對被存儲并被選擇的主要成分而理解的抽象語意的相應(yīng)值,并將讀取的值作為語法概要句子進行組合和存儲;概要句子輸出, 用于確定是否存在輸出控制信號,如果存在,則在該步驟處通過輸出單元的操作來輸出并顯示存儲的數(shù)據(jù)值。注冊號為10-0836878 的韓國專利(APPARATUS AND METHOD FOR ALLOCATION OF SUBJECT OR FIELD IN INFORMATION SEARCH SYSTEM)是用于在信息搜索系統(tǒng)內(nèi)分配主題或字段的設(shè)備,所述信息搜索系統(tǒng)連接至用戶終端、網(wǎng)絡(luò)入口站點、網(wǎng)站,對信息進行搜索并提供搜索到的信息,信息搜索服務(wù)器包括搜索引擎,用于基于與查詢字或文檔相對應(yīng)的索引字來對文檔執(zhí)行信息搜索;數(shù)據(jù)庫,用于對搜索引擎搜索到的信息進行存儲和管理; 同義詞匹配單元,用于從存儲于所述數(shù)據(jù)庫內(nèi)的原始句子中提取所述索引字,并通過該索引字執(zhí)行同義詞匹配,以對所述原始句子執(zhí)行主題或域分配;分眾分類(folksonomy)處理器,用于從存儲于所述數(shù)據(jù)庫內(nèi)的定義句子中提取術(shù)語,通過提取的術(shù)語來分配所述主題并使用分眾分類法來分配域。此外,大型信息搜索門戶網(wǎng)站(諸如,谷歌、雅虎等)所使用的信息搜索系統(tǒng)是以搜索鍵類型的“單詞”單元為基礎(chǔ)的。雖然可執(zhí)行“短語”輸入,但當(dāng)前技術(shù)通過邏輯運算符 (與、或、非)而非通過根據(jù)高技術(shù)“短語”的語言處理方法來連接基于N元語法的索引鍵, 以給出搜索結(jié)果,從而在改善信息搜索的再生及精確性方面存在局限性。特別地,“移動信息搜索”技術(shù)已作為下一代信息搜索領(lǐng)域而嶄露頭角,并且正在提出并討論作為“語義網(wǎng)” 技術(shù)飛新的網(wǎng)絡(luò)搜索技術(shù)。然而,截至目前為止,并不存在具體的成功示例。

發(fā)明內(nèi)容
本發(fā)明被設(shè)計為解決上述問題。本發(fā)明的目標(biāo)為提供用于搜索多功能綜合信息 (integration information)的方法及系統(tǒng),該方法及系統(tǒng)能夠通過將單詞單元用作關(guān)鍵字來擴展信息搜索系統(tǒng)內(nèi)的短語單元及句子單元內(nèi)的搜索鍵,以使信息搜索系統(tǒng)的用戶界面更為便利,并且能夠執(zhí)行多功能綜合處理(諸如信息的供應(yīng)、搜索、分類、評估、監(jiān)視等)。此外,本發(fā)明的另一目標(biāo)為提供一種用于搜索多功能綜合信息的方法及系統(tǒng),該方法及系統(tǒng)能夠檢測信息搜索者或信息提供者的意圖,并基于檢測到的意圖來提供信息結(jié)^ ο為實現(xiàn)上述目標(biāo),根據(jù)本發(fā)明的示例性實施方式,提供一種用于搜索信息的方法, 該方法包括通過使用針對關(guān)鍵字的分析結(jié)果來檢測搜索者的意圖;向所述搜索者提供符合所述搜索者的意圖的編輯器;以及對具有與通過所述編輯器的輸入項輸入的元數(shù)據(jù)相關(guān)聯(lián)的內(nèi)容進行搜索。所述用于搜索信息的方法可進一步包括將輸入的關(guān)鍵字分離為語意單詞;以及對分離后的關(guān)鍵字執(zhí)行語法分析,其中,對搜索者的意圖進行檢測可以通過使用執(zhí)行所述語法分析時的語法分析結(jié)果來檢測搜索者的意圖。所述語法分析的執(zhí)行可以輸出語法表達(dá)式來作為語法分析結(jié)果,其中,可以通過分析句子內(nèi)分離后的單詞是否具有任何文法關(guān)系以及語義關(guān)聯(lián)來獲取所述語法表達(dá)式。所述語法表達(dá)式可為邏輯表達(dá)式、修飾-被修飾以及語法列表表達(dá)式中的至少一
者ο
所述語法分析的執(zhí)行可參考語法文法規(guī)則字典,以分析句子內(nèi)分離后的單詞是否具有任何文法關(guān)系以及語義關(guān)聯(lián),且所述語法文法規(guī)則字典可列有短語結(jié)構(gòu)文法、格文法、 敏感文法(sensitive grammar)以及詞匯文法中的至少一者。所述分離可針對每個詞性(part)來對所述關(guān)鍵字進行分離。所述分離可通過參考與每個單詞的詞性相關(guān)的信息來針對每個詞性對所述關(guān)鍵字進行分離,所述信息以數(shù)據(jù)庫方式存儲于語素字典內(nèi)。所述用于搜索信息的方法可進一步包括提取內(nèi)容的符合搜索者意圖的元數(shù)據(jù),其中所述編輯器的提供可提供作為符合搜索者的意圖的編輯器的編輯器,在該編輯器中,被提取的元數(shù)據(jù)成為輸入項。所述用于搜索信息的方法可進一步包括通過參考信息提供者的意圖來確定用于執(zhí)行搜索的目錄,其中所述搜索可對與所確定的目錄相同或相似的目錄中的內(nèi)容進行搜索。所述關(guān)鍵字可為單詞單元、短語單元以及句子單元中的任一者。所述搜索可對具有與通過所述編輯器的輸入項輸入的元數(shù)據(jù)中的至少一者相同的元數(shù)據(jù)、或具有與通過所述編輯器的輸入項輸入的元數(shù)據(jù)中的至少一者同義的元數(shù)據(jù)的內(nèi)容進行搜索。所述用于搜索信息的方法可進一步包括在搜索時將附加服務(wù)添加至搜索結(jié)果。所述附加服務(wù)可為內(nèi)容上下文認(rèn)知服務(wù),并且該內(nèi)容上下文認(rèn)知服務(wù)可包括以下各項中的至少一者導(dǎo)航服務(wù)、銷售服務(wù)、廣告服務(wù)、教育服務(wù)、咨詢服務(wù)、推薦服務(wù)以及行政月艮務(wù)(administrative service)。所述編輯器的輸入項中的至少一個輸入項可以作為通過使用所述關(guān)鍵字生成的實際數(shù)據(jù)(real data)而被自動輸入。所述用于搜索信息的方法可進一步包括通過將輸入的元數(shù)據(jù)與用于配置被搜索內(nèi)容的元數(shù)據(jù)進行比較,來分別選擇并輸出具有高度一致性的內(nèi)容。根據(jù)本發(fā)明另一示例性實施方式,提供一種提供用于搜索的信息的方法,該方法包括通過使用針對包含于信息內(nèi)的文本的分析結(jié)果,來檢測提供所述信息的信息提供者的意圖;將符合所述信息提供者的意圖的編輯器提供給用戶;以及將對通過所述編輯器的輸入項輸入的元數(shù)據(jù)進行整合的內(nèi)容進行存儲。所述提供用于搜索的信息的方法可進一步包括將包含于輸入信息內(nèi)的文本分離成語意單詞;以及對分離后的關(guān)鍵字執(zhí)行語法分析,其中對信息提供者的意圖進行檢測可以通過使用執(zhí)行所述語法分析時的語法分析結(jié)果來檢測提供信息的信息提供者的意圖。所述語法分析的執(zhí)行可以輸出語法表達(dá)式來作為語法分析結(jié)果,其中,可以通過分析句子內(nèi)分離后的單詞是否具有任何文法關(guān)系以及語義關(guān)聯(lián)來獲取所述語法表達(dá)式。所述語法表達(dá)式可為邏輯表達(dá)式、修飾-被修飾以及語法列表表達(dá)式中的至少一者ο所述語法分析的執(zhí)行可參考語法文法規(guī)則字典,以分析句子內(nèi)分離后的單詞是否具有任何文法關(guān)系以及語義關(guān)聯(lián),且所述語法文法規(guī)則字典可列有短語結(jié)構(gòu)文法、格文法、 敏感文法以及詞匯文法中的至少一者。所述分離可針對每個詞性來對所述文本進行分離。
所述分離可通過參考與每個單詞的詞性相關(guān)的信息來將針對每個詞性對所述文本進行分離,所述信息以數(shù)據(jù)庫方式存儲于語素字典內(nèi)。所述提供用于搜索的信息的方法可進一步包括提取內(nèi)容的符合信息提供者的意圖的元數(shù)據(jù),其中所述編輯器的提供可提供作為符合信息提供者的意圖的編輯器的編輯器,在該編輯器中,被提取的元數(shù)據(jù)成為輸入項。所述提供用于搜索的信息的方法可進一步包括通過參考信息提供者的意圖來確定存儲所述信息的目錄,其中內(nèi)容的存儲可以將所述內(nèi)容存儲于所確定的目錄內(nèi)。所述提供用于搜索的信息的方法可進一步包括對包含于針對每一目錄劃分的內(nèi)容內(nèi)的文本進行收集,其中所述檢測可使用對收集到的文本的分析結(jié)果。根據(jù)本發(fā)明的另一示例性實施方式,提供一種提供用于搜索的信息的方法,該方法包括對包含于針對每一目錄劃分的內(nèi)容內(nèi)的文本進行收集;通過使用針對收集到的文本的分析結(jié)果,來檢測提供信息的信息提供者的意圖;將符合信息提供者的意圖的編輯器提供給用戶;以及將對通過所述編輯器的輸入項輸入的元數(shù)據(jù)進行整合的內(nèi)容進行存儲。根據(jù)本發(fā)明的另一示例性實施方式,提供一種用于搜索信息的方法,該方法包括 接收關(guān)鍵字;接收輸入所述關(guān)鍵字的搜索者的意圖;將符合最終意圖的編輯器提供給所述搜索者,所述最終意圖整合了針對所述關(guān)鍵字的分析結(jié)果以及所述搜索者的意圖;以及對具有與通過所述編輯器的輸入項輸入的元數(shù)據(jù)相關(guān)聯(lián)的元數(shù)據(jù)的內(nèi)容進行搜索。所述用于搜索信息的方法可進一步包括將輸入的關(guān)鍵字分離成語意單詞;以及對分離后的關(guān)鍵字執(zhí)行語法分析,其中所述編輯器的提供可使用執(zhí)行所述語法分析時的語法分析結(jié)果。根據(jù)本發(fā)明的另一示例性實施方式,提供一種提供用于搜索的信息的方法,該方法包括接收信息;接收輸入所述信息的信息提供者的意圖;將符合最終意圖的編輯器提供給所述信息提供者,所述最終意圖整合了針對所述信息的分析結(jié)果以及所述信息提供者的意圖;以及將對通過所述編輯器的輸入項輸入的元數(shù)據(jù)進行整合的內(nèi)容進行存儲。所述提供用于搜索的信息的方法可進一步包括將輸入的信息分離成語意單詞; 以及對分離后的單詞執(zhí)行語法分析,其中所述編輯器的提供可以使用執(zhí)行所述語法分析時的語法分析結(jié)果。如上所述,與現(xiàn)有的將“搜索單詞”用作關(guān)鍵字,并通過將邏輯運算符與、或和非的組合用作所述關(guān)鍵字的擴展來搜索其他搜索單詞的搜索方法相比,本發(fā)明的示例性實施方式可執(zhí)行“短語”及“句子”級別的搜索,實現(xiàn)了信息的再現(xiàn)性及精確性。進一步地,本發(fā)明的示例性實施方式可根據(jù)提供者的意圖來針對每一目錄對信息提供者所提供的信息進行分類及存儲,并通過檢測信息搜索者的搜索意圖來對存儲于相應(yīng)目錄內(nèi)的信息進行搜索,從而通過上下文認(rèn)知信息供應(yīng)/搜索提供了經(jīng)雙方同意的/定制的搜索服務(wù)。另外,本發(fā)明的示例性實施方式還針對每一內(nèi)容來定義不同的元數(shù)據(jù),并采用通過使用基于該元數(shù)據(jù)生成的編輯器來更為詳細(xì)地對信息供應(yīng)及搜索內(nèi)容進行開發(fā)的方法, 從而相比于現(xiàn)有的搜索方法,能夠更為方便且精確地執(zhí)行搜索。此外,本發(fā)明的示例性實施方式從搜索者輸入的信息來檢測搜索者的意圖、基于檢測到的意圖來推導(dǎo)詳細(xì)的元數(shù)據(jù)輸入以及使用輸入的元數(shù)據(jù),從而在符合搜索者意圖的目錄里執(zhí)行搜索。進一步地,在本發(fā)明的示例性實施方式中,信息提供者或搜索者可更為方便地輸入元數(shù)據(jù),并可在輸入哪種類型的元數(shù)據(jù)方面接收引導(dǎo),從而提高了輸入的方便性。另外,本發(fā)明的示例性實施方式可以基于信息提供者的意圖來對針對每一目錄的相應(yīng)信息進行劃分,且可以對相應(yīng)的元數(shù)據(jù)進行匹配和存儲。同時,本發(fā)明的示例性實施方式可從搜索者輸入的信息來檢測搜索者的意圖,并基于檢測到的意圖來推導(dǎo)詳細(xì)元數(shù)據(jù)的輸入,從而可自動輸入生成實際數(shù)據(jù)的元數(shù)據(jù)。進一步地,本發(fā)明的示例性實施方式可直接輸入信息提供者及信息搜索者的意圖,以更為精確地檢測信息提供者及信息搜索者的意圖,從而精確地提供并搜索信息。另外,本發(fā)明的示例性實施方式可通過使用PC或移動電話等來將候選人的宣傳資料發(fā)布給投票者,從而可通過使用目前使用成本很低的宣傳紙來迅速地提供候選人的宣傳資料。


圖1為示出了根據(jù)本發(fā)明示例性實施方式的搜索系統(tǒng)的圖示;圖2為示出了內(nèi)容的元數(shù)據(jù)的圖示;圖3為示出了韓文語素字典的圖示;圖4為用于對將短語/句子處理成語素并之后執(zhí)行語法分析的過程進行解釋的圖示;圖5為用于對根據(jù)本發(fā)明另一示例性實施方式的搜索方法進行解釋的流程圖;圖6為用于對根據(jù)本發(fā)明另一示例性實施方式的搜索方法進行解釋的流程圖;圖7為用于對地理導(dǎo)航服務(wù)進行解釋的圖示,該地理導(dǎo)航服務(wù)作為存儲于附加服務(wù)數(shù)據(jù)庫內(nèi)且生成自附加服務(wù)生成器的附加服務(wù)的示例,并且是一種上下文認(rèn)知搜索服務(wù);圖8為用于對提供不同于圖7所示類型的附加服務(wù)的方法進行解釋的圖示;圖9為示出了將信息搜索窗口及信息提供窗口提供在一起的信息提供/搜索窗口的示例的圖示;圖10為示出了根據(jù)本發(fā)明另一示例性實施方式的搜索系統(tǒng)的圖示;圖11和圖12為用于對根據(jù)本發(fā)明另一示例性實施方式的搜索方法進行解釋的圖示;圖13為用于對根據(jù)本發(fā)明另一示例性實施方式的搜索方法進行解釋的圖示;圖14-圖16為用于對圖13所示的搜索方法進行附加解釋的圖示;圖17為示出了根據(jù)本發(fā)明另一示例性實施方式的搜索系統(tǒng)的圖示;圖18為用于對根據(jù)本發(fā)明另一示例性實施方式的搜索系統(tǒng)進行解釋的圖示;圖19為用于對根據(jù)本發(fā)明另一示例性實施方式的搜索系統(tǒng)進行解釋的圖示;圖20為示出了應(yīng)用于宣傳候選人以進行電子投票的示例的圖示。參考標(biāo)記及符號說明101 信息搜索窗口102:關(guān)鍵字輸入裝置
103 關(guān)鍵字語素處理器104 關(guān)鍵字語法分析器105 搜索者意圖檢測器106 信息監(jiān)視器107 用于搜索的元數(shù)據(jù)提取器108 用于搜索的編輯器109:搜索目錄確定裝置110 搜索裝置111:元數(shù)據(jù)比較器112:附加服務(wù)數(shù)據(jù)庫113:附加服務(wù)生成器114:搜索結(jié)果生成器115:信息存儲單元116:存儲目錄確定裝置117:信息提供編輯器118 信息提供元數(shù)據(jù)提取器119:元數(shù)據(jù) DB120 信息提供者意圖檢測器121 信息監(jiān)視器122 信息語法分析器123 語法文法規(guī)則字典124 信息語素處理器125 語素字典126 信息輸入裝置127:信息提供窗口128 信息數(shù)據(jù)庫129 搜索結(jié)果顯示單元1001 信息搜索窗口1002:關(guān)鍵字輸入裝置1003 關(guān)鍵字語素處理器1004 關(guān)鍵字語法分析器1005 搜索者意圖檢測器1006 信息監(jiān)視器1007 用于搜索的元數(shù)據(jù)提取器1008 用于搜索的編輯器1009 搜索裝置1010:元數(shù)據(jù)比較器1011 附加服務(wù)數(shù)據(jù)庫1012:附加服務(wù)生成器
1013 搜索結(jié)果生成器1014 信息存儲裝置1015 信息提供編輯器1016 信息提供元數(shù)據(jù)提取器1017:元數(shù)據(jù) DB1018 內(nèi)容提供者意圖檢測器1019 信息監(jiān)視器1020:語法分析器1021 語法文法規(guī)則字典1022:語素處理器1023:語素字典1024:目錄內(nèi)容搜索器1025 :信息081026 搜索結(jié)果顯示裝置1027 搜索目錄確定裝置1028 存儲目錄確定裝置1701 信息提供/搜索窗口1702:語素處理器1703:語素字典1704 語法分析器1705 語法文法規(guī)則字典1706 意圖指定器1707 信息監(jiān)視器1708 信息提供元數(shù)據(jù)提取器1709 信息提供編輯器1710:存儲目錄確定裝置1711 信息存儲裝置1712 J^gDB1714 用于搜索的元數(shù)據(jù)提取器1715 用于搜索的編輯器1716:搜索目錄確定裝置1717 搜索裝置1718:元數(shù)據(jù)比較器1719 搜索結(jié)果生成器1720 搜索結(jié)果顯示裝置1721:附加服務(wù) DB1722:附加服務(wù)生成器
具體實施方式
下文中,將參考附圖對本發(fā)明的示例性實施方式進行描述。圖1示出了根據(jù)本發(fā)明示例性實施方式的搜索系統(tǒng)。構(gòu)成根據(jù)本發(fā)明示例性實施方式的搜索系統(tǒng)的塊可通過S/W及H/W來實現(xiàn)。此外,構(gòu)成所述搜索系統(tǒng)的一些塊可通過 S/W來實現(xiàn),而其余的塊則可通過H/W來實現(xiàn)。根據(jù)本發(fā)明示例性實施方式的搜索系統(tǒng)通過上下文認(rèn)知信息供應(yīng)/搜索來提供經(jīng)雙方同意的/定制的搜索服務(wù),該服務(wù)根據(jù)提供者的意圖、針對每一目錄來對信息提供者提供的信息進行分類和存儲,并通過檢測信息搜索者的搜索意圖來對存儲于相應(yīng)目錄內(nèi)的信息執(zhí)行搜索。此外,本發(fā)明的示例性實施方式還針對每一內(nèi)容來定義不同的元數(shù)據(jù),并采用通過使用基于該元數(shù)據(jù)生成的編輯器來更為詳細(xì)地對信息供應(yīng)及搜索內(nèi)容進行開發(fā)的方法, 從而相比于現(xiàn)有的搜索方法,能夠更為方便且精確地執(zhí)行搜索。在此情況下,所述元數(shù)據(jù)可為可詳細(xì)且系統(tǒng)地定義內(nèi)容的特征(其為信息供應(yīng)/ 搜索的對象)的數(shù)據(jù)。例如,“書籍”的元數(shù)據(jù)指有關(guān)書籍的詳細(xì)信息,諸如書籍名稱、作者、出版社、出版年限、價格、主題等。在本發(fā)明的示例性實施方式中,可通過具有已定義框架的編輯器來對所述元數(shù)據(jù)進行輸入及確認(rèn)??赏ㄟ^表格格式或句子格式來實施所述框架格式。圖2為示出了內(nèi)容的元數(shù)據(jù)的圖示。如圖2所示,可以確認(rèn),已對所有領(lǐng)域的內(nèi)容的必要的元數(shù)據(jù)進行了定義。例如,可以確認(rèn),在不動產(chǎn)交易202中,將“銷售物品”、“位置""預(yù)期價格”、“特征”、
“地鐵信息”和“視頻信息”等標(biāo)準(zhǔn)化為元數(shù)據(jù)。圖2所示的內(nèi)容的元數(shù)據(jù)存儲于圖1所示的元數(shù)據(jù)DB 119中。同時,如圖1所示,根據(jù)示例性實施方式的搜索系統(tǒng)包括信息搜索窗口 101、關(guān)鍵字輸入裝置102、關(guān)鍵字語素處理器103、關(guān)鍵字語法分析器104、搜索者意圖檢測器105、 信息監(jiān)視器106、用于搜索的元數(shù)據(jù)提取器107、用于搜索的編輯器108、搜索目錄確定裝置 109、搜索裝置110、元數(shù)據(jù)比較器111、附加服務(wù)數(shù)據(jù)庫112、附加服務(wù)生成器113、搜索結(jié)果生成器114、信息存儲裝置1115、存儲目錄確定裝置116、信息提供編輯器117、信息提供元數(shù)據(jù)提取器118、元數(shù)據(jù)DB 119、信息提供者意圖檢測器120、信息監(jiān)視器121、信息語法分析器122、語法文法規(guī)則字典123、信息語素處理器124、語素字典125、信息輸入裝置126、信息提供窗口 127、信息DB 128以及搜索結(jié)果顯示裝置129。信息輸入裝置1 將用戶通過信息提供窗口 127輸入的信息傳輸至信息語素處理器 1240語素字典125以數(shù)據(jù)庫方式對每個單詞的詞性信息進行存儲。此外,語素字典125 對每一單詞的擴展信息、同義詞信息或外文翻譯擴展信息等以數(shù)據(jù)庫方式進行存儲。在此情況下,由于對登記于語素字典125內(nèi)的單詞不存在限制,所以還可在該語素字典125內(nèi)登記其他詞性信息(part information)(代詞、形容詞、后置詞或結(jié)尾等)??蓞⒖嫉怯浻谡Z素字典125內(nèi)的詞性信息來將針對每個詞性對文本進行分離,且可使用語義信息來理解內(nèi)容作者或搜素者的意圖。此外,可使用同義詞信息來在更寬范圍內(nèi)執(zhí)行擴展搜索,且可使用外文翻譯來執(zhí)行多語言搜索。
圖3示出了登記于語素字典125內(nèi)的信息,且下面將參考圖3對語素字典125進行詳細(xì)描述。信息語素處理器124以“語義單詞”為單元對傳輸自信息輸入裝置126的文本進行分離。在此情況下,所述“語義單詞”指一個詞性。從而,可以理解的是,信息語素處理器 124針對每個詞性來將文本進行分離。為此目的,信息語素處理器IM通過參考語素字典125內(nèi)以數(shù)據(jù)庫方式存儲的單詞的詞性信息,來針對每個詞性將文本進行分離。信息語法分析器122基于信息語素處理器124的語素處理結(jié)果,對用戶輸入的信息執(zhí)行語法分析。該信息語法分析器122在執(zhí)行語法分析的同時參考語法文法規(guī)則字典 123內(nèi)登記的文法規(guī)則。信息提供者意圖檢測器120使用輸出自信息語法分析器122的語法分析結(jié)果來檢測信息提供者的意圖。信息監(jiān)視器121對信息提供者意圖檢測器120檢測到的信息提供者的意圖進行輸出,以使得用戶可見。為此目的,該信息監(jiān)視器121可使用圖形化工具。信息提供元數(shù)據(jù)提取器118從元數(shù)據(jù)DB 119中提取符合信息提供者意圖檢測器 120檢測到的信息提供者意圖的內(nèi)容的元數(shù)據(jù)。信息提供編輯器117生成編輯器(其中,信息提供元數(shù)據(jù)提取器118提取的元數(shù)據(jù)被形成為輸入項),并將該編輯器提供給信息提供者。存儲目錄確定裝置116確定信息DB 1 上適于存儲所述內(nèi)容的目錄。在此情況下,存儲目錄確定裝置116可通過參考信息提供者意圖檢測器120檢測到的信息提供者的意圖來確定所述目錄。信息存儲裝置115將整合了信息提供編輯器117所生成的元數(shù)據(jù)的內(nèi)容存儲于信息DB 128內(nèi)。在此情況下,該內(nèi)容存儲于由存儲目錄確定裝置116所確定的目錄內(nèi)。上述組件為用于生成并存儲提供所述信息所必須的信息的組件。在下文中,將對當(dāng)信息搜索者通過輸入關(guān)鍵字來請求進行搜索時可通過推導(dǎo)通過搜索意圖檢測而輸入的詳細(xì)關(guān)鍵字來更為精確地執(zhí)行搜索的組件進行詳細(xì)描述。在此情況下,用戶輸入的關(guān)鍵字的示例可包括單詞、短語以及句子。信息搜索窗口 101提供輸入窗口,用戶可通過該窗口輸入關(guān)鍵字,諸如單詞、短語或句子。進一步地,關(guān)鍵字輸入裝置102將用戶通過信息搜索窗口 101輸入的關(guān)鍵字傳輸至關(guān)鍵字語素處理器103。關(guān)鍵字語素處理器103以“語義單詞”為單元對傳輸自關(guān)鍵字輸入裝置102的關(guān)鍵字進行分離。在此情況下,所述“語義單詞”指一個詞性。從而,可以理解的是,關(guān)鍵字語素處理器103以類似于信息語素處理器124的方式來針對每個詞性將關(guān)鍵字進行分離。為此目的,關(guān)鍵字語素處理器103通過參考語素字典125內(nèi)以數(shù)據(jù)庫方式存儲的單詞的詞性信息,針對每個詞性將文本進行分離。關(guān)鍵字語法分析器104基于關(guān)鍵字語素處理器103的語素處理結(jié)果,對搜索者輸入的關(guān)鍵字執(zhí)行語法分析。該關(guān)鍵字語法分析器104在執(zhí)行語法分析的同時,參考語法文法規(guī)則字典123。
搜索者意圖檢測器105使用輸出自關(guān)鍵字語法分析器104的語法分析結(jié)果來檢測搜索者的意圖。信息監(jiān)視器106對搜索者意圖檢測器105檢測到的搜索者意圖進行輸出,以使得用戶可見。為此目的,該信息監(jiān)視器106可使用圖形化工具。用于搜索的元數(shù)據(jù)提取器107從元數(shù)據(jù)DB 119中提取符合信息搜索者意圖檢測器105檢測到的搜索者意圖的內(nèi)容的元數(shù)據(jù)。用于搜索的編輯器108生成編輯器(其中,用于搜索的元數(shù)據(jù)提取器108提取的元數(shù)據(jù)被形成為輸入項),并將該編輯器提供給搜索者。搜索目錄確定裝置109確定信息DB 1 上適于搜索所述內(nèi)容的目錄。在此情況下,搜索目錄確定裝置109可通過搜索者意圖檢測器105檢測到的搜索者的意圖來確定所述目錄。進一步地,搜索目錄確定裝置109可另外確定與所確定的目錄相類似的目錄。這可執(zhí)行更寬范圍的搜索。搜索裝置110對信息DB 128內(nèi)的具有與由用于搜索的編輯器108輸入的元數(shù)據(jù)相同的元數(shù)據(jù)的內(nèi)容進行搜索。在此情況下,在搜索目錄確定裝置109中所確定的目錄內(nèi)執(zhí)行所述搜索。搜索裝置110可執(zhí)行擴展搜索,該擴展搜索通過將用于搜索的編輯器108輸入的元數(shù)據(jù)替換為同義詞來執(zhí)行所述搜索。進一步地,搜索裝置110可搜索在結(jié)構(gòu)及單詞方面具有與元數(shù)據(jù)完全相同的元數(shù)據(jù)的內(nèi)容以及僅在結(jié)構(gòu)及單詞中的詞性方面具有與元數(shù)據(jù)相同的元數(shù)據(jù)的內(nèi)容。換言之, 搜索裝置110還可執(zhí)行相同搜索、部分搜索或相關(guān)搜索。元數(shù)據(jù)比較器111將通過由用于搜索的編輯器108輸入的元數(shù)據(jù)與構(gòu)成由搜索裝置110所搜索的內(nèi)容的元數(shù)據(jù)進行比較,并基于比較結(jié)果來僅選擇和輸出具有高度一致性的內(nèi)容。如上所述,可通過將以表格格式形成的元數(shù)據(jù)分別進行比較來執(zhí)行所述比較(確定所述一致性)。附加服務(wù)數(shù)據(jù)庫112可存儲用于提供適合于搜索者的搜索意圖的站點信息或相關(guān)廣告服務(wù)等的單元。附加服務(wù)生成器113生成與所述關(guān)鍵字相關(guān)的附加服務(wù)。為此目的,附加服務(wù)生成器113使用存儲于附加服務(wù)數(shù)據(jù)庫112內(nèi)的附加服務(wù)中的、適合于搜索者的搜索意圖的附加服務(wù)。附加服務(wù)數(shù)據(jù)庫112及附加服務(wù)生成器113所提供的附加服務(wù)可被實施為內(nèi)容上下文認(rèn)知服務(wù)。在此情況下,該內(nèi)容上下文認(rèn)知服務(wù)的示例可包括導(dǎo)航服務(wù)、銷售服務(wù)、廣告服務(wù)、教育服務(wù)、咨詢服務(wù)、推薦服務(wù)、行政服務(wù)等。搜索結(jié)果生成器114根據(jù)與輸出自元數(shù)據(jù)比較器111的搜索結(jié)果(內(nèi)容)的一致性,來添加附加服務(wù)生成器113所生成的附加服務(wù)。搜索結(jié)果顯示單元1 通過屏幕輸出從搜索結(jié)果生成器114生成的添加有附加服務(wù)的搜索結(jié)果,以將該結(jié)果提供給用戶。同時,可僅將與搜索結(jié)果一致的內(nèi)容提供給用戶,而不提供附加服務(wù)。這可以通過下面的方式來實現(xiàn)附加服務(wù)生成器113不生成附加服務(wù),或即使附加服務(wù)生成器113生成了附加服務(wù),搜索結(jié)果生成器114亦不添加所生成的附加服務(wù)。
下文中,將參考圖3,對上述語素字典125進行詳細(xì)描述。圖3示出了作為語素字典的示例的韓文語素字典。如圖3所示,語素字典125被配置成分別列有1)第一列的韓文單詞;2)第二列的單詞詞性信息;3)第三列的單詞語義信息;4)第四列的一組同義詞(或同意短語)、類似單詞和/或代表單詞力)第五列的英文翻譯;6)第六列的日文翻譯;以及7)第七列的中文翻譯。通過使用圖3所示的語素字典125,可允許信息語素處理器IM將文本作為語素進行處理,并允許關(guān)鍵字語素處理器103將關(guān)鍵字作為語素進行處理。如上所述,語素處理指的是給定句子的元素是否被配置為任何有意義的單詞。 例如,當(dāng)將叫1 ^"Cf (我去學(xué)校)”被作為語素進行處理時,劃分單詞界(例如, “計51+011+外+1_鈄”)即為語素處理。在此情況下,所使用的信息(該信息為存儲于語素字典125內(nèi)的詞性信息)審查各詞性之間的關(guān)系,并輸出諸如“計JiI /名詞+叫/介詞+ 7]· /動詞+ L /結(jié)尾”這樣的關(guān)系作為處理結(jié)果。進一步地,作為語素處理的附帶信息,可獲得諸如“單詞頻率”、“句子數(shù)量”之類的語言統(tǒng)計值,且可同時輸出語義信息、同義詞信息、外文翻譯。
同時,可對登記于語素字典125內(nèi)的語義信息進行如下分類
動物/ 頻率/ 域名稱/2)動詞實例行為/立即 /服務(wù)等。
1)名詞實例
事情/自然/物質(zhì)/元素/工具/裝置/人際關(guān)系/社會/罪行人類/植物/數(shù)字/抽象/建筑/具體/行為/狀態(tài)/時間/地點比率/等級/數(shù)量/重點/事實/情感/弊端/辱罵/政治/經(jīng)濟/ 思想/人名/食物/邪惡/醫(yī)藥用品等。
組織
化/文化/
‘位置/周期/ 公司名稱/區(qū)
繼續(xù)/運動/改變/情感/思考/認(rèn)知/存在/確定/意外/表達(dá)
/目標(biāo)
3)形容詞實例
狀態(tài)/關(guān)系/屬性/等級/重點/好的感覺/不好的感覺/選擇/邪惡/方面等
4)介詞實例
短語I裝置/方法I原料
結(jié)果I給出結(jié)束I接收結(jié)束
材料I起因/原因I源/起始點I原點/方向I對象地點I時間I情況I內(nèi)容I角色I(xiàn)對比I范圍/頻
率I等級I數(shù)量I比率I重點I事實I方面等。5)副詞實例I重點I等。6)結(jié)尾表示方面的實例過去I當(dāng)前I未來I否定I可能性I親密I義務(wù)I必需性主張I確定估計I不確定估計/計劃I希望I執(zhí)行I命令I(lǐng)問題
工作I依賴I被動性I利益I謙虛I榮譽稱號等。然而,上述分類僅為示例,且可被改變。單詞的語意時刻均在變化,從而可根據(jù)時
間變化來改變語意分類,而非不變。進一步地,在對語義信息進行分類時,可參考根據(jù)同義
18
必然性I請求I需求忠誠I允許I邀請詞分類的詞匯字典。根據(jù)圖3所示,1)可以理解的是,“Syng Man lee 125-1”的詞性信息為“名詞”、語義信息為“人名”、以及同義詞信息為“南韓總統(tǒng)”。2)可以理解的是,"Naengmyeon 125-2”的詞性信息為“名詞”、語義信息為“食品名稱”、以及同義詞信息為“韓國的代表性面食”。3)可以理解的是,“Carbon Dioxide 125_3”的詞性信息為“名詞”、語義信息為“有害物質(zhì)”、以及同義詞信息為“二氧化碳,全球變暖”。4)可以理解的是,Meyo 125_4”的詞性信息為“結(jié)尾”、語義信息為“請求,尊敬”、 以及同義詞信息為“命令”。5)可以理解的是,"Nom 125-5"的詞性信息為“名詞”、語義信息為“謙稱”、以及同義詞信息為“成員”。可使用所述語義信息及同義詞信息來擴大和擴展搜索。例如,當(dāng)將“Syng Man lee”用作關(guān)鍵字時,還可提供針對“Syng Man lee”的搜索結(jié)果以及與“南韓總統(tǒng)”相關(guān)的搜索結(jié)果。此外,當(dāng)將“二氧化碳對策”用作關(guān)鍵字時,可進一步提供“有害物質(zhì)”、“C02對策”、 “全球變暖對策”以及“二氧化碳對策”的搜索結(jié)果。類似地,由于語義信息(諸如,“牛肉、豬肉、韓國泡菜”等)為“食物”且同義詞信息為“肉”及“蔬菜”,所以可通過使用該語義信息及同義詞信息來執(zhí)行擴展搜索。如上所述,可將詞性信息、語義信息以及同義詞信息登記于語素字典125內(nèi),從而可搜索豐富的信息。下文中,將參考圖3,進一步對通過處理短語/句子來對語法進行分析的過程進行描述。所述語法分析為是分析構(gòu)成句子的每一語意單詞是否具有其他構(gòu)成正確句子的結(jié)構(gòu)的過程。可使用描述自然語言的文法理論來對語法進行分析。描述自然語言的文法理論的示例可包括短語結(jié)構(gòu)文法、格文法、敏感文法或詞匯文法等,這些對于文法描述方法而言均是不同的。由于可將文法理論應(yīng)用至所有語言(諸如英文、韓文、中文或日文等),還可將本實施方式所述的韓文語法分析方法應(yīng)用至其他語言。將經(jīng)歷圖4所示的語素處理401過程的輸入句子分離為語意單詞單元,并將詞性信息添加至每一分離后的單詞402。該詞性信息變?yōu)榇蠹s10-12個詞性名稱,諸如{名詞, 代詞,數(shù)字,形容詞,副詞,介詞,···}等。為了分析每個單詞相互之間如何耦合以形成正確的短語、從句以及句子,需要用于每種語言的正確短語、從句以及句子的生成規(guī)則403。該規(guī)則包含于上述語法文法規(guī)則字典123中,從而可從語法文法規(guī)則字典123中提取。例如,當(dāng)文法清楚地表達(dá)了 “句子包括主題(名詞短語)以及謂語(動詞短語),, 這一知識時,S(句子)可被表示為一NP(名詞短語)·νΡ(動詞短語)。用于短語、從句以及句子的生成規(guī)則403即為定義該規(guī)則之處。簡要描述這些規(guī)則1)基于短語、從句以及句子中生成的規(guī)則,以單詞為單位來定義短語結(jié)構(gòu)文法類型;幻格文法類型及敏感文法類型以單詞從句為單位來定義修飾單元與被修飾單元之間的關(guān)系;3)詞匯文法類型采用VP = cat (動詞,基礎(chǔ)語意、…,Sub, SEM)類型,且通過被稱之為聯(lián)合的操作來執(zhí)行各個單詞之間的正確耦合。作為具體示例,對短語結(jié)構(gòu)文法規(guī)則及處理方法作如下定義(I)S ^ PPV(2) PP — NP當(dāng)對“來自首爾”的語法進行分析時,生成語素處理結(jié)果的單詞(首爾/N(名詞), 自/P(介詞),來Λ(動詞)過去)。當(dāng)執(zhí)行短語分析時,由于“自首爾”為“NP”,故根據(jù)文法規(guī)則⑵將“自首爾”的語法分析為“PP(介詞短語)”,且由于“來”為動詞,故根據(jù)文法規(guī)則(1)將PP和V分析為“S(句子)”,從而就韓文而言,結(jié)果被輸出為稱之為(來(自首爾))的樹狀結(jié)構(gòu)公式或列表結(jié)構(gòu)公式。同時,當(dāng)根據(jù)敏感文法規(guī)則來對上述示例句子進行分析時,通過被稱之為“自首爾 —來”的表達(dá)式來輸出語法分析關(guān)系,其中單詞子句“自首爾”修飾單詞子句“來”。進一步地,詞匯文法類型輸出被稱之為(來,[誰].[自首爾])的語法分析結(jié)果作為語義表達(dá)式。本發(fā)明可根據(jù)文法理論來輸出語法分析表達(dá)式404中的每一者。因此, 可輸出根據(jù)詞性信息的表達(dá)式405、根據(jù)語義信息的表達(dá)式406以及根據(jù)同義詞/短語的表達(dá)式407。圖5示出了用于對根據(jù)本發(fā)明另一示例性實施方式的搜索方法進行解釋的流程圖。如圖5所示,當(dāng)用戶通過信息提供窗口 127輸入“吾衛(wèi)外普M坤(銷售二手車),,時,信息輸入裝置126將用戶輸入的信息傳輸至信息語素處理器124(501)。信息語素處理器IM通過參考語素字典125來針對每個詞性將“吾衛(wèi)^“普^! 4 (銷售二手車)”進行分離,并將“銷售二手車”輸出為“U) (502)。在此情況下,根據(jù)語素處理結(jié)果,將詞性信息及語義信息(名詞/ 二手車,,動詞/ 銷售,結(jié)尾/尊敬)一起輸出。在此情況下,所述詞性信息為名詞、動詞以及結(jié)尾,而所述語義信息為二手車、銷售以及尊敬。之后,信息語法分析器122對語素處理結(jié)果執(zhí)行語法分析,并輸出結(jié)果(二手車一銷售)(503)。信息提供者意圖檢測器120使用輸出自信息語法分析器122的語法分析結(jié)果來檢測信息提供者的意圖為“銷售二手車”(504)。因此,信息提供元數(shù)據(jù)提取器118從元數(shù)據(jù)DB 119中提取適于信息提供者意圖的內(nèi)容的元數(shù)據(jù),即“詈衛(wèi)斗例(二手車交易)” (505)。信息提供編輯器117生成編輯器(其中提取的元數(shù)據(jù)成為輸入項),并將該編輯器提供給信息提供者(506)。最終,信息提供者通過提供的編輯器輸入元數(shù)據(jù)(507)。圖5示出了這樣一種情況,即將“二手車名稱索納塔”、“變速箱自動”、“年份 2001”、“行駛里程100, 000公里”、“顏色銀色”、“預(yù)期價格1, 200,000韓元”以及照片信息輸入至具體項。存儲目錄信息裝置116確定信息DB 128上適于存儲所述內(nèi)容的目錄,并添加目錄索引鍵(二手車,銷售)。這將在相應(yīng)的目錄內(nèi)存儲所述內(nèi)容。同時,除了所述目錄索引鍵 (二手車,銷售)之外,存儲目錄確定裝置116還可添加用戶ID (508)。進一步地,信息存儲裝置115將整合了信息提供編輯器117所輸入的元數(shù)據(jù)的內(nèi)容存儲于信息DB 1 內(nèi)。在此情況下,所述內(nèi)容被存儲于存儲目錄確定裝置116所確定的目錄內(nèi)。以上對根據(jù)信息提供者輸入的信息來檢測用戶的意圖并基于檢測到的意圖來推導(dǎo)將被存儲為單個內(nèi)容的詳細(xì)元數(shù)據(jù)輸入的過程進行了詳細(xì)描述。下文中,將參考圖6對通過使用上述過程所存儲的元數(shù)據(jù)來基于搜索者輸入的關(guān)鍵字執(zhí)行搜索的過程進行描述。圖6為用于對根據(jù)本發(fā)明另一示例性實施方式的搜索方法進行解釋的圖示。在該示例性實施方式中,當(dāng)信息搜索者輸入關(guān)鍵字時,可檢測搜索者的搜索意圖,且可以基于檢測到的搜索者意圖來進行詳細(xì)且精確的搜索。在此情況下,用戶輸入的關(guān)鍵字的示例可包括單詞、短語以及句子。如圖6所示,當(dāng)用戶通過信息搜索窗口首次輸入關(guān)鍵字“吾衛(wèi)外晳Μ斗(購買二手車)”(601)時,關(guān)鍵字語素處理器103針對每個詞性來對輸入的關(guān)鍵字進行分離,并在將其輸出為(吾JI外MlVW 鈄)(602)的同時,添加并輸出詞性信息及語義信息(即,名詞/吾衛(wèi)外,動詞/干呻,結(jié)尾/尊敬)。之后,信息語法分析器104基于語素處理結(jié)果來執(zhí)行語法分析,并之后輸出結(jié)果 (二手車一購買)(60 。搜索者意圖檢測器105使用語法分析結(jié)果來檢測搜索者的意圖為 “二手車一購買”(604)。之后,用于搜索的元數(shù)據(jù)提取器107從元數(shù)據(jù)DB 119中提取適于搜索者的意圖 “購買二手車”的內(nèi)容的元數(shù)據(jù),且用于搜索的編輯器108生成編輯器(其中用于搜索的元數(shù)據(jù)提取器107提取的元數(shù)據(jù)為輸入項),并將該編輯器提供給搜索者(605)。結(jié)果,搜索者通過提供的編輯器來輸入元數(shù)據(jù)(606)。圖6示出了這樣一種情況,即將“二手車名稱索納塔”、“變速箱自動”、“年份2001年之后”、“行駛里程低于 100, 000公里”、“顏色銀色”、“預(yù)期價格1, 200,000韓元或更低”以及“燃料液化氣”輸入至具體項。搜索目錄確定裝置109確定信息DB 128上適于搜索所述內(nèi)容的目錄,且搜索裝置 110在信息DB 1 中搜索具有與由用于搜索的編輯器108輸入的元數(shù)據(jù)相同的元數(shù)據(jù)的內(nèi)容。在搜索目錄確定裝置109中確定的目錄內(nèi)執(zhí)行所述搜索。在此情況下,搜索目錄確定裝置109可通過參考搜索者意圖檢測器105檢測到的搜索者意圖來確定所述目錄??闪硗獯_定與所確定的目錄相類似的目錄。這可執(zhí)行更寬范圍的搜索。進一步地,搜索裝置110還可執(zhí)行相同搜索、部分搜索或相關(guān)搜索。之后,元數(shù)據(jù)比較器111將通過用于搜索的編輯器108輸入的元數(shù)據(jù)與構(gòu)成搜索者110所搜索的內(nèi)容的元數(shù)據(jù)進行比較(608)。進一步地,元數(shù)據(jù)比較器111基于比較結(jié)果來僅選擇并輸出具有高度一致性的內(nèi)容。到目前,詳細(xì)描述了根據(jù)搜索者輸入的信息來檢測搜索者的意圖、基于檢測到的意圖來推導(dǎo)詳細(xì)的元數(shù)據(jù)輸入以及通過使用輸入的元數(shù)據(jù)來在符合搜索者意圖的目錄中執(zhí)行所述搜索的過程。
本發(fā)明的示例性實施方式可被實施為通過使用常規(guī)或標(biāo)準(zhǔn)編輯器來輸入元數(shù)據(jù)。 因此,信息提供者或搜索者可更方便地輸入元數(shù)據(jù),并且可在輸入哪種類型的元數(shù)據(jù)方面接收引導(dǎo)。因此,可增加輸入的方便性。通過使用常規(guī)編輯器來輸入元數(shù)據(jù)的形式還可被應(yīng)用至諸如移動電話或IPTV之類的裝置的情形。同時,本發(fā)明的示例性實施方式可執(zhí)行條件搜索,該條件搜索可根據(jù)特定條件來限制特定元數(shù)據(jù)。例如,執(zhí)行關(guān)鍵字為“120進省叫許營衛(wèi)許(1,200,000韓元或更低的二手車)”的搜索對應(yīng)于所述條件搜索。圖7為用于對地理導(dǎo)航服務(wù)進行解釋的圖示,該地理導(dǎo)航服務(wù)作為存儲于附加服務(wù)數(shù)據(jù)庫112內(nèi)且生成自附加服務(wù)生成器113的附加服務(wù)的示例,并且是一種上下文認(rèn)知搜索服務(wù)。為此目的,圖7中假設(shè)通過信息搜索窗口 101來輸入句子“叫^^ 艾效芒^Hfle]司]厶互眢芒(這附近是否有美味的意大利餐館)”(701)。語素處理器103以語素形式對輸入句子701進行處理,并將其分離成 “叫己祠/貲效/芒/叫砷司/矧厶旦智/芒” (702),之后輸出加入了語義信息的
“O〗己詞/名詞/當(dāng)前位置,貨效/形容詞/食物評價,芒/介詞/修飾,O] _司/名詞/ 國名,矧厶互名詞/餐館,各/介詞/暗示”(703)。之后,關(guān)鍵字語法分析器104對語素處理結(jié)果的語法進行分析,且搜索者意圖檢測器105通過語法分析結(jié)果來檢測搜索者的意圖。具體而言,搜索者意圖檢測器105分別指示上下文認(rèn)知單詞“芒/芒”的語義信息為“溝μι,,,上下文認(rèn)知單詞“叫e祠”被檢測為具有“可以通過GPS確認(rèn)的當(dāng)前位置”的語意,且“叫砷司釗厶旦導(dǎo)”被檢測為具有要求搜索餐館數(shù)據(jù)庫的意圖。因此,附加服務(wù)生成器113通過使用GPS來檢測當(dāng)前位置(704),搜索裝置110執(zhí)行對美味意大利餐館的搜索(705),附加服務(wù)生成器113執(zhí)行映射(706),并且指示地圖 (該地圖上顯示了當(dāng)前位置)上被搜索到的美味意大利餐館的地圖被輸出(707)。圖8為用于對提供不同類型的附加服務(wù)的方法進行解釋的圖示。圖8所示的附加服務(wù)用于將與包含于文本輸出中的特定單詞及主題相關(guān)的各種附加信息提供作為搜索結(jié)果。為此目的,可使用存儲于附加服務(wù)數(shù)據(jù)庫112內(nèi)的各種信息,諸如組織信息801、廣告信息802、特性信息803、正題主題信息804或公司信息805等,且可以從通過網(wǎng)絡(luò)相連的其他數(shù)據(jù)庫中獲取所述各種信息。圖9為示出了將信息搜索窗口及信息提供窗口提供在一起的信息提供/搜索窗口的示例的圖示。所示信息提供/搜索窗口中的輸入窗口 901為用于輸入關(guān)鍵字的窗口,信息提供按鈕902為在信息被提供/登記輸入至輸入窗口 901時使用的按鈕,信息搜索按鈕 903為用于命令對輸入至輸入窗口 901的關(guān)鍵字進行信息搜索的按鈕。進一步地,提供于底部的按鈕904用于設(shè)置搜索方法及提供搜索結(jié)果的方法。例如,圖9中給出的“完整搜索”按鈕用于將搜索類型設(shè)置為完整搜索,“廣告許可”按鈕用于允許將與搜索結(jié)果相關(guān)的廣告與搜索結(jié)果一起顯示,“相關(guān)服務(wù)提供許可”按鈕用于允許在包含于搜索結(jié)果內(nèi)的單詞及短語上一起提供附加信息。
還可將圖7-9中所給出的實施示例應(yīng)用于將在以下進行描述的其他示例性實施方式,因此,將在以下進行描述的示例性實施方式將不再重復(fù)地描述以上實施的示例。圖10為示出了根據(jù)本發(fā)明另一示例性實施方式的搜索系統(tǒng)的圖示。構(gòu)成根據(jù)本發(fā)明示例性實施方式的搜索系統(tǒng)的塊可通過S/W及H/W來實現(xiàn)。此外,構(gòu)成所述搜索系統(tǒng)的一些塊可通過S/W來實現(xiàn),而其余的塊則可通過H/W來實現(xiàn)。如圖10所示,根據(jù)本示例性實施方式的搜索系統(tǒng)包括信息搜索窗口 1001、關(guān)鍵字輸入裝置1002、關(guān)鍵字語素處理器1003、關(guān)鍵字語法分析器1004、搜索者意圖檢測器 1005、信息監(jiān)視器1006、用于搜索的元數(shù)據(jù)提取器1007、用于搜索的編輯器1008、搜索裝置 1009、元數(shù)據(jù)比較器1010、附加服務(wù)數(shù)據(jù)庫1011、附加服務(wù)生成器1012、搜索結(jié)果生成器 1013、信息存儲裝置1014、信息提供編輯器1015、信息提供元數(shù)據(jù)提取器1016、元數(shù)據(jù)DB 1017、信息提供者意圖檢測器1018、信息監(jiān)視器1019、語法分析器1020、語法文法規(guī)則字典 1021、語素處理器1022、語素字典1023、目錄內(nèi)容搜索器IOM、信息DB 1025、搜索結(jié)果顯示裝置10 、搜索目錄確定裝置1027以及存儲目錄確定裝置1(^8。目錄內(nèi)容搜索器IOM收集包含于分離自每一目錄的內(nèi)容中的文本。目錄內(nèi)容搜索器IOM收集到的文本被傳輸至將在以下描述的語素處理器1022。圖10示出了工作信息21、大學(xué)入學(xué)考試信息13、不動產(chǎn)23、金融M、汽車25、電影及游戲沈、購物27、交通信息觀、旅游信息四、推薦30等作為在其中存儲內(nèi)容的目錄,但還可采用其他目錄。語素字典1023可被實施為與圖1所示的語素字典125相同的語素字典。語素處理器1022通過參考語素字典1023,針對每個詞性將傳輸自目錄內(nèi)容搜索器IOM的文本進行分離,并輸出每個詞性。語法分析器1020基于語素處理器1022的語素處理結(jié)果,來對包含于內(nèi)容內(nèi)的文本執(zhí)行語法分析。語法分析器1020在執(zhí)行語法分析的同時,參考語法文法規(guī)則字典1021。內(nèi)容提供者意圖檢測器1018使用輸出自語法分析器1020的語法分析結(jié)果來檢測內(nèi)容作者的意圖。信息監(jiān)視器1019輸出信息提供者意圖檢測器1018檢測到的信息作者的意圖,以使得用戶可見。為此目的,信息監(jiān)視器1019可使用圖形化工具。信息提供元數(shù)據(jù)提取器1016從元數(shù)據(jù)DB 1017中提取符合信息提供者意圖檢測器1018檢測到的信息提供者意圖的內(nèi)容的元數(shù)據(jù)。信息提供編輯器1015生成編輯器(其中,信息提供元數(shù)據(jù)提取器1016提取的元數(shù)據(jù)被形成為輸入項),并將該編輯器提供給信息提供者。存儲目錄確定裝置10 確定信息DB 1025上適于存儲所述內(nèi)容的目錄。在此情況下,存儲目錄確定裝置10 可通過參考信息提供者意圖檢測器1020檢測到的內(nèi)容提供者的意圖來確定所述目錄。信息存儲裝置1014將整合了信息提供編輯器1015所生成的元數(shù)據(jù)的內(nèi)容存儲于信息DB 1025內(nèi)。在此情況下,所述內(nèi)容存儲于存儲目錄確定裝置10 所確定的目錄內(nèi)。到目前為止所描述的組件用于收集內(nèi)容,并基于作者的意圖來對收集到的內(nèi)容進行劃分及存儲。下文中,將對當(dāng)信息搜索者通過輸入關(guān)鍵字來請求進行搜索時可通過推導(dǎo)通過搜索意圖檢測而輸入的詳細(xì)關(guān)鍵字來更為精確地執(zhí)行搜索的組件進行詳細(xì)描述。在此情況下,用戶輸入的關(guān)鍵字的示例可包括單詞、短語以及句子。信息搜索窗口 1001提供輸入窗口,用于可通過該輸入窗口輸入關(guān)鍵字,諸如單詞、短語或句子。進一步地,關(guān)鍵字輸入裝置1002將用戶通過信息搜索窗口 1001輸入的關(guān)鍵字傳輸至關(guān)鍵字語素處理器1003。語素處理器1003通過參考語素字典1023,針對每個詞性將傳輸自關(guān)鍵字輸入裝置1002的關(guān)鍵字進行分離,并輸出每個詞性。關(guān)鍵字語法分析器1004基于關(guān)鍵字語素處理器1003的語素處理結(jié)果,對搜索者輸入的關(guān)鍵字執(zhí)行語法分析。該關(guān)鍵字語法分析器1004在執(zhí)行語法分析的同時,參考語法文法規(guī)則字典1021。搜索者意圖檢測器1005使用輸出自關(guān)鍵字語法分析器1004的語法分析結(jié)果來檢測搜索者的意圖。信息監(jiān)視器1006對搜索者意圖檢測器1005檢測到的搜索者意圖進行輸出,以使得用戶可見。為此目的,該信息監(jiān)視器1006可使用圖形化工具。用于搜索的元數(shù)據(jù)提取器1007從元數(shù)據(jù)DB 1017中提取符合搜索者意圖檢測器 1005檢測到的搜索者意圖的內(nèi)容的元數(shù)據(jù)。用于搜索的編輯器1008生成編輯器(其中,用于搜索的元數(shù)據(jù)提取器1007提取的元數(shù)據(jù)被形成為輸入項),并將該編輯器提供給搜索者。搜索目錄確定裝置1027確定信息DB 1025上適于搜索所述內(nèi)容的目錄。在此情況下,搜索目錄確定裝置1027可通過參考搜索者意圖檢測器1005檢測到的搜素者的意圖來確定所述目錄。進一步地,搜索目錄確定裝置1027可另外確定與所確定的目錄相類似的目錄。這可執(zhí)行更寬范圍的搜索。搜索者1009對信息DB 1025中的具有與用于搜索的編輯器1008輸入的元數(shù)據(jù)相同的元數(shù)據(jù)的內(nèi)容進行搜索。在此情況下,在搜索目錄確定裝置1027中所確定的目錄內(nèi)執(zhí)行所述搜索。搜素裝置1009可執(zhí)行擴展搜索,該擴展搜索通過將用于搜索的編輯器1008輸入的元數(shù)據(jù)替換為同義元數(shù)據(jù)來執(zhí)行所述搜索。進一步地,搜索裝置1009可搜索在結(jié)構(gòu)及單詞方面具有與元數(shù)據(jù)完全相同的元數(shù)據(jù)的內(nèi)容以及僅在結(jié)構(gòu)及單詞中的詞性方面具有與元數(shù)據(jù)相同的元數(shù)據(jù)的內(nèi)容。換言之,搜索裝置1009還可執(zhí)行相同搜索、部分搜索或相關(guān)搜索。元數(shù)據(jù)比較器1010將通過由用于搜索的編輯器1008輸入的元數(shù)據(jù)與構(gòu)成搜索裝置1010所搜索的內(nèi)容的元數(shù)據(jù)進行比較,并基于比較結(jié)果來僅選擇和輸出具有高度一致性的內(nèi)容。如上所述,可通過將以表格格式形成的元數(shù)據(jù)分別進行比較的方法來執(zhí)行所述比較(確定所述一致性)。附加服務(wù)數(shù)據(jù)庫1011可存儲用于提供適合于搜索者的搜索意圖的站點信息或相關(guān)廣告服務(wù)等的擔(dān)憂。附加服務(wù)生成器1012生成與搜索鍵相關(guān)的附加服務(wù)。為此目的,附加服務(wù)生成器 1012使用存儲于附加服務(wù)數(shù)據(jù)庫1011內(nèi)的附加服務(wù)中的、適合于搜索者的搜索意圖的附加服務(wù)。附加服務(wù)數(shù)據(jù)庫1011及附加服務(wù)生成器1012所提供的附加服務(wù)可被實施為內(nèi)容上下文認(rèn)知服務(wù)。在此情況下,該內(nèi)容上下文認(rèn)知服務(wù)的示例可包括導(dǎo)航服務(wù)、銷售服務(wù)、 廣告服務(wù)、教育服務(wù)、咨詢服務(wù)、推薦服務(wù)等。搜索結(jié)果生成器1013根據(jù)與輸出自元數(shù)據(jù)比較器1010的搜索結(jié)果(內(nèi)容)的一致性,來添加附加服務(wù)生成器1012所生成的附加服務(wù)。搜索結(jié)果顯示裝置10 通過屏幕輸出從搜索結(jié)果生成器1013生成的添加有附加服務(wù)的搜索結(jié)果,以將該結(jié)果提供給用戶。同時,可僅將搜索結(jié)果及一致性提供給用戶,而不提供任何附加服務(wù)。這可以通過下面的方式來實現(xiàn)附加服務(wù)生成器1012不生成附加服務(wù),或即使附加服務(wù)生成器113生成了附加服務(wù),搜索結(jié)果生成器1013亦不添加所生成的附加服務(wù)。下文中,將參考圖11,對考慮了以下情形的過程進行詳細(xì)描述,該情形為推薦目錄 30上列有推薦中國餐館及第一次生日聚會的體驗經(jīng)歷的記錄,且該記錄作為信息被存儲。 圖11為用于對根據(jù)本發(fā)明另一示例性實施方式的搜索方法進行解釋的圖示。首先,如圖IlA所示,目錄內(nèi)容搜索器IOM收集列于推薦目錄30上的推薦記錄, 并將該推薦記錄傳輸至語素處理器1022。之后,語素處理器1022通過參考語素字典1023來執(zhí)行語素處理。圖IlB示出了語素處理器1022的語素處理結(jié)果。之后,語法分析器1020對圖IlB執(zhí)行語法分析。圖IlC示出了該語法分析器1020 的語素分析結(jié)果。進一步地,內(nèi)容提供者意圖檢測器1018基于圖IlC來檢測提供者的意圖。圖IlD 示出了內(nèi)容提供者意圖檢測器1018檢測到的提供者的意圖。之后,信息提供元數(shù)據(jù)提取器1016從元數(shù)據(jù)DB 1017中提取符合提供者意圖的內(nèi)容的元數(shù)據(jù)。信息提供編輯器1015生成編輯器(其中,提取的元數(shù)據(jù)成為輸入項),并將該編輯器提供給信息提供者。在圖IlD中,符合“第一次生日聚會一地點一推薦”的內(nèi)容是內(nèi)容“第一次生日聚會地點提供”。如圖IlE所示,信息提供編輯器1015對內(nèi)容提供者意圖檢測器1018檢測到的內(nèi)容提供者的意圖進行排列。進一步地,信息提供編輯器1015自動將對應(yīng)的元數(shù)據(jù)輸入至圖12A所示的編輯器的每一項中,其中圖12B示出了輸入結(jié)果。存儲目錄確定裝置10 確定信息DB 1025上適于存儲所述內(nèi)容的目錄。在此情況下,該存儲目錄確定裝置10 可通過參考內(nèi)容提供者意圖檢測器1018檢測到的內(nèi)容提供者的意圖來確定所述目錄。信息存儲裝置1014將整合了信息提供編輯器1015所生成的元數(shù)據(jù)的內(nèi)容存儲于信息DB 1025內(nèi)。在此情況下,所述內(nèi)容被存儲于存儲目錄確定裝置10 所確定的目錄內(nèi)。根據(jù)本發(fā)明的示例性實施方式可以基于內(nèi)容提供者的意圖來對針對每一目錄的相應(yīng)信息進行劃分,且可以對相應(yīng)的元數(shù)據(jù)進行匹配和存儲。下文中,將參考圖13對通過使用上述過程所存儲的元數(shù)據(jù)來基于信息搜索者輸入的關(guān)鍵字執(zhí)行搜索的過程進行描述。圖13為用于對根據(jù)本發(fā)明另一示例性實施方式的搜索方法進行解釋的圖示。在該示例性實施方式中,當(dāng)信息搜索者輸入關(guān)鍵字時,可檢測搜索者的搜索意圖,并可以基于該搜索者的意圖來進行詳細(xì)且精確的搜索。在此情況下,用戶輸入的關(guān)鍵字的示例可包括單詞、短語以及句子。如圖13所示,當(dāng)用戶輸入通過信息搜索窗口 1001輸入關(guān)鍵字“0")租
晉釷赴畀只丨智外導(dǎo)(請推薦這周六值得欣賞的音樂劇),,(1301)時, 關(guān)鍵字語素處理器1003針對每個詞性將輸入的關(guān)鍵字進行分離,并在輸出(這次/星期六 /觀看/音樂劇/推薦/期望)(1302)的同時,添加并輸出詞性信息及語義信息(名詞/現(xiàn)在,名詞/日期,形容詞/好的感覺,名詞/音樂劇,名詞/推薦,動詞/請求)(1303)。之后,關(guān)鍵字語法分析器1004基于語素處理結(jié)果來執(zhí)行語法分析,并之后輸出 (這次一星期六,值得一音樂劇,一推薦,一期望)作為結(jié)果(1304)。可以理解的是,通過語法分析,示例句子中可存在兩個上下文認(rèn)知信息。一個是作為實際物理數(shù)據(jù)“所有的星期六”的日期,另一個是作為“意圖”的“推薦,請求”。因此,關(guān)鍵字語法分析器1004針對前者執(zhí)行上下文認(rèn)知處理,這將在以下進行描述。首先,將對生成“本周六”的上下文認(rèn)知實際數(shù)據(jù)的過程進行詳細(xì)描述。圖14示出了指示時間的上下文認(rèn)知單詞,其可列于語素字典1023內(nèi)。如圖14所示,將每個單詞的語義信息定義為“過去”、“現(xiàn)在”或“將來”等。圖15通過指定“現(xiàn)在時間”的單位為“年”、“月”、“日”、“星期”、“時”、“分”、“秒”,
示出了系統(tǒng)所管理的情況。圖16示出了在當(dāng)天對“本周六”的語言表示進行數(shù)量上的計算的方式。換言之, 由于將獲得的時間為指示將獲得的時間的語言表示中的實際量化時間,當(dāng)對“本周六”執(zhí)行語素處理時,根據(jù)語義信息“本/當(dāng)前,周六/星期六”而在系統(tǒng)日歷中獲得的當(dāng)前日期為星期三,并且由于當(dāng)前系統(tǒng)“星期六”為三天之后即“星期三一星期四一星期五一星期六”, 故當(dāng)將三天加到當(dāng)前日期2008年11月6日之后,可生成實際數(shù)據(jù)2008年11月9日。通過上述過程,還可將指示不同于當(dāng)前時間的時間的語言表示變形為實際數(shù)據(jù)。 參考圖14-16描述的“本周六”的上下文認(rèn)知實際數(shù)據(jù)的生成對應(yīng)于圖13中的1306、1307 以及1308。同時,搜索者意圖檢測器1005使用語法分析結(jié)果來將搜素者的意圖檢測為“音樂劇一推薦一請求”(1308)。之后,用于搜索的元數(shù)據(jù)提取器1007從元數(shù)據(jù)DB 1017中提取適于搜索者意圖即 “音樂劇推薦請求”的內(nèi)容的元數(shù)據(jù),且用于搜索的編輯器1008生成編輯器(其中,用于搜索的元數(shù)據(jù)提取器1007提取的元數(shù)據(jù)為輸入項),并將該編輯器提供給搜索者(1311)。在此情況下,履行日期“2008年11月9日”(即所生成的實際日期)被自動輸入至編輯器。結(jié)果,搜索者通過提供的編輯器來輸入元數(shù)據(jù)(1312)。搜索目錄確定裝置1027確定信息DB 1025上適于搜索所述內(nèi)容的目錄,且搜索裝置1009對信息DB 1025中的具有與用于搜索的編輯器1008所輸入的元數(shù)據(jù)相同的元數(shù)據(jù)的內(nèi)容進行搜索(131;3)。該搜索在搜索目錄確定裝置1027中確定的目錄內(nèi)執(zhí)行。在此情況下,搜索目錄確定裝置1027可通過參考搜索者意圖檢測器1005檢測到的搜索者的意圖來確定所述目錄??闪硗獯_定與所確定的目錄相類似的目錄。這可執(zhí)行更寬范圍的搜索。
進一步地,搜索裝置1009還可執(zhí)行相同搜索、部分搜索或相關(guān)搜索。之后,元數(shù)據(jù)比較器1010將通過用于搜索的編輯器1008輸入的元數(shù)據(jù)與構(gòu)成搜索裝置1009所搜索的內(nèi)容的元數(shù)據(jù)進行比較(1314)。進一步地,元數(shù)據(jù)比較器1010基于比較結(jié)果來僅選擇并輸出具有高度一致性的內(nèi)容(1315)。到目前,詳細(xì)描述了根據(jù)搜索者輸入的信息來檢測搜索者的意圖、基于檢測到的意圖來推導(dǎo)詳細(xì)的元數(shù)據(jù)輸入、自動輸入用于生成實際數(shù)據(jù)的元數(shù)據(jù)以及通過使用該元數(shù)據(jù)來在符合搜索者意圖的目錄中執(zhí)行搜索的過程。在到目前為止所描述的示例性實施方式中,通過對輸入語言表示進行分析來自動檢測信息提供者或信息搜索者的意圖。例如,包含諸如“獲取、買、購買、給予、請求、詢問、尋找”等語言表示的表示被檢測為被稱為“信息搜索”的意圖,因為信息“搜索”的語意在語意中被稱為“尋找信息”;而所有包含諸如“賣、銷售、提供、給予、呈現(xiàn)”等語言表示的表示均被檢測為“信息提供”的意圖, 因為信息“提供”的語意在語意中被稱為“信息提供”。之后,處理該意圖。將在以下進行描述的示例性實施方式采用由信息提供者或信息搜索者直接輸入的方法,而非自動檢測信息提供者及信息搜索者的意圖。這是為了更為精確地檢測信息提供者及信息搜索者的意圖。圖17示出了根據(jù)本發(fā)明示例性實施方式的搜索系統(tǒng)。構(gòu)成根據(jù)本發(fā)明示例性實施方式的搜索系統(tǒng)的塊可通過S/W及H/W來實現(xiàn)。此外,構(gòu)成所述搜索系統(tǒng)的一些塊可通過S/W來實現(xiàn),而其余的塊則可通過H/W來實現(xiàn)。如圖17所示,根據(jù)本發(fā)明示例性實施方式的搜索系統(tǒng)包括信息提供/搜索窗口 1701、語素處理器1702、語素字典1703、語法分析器1704、語法文法規(guī)則字典1705、意圖指定器1706、信息監(jiān)視器1707、信息提供元數(shù)據(jù)提取器1708、信息提供編輯器1709、存儲目錄確定裝置1710、信息存儲單元1711、信息DB 1712、元數(shù)據(jù)DB 1713、用于搜索的元數(shù)據(jù)提取器1714、用于搜索的編輯器1715、搜索目錄確定裝置1716、搜索裝置1717、元數(shù)據(jù)比較器 1718、搜索結(jié)果生成器1719、搜索結(jié)果顯示單元1720、附加服務(wù)數(shù)據(jù)庫1721以及附加服務(wù)生成器1722。信息提供/搜索窗口 1701為用于輸入將由信息提供者登記的信息或輸入由信息搜索者提供的關(guān)鍵字的用戶界面。信息提供/搜索窗口 1701提供有輸入窗口 1701-1、信息提供按鈕1701-2以及信息搜索按鈕1701-3。輸入窗口 1701-1為用于輸入將被提供的信息或關(guān)鍵字的窗口,并且輸入窗口 1701-1可輸入作為單詞、短語或句子的信息及關(guān)鍵字。信息提供按鈕1701-2是在提供并登記輸入至輸入窗口 1701-1的信息時使用的按鈕,而信息搜索按鈕1701-3是用于命令對輸入至輸入窗口 1701-1的關(guān)鍵字進行信息搜索的按鈕。通過信息提供/搜索窗口 1701輸入的信息或關(guān)鍵字被傳輸至語素處理器1702。語素字典1703可被實施為與圖1所示的語素字典125相同的語素字典。語素處理器1702通過參考語素字典1023來針對每個詞性將通過信息提供/搜索窗口 1701輸入的信息或關(guān)鍵字進行分離,并輸出每個詞性。語法分析器1704基于語素處理器1702的語素處理結(jié)果來對用戶的輸入信息或關(guān)鍵字執(zhí)行語法分析。語法分析器1704在執(zhí)行語法分析的同時,參考登記于語法文法規(guī)則字典1705內(nèi)的文法規(guī)則。意圖指定器1706提供用于對信息提供者的意圖或信息搜索者的意圖進行直接指定的用戶界面單元,并對語法分析結(jié)果所指定的意圖進行整合以輸出最終意圖。信息監(jiān)視器1707對輸出自意圖指定器1706的最終意圖進行輸出,以使得用戶可見。為此目的,該信息監(jiān)視器1707可使用圖形化工具。信息提供元數(shù)據(jù)提取器1708從元數(shù)據(jù)DB 1713中提取符合輸出自意圖指定器 1706的信息提供者的最終意圖的內(nèi)容的元數(shù)據(jù)。信息提供編輯器1709生成編輯器(其中,信息提供元數(shù)據(jù)提取器1708提取的元數(shù)據(jù)被形成為輸入項),并將該編輯器提供給信息提供者。存儲目錄確定裝置1710確定信息DB 1712上適于存儲所述內(nèi)容的目錄。在此情況下,存儲目錄確定裝置1710可通過參考意圖指定器1706檢測到的信息提供者的最終意圖來確定所述目錄。信息存儲單元1711將整合了信息提供編輯器1709所生成的元數(shù)據(jù)的內(nèi)容存儲于信息DB 1709內(nèi)。在此情況下,所述內(nèi)容存儲于存儲目錄確定裝置1710所確定的目錄內(nèi)。用于搜索的元數(shù)據(jù)編輯器1714從元數(shù)據(jù)DB 1713中提取符合輸出自意圖指定器 1706的信息提供者的最終意圖的內(nèi)容的元數(shù)據(jù)。搜索編輯器1715生成編輯器(其中,用于搜索的元數(shù)據(jù)提取器1714提取的元數(shù)據(jù)被形成為輸入項),并將該編輯器提供給搜索者。搜索目錄確定裝置1716確定信息DB 1712上適于搜索所述內(nèi)容的目錄。在此情況下,搜索目錄確定裝置1716可通過參考輸出自意圖指定器1706的搜索者的最終意圖來確定所述目錄。進一步地,搜索目錄確定裝置1716可另外確定與所確定的目錄相類似的目錄。這可執(zhí)行更寬范圍的搜索。搜索裝置1717對信息DB 1712中的具有與由用于搜索的編輯器1715輸入的元數(shù)據(jù)相同的元數(shù)據(jù)的內(nèi)容進行搜索。在此情況下,在搜索目錄確定裝置1716所確定的目錄中執(zhí)行所述搜索。搜索裝置1717可執(zhí)行擴展搜索,該擴展搜索通過將搜索編輯器1715輸入的元數(shù)據(jù)替換為同義元數(shù)據(jù)來執(zhí)行所述搜索。進一步地,搜索裝置1717可搜索在結(jié)構(gòu)及單詞方面具有與元數(shù)據(jù)完全相同的元數(shù)據(jù)的內(nèi)容以及僅在結(jié)構(gòu)及單詞中的詞性方面具有與元數(shù)據(jù)相同的元數(shù)據(jù)的內(nèi)容。換言之,搜索裝置1717還可執(zhí)行相同搜索、部分搜索或相關(guān)搜索。元數(shù)據(jù)比較器1718將通過由用于搜索的編輯器1715輸入的元數(shù)據(jù)與構(gòu)成搜索裝置1717所搜索的內(nèi)容的元數(shù)據(jù)進行比較,并基于比較結(jié)果來僅選擇和輸出具有高度一致性的內(nèi)容。如上所述,可通過將以表格格式形成的元數(shù)據(jù)分別進行比較的方法來執(zhí)行所述比較(確定所述一致性)。附加服務(wù)數(shù)據(jù)庫1721可存儲用于提供適合于搜索者的搜索意圖的站點信息或相關(guān)廣告服務(wù)等的單元。附加服務(wù)生成器1722生成與搜索鍵相關(guān)的附加服務(wù)。為此目的,附加服務(wù)生成器 1722使用存儲于附加服務(wù)數(shù)據(jù)庫1721內(nèi)的附加服務(wù)中的、適合于搜索者的搜索意圖的附加服務(wù)。附加服務(wù)數(shù)據(jù)庫1721及附加服務(wù)生成器1722所提供的附加服務(wù)可被實施為內(nèi)容上下文認(rèn)知服務(wù)。在此情況下,該內(nèi)容上下文認(rèn)知服務(wù)的示例可包括導(dǎo)航服務(wù)、銷售服務(wù)、 廣告服務(wù)、教育服務(wù)、咨詢服務(wù)、推薦服務(wù)、行政服務(wù)等。搜索結(jié)果生成器1719根據(jù)與輸出自元數(shù)據(jù)比較器1718的搜索結(jié)果(內(nèi)容)的一致性,來添加附加服務(wù)生成器1722所生成的附加服務(wù)。搜索結(jié)果顯示單元1720通過屏幕輸出從搜索結(jié)果生成器1719生成的添加有附加服務(wù)的搜索結(jié)果,以將該結(jié)果提供給用戶。同時,可僅將搜索結(jié)果及一致性提供給用戶,而不提供附加服務(wù)。這可以通過以下的方式來實現(xiàn)附加服務(wù)生成器1722不生成附加服務(wù),或即使附加服務(wù)生成器113生成了附加服務(wù),搜索結(jié)果生成器1719亦不添加所生成的附加服務(wù)。圖18為用于對根據(jù)本發(fā)明另一示例性實施方式的搜索方法進行解釋的流程圖。如圖18所示,當(dāng)用戶輸入“對課程進行計劃”至信息提供/搜索窗口 1701的輸入窗口 1701-1中并按下信息提供按鈕1701-2(1801)時,語素處理器1702通過參考語素字典1703來針對每個詞性將“對課程進行計劃”進行分離,以將其輸出為“對課程進行計劃,,(1802)。之后,語法分析器1704對語素處理結(jié)果執(zhí)行語法分析,并輸出結(jié)果(課程一計劃) (1803)。之后,當(dāng)意圖指定器1706將信息提供者的意圖指定為“提供”(1804和1805)時, 意圖指定器1706基于語法分析來輸出整合了所指定意圖的最終意圖“課程一計劃一提供,,(1806)。之后,信息提供元數(shù)據(jù)提取器1708從元數(shù)據(jù)DB 1713中提取適于信息提供者的最終意圖“課程一計劃一提供”的內(nèi)容的元數(shù)據(jù)(1807)。信息提供編輯器1709生成編輯器(其中,提取的元數(shù)據(jù)成為輸入項),并將該編輯器提供給信息提供者(1808)。結(jié)果,信息提供者通過所提供的編輯器來輸入元數(shù)據(jù)
(1809)。之后,存儲目錄確定裝置1710確定信息DB 1712上適于存儲所述內(nèi)容的目錄
(1810)。進一步地,信息存儲裝置1711將整合了由信息提供編輯器1709輸入的元數(shù)據(jù)的內(nèi)容存儲于信息DB 1712內(nèi)。在此情況下,所述內(nèi)容被存儲于由存儲目錄確定裝置1710所確定的目錄內(nèi)。到目前為止,詳細(xì)描述了根據(jù)信息提供者輸入的信息及意圖來檢測信息提供者的最終意圖、并基于檢測到的意圖來推導(dǎo)將被存儲為單個內(nèi)容的詳細(xì)元數(shù)據(jù)輸入的過程。下文中,將參考圖19來對通過使用上述過程所存儲的元數(shù)據(jù)來基于信息搜索者提供的關(guān)鍵字及意圖來執(zhí)行搜索的過程進行描述。圖19為用于對根據(jù)本發(fā)明另一示例性實施方式的搜索方法進行解釋的圖示。在本發(fā)明的該示例性實施方式中,信息搜索者可基于關(guān)鍵字及意圖來執(zhí)行詳細(xì)且精確的搜索。在此情況下,用戶輸入的關(guān)鍵字的示例可包括單詞、短語以及句子。如圖19所示,當(dāng)用戶輸入“計劃列表”至信息提供/搜索窗口 1701的輸入窗口1701-1并按下搜索按鈕1701-3 (1901)時,語素處理器1702通過參考語素字典1703來針對每個詞性將“計劃列表”進行分離,以將其輸出為“計劃/列表”(1902)。之后,語法分析器1704對語素處理結(jié)果執(zhí)行語法分析,并輸出結(jié)果(計劃一列表) (1903)。之后,當(dāng)意圖指定器1706將信息提供者的意圖指定為“搜索”(1904和1905)時, 意圖指定器1706基于語法分析來輸出整合了所指定意圖的最終意圖“計劃一列表一搜索,,(1906)。之后,用于搜索的元數(shù)據(jù)提取器1714從元數(shù)據(jù)DB 1713中提取適于搜索者的最終意圖“計劃一列表一搜索”的內(nèi)容的元數(shù)據(jù),且用于搜索的編輯器1715生成編輯器(其中,用于搜索的元數(shù)據(jù)提取器1714提取的元數(shù)據(jù)是輸入項),并將該編輯器提供給搜索者 (1908)。結(jié)果,搜索者通過所提供的編輯器輸入元數(shù)據(jù)(1909)。搜索目錄確定裝置1716確定信息DB 1712上適于搜索所述內(nèi)容的目錄(1910), 且搜索裝置1717對信息DB 1712的具有與由用于搜索的編輯器1715輸入的元數(shù)據(jù)相同的元數(shù)據(jù)的內(nèi)容進行搜索(1911)。在搜索目錄確定裝置1716中所確定的目錄內(nèi)執(zhí)行所述搜索。在此情況下,搜索目錄確定裝置1716可通過參考意圖指定器1706檢測到的搜索者意圖來確定所述目錄??闪硗獯_定與所確定的目錄相類似的目錄。這可執(zhí)行更寬范圍的搜索。進一步地,搜索裝置1717還可執(zhí)行相同搜索、部分搜索或相關(guān)搜索。之后,元數(shù)據(jù)比較器1718將通過用于搜索的編輯器1715輸入的元數(shù)據(jù)與構(gòu)成搜索裝置1717所搜索的內(nèi)容的元數(shù)據(jù)進行比較(191幻。進一步地,元數(shù)據(jù)比較器1718基于比較結(jié)果來僅選擇并輸出具有高度一致性的內(nèi)容(1913)。到目前為止,詳細(xì)描述了基于搜索者輸入的信息及意圖來推導(dǎo)詳細(xì)元數(shù)據(jù)輸入并通過使用輸入的元數(shù)據(jù)來在符合搜索者的意圖的目錄內(nèi)執(zhí)行所述搜索的過程。上述示例性實施方式可用于宣傳候選人以進行電子投票。圖20示出了輸入元數(shù)據(jù)至編輯器的結(jié)果,該結(jié)果通過輸入“提供候選人的宣傳信息”至信息提供/搜索窗1701并對其執(zhí)行語素處理、語法分析、意圖指定以及元數(shù)據(jù)提取而生成,且所述編輯器被提供給信息提供者。之后,當(dāng)通過存儲目錄確定來將所述信息存儲于信息DB 1712內(nèi)時,可將候選人的宣傳資料通過PC或移動電話等分發(fā)給投票者。因此,可通過使用目前使用成本很低的宣傳紙來迅速地提供候選人的宣傳資料。上述的示例性實施方式可實施于移動信息裝置(諸如移動電話)中以及其他信息裝置內(nèi)。此外,信息提供按鈕及信息搜索按鈕可對應(yīng)于/分派至移動信息裝置(諸如移動電話)以及其他信息裝置的特定按鈕(按鍵)。雖然已結(jié)合目前被視為實際示例性實施方式的實施方式對本發(fā)明進行了描述,但可以理解的是,本發(fā)明并不局限于所公開的實施方式,相反地,本發(fā)明意欲覆蓋包含于所附權(quán)利要求書的精神及范圍內(nèi)的各種變化及等價布置。
權(quán)利要求
1.一種用于搜索信息的方法,該方法包括通過使用針對關(guān)鍵字的分析結(jié)果來檢測搜索者的意圖;向所述搜索者提供符合所述搜索者的意圖的編輯器;以及搜索具有與通過所述編輯器的輸入項輸入的元數(shù)據(jù)相關(guān)聯(lián)的元數(shù)據(jù)的內(nèi)容。
2.根據(jù)權(quán)利要求1所述的方法,該方法進一步包括 將輸入的關(guān)鍵字分離為語意單詞;以及對分離后的關(guān)鍵字執(zhí)行語法分析,其中,對搜索者的意圖的檢測通過使用執(zhí)行所述語法分析時的語法分析結(jié)果來檢測所述搜索者的意圖。
3.根據(jù)權(quán)利要求2所述的方法,其中所述語法分析的執(zhí)行將語法表達(dá)式輸出作為所述語法分析結(jié)果,其中通過分析句子內(nèi)分離后的單詞是否具有任何文法關(guān)系以及語義關(guān)聯(lián)來獲取所述語法表達(dá)式。
4.根據(jù)權(quán)利要求3所述的方法,其中所述語法表達(dá)式為邏輯表達(dá)式、修飾-被修飾以及語法列表表達(dá)式中的至少一者。
5.根據(jù)權(quán)利要求3所述的方法,其中語法分析的執(zhí)行參考語法文法規(guī)則字典,以分析句子內(nèi)分離后的單詞是否具有任何文法關(guān)系以及語義關(guān)聯(lián),以及所述語法文法規(guī)則字典列有短語結(jié)構(gòu)文法、格文法、敏感文法以及詞匯文法中的至少 “"者 ο
6.根據(jù)權(quán)利要求2所述的方法,其中所述分離針對每個詞性來對所述關(guān)鍵字進行分離。
7.根據(jù)權(quán)利要求6所述的方法,其中所述分離通過參考與每個單詞的詞性相關(guān)的信息來針對每個詞性將所述關(guān)鍵字進行分離,所述與每個單詞的詞性相關(guān)的信息以數(shù)據(jù)庫方式存儲于語素字典內(nèi)。
8.根據(jù)權(quán)利要求1所述的方法,該方法進一步包括提取符合所述搜索者的意圖的內(nèi)容的元數(shù)據(jù),其中編輯器的提供提供作為符合所述搜索者的意圖的編輯器的編輯器,在該編輯器中,被提取的元數(shù)據(jù)成為輸入項。
9.根據(jù)權(quán)利要求1所述的方法,該方法進一步包括通過參考信息提供者的意圖來確定用于執(zhí)行搜索的目錄,其中所述搜索對與所確定的目錄相同或相似的目錄中的內(nèi)容進行搜索。
10.根據(jù)權(quán)利要求1所述的方法,其中所述關(guān)鍵字為單詞單元、短語單元以及句子單元中的任一者。
11.根據(jù)權(quán)利要求1所述的方法,其中所述搜索對具有與通過所述編輯器的輸入項輸入的元數(shù)據(jù)中的至少一者相同的元數(shù)據(jù)、或具有與通過所述編輯器的輸入項輸入的元數(shù)據(jù)中的至少一者同義的元數(shù)據(jù)的內(nèi)容進行搜索。
12.根據(jù)權(quán)利要求1所述的方法,該方法進一步包括在搜索時將附加服務(wù)添加至搜索結(jié)果中。
13.根據(jù)權(quán)利要求12所述的方法,其中所述附加服務(wù)為內(nèi)容上下文認(rèn)知服務(wù),并且該內(nèi)容上下文認(rèn)知服務(wù)包括以下各項中的至少一者導(dǎo)航服務(wù)、銷售服務(wù)、廣告服務(wù)、教育服務(wù)、咨詢服務(wù)、推薦服務(wù)以及行政服務(wù)。
14.根據(jù)權(quán)利要求1所述的方法,其中所述編輯器的輸入項中的至少一者被自動輸入作為通過使用所述關(guān)鍵字生成的實際數(shù)據(jù)。
15.根據(jù)權(quán)利要求1所述的方法,該方法進一步包括通過將輸入的元數(shù)據(jù)與構(gòu)成所搜索的內(nèi)容的元數(shù)據(jù)進行比較,來分別選擇并輸出具有高度一致性的內(nèi)容。
16.一種提供用于搜索的信息的方法,該方法包括通過使用針對包含于信息內(nèi)的文本的分析結(jié)果,來檢測提供所述信息的信息提供者的意圖;將符合所述信息提供者的意圖的編輯器提供給用戶;以及對整合了通過所述編輯器的輸入項輸入的元數(shù)據(jù)的內(nèi)容進行存儲。
17.根據(jù)權(quán)利要求16所述的方法,該方法進一步包括將包含于輸入信息內(nèi)的文本分離成語意單詞;以及對分離后的關(guān)鍵字執(zhí)行語法分析,其中對信息提供者的意圖的檢測通過使用執(zhí)行所述語法分析時的語法分析結(jié)果來檢測提供所述信息的所述信息提供者的意圖。
18.根據(jù)權(quán)利要求17所述的方法,其中語法分析的執(zhí)行將語法表達(dá)式輸出作為所述語法分析結(jié)果,其中通過分析句子內(nèi)分離后的單詞是否具有任何文法關(guān)系以及語義關(guān)聯(lián)來獲取所述語法表達(dá)式。
19.根據(jù)權(quán)利要求18所述的方法,其中所述語法表達(dá)式為邏輯表達(dá)式、修飾-被修飾以及語法列表表達(dá)式中的至少一者。
20.根據(jù)權(quán)利要求18所述的方法,其中語法分析的執(zhí)行參考語法文法規(guī)則字典,以分析句子內(nèi)分離后的單詞是否具有任何文法關(guān)系以及語義關(guān)聯(lián),以及所述語法文法規(guī)則字典列有短語結(jié)構(gòu)文法、格文法、敏感文法以及詞匯文法中的至少 “"者 ο
21.根據(jù)權(quán)利要求17所述的方法,其中所述分離針對每個詞性來對所述文本進行分1 O
22.根據(jù)權(quán)利要求21所述的方法,其中所述分離通過參考與每個單詞的詞性相關(guān)的信息來針對每個詞性將所述文本進行分離,所述與每個單詞的詞性相關(guān)的信息以數(shù)據(jù)庫方式存儲于語素字典內(nèi)。
23.根據(jù)權(quán)利要求16所述的方法,該方法進一步包括提取符合所述信息提供者的意圖的內(nèi)容的元數(shù)據(jù),其中編輯器的提供提供作為符合所述信息提供者的意圖的編輯器的編輯器,在該編輯器中,被提取的元數(shù)據(jù)成為輸入項。
24.根據(jù)權(quán)利要求16所述的方法,該方法進一步包括通過參考所述信息提供者的意圖來確定存儲所述信息的目錄,其中所述內(nèi)容的存儲將所述內(nèi)容存儲于所確定的目錄內(nèi)。
25.根據(jù)權(quán)利要求16所述的方法,該方法進一步包括對包含于針對每一目錄劃分的內(nèi)容內(nèi)的文本進行收集,其中所述檢測使用針對收集到的文本的分析結(jié)果。
26.一種提供用于搜索的信息的方法,該方法包括 對包含于針對每一目錄劃分的內(nèi)容內(nèi)的文本進行收集;通過使用針對收集到的文本的分析結(jié)果,來檢測提供信息的信息提供者的意圖; 將符合所述信息提供者的意圖的編輯器提供給用戶;以及對整合了通過所述編輯器的輸入項輸入的元數(shù)據(jù)的內(nèi)容進行存儲。
27.一種搜索信息的方法,該方法包括 接收關(guān)鍵字;接收輸入所述關(guān)鍵字的搜索者的意圖;將符合最終意圖的編輯器提供給所述搜索者,所述最終意圖整合了對所述關(guān)鍵字的分析結(jié)果以及所述搜索者的意圖;以及搜索具有與通過所述編輯器的輸入項輸入的元數(shù)據(jù)相關(guān)聯(lián)的元數(shù)據(jù)的內(nèi)容。
28.根據(jù)權(quán)利要求27所述的方法,該方法進一步包括 將輸入的關(guān)鍵字分離為語意單詞;以及對分離后的關(guān)鍵字執(zhí)行語法分析,其中所述編輯器的提供使用執(zhí)行所述語法分析時的語法分析結(jié)果。
29.一種提供用于搜索的信息的方法,該方法包括 接收信息;接收輸入所述信息的信息提供者的意圖;將符合最終意圖的編輯器提供給所述信息提供者,所述最終意圖整合了對所述信息的分析結(jié)果以及所述信息提供者的意圖;以及對整合了通過所述編輯器的輸入項輸入的元數(shù)據(jù)的內(nèi)容進行存儲。
30.根據(jù)權(quán)利要求四所述的方法,該方法進一步包括 將輸入的信息分離為語意單詞;以及對分離后的單詞執(zhí)行語法分析,其中所述編輯器的提供使用執(zhí)行所述語法分析時的語法分析結(jié)果。
全文摘要
提供了基于用戶意圖的信息搜索方法以及信息供應(yīng)方法。所述信息搜索方法包括通過使用對被搜索的關(guān)鍵字的分析結(jié)果,來提供與所確認(rèn)的搜索者的意圖相匹配的編輯裝置;以及,對具有與通過該編輯裝置輸入的元數(shù)據(jù)相關(guān)的元數(shù)據(jù)的內(nèi)容進行搜索。以此方式,可根據(jù)搜索者輸入的信息來確認(rèn)搜索者的意圖,可基于所確認(rèn)的意圖來導(dǎo)出詳細(xì)元數(shù)據(jù),并可通過使用輸入的元數(shù)據(jù)來執(zhí)行搜索。
文檔編號G06F17/30GK102246164SQ200980150114
公開日2011年11月16日 申請日期2009年12月11日 優(yōu)先權(quán)日2008年12月11日
發(fā)明者鄭喜盛 申請人:有限公司呢哦派豆
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
昭觉县| 孟连| 合作市| 广州市| 台南县| 麦盖提县| 贵港市| 德格县| 汽车| 夹江县| 江永县| 阿瓦提县| 新密市| 海林市| 乌拉特后旗| 土默特左旗| 宁海县| 吉隆县| 蒲城县| 峨山| 汾西县| 左云县| 汽车| 肇东市| 汉阴县| 嘉祥县| 赞皇县| 汉中市| 廉江市| 河间市| 洛扎县| 喀喇沁旗| 托克逊县| 普兰店市| 进贤县| 郓城县| 北票市| 乌鲁木齐市| 吉木乃县| 洪湖市| 遵化市|