欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

基于虛擬案例節(jié)點的案例檢索網(wǎng)絡(luò)top?k擴展激活方法與流程

文檔序號:12124230閱讀:579來源:國知局
基于虛擬案例節(jié)點的案例檢索網(wǎng)絡(luò)top?k擴展激活方法與流程

本發(fā)明涉及案例推理技術(shù)領(lǐng)域,具體涉及一種基于虛擬案例節(jié)點的案例檢索網(wǎng)絡(luò)top-k擴展激活方法技術(shù)方案。



背景技術(shù):

案例推理(Case-based reasoning,簡稱CBR)是近年來人工智能領(lǐng)域中興起的一項重要的推理技術(shù)。人們在解決問題時,通?;貞涍^去類似問題的經(jīng)驗、處理過程,并在新問題的環(huán)境下對這些經(jīng)驗、處理過程進行適當修改,對其進行復用來解決新的問題。CBR即是模擬人們這種解決問題辦法的一種人工智能方法。這些過程反映在CBR中就是CBR的處理模型,以Aamodt 提出的4R模型最為經(jīng)典(Aamodt et al., 1994),其中的核心問題包括案例表示、案例相似性計算、案例檢索、案例修正及復用。

案例檢索網(wǎng)絡(luò)(Case Retrieval Nets,CRN)案例檢索過程中的一種集案例表示、檢索一體的圖(Lenz, 1999, Lenz et al., 1996)。檢索之前,首先將案例庫編譯為CRN,然后獲取查詢中的信息實體E’,通過E’選擇CRN中的初始節(jié)點,然后通過激活函數(shù)在CRN中不斷擴展蔓延,直至滿足激活終止條件,最后將激活過的節(jié)點排序輸出,作為檢索結(jié)果。這種網(wǎng)絡(luò)的優(yōu)點是采用模塊化數(shù)據(jù)結(jié)構(gòu),檢索高效,其效率只與激活的信息實體數(shù)量有關(guān),并且允許屬性值的缺失,當新案例加入時僅需增量修改網(wǎng)絡(luò)即可,網(wǎng)絡(luò)無需重新生成。其缺點是生成網(wǎng)絡(luò)的代價較高,對于數(shù)值型屬性處理不是很好,同時當網(wǎng)絡(luò)中信息實體相似度較高時,激活次數(shù)較多。

CRN可以形式化描述為,

其中:

是信息實體節(jié)點集合;

是案例節(jié)點集合;

是相似性計算函數(shù)

(1)

表示信息實體、之間的相似性;

是相關(guān)性函數(shù)

(2)

表示信息實體與案例之間的相關(guān)關(guān)系;如果某個信息實體與案例存在相關(guān)性,則。反映了信息實體在案例中的重要性程度。

是激活函數(shù)

(3)

是案例庫中的所有節(jié)點,。

CRN的檢索是迭代的擴展激活過程,激活是關(guān)于BCRN的一個函數(shù):

(4)

表示節(jié)點所代表的信息實體IE對問題求解的重要程度。信息實體IE對檢索的影響程度一方面與值有關(guān),另一方面與相關(guān)。

設(shè)CRN ,其信息實體節(jié)點集合為, 是在時刻的激活,那么在時刻信息實體節(jié)點的激活狀態(tài)為:

(5)

案例節(jié)點在時刻的激活狀態(tài)為:

(6)

CRN在查詢初始的激活狀態(tài)為:

(7)

對于更加復雜的查詢,還可以給信息實體IE賦予不同的權(quán)重,同時激活必要的上下文節(jié)點。

基于擴展激活的案例檢索主要有三步:

1)根據(jù)查詢激活初始擴展節(jié)點;

2)根據(jù)相似度激活擴展信息實體節(jié)點;

(8)

3)根據(jù)相關(guān)度激活擴展案例節(jié)點。

(9)

案例檢索網(wǎng)絡(luò)的最終檢索結(jié)果是根據(jù)偏好排序的案例集合,案例集合由降序激活值中包含的節(jié)點確定。

CRN的檢索是通過信息實體的不斷激活來完成的。然而,在大規(guī)模的CNR中存在大量的不同類型信息實體,由于存在小世界現(xiàn)象(Kleinberg, 2000),任意兩個同類型的信息實體都可能存在相似性關(guān)聯(lián),此時大量信息實體的激活將影響檢索效率,并且也會返回大量無用的案例結(jié)果。雖然CRN的檢索方法可以尋找到最優(yōu)解,然而當數(shù)據(jù)量不斷增大時,其效率降呈指數(shù)下降。一般來說,檢索結(jié)果的前top-k個結(jié)果是最有效的,可以使用近似最優(yōu)解代替最優(yōu)解,因此有必要限制激活的信息實體數(shù)量,并設(shè)置評價值對閾值進行案例總體相似度進行評估,舍棄低于設(shè)定閾值的案例,從而提高檢索效率。



技術(shù)實現(xiàn)要素:

本發(fā)明針對現(xiàn)有技術(shù)的缺陷,提出一種基于虛擬案例節(jié)點的案例檢索網(wǎng)絡(luò)top-k擴展激活方法技術(shù)方案。

本發(fā)明技術(shù)方案提供的基于虛擬案例節(jié)點的案例檢索網(wǎng)絡(luò)top-k擴展激活方法,包括以下步驟:

步驟1,輸入查詢信息實體q={},初始化CRN案例激活節(jié)點集合AC,初始化CRN檢索結(jié)果集合Topk,令激活時刻t=0;

步驟2,激活CRN初始信息實體節(jié)點AS(t)={},根據(jù)AS(t)和相關(guān)弧段激活案例節(jié)點得到AC(t)={},根據(jù)相關(guān)性函數(shù)值計算AC(t)中各激活案例節(jié)點的相似度值,并按降序排列加入CRN檢索結(jié)果集合Topk中;

其中所述指CRN中在t時刻正在激活的第m類信息實體,指t時刻正在激活的第k個案例節(jié)點;

步驟3,根據(jù)激活條件StillAct判斷是否繼續(xù)激活,若繼續(xù)激活則令激活時刻t=t+1,并重復步驟2和3,直到激活終止;

在上述的基于虛擬案例節(jié)點的案例檢索網(wǎng)絡(luò)top-k擴展激活方法,所述步驟3中,對激活條件StillAct的判斷方法具體步驟如下:

步驟3.1,建立t時刻虛擬案例節(jié)點VC(t);

其中所述虛擬案例節(jié)點VC(t)定義為:

設(shè)CRN中共有m類信息實體,分別為,各類信息實體中t時刻正在激活的信息實體記為,那么虛擬案例VC(t)為一個假設(shè)與所有t+1時刻激活信息實體()都相關(guān)的案例;虛擬案例并不存在,僅為了計算而提出。

步驟3.2,根據(jù)相關(guān)性函數(shù)值計算VC(t)與查詢的相似度Sim(VC(t),q);

步驟3.3,CRN檢索結(jié)果集合Topk中第k個案例與查詢相似度為Sim(Ck,q),若Sim(Ck,q)> Sim(VC(t),q),則終止激活,否則,繼續(xù)激活;

其中步驟3.3終止激活條件證明過程如下:

根據(jù)虛擬案例的定義可知,是在當前激活狀態(tài)下與查詢相似度最高的案例。在初始激活狀態(tài)下,與查詢的相似度為。對于在t時刻與、…、相關(guān)的所有案例記為,包含的信息實體為。記是查詢中與CRN對應(yīng)的第m類的信息實體,即初始激活信息實體,由于信息實體的激活是依據(jù)與其相似度的高低依次激活的,那么必然有,而案例與查詢的相似度是通過信息實體之間的相似度來計算的,即,則必然有。而,若不能加入前top-k個結(jié)果中,那么則必然不能加入前top-k個結(jié)果中,證畢。

本發(fā)明的有益效果是,本發(fā)明通過虛擬案例節(jié)點控制CRN的擴展激活過程,可有效減少在top-k查詢中大量信息實體節(jié)點被激活的問題,具體包括:

(1)虛擬案例節(jié)點無需改變原有CRN組織結(jié)構(gòu),是計算過程中的虛擬實體;

(2)通過虛擬案例節(jié)點可以在top-k查詢中更早結(jié)束迭代過程,并保證查詢到的top-k結(jié)果是完整和正確的,從而提高檢索速度。

附圖說明

圖1是本發(fā)明實施例的CRN結(jié)構(gòu)示意圖。

圖2是本發(fā)明實施例的方法流程偽代碼圖。

具體實施方式

下面通過實施例,并結(jié)合附圖,對本發(fā)明的技術(shù)方案作進一步具體的說明。

首先介紹一下本發(fā)明所用到的理論基礎(chǔ)。

案例檢索網(wǎng)絡(luò)(Case Retrieval Nets,CRN)案例檢索過程中的一種集案例表示、檢索一體的圖(Lenz, 1999, Lenz et al., 1996)。檢索之前,首先將案例庫編譯為CRN,然后獲取查詢中的信息實體E’,通過E’選擇CRN中的初始節(jié)點,然后通過激活函數(shù)在CRN中不斷擴展蔓延,直至滿足激活終止條件,最后將激活過的節(jié)點排序輸出,作為檢索結(jié)果。這種網(wǎng)絡(luò)的優(yōu)點是采用模塊化數(shù)據(jù)結(jié)構(gòu),檢索高效,其效率只與激活的信息實體數(shù)量有關(guān),并且允許屬性值的缺失,當新案例加入時僅需增量修改網(wǎng)絡(luò)即可,網(wǎng)絡(luò)無需重新生成。其缺點是生成網(wǎng)絡(luò)的代價較高,對于數(shù)值型屬性處理不是很好,同時當網(wǎng)絡(luò)中信息實體相似度較高時,激活次數(shù)較多。

CRN可以形式化描述為,

其中:

是信息實體節(jié)點集合;

是案例節(jié)點集合;

是相似性計算函數(shù)

(1)

表示信息實體、之間的相似性;

是相關(guān)性函數(shù)

(2)

表示信息實體與案例之間的相關(guān)關(guān)系;如果某個信息實體與案例存在相關(guān)性,則。反映了信息實體在案例中的重要性程度。

是激活函數(shù)

(3)

是案例庫中的所有節(jié)點,。

CRN的檢索是迭代的擴展激活過程,激活是關(guān)于BCRN的一個函數(shù):

(4)

表示節(jié)點所代表的信息實體IE對問題求解的重要程度。信息實體IE對檢索的影響程度一方面與值有關(guān),另一方面與相關(guān)。

設(shè)CRN ,其信息實體節(jié)點集合為, 是在時刻的激活,那么在時刻信息實體節(jié)點的激活狀態(tài)為:

(5)

案例節(jié)點在時刻的激活狀態(tài)為:

(6)

CRN在查詢初始的激活狀態(tài)為:

(7)

對于更加復雜的查詢,還可以給信息實體IE賦予不同的權(quán)重,同時激活必要的上下文節(jié)點。

基于擴展激活的案例檢索主要有三步:

1)根據(jù)查詢激活初始擴展節(jié)點;

2)根據(jù)相似度激活擴展信息實體節(jié)點;

(8)

3)根據(jù)相關(guān)度激活擴展案例節(jié)點。

(9)

案例檢索網(wǎng)絡(luò)的最終檢索結(jié)果是根據(jù)偏好排序的案例集合,案例集合由降序激活值中包含的節(jié)點確定。

CRN結(jié)構(gòu)示意圖參見圖1。

接下來,闡述本發(fā)明的具體技術(shù)方案:

參見圖2,本發(fā)明實施例所提供方法主要包括以下步驟:

步驟1,輸入查詢信息實體q={},初始化CRN案例激活節(jié)點集合AC,初始化CRN檢索結(jié)果集合Topk,令激活時刻t=0;

步驟2,激活CRN初始信息實體節(jié)點AS(t)={},根據(jù)AS(t)和相關(guān)弧段激活案例節(jié)點得到AC(t)={},根據(jù)相關(guān)性函數(shù)值計算AC(t)中各激活案例節(jié)點的相似度值,并按降序排列加入CRN檢索結(jié)果集合Topk中;

其中所述指CRN中在t時刻正在激活的第m類信息實體,指t時刻正在激活的第k個案例節(jié)點;

步驟3,根據(jù)激活條件StillAct判斷是否繼續(xù)激活,若繼續(xù)激活則令激活時刻t=t+1,并重復步驟2和3,直到激活終止;

在上述的一種基于虛擬案例節(jié)點的案例檢索網(wǎng)絡(luò)top-k擴展激活方法,所述步驟3中,對激活條件StillAct的判斷方法具體步驟如下:

步驟3.1,建立t時刻虛擬案例節(jié)點VC(t);

其中所述虛擬案例節(jié)點VC(t)定義為:

設(shè)CRN中共有m類信息實體,分別為,各類信息實體中t時刻正在激活的信息實體記為,那么虛擬案例VC(t)為一個假設(shè)與所有t+1時刻激活信息實體()都相關(guān)的案例;虛擬案例并不存在,僅為了計算而提出。

步驟3.2,根據(jù)相關(guān)性函數(shù)值計算VC(t)與查詢的相似度Sim(VC(t),q);

步驟3.3,CRN檢索結(jié)果集合Topk中第k個案例與查詢相似度為Sim(Ck,q),若Sim(Ck,q)> Sim(VC(t),q),則終止激活,否則,繼續(xù)激活;

其中步驟3.3終止激活條件證明過程如下:

根據(jù)虛擬案例的定義可知,是在當前激活狀態(tài)下與查詢相似度最高的案例。在初始激活狀態(tài)下,與查詢的相似度為。對于在t時刻與、…、相關(guān)的所有案例記為,包含的信息實體為。記是查詢中與CRN對應(yīng)的第m類的信息實體,即初始激活信息實體,由于信息實體的激活是依據(jù)與其相似度的高低依次激活的,那么必然有,而案例與查詢的相似度是通過信息實體之間的相似度來計算的,即,則必然有。而,若不能加入前top-k個結(jié)果中,那么則必然不能加入前top-k個結(jié)果中,證畢。

本文中所描述的具體實施例僅僅是對本發(fā)明精神作舉例說明。本發(fā)明所屬技術(shù)領(lǐng)域的技術(shù)人員可以對所描述的具體實施例做各種各樣的修改或補充或采用類似的方式替代,但并不會偏離本發(fā)明的精神或者超越所附權(quán)利要求書所定義的范圍。

當前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
万山特区| 叶城县| 新安县| 泰和县| 汝南县| 雅安市| 宁德市| 凤山市| 黔东| 平遥县| 兖州市| 平凉市| 恭城| 且末县| 安阳县| 新源县| 越西县| 沅江市| 托克托县| 河东区| 绥江县| 侯马市| 咸宁市| 绿春县| 萨迦县| 临猗县| 论坛| 元谋县| 荃湾区| 昌吉市| 内乡县| 内黄县| 麻阳| 宿迁市| 新竹县| 当阳市| 许昌市| 本溪市| 新民市| 武安市| 邢台县|