本發(fā)明涉及計算機技術(shù)領(lǐng)域,具體地說,涉及一種用于評價從眾包環(huán)境中獲取物品的創(chuàng)新活力的方法。
背景技術(shù):
通過利用眾包平臺上來自不同地域及具有不同專業(yè)背景的參與者,能在短時間內(nèi)獲取滿足眾包請求的目標物品,包括產(chǎn)品、設(shè)計方案等,且獲取的目標物品由于具有豐富的多樣性而更具創(chuàng)新活力。
但是,隨著眾包迭代輪次的增加,相對以往眾包迭代輪次獲取的物品,后續(xù)輪次所獲取物品中的重復(fù)比例或高度相似比例也會隨之增加,導(dǎo)致后續(xù)輪次獲取物品的創(chuàng)新活力隨迭代輪次增加而降低,并趨于缺乏創(chuàng)新活力。
技術(shù)實現(xiàn)要素:
本發(fā)明的目的是提供一種用于評價從眾包環(huán)境中獲取物品的創(chuàng)新活力的方法,以評價出當(dāng)前輪次獲取物品較以往輪次所獲取物品的創(chuàng)新活力,從而便于決定是否繼續(xù)發(fā)布獲取目標物品的眾包請求。
為了實現(xiàn)上述目的,本發(fā)明提供眾包環(huán)境下創(chuàng)新活力的評價方法包括第一獲取步驟、第二獲取步驟、第一建模步驟、第二建模步驟及評價步驟;其中,第一獲取步驟包括通過通訊線路向眾包平臺服務(wù)器發(fā)送獲取目標物品的眾包請求,并接收眾包平臺服務(wù)器基于該眾包請求獲取的當(dāng)前輪次的物品集合sk,構(gòu)成總物品集合
利用眾包平臺,獲取目標物品及對目標物品間相似度的評價結(jié)果,以充分地獲取創(chuàng)新度高的設(shè)計方案、產(chǎn)品等符合要求的物品,利用評價結(jié)果的普遍性,提高評價結(jié)果的準確性;利用語義細胞混合模型獲取不同輪次物品間概念相似性,并基于概念相似性對當(dāng)前輪次物品的創(chuàng)新活力進行評價,以從物品概念層次去評價,有效避免現(xiàn)有技術(shù)中方案搜尋輔助、方案空間呈現(xiàn)、專家反饋等創(chuàng)新支持方法中存在限制參與者思維、評價缺乏參考、適用性有限等問題。
具體的方案為使用隨機三元組嵌入的建模方法對總物品集合
更具體的方案為構(gòu)建總物品集合
(1)(1)構(gòu)建語義細胞混合模型lp,并計算物品ii的空間嵌入mi與語義細胞lj的支持度support(mi,lj),并以所有語義細胞中與空間嵌入mi的支持度最大者為物品ii空間嵌入mi所屬的最似概念原型;
(2)利用語義細胞更新算法從所獲取的空間嵌入矩陣m中訓(xùn)練出混合模型lp,目標是優(yōu)化目標函數(shù)j,
其中,∈ij=||mi-mj||2為物品ii空間嵌入與物品ij空間嵌入的歐氏距離;
(3)構(gòu)建物品ii的silhouette系數(shù)s(mi),
其中,a(mi)為物品ii空間嵌入mi到其所屬同一簇的其他物品空間嵌入的平均距離;b(mi)為物品ii空間嵌入mi到非其所屬的簇的物品空間嵌入的平均距離;
(4)計算所有空間嵌入的silhouette系數(shù)的平均值,并將該平均值最大時的語義細胞的個數(shù)確定為語義細胞混合模型中語義細胞的數(shù)量。
再具體的方案為在評價步驟中,用概念相似指數(shù)υk表征概念相似性,
其中,h(i,lp)為物品ii∈sk對產(chǎn)品集
通過選選取排序后的前25%的平均值進行表征,概念相似指數(shù)的評價主要考慮的是新概念的產(chǎn)品是否仍占本輪的主導(dǎo)地位,在確保表征有效性的前提,以減少計算量。
進一步的方案為基于概念相似性評價當(dāng)前輪次產(chǎn)品的創(chuàng)新活力的步驟包括:
(1)構(gòu)建第k輪次眾包迭代時概念空間探索活力指數(shù)ek=1-λυk,λ∈(0,1);
(2)通過比較當(dāng)前輪次的概念空間探索活力指數(shù)與之前輪次的概念空間探索活力指數(shù),評價當(dāng)前輪次物品的創(chuàng)新活力。
通過構(gòu)建概念空間探索活力指數(shù),以正向地表征其概念空間的可拓展性能,從而表征其創(chuàng)新活力。
再進一步的方案為在構(gòu)建概念空間探索活力指數(shù)時,考慮語義混合細胞的老化指數(shù)gk(i),獲取概念空間探索活力指數(shù)為
其中,老化指數(shù)gk(i)為
通過引入簇內(nèi)老化指數(shù)作為對概念相似指數(shù)的約束,以避免得到的語義細胞混合模型中存在由
優(yōu)選的方案為在第一建模步驟中,對建模結(jié)構(gòu)進行白化處理。通過白化處理,使兩個維度特征的方差相同且特征之間的相關(guān)性較低,從而便于數(shù)據(jù)的呈現(xiàn)與對比。
附圖說明
圖1是本發(fā)明實施例的工作流程圖。
具體實施方式
以下結(jié)合實施例及其附圖對本發(fā)明作進一步說明。
實施例
在本實施例中,獲取目標物品的具體形式為通過搜尋方式獲取互聯(lián)網(wǎng)上已存在的目標物品,具體為能保持正確坐姿的物品,包括產(chǎn)品、創(chuàng)意設(shè)計方案等。
參見圖1,本眾包環(huán)境下創(chuàng)新活力的計算方法包括第一獲取步驟s1、第二獲取步驟s2、第一建模步驟s3、第二建模步驟s4及評價步驟s5。
第一獲取步驟s1,通過通訊線路向眾包平臺服務(wù)器發(fā)送搜尋目標物品的眾包請求,并接收眾包平臺服務(wù)器基于該眾包請求獲取的當(dāng)前輪次的物品集合,一起構(gòu)成總物品集合。
在本實施例中的物品,包括但不局限于硬件、軟件及手機應(yīng)用,比如靠墊、椅子、筆等,并提供描述該物品的頁面網(wǎng)址、描述圖片網(wǎng)址、簡要文字描述。
“通訊線路”為包括一個或多個被配置在用戶與眾包平臺間用于傳送信息數(shù)據(jù)的數(shù)據(jù)路線,可以是通訊網(wǎng)絡(luò)中的電線路、光學(xué)線路、無線線路及它們的組合,其還有多種顯而易見的變化。
為了充分地獲取互聯(lián)網(wǎng)上的既有物品,需不斷迭代地發(fā)布目標物品搜尋任務(wù)。設(shè)當(dāng)前搜尋輪次為第k輪,從獲取的物品中剔除無效的反饋,剩余物品構(gòu)成本輪次物品集合,記為sk,則前k輪所獲取的物品集合為
第二獲取步驟s2,通過通訊線路向眾包平臺服務(wù)器發(fā)送對總物品集合
第一建模步驟s3,使用隨機三元組嵌入(t-ste,t-distributedstochastictripletembedding)的建模方法對物品的概念空間進行二維空間建模。
在收集眾包參與者對物品間相似度的評價結(jié)果后,基于該評價結(jié)果構(gòu)建相似度評價三元組(ia,ib,ic),其中,物品
為了方便數(shù)據(jù)呈現(xiàn)及比對,對建模結(jié)果進行白化(whitening)處理,使兩個維度特征的方差相同且特征之間的相關(guān)性較低。
第二建模步驟s4,構(gòu)建物品集合
(1)、構(gòu)建語義細胞l:
l=<p,dist,δ>;
其中,
其中,f(∈|μ,σ)是參數(shù)為μ,σ的正態(tài)分布的概率密度函數(shù),表示為:
(2)、構(gòu)建用于描述整個概念空間的語義細胞混合模型lp:
lp={(lj,wj)|∑jwj=1,j=1,…,n};
其中,wj為個語義細胞混合模型lp中語義細胞lj的權(quán)重,即,既有物品的概念空間通常由多個概念構(gòu)成。
(3)、利用語義細胞混合模型,計算某一物品概念的空間嵌入mi與該模型刻畫的概念的支持度support(mi,l),即空間嵌入mi與語義細胞l的支持度,用于描述空間嵌入mi是語義細胞l所描述概念集合一員的隸屬度:
(4)、計算某一物品概念的空間嵌入mi與語義細胞混合模型lp的支持度為:
即,在計算語義細胞混合模型的支持度時,考慮了每個代表不同概念的語義細胞lj的權(quán)重wj。
(5)、利用語義細胞更新算法從所獲取的空間嵌入矩陣m中訓(xùn)練出混合模型lp,目標是優(yōu)化目標函數(shù)j,從而使語義細胞能覆蓋盡可能地覆蓋前k輪產(chǎn)品集合所對應(yīng)的空間嵌入,該優(yōu)化目標函數(shù)j為,
其中,
(6)、計算每個既有物品ii的概念模型對應(yīng)的silhouette系數(shù)s(mi):
其中,a(mi)為物品ii空間嵌入mi到其所屬同一簇的其他物品空間嵌入的平均距離;b(mi)為物品ii空間嵌入mi到非其所屬的簇的物品空間嵌入的平均距離。
silhouette系數(shù)s(mi)的取值范圍為[-1,1],當(dāng)其值接近于1時有a(mi)<<(mi)),表示著簇內(nèi)元素的緊密程度較好,當(dāng)其值接近于-1時,表示該點聚類結(jié)果不佳。
(7)、定義一個物品ii空間嵌入mi所屬的最似概念原型是所有語義細胞中與mi的支持度最大者,即,其最似概念原型為物品集合
(8)、確定語義細胞的個數(shù),由于silhouette系數(shù)在n=1時沒有定義,假定方案的概念空間分布由多組概念組成,從n=2開始求物品的語義細胞混合模型,并計算所有空間嵌入的平均silhouette系數(shù),取silhouette系數(shù)最大時的n為最終的語義細胞個數(shù),即
評價步驟s5,利用得到前k輪次物品集合
(1)、定義第k輪次搜集的一個物品ii∈sk對產(chǎn)品集
若該產(chǎn)品處在語義細胞混合模型lp的領(lǐng)域邊界上(即遠離語義細胞原型),對應(yīng)的鄰近指數(shù)將接近于0,表示當(dāng)前產(chǎn)品遠離各個概念原型,概念較為新穎。相比于直接對所有產(chǎn)品計算相對距離,該定義的計算量小,且較少受方案分布的細節(jié)差異擾動。
(2)、定義簇內(nèi)老化指數(shù),一個語義細胞li∈lp表示的概念的化指數(shù)為gk(i):
其中,ci是指第i輪物品的數(shù)量,即,老化指數(shù)為概念鄰域內(nèi)前(k-1)輪產(chǎn)品數(shù)量與第k輪產(chǎn)品數(shù)量的比值。
由于得到的語義細胞混合模型中存在由
(3)、定義第k輪時搜集產(chǎn)品的概念相似指數(shù)υk為:
其中,
使用前25%鄰近指數(shù)的產(chǎn)品作為依據(jù),是考慮每一輪眾包收集的既有產(chǎn)品中往往存在與原有概念相近的產(chǎn)品,即概念相似指數(shù)的評價主要考慮的是新概念的產(chǎn)品是否仍占本輪的主導(dǎo)地位。
(4)、定義第k輪眾包迭代時概念空間探索活力指數(shù)ek為:
其中,λ∈(0,1),為預(yù)設(shè)值,表示創(chuàng)新指數(shù)與老化指數(shù)的偏重程度。
在本實施例中,通過分析當(dāng)前輪次眾包過程中搜尋到的物品與以往搜尋到的物品的概念相似性,依次計算當(dāng)前方案分布下概念空間拓展的能力,以判斷出相鄰幾輪次所搜尋產(chǎn)品相對之前所收集產(chǎn)品的創(chuàng)新活力變化。