欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種數(shù)據(jù)庫動態(tài)查詢表單的生成方法_2

文檔序號:9564625閱讀:來源:國知局
投影屬性,它使
最大。從定義3可知
[0034] 注意到,添加一個投影分量
不影響
的選擇部分。因此,

因為_已經(jīng)被用戶使用,可以按如下方法估算
對于每個提交給表單的查詢,保留查詢結(jié)果包括_中的所有 列。顯然,對于那些不在查詢結(jié)果中的實例,
并不需要考慮它們。對于查 詢結(jié)果中的每個實例d,簡單地計算他們在結(jié)果中出現(xiàn)的次數(shù),
等于 出現(xiàn)次數(shù)除以N。
[0035] 現(xiàn)在,只需要估討
考慮投影分量,有:
等式(4)中的
丨可以通過用戶在_:結(jié)果上的點擊進行估計。點擊的
:是用戶在前一次查詢結(jié)果中點擊的數(shù)據(jù)實例集合。采用核密度估計方 法來估計
每個
代表一個用戶感興趣的高斯分布。然后,
表示兩個數(shù)據(jù)實例 之間的距離,£#是高斯模型的方差。
[0036] 等式(4)中
:是運行時不可見的數(shù)據(jù),因為
之前尚 未使用,只能從其他數(shù)據(jù)源來估算它,主要考慮以下兩種數(shù)據(jù)驅(qū)動的方法來估計條件概率
[0037] ?工作量驅(qū)動方法:條件概率
能從歷史查詢的查詢結(jié)果估計。如 果有很多用戶在實例d上同時查詢屬性
一定會很高。
[0038] ?模式驅(qū)動方法:數(shù)據(jù)庫模式隱含屬性間的關(guān)系。如果兩個屬性由同一實體包含, 那么他們關(guān)聯(lián)更大。
[0039] 這兩種方式都有自己的缺點。工作量驅(qū)動方法具有冷啟動問題,因為它需要大 量的查詢。模式驅(qū)動的方法不能識別同一實體中屬性的差異。該方法將這兩種方法結(jié) 合,如下所示: 卜
< 其中
:是從歷史查詢中估計的概率,
是從數(shù)據(jù)庫模式中估計 的
之間的相似度,而1是|_|1之間的權(quán)重參數(shù),用來平衡工作量驅(qū)動估計和模 式驅(qū)動估計。記;
?是模式圖中屬 性
之間的模式距離:
是模式圖的直徑。該方法利用模式圖來計算兩個屬性 的相關(guān)性。數(shù)據(jù)庫模式圖表示戈
,其中爾是代表關(guān)系的節(jié)點集合,屬 是屬性集合:
是表示外鍵的邊的集合,
是一個屬性標記方法,用于顯示哪個 關(guān)系包含該屬性。根據(jù)數(shù)據(jù)庫模式圖,模式距離定義如下: 定義4 :模式距離:給定兩個屬性/1^42和數(shù)據(jù)庫模式圖
:之間的模式距_
,是節(jié) 點
之間的最短路徑的長度。
[0040] 一個實體的排名得分是該實體所有屬性
的平均值。直觀地說,如 果一個實體有很多高分屬性,那么它應(yīng)該有一個較高的排名。
[0041] 選擇表單組件排名時選擇的屬性必須與當前投影的實體關(guān)聯(lián),否則該選擇將毫無 意義。因此,系統(tǒng)應(yīng)該先找出關(guān)聯(lián)屬性用于創(chuàng)建選擇組件。
[0042] 系統(tǒng)中屬性的相關(guān)性基于數(shù)據(jù)庫模式測量,如下所示: 定義5:關(guān)聯(lián)屬性:給定一個數(shù)據(jù)庫查詢表單F和模式圖
關(guān)聯(lián) 屬性是:
其中I是用戶定義的閾值,
是定義4中定義的模式距離。
[0043] I的選擇取決于該模式設(shè)計的緊湊程度。例如,某些數(shù)據(jù)庫把一個實體的所有屬性 放到一個關(guān)系,則i可能是1。有些數(shù)據(jù)庫把一個實體的所有屬性分離到幾個關(guān)系中,可 能大于1。使用數(shù)據(jù)庫模式圖深度優(yōu)先遍歷,可以在
的復(fù)雜度得致
O
[0044] 為了改善查詢表單中的選擇表單組件,投影分量的集合C/?.F固定的,即
因此,
::只依賴于
[0045] 為了簡化用戶界面,大多數(shù)查詢表單的選擇組件都是
形式的簡單二元 關(guān)系,其中_是屬性,Il是常量,是關(guān)系運算符。運算符可以是
等等。在 每個周期中,系統(tǒng)為用戶提供這樣的二元關(guān)系的排名列表,以增強選擇部分。由于二元關(guān)系 的總數(shù)很大,只選擇每個屬性的最佳選擇組件。
[0046] 對于屬性
包含根據(jù)
的公式,為找到
:丨最大,只需要就每個數(shù)據(jù)實例
需要注意的是,:_代表連接表達式,它通過連接所有基本 的二元表達式。當且僅當:和i存在
存在。因此,
那么有:

:可以通過在查詢表單上前一次執(zhí)行的查詢估計。當且僅當_滿足#%和S,
為1,否則為0。唯一的問題是確定金的空間,因為要列舉所有的玄來計算它們的 得分。注意,S是一個
形式的二元表達式,其中裏#固定并且已給出。
,其中讓於是一個關(guān)系運算符的有限集合
屬于數(shù)據(jù)庫中邊#的數(shù)據(jù)域。因 此,波的空間是一個的有限集合。為了有效地估計查詢條件瘦產(chǎn)生的新的顚顏銷 ,本文中提出方法。二一:C|i_!的想法很簡單:將中的屬性值排序,并 對該屬性上的所有可能值逐步計算的謂Se_i#。
[0047] 為了為下一次查詢表單找到最佳選擇組件,第一步是查詢數(shù)據(jù)庫檢索數(shù)據(jù)實例。 等式(5)表明
:依賴于以前的查詢條件f%。如果I
必為0。因此,為了對每個_繼:凝計算
并不需要檢索數(shù)據(jù)庫中所有的數(shù)據(jù)實 例,需要的只是震蒙?的數(shù)據(jù)實例的集合,使得每個
,所以 !查詢的選擇是在_中執(zhí)行的查詢條件的并集。
[0048] 此外,一次算法不會發(fā)送每個查詢條件I到數(shù)據(jù)庫引擎來選擇數(shù) 據(jù)實例,這對數(shù)據(jù)庫引擎是一個沉重的負擔,因為查詢條件數(shù)量巨大;相反,它檢索數(shù)據(jù)實 例集合IT,然后自己使用每個查詢條件核對每一個數(shù)據(jù)實例,為此目的,算法需要知道IT 的所有選擇屬性的值,因此,將所有選擇屬性加到投影查詢中。
[0049] 圖3描述了查詢構(gòu)造的算法。函數(shù)基于給定的 投影屬性集合《^_和選擇表達式生成數(shù)據(jù)庫查詢。
[0050] 當系統(tǒng)接收到數(shù)據(jù)庫引擎1§_查詢的結(jié)果,它第二次調(diào)用_?〇__|算法來 尋找最佳查詢條件。
[0051] 首先討論《__條件。該算法的基本思想基于一個簡單的性質(zhì)。對于數(shù)據(jù)實例_的 一個特定的屬性?%:,給出兩個條件:
如果%滿足, 則必滿足?;谶@個特性,通過掃描一遍數(shù)據(jù)實例可以逐步計算每個查詢條件的FScore 。做到這一點有2個步驟。
[0052] 1)首先,按
的順序給?的值排序,其中_是_值的個數(shù)。 Isl表示數(shù)據(jù)實例的集合,其中%的值等于_。
[0053] 2)然后按%值的順序遍歷每個數(shù)據(jù)實例。設(shè)查詢條件
及其相應(yīng) 為根據(jù)公式⑶,
[0054] 對于和義可以遞推計算:
[0055] 圖4展示了尋找最佳"條件的偽代碼。
[0056] 復(fù)雜度:至于其他的查詢條件,例如u ,也可以找到類似的遞 歸方法來計算他們FScore。它們都共享第一步中的排序結(jié)果。而對于第二步, 所有的遞推計算可以合并成一次掃描。因此,尋找一個屬性的最佳查詢條 件的時間復(fù)雜度為
為每個屬性的選擇組件排名的復(fù)雜度為
[0057] 在上述實施例中,詳細介紹了如何通過計算查詢組件的Fscore為它們排序,從而 向用戶推薦一個查詢組件的排名列表,使用戶可以快速檢索到想要的查詢結(jié)果。
[0058] 本發(fā)明未涉及部分均與現(xiàn)有技術(shù)相同或可采用現(xiàn)有技術(shù)加以實現(xiàn)。
【主權(quán)項】
1. 一種數(shù)據(jù)庫動態(tài)查詢表單的生成方法,其特征在于包括以下步驟: 步驟一:以一個包含數(shù)據(jù)庫中極少數(shù)主要屬性的基本查詢表單開始; 步驟二:用戶填寫查詢表單,系統(tǒng)執(zhí)行查詢; 步驟三:系統(tǒng)顯示查詢結(jié)果,若用戶對查詢結(jié)果滿意,則結(jié)束;否則,通過用戶對查詢 結(jié)果的點擊來反饋用戶的偏好,系統(tǒng)根據(jù)用戶偏好計算每個表單組件的得分,按得分的降 序排列為用戶提供一個表單組件的排名列表,用戶根據(jù)排名列表選擇相應(yīng)表單組件加入到 表單中來改善查詢表單,繼續(xù)執(zhí)行步驟二,直到用戶對查詢結(jié)果滿意。2. 根據(jù)權(quán)利要求1所述的一種數(shù)據(jù)庫動態(tài)查詢表單的生成方法,其特征在于查詢表單 的生成是一個迭代過程。3. 根據(jù)權(quán)利要求1所述的一種數(shù)據(jù)庫動態(tài)查詢表單的生成方法,其特征在于查詢表單 允許用戶填寫參數(shù)來生成不同的查詢。4. 根據(jù)權(quán)利要求1所述的一種數(shù)據(jù)庫動態(tài)查詢表單的生成方法,其特征在于步驟三中 系統(tǒng)顯示查詢結(jié)果采用的是壓縮表視圖。
【專利摘要】本發(fā)明提出一種數(shù)據(jù)庫動態(tài)查詢表單的生成方法,它為龐大而復(fù)雜的數(shù)據(jù)庫查詢提供了一種解決方法。它提出了以一個包含數(shù)據(jù)庫中極少數(shù)主要屬性的基本查詢表單開始,通過用戶與系統(tǒng)的交互,系統(tǒng)捕捉用戶的偏好,從而計算每個表單組件的得分,按得分的降序排列為用戶提供一個組件的排名列表,用戶可以選擇相應(yīng)的組件來增強和完善查詢表單。此過程是迭代進行的,直到用戶對查詢結(jié)果感到滿意。本發(fā)明可以讓用戶自定義查詢表單,能快速的從數(shù)據(jù)庫中檢索到想要的查詢結(jié)果。
【IPC分類】G06F17/30
【公開號】CN105320700
【申請?zhí)枴緾N201410379783
【發(fā)明人】李濤, 王敏君, 李千目, 侯軍, 徐建
【申請人】南京理工大學常熟研究院有限公司
【公開日】2016年2月10日
【申請日】2014年8月5日
當前第2頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
靖远县| 垫江县| 临邑县| 韶关市| 陆丰市| 桑植县| 松桃| 游戏| 贵溪市| 新干县| 扬中市| 彭泽县| 沧州市| 乌鲁木齐市| 鱼台县| 屯留县| 丰宁| 左贡县| 壤塘县| 东阿县| 临潭县| 新泰市| 新野县| 丹巴县| 平罗县| 恩平市| 玛多县| 富宁县| 邯郸县| 武邑县| 化隆| 河北区| 邵阳县| 江北区| 奇台县| 康平县| 凭祥市| 江川县| 阳江市| 板桥市| 阜宁县|