欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種數(shù)據(jù)處理方法和裝置的制造方法_2

文檔序號:9471484閱讀:來源:國知局
明實施例中是W對各數(shù)據(jù)源中的數(shù)據(jù)按照兩組設(shè)定關(guān)鍵詞組 進(jìn)行匹配合并為例進(jìn)行的說明。其中,步驟S202至步驟S208為按照第一設(shè)定關(guān)鍵詞組對 數(shù)據(jù)進(jìn)行匹配合并,步驟S210至步驟S214為按照第二設(shè)定關(guān)鍵詞組對數(shù)據(jù)進(jìn)行匹配合并。 在具體實現(xiàn)過程中,并不局限于本發(fā)明實施例中所記載的按照兩組設(shè)定關(guān)鍵詞組對數(shù)據(jù)進(jìn) 行匹配合并的方式,可W僅按照一組設(shè)定關(guān)鍵詞組對數(shù)據(jù)進(jìn)行匹配合并,還可W按照=組、 四組甚至多組設(shè)定關(guān)鍵詞組對數(shù)據(jù)進(jìn)行匹配合并。
[0040] 其中,本發(fā)明實施例中的數(shù)據(jù)源可W為影視數(shù)據(jù)存儲源,當(dāng)然,也可W是其他數(shù)據(jù) 源。當(dāng)數(shù)據(jù)源為影視數(shù)據(jù)源時,第一設(shè)定關(guān)鍵詞組可W為主電影名的前兩個字,第二設(shè)定關(guān) 鍵詞組可W為導(dǎo)演名,當(dāng)然,也可W為其他的關(guān)鍵詞組。
[0041] 步驟S204 :處理裝置針對每個數(shù)據(jù)組分別判斷存儲的數(shù)據(jù)中是否存在兩兩匹配 的數(shù)據(jù)。
[0042] 針對當(dāng)前數(shù)據(jù)組判斷存儲的數(shù)據(jù)中是否存在兩兩匹配的數(shù)據(jù)時:
[0043] 判斷當(dāng)前數(shù)據(jù)組中是否存儲有至少兩段數(shù)據(jù);若是,則判斷存儲的數(shù)據(jù)中是否存 在兩兩匹配的數(shù)據(jù)。
[0044] 當(dāng)數(shù)據(jù)組中僅存在一段數(shù)據(jù)時,則可斷定在該數(shù)據(jù)組中不存在與其匹配的數(shù)據(jù), 因此,無需進(jìn)行兩兩匹配。
[0045] 需要說明的是,對各數(shù)據(jù)組中存儲的數(shù)據(jù)進(jìn)行兩兩匹配時,可W對各數(shù)據(jù)組同時、 并行進(jìn)行處理。
[0046] 步驟S206 :當(dāng)存在兩兩匹配的數(shù)據(jù)時,處理裝置將兩兩匹配的數(shù)據(jù)進(jìn)行合并生成 匹配后的數(shù)據(jù)組。
[0047] 例如:數(shù)據(jù)組1中存儲有數(shù)據(jù)A和B,且A和B為相匹配的數(shù)據(jù),則將運兩段數(shù)據(jù) 進(jìn)行合并,此時,數(shù)據(jù)組1中僅包含一段數(shù)據(jù)。
[0048] 步驟S208 :處理裝置將匹配后的全部數(shù)據(jù)組中存儲的數(shù)據(jù)組合成第一數(shù)據(jù)集合。
[0049] 將匹配后的全部數(shù)據(jù)組中存儲的數(shù)據(jù)組合成第一數(shù)據(jù)集合后,此時即完成了按照 一組設(shè)定關(guān)鍵詞組對數(shù)據(jù)進(jìn)行匹配合并的處理流程。若需要進(jìn)行再次合并處理,則執(zhí)行步 驟S210即可,若無需再進(jìn)行合并處理,則終止整個流程即可。
[0050] 步驟S210:處理裝置對組合后的數(shù)據(jù)集合中存儲的數(shù)據(jù)按照第二設(shè)定關(guān)鍵詞組 進(jìn)行投影,W獲得與各設(shè)定關(guān)鍵詞相匹配的數(shù)據(jù)組。
[0051] 按照第二設(shè)定關(guān)鍵詞組對數(shù)據(jù)進(jìn)行投影的具體方式,參見按照第一設(shè)定關(guān)鍵詞對 數(shù)據(jù)進(jìn)行投影即可,本步驟中對此不再寶述。
[0052] 步驟S212:處理裝置針對每個數(shù)據(jù)組分別判斷存儲的數(shù)據(jù)中是否存在兩兩匹配 的數(shù)據(jù);當(dāng)存在兩兩匹配的數(shù)據(jù)時,將兩兩匹配的數(shù)據(jù)進(jìn)行合并生成匹配后的數(shù)據(jù)組。
[0053] 步驟S214 :處理裝置將匹配后的全部數(shù)據(jù)組中存儲的數(shù)據(jù)組合成第二數(shù)據(jù)集合。
[0054] 將匹配后的全部數(shù)據(jù)組中存儲的數(shù)據(jù)組合成第二數(shù)據(jù)集合后,此時即完成了按照 第二組設(shè)定關(guān)鍵詞組對數(shù)據(jù)進(jìn)行匹配合并的處理流程。若需要進(jìn)行第=次合并處理,則返 回執(zhí)行步驟S210,按照第S設(shè)定關(guān)鍵詞組對數(shù)據(jù)進(jìn)行投影即可,若無需再進(jìn)行合并處理,貝U 終止整個流程即可。 陽化5] 通過本發(fā)明實施例提供的數(shù)據(jù)處理方法,將各數(shù)據(jù)源中的數(shù)據(jù)首先按照第一設(shè)定 關(guān)鍵詞組進(jìn)行投影成多個數(shù)據(jù)組,然后將投影后的各數(shù)據(jù)組分別進(jìn)行兩兩匹配合并。相較 于現(xiàn)有的直接將各數(shù)據(jù)源中存儲的數(shù)據(jù)進(jìn)行兩兩合并的數(shù)據(jù)處理方法,大大縮短了數(shù)據(jù)處 理時間。
[0056] 下面參照圖3W-具體實例對本發(fā)明實施例數(shù)據(jù)處理方法進(jìn)行說明。本具體實例 中W對影視數(shù)據(jù)源中存儲的數(shù)據(jù)進(jìn)行五次投影(分別為主電影名、第一導(dǎo)演、主電影名稱 前兩個字、第一演員、第一編?。槔M(jìn)行說明。
[0057] 本具體實例的數(shù)據(jù)處理方法具體包括W下流程:
[0058]S1:對影視數(shù)據(jù)源中存儲的影視數(shù)據(jù)整合至一個數(shù)據(jù)集合。
[0059]S2:對各條影視數(shù)據(jù)按照第一設(shè)定關(guān)鍵詞組進(jìn)行投影操作。
[0060] 其中,本具體實例中第一設(shè)定關(guān)鍵詞組為電影名稱。按照第一設(shè)定關(guān)鍵詞組對數(shù) 據(jù)進(jìn)行分組即為按照圖3中所示的按照某種方式1投影。
[0061] 對每一條電影數(shù)據(jù)按照其主電影名(如:"賭城風(fēng)云II"主電影名為:"賭城風(fēng)云 2","饑餓游戲3 :嘲笑鳥(上)"的主電影名為:"饑餓游戲","勝者即是正義2014SP"的主 電影名為:"勝者即是正義")分別進(jìn)行分組,將相同的電影名稱的電影數(shù)據(jù)分為一組。
[00創(chuàng) S3 :分別對各組數(shù)據(jù)進(jìn)行匹配合并。
[0063] 如圖3所示,分別對分好的每一組數(shù)據(jù)進(jìn)行匹配合并。進(jìn)行匹配合并的具體方案 為:如果分組中的數(shù)據(jù)量大于1,則對分組中的數(shù)據(jù)分別進(jìn)行兩兩匹配和合并,因為每一分 組中的數(shù)據(jù)互不相干,因此,各分組之間的計算可W并行執(zhí)行。.
[0064]S4 :對合并后的所有分組重新組合在一起,形成一個大的數(shù)據(jù)集合。 陽0化]S5 :按照第二設(shè)定關(guān)鍵詞組對重新組合的數(shù)據(jù)集合進(jìn)行分組。
[0066] 其中,本具體實例中第二設(shè)定關(guān)鍵詞組為第一導(dǎo)演的姓名。按照第二設(shè)定關(guān)鍵詞 組對數(shù)據(jù)進(jìn)行分組即為按照某種方式2投影。
[0067] 對于上述經(jīng)過第一設(shè)定關(guān)鍵詞組匹配、合并、組合后的數(shù)據(jù)集合,按照第一導(dǎo)演進(jìn) 行分組。
[0068]S6 :重復(fù)執(zhí)行步驟S3、S4,最終組合成一個新的數(shù)據(jù)集合。
[0069]S7:同步驟Sl-S4(或S5-S6),分別再按照主電影名稱前兩個字、第一演員、第一編 劇對數(shù)據(jù)集合進(jìn)行投影,投影完畢進(jìn)行匹配合并計算,即可完成整個匹配合并流程。
[0070] 需要說明的是,上述具體實例中是W進(jìn)行多次投影為例進(jìn)行的說明,在具體實現(xiàn) 過程中,可W僅進(jìn)行一次投影。
[0071] 本發(fā)明實施例提供的數(shù)據(jù)處理方法具有W下效果:
[0072] 時間效果:應(yīng)用上述投影方式計算后,計算時間由原來的7-12小時降至3-5分鐘, 計算效率獲得極大提升。
[0073] 時間復(fù)雜度分析:在大量影視數(shù)據(jù)(條數(shù)為n)中,將其中所有的電影數(shù)目、所有的 演員數(shù)目、所有的導(dǎo)演數(shù)目、所有的編劇數(shù)目設(shè)為叫,m2,…,實際進(jìn)行投影操作時,計算時 間近似為:
[0074]
陽0巧]其中k為常數(shù)。
[0076] 由于nil的數(shù)據(jù)量很大,可W認(rèn)為:
[0077]
[007引其中,k池為常數(shù)。因此,可W認(rèn)為其計算時間為:
[0079]
[0080] 由于ki和k均為常數(shù),本發(fā)明實施例中的數(shù)據(jù)處理方法的最終計算復(fù)雜度為 0(n)〇
[0081] 投影方向選擇分析:
[0082]在選擇投影方向時,可W通過某幾種相對簡單的計算(如實例中的電影主名、第 一導(dǎo)演、第一演員等,算法的選擇影視數(shù)據(jù)集的不同而不同)將整個數(shù)據(jù)集投影,方向的選 擇應(yīng)當(dāng)盡量在數(shù)據(jù)空間中相互正交(即每次投影后,需要合并的內(nèi)容與前述投影需要合并 的內(nèi)容之間的重合度越低越好),W減少重復(fù)計算的次數(shù)。可W選擇一個相對比較寬松的策 略將數(shù)據(jù)集合進(jìn)行投影,使得投影后每一個分組內(nèi)的數(shù)據(jù)覆蓋范圍更廣,W補償多次精細(xì) 投影均覆蓋不到的位置,從而減少精度損失,如上述具體實例中按電影主名前兩個字投影 的策略。
[0083] 需要說明的是在具體實現(xiàn)過程中,可W準(zhǔn)備幾種不同的投影方式,相互組合之后 對數(shù)據(jù)集進(jìn)行測試,從而找到一個速度與精度的可W接受的合理平衡點,具體平衡點的選 擇視場景和數(shù)據(jù)集而定。
[0084] 本具體實例提供的數(shù)據(jù)處理方法,可W應(yīng)用于需要對數(shù)據(jù)集進(jìn)行兩兩匹配或者兩 兩計算的場景中,如圖像的匹配算法等,本發(fā)明實施例提供的數(shù)據(jù)處理方法通過在不同的 維度進(jìn)行投影,再進(jìn)行復(fù)雜的計算,從而縮短了程序的運行時間,增加單位時間的數(shù)據(jù)處理 能力。 陽0財 實施例S
[0086] 參照圖4,示出了本發(fā)明實施例=的一種數(shù)據(jù)處理裝置的結(jié)構(gòu)框圖。
[0087] 本發(fā)明實施例提供的數(shù)據(jù)處理裝置包括:第一分組模塊402,用于對各數(shù)據(jù)源中 存儲的數(shù)據(jù)按照第一設(shè)定關(guān)鍵詞組進(jìn)行投影,W獲得與各設(shè)定關(guān)鍵詞相匹配的數(shù)據(jù)組;第 一合并模塊404,用于針對每個數(shù)據(jù)組分別判斷存儲的數(shù)據(jù)中是否存在兩兩匹配的數(shù)據(jù); 當(dāng)存在兩兩匹配的數(shù)據(jù)時,將兩兩匹配的數(shù)據(jù)進(jìn)行合并生成匹配后的數(shù)據(jù)組;第一組合模 塊406,用于將匹配后的全部數(shù)據(jù)組中存儲的數(shù)據(jù)組合成第一數(shù)據(jù)集合。
[0088] 優(yōu)選地,所述裝置還
當(dāng)前第2頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
达孜县| 韶山市| 利津县| 恩平市| 枣庄市| 青川县| 岱山县| 大埔县| 繁峙县| 安塞县| 桐柏县| 南京市| 吴旗县| 通渭县| 山东省| 陇西县| 平潭县| 祁连县| 米泉市| 民和| 潜山县| 三亚市| 顺义区| 大洼县| 兴化市| 二连浩特市| 吴忠市| 雅江县| 章丘市| 剑川县| 张家口市| 井陉县| 民县| 施甸县| 砀山县| 永宁县| 建湖县| 绥化市| 宁夏| 兴山县| 龙游县|