一種基于模板的出版物半自動(dòng)生成方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開(kāi)了一種基于模板的出版物半自動(dòng)生成方法及系統(tǒng),屬于信息檢索【技術(shù)領(lǐng)域】。本發(fā)明根據(jù)用戶的需求選擇相應(yīng)的數(shù)字內(nèi)容類型和版面布局,將用戶的選擇和確定的內(nèi)容使用標(biāo)記語(yǔ)言生成模板描述文件;根據(jù)模板描述文件在互聯(lián)網(wǎng)進(jìn)行信息抓取,同時(shí)在本地已經(jīng)建立好的本地知識(shí)庫(kù)中檢索相關(guān)信息,對(duì)得到數(shù)據(jù)進(jìn)行合并和相似度計(jì)算,得到相關(guān)內(nèi)容列表,然后存儲(chǔ)到本地?cái)?shù)據(jù)庫(kù)中;根據(jù)相關(guān)內(nèi)容列表和關(guān)鍵詞的相關(guān)性計(jì)算生成內(nèi)容草稿;將內(nèi)容草稿和相關(guān)內(nèi)容列表自動(dòng)發(fā)送到編輯軟件,用戶既可以對(duì)內(nèi)容草稿的內(nèi)容和格式進(jìn)行修改,也可以使用相關(guān)內(nèi)容列表中的內(nèi)容替換內(nèi)容草稿中的內(nèi)容,最后生成最終稿件。
【專利說(shuō)明】一種基于模板的出版物半自動(dòng)生成方法及系統(tǒng)
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于信息檢索【技術(shù)領(lǐng)域】,更具體地,涉及一種基于模板的出版物半自動(dòng)生 成方法及系統(tǒng),本發(fā)明利用標(biāo)記語(yǔ)言、多媒體檢索技術(shù)和信息融合技術(shù)實(shí)現(xiàn)出版物的半自 動(dòng)生成。
【背景技術(shù)】
[0002] 現(xiàn)有的數(shù)字出版物的生成過(guò)程是:作者或編者根據(jù)自己出版物的主題查閱資料, 進(jìn)行文字錄入,圖像掃描和圖形繪制,然后采用近似手工方式對(duì)自己感興趣的題材進(jìn)行編 輯、創(chuàng)作,使其彼此之間按照有機(jī)的方式交互聯(lián)系,具備良好的可讀性。然而最終成稿的數(shù) 字內(nèi)容,除了點(diǎn)睛之筆外,有近60%?70%的內(nèi)容來(lái)自于各種參考文獻(xiàn)。傳統(tǒng)的手工收集 素材和傳統(tǒng)的數(shù)字出版物的手工編輯方式需要大量的人力和物力,同時(shí)數(shù)字內(nèi)容的撰寫(xiě)周 期較長(zhǎng),獲得的素材所包含的廣度都有一定的局限。
【發(fā)明內(nèi)容】
[0003] 針對(duì)現(xiàn)有技術(shù)的以上缺陷或改進(jìn)需求,本發(fā)明提供一種基于模板的半自動(dòng)化出版 物方法及系統(tǒng),其目的在于縮短出版物的出版周期,由此解決出版物內(nèi)容自動(dòng)生成的技術(shù) 問(wèn)題。
[0004] 為實(shí)現(xiàn)上述目的,按照本發(fā)明的一個(gè)方面,提供一種基于模板的出版物半自動(dòng)生 成方法,包括以下步驟:
[0005] 步驟1接收用戶選擇和確定的出版物的數(shù)字內(nèi)容類型;
[0006] 步驟2接收所述用戶選擇和確定所述出版物的版面整體布局;
[0007] 步驟3對(duì)所述數(shù)字內(nèi)容類型和所述版面整體布局使用標(biāo)記語(yǔ)言生成模板描述文 件;
[0008] 步驟4根據(jù)所述數(shù)字內(nèi)容中每個(gè)內(nèi)容單元的關(guān)鍵詞從互聯(lián)網(wǎng)上抓取相關(guān)信息和 從本地知識(shí)庫(kù)中檢索相關(guān)信息得到信息列表,然后對(duì)所述信息列表進(jìn)行排序得到相關(guān)內(nèi)容 列表,其中,所述內(nèi)容單元為一個(gè)自然段;
[0009] 步驟5對(duì)所述相關(guān)內(nèi)容列表進(jìn)行相關(guān)性排序,生成內(nèi)容草稿;
[0010] 步驟6根據(jù)所述相關(guān)內(nèi)容列表和所述內(nèi)容草稿進(jìn)行內(nèi)容編輯和修改,確定所述出 版物的最終的格式和內(nèi)容。
[0011] 按照本發(fā)明的另一方面,提供一種基于模板的出版物半自動(dòng)生成系統(tǒng),包括:
[0012] 模板定制模塊,根據(jù)用戶選擇的數(shù)字內(nèi)容類型和版面整體布局使用標(biāo)記語(yǔ)言生成 模板描述文件;
[0013] 草稿生成模塊,根據(jù)所述模板描述文件,在互聯(lián)網(wǎng)和本地知識(shí)庫(kù)中檢索相關(guān)信息 得到信息列表,然后對(duì)所述信息列表進(jìn)行相關(guān)性排序生成相關(guān)內(nèi)容列表,對(duì)所述相關(guān)內(nèi)容 列表進(jìn)行相關(guān)性排序生成內(nèi)容草稿;以及
[0014] 手工編輯模塊,用于對(duì)所述相關(guān)內(nèi)容列表和所述內(nèi)容草稿進(jìn)行編輯和修改,確定 所述出版物最終的格式和內(nèi)容。
[0015] 總體而言,通過(guò)本發(fā)明所構(gòu)思的以上技術(shù)方案與現(xiàn)有技術(shù)相比,具有以下有益效 果:
[0016] (1)數(shù)字內(nèi)容類型和版面整體布局可根據(jù)需求定制,滿足了各種各樣出版物的需 求;
[0017] (2)從互聯(lián)網(wǎng)上抓取信息和從本地知識(shí)庫(kù)中檢索信息,即保證了題材的豐富性,又 保證了出版物的內(nèi)容的廣度,深度以及可信度;實(shí)現(xiàn)了出版物的數(shù)字化;
[0018] (3)對(duì)從互聯(lián)網(wǎng)抓取下來(lái)的信息和從本地知識(shí)庫(kù)中檢索的信息自動(dòng)進(jìn)行整理,生 成內(nèi)容草稿,將內(nèi)容草稿和相關(guān)內(nèi)容列表提供給用戶進(jìn)行編輯,大大降低了人力成本,縮短 了出版物的生成周期;
[0019] (4)用戶對(duì)內(nèi)容草稿和相關(guān)內(nèi)容列表進(jìn)行選擇和編輯,保證了最后生成稿件的正 確性,相關(guān)性和可取性。
【專利附圖】
【附圖說(shuō)明】
[0020] 圖1為本發(fā)明基于模板的出版物半自動(dòng)生成系統(tǒng)的結(jié)構(gòu)示意圖;
[0021] 圖2為本發(fā)明基于模板的出版物半自動(dòng)生成方法的流程圖;
[0022] 圖3為本發(fā)明數(shù)字內(nèi)容類型選擇的流程圖;
[0023] 圖4為本發(fā)明版面整體布局設(shè)計(jì)的流程圖;
[0024] 圖5為本發(fā)明使用標(biāo)記語(yǔ)言進(jìn)行語(yǔ)義描述的流程圖;
[0025] 圖6為本發(fā)明相關(guān)數(shù)字內(nèi)容抓取的流程圖;
[0026] 圖7為本發(fā)明草稿自動(dòng)生成的流程圖;
[0027] 圖8為本
【發(fā)明內(nèi)容】
編輯的流程圖;
[0028] 圖9為本
【發(fā)明內(nèi)容】
編輯操作界面演示圖。
【具體實(shí)施方式】
[0029] 為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合附圖及實(shí)施例,對(duì) 本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說(shuō)明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并 不用于限定本發(fā)明。此外,下面所描述的本發(fā)明各個(gè)實(shí)施方式中所涉及到的技術(shù)特征只要 彼此之間未構(gòu)成沖突就可以相互組合。
[0030] 圖1所示為本發(fā)明基于模板的出版物半自動(dòng)生成系統(tǒng)的結(jié)構(gòu)示意圖,包括模板定 制模塊1〇〇、草稿生成模塊200和手工編輯模塊300。
[0031] 模板定制模塊100根據(jù)用戶選擇的數(shù)字內(nèi)容類型和版面整體布局使用標(biāo)記語(yǔ)言 生成模板描述文件。模板定制模塊100包括:數(shù)字內(nèi)容類型選擇模塊101、版面整體布局設(shè) 計(jì)模塊102和語(yǔ)義描述模塊103。數(shù)字內(nèi)容類型選擇模塊101用于選擇和確定數(shù)字內(nèi)容,用 戶通過(guò)選擇出版物的類型、章節(jié)、標(biāo)題、段落和填寫(xiě)每個(gè)段落的關(guān)鍵詞等信息來(lái)確定出版物 的數(shù)字內(nèi)容類型,其中每個(gè)自然段為一個(gè)內(nèi)容單元。版面整體布局設(shè)計(jì)模塊102用于選擇 和確定版面整體布局,具有相同格式和布局的文字塊組成一個(gè)布局單元,用戶通過(guò)選擇出 版物的封面和每個(gè)布局單元的字體、字號(hào)、線條和顏色等信息來(lái)確定出版物的版面整體布 局。語(yǔ)義描述模塊103根據(jù)用戶選擇的數(shù)字內(nèi)容類型和版面整體布局設(shè)計(jì),對(duì)數(shù)字內(nèi)容類 型和生成的版面整體布局信息使用標(biāo)記語(yǔ)言生成模板描述文件。在本發(fā)明實(shí)施例中,語(yǔ)義 描述模塊103依次讀入每一個(gè)內(nèi)容單元和布局單元,然后依次使用標(biāo)記語(yǔ)言來(lái)表示。標(biāo)記 語(yǔ)言是一種將文本以及文本相關(guān)的其他信息結(jié)合起來(lái),展現(xiàn)出關(guān)于文檔結(jié)構(gòu)和數(shù)據(jù)處理細(xì) 節(jié)的電腦編碼。與文本相關(guān)的其他信息(包括文本的結(jié)構(gòu)和表示信息等)與原來(lái)的文本結(jié) 合在一起,但是使用標(biāo)記進(jìn)行標(biāo)識(shí)。在本發(fā)明實(shí)施例中,使用的標(biāo)記語(yǔ)言對(duì)各定義的標(biāo)簽解 釋如下:publicationname:出版物的書(shū)名或期刊名屬性集;name:名字;top:到頂部的距 離;bottom:到底部的距離;left:到左邊緣的距離;right:到右邊緣的距離;font:字體; fontsize:字體大??;color:顏色;version:版本;author:作者;booksize:出版物的長(zhǎng)度 及寬度;press:出版社;printing:印刷廠;bind:裝訂廠;numberofprint:印刷次;price: 價(jià)格;pagenumber :總頁(yè)數(shù);linestyle :線條格式;page :出版物的頁(yè)數(shù)集合;pageid :頁(yè) 數(shù);plate :本頁(yè)的版面格式集合;title :版面的標(biāo)題格式的集合;contents :版面標(biāo)題的 內(nèi)容;body :版面的內(nèi)容;keyword :版面的關(guān)鍵字等。
[0032] 標(biāo)記語(yǔ)言的一種具體實(shí)現(xiàn)文檔格式如下所示:
[0033] -.................................<?-version^'LO"-encoding=〃UTF-8〃?> .................................................................................................................................................................................... 〈publication〉 < pub1i c at i onname > < n ame >馬云和他創(chuàng)造的帝國(guó)< / n ame > <top>5</top) <bottom>48</bottom> <left>5〈/le'ft>
[0034] I <right>5</right) | I <font> 黑體 </font> I I <fontsize>16</fontsize> | I <color>black</color> | I </publicationname> | I <version>2</version) | I <author>zE3i</author) | I <booksize> | I <width>787</width> | I <height>1092</height> | I </booksize> | I 〈press〉北京大學(xué)出版社〈/press〉 | I 〈printing〉北京東光印刷廠〈/printing〉 | I 〈bind〉三河市皇家裝訂廠〈/bind〉 | ! <numberofprint>5</numberofprint> | ! <price>230.5</price> | I <pagenumber>142</pagenumber> | I <linestyle>l</linestyle> | I 〈/publication〉 |
[0035] 草稿生成模塊200根據(jù)語(yǔ)義描述模塊103生成的模板描述文件,在互聯(lián)網(wǎng)和本地 知識(shí)庫(kù)中檢索相關(guān)信息得到信息列表,然后對(duì)信息列表進(jìn)行相關(guān)性排序生成相關(guān)內(nèi)容列 表,對(duì)相關(guān)內(nèi)容列表進(jìn)行加工生成內(nèi)容草稿。在本發(fā)明實(shí)施例中,本地知識(shí)庫(kù)是由用戶自己 平時(shí)收集的多種類的素材組成的數(shù)據(jù)庫(kù)。草稿生成模塊200包括:相關(guān)數(shù)字內(nèi)容抓取模塊 201和草稿自動(dòng)生成模塊202。相關(guān)數(shù)字內(nèi)容抓取模塊201根據(jù)每個(gè)內(nèi)容單元的一組關(guān)鍵詞 從互聯(lián)網(wǎng)上抓取相關(guān)信息和從本地知識(shí)庫(kù)檢索相關(guān)信息,將以上兩部分信息合并得到信息 列表。在本發(fā)明實(shí)施例中,從互聯(lián)網(wǎng)上抓取相關(guān)信息是借用主流的搜索引擎來(lái)實(shí)現(xiàn)的。根 據(jù)與內(nèi)容單兀中的關(guān)鍵詞的相關(guān)性對(duì)彳目息列表中的條目進(jìn)行由1?到低的排序,得到相關(guān)內(nèi) 容列表,將該相關(guān)內(nèi)容列表存入本地?cái)?shù)據(jù)庫(kù)中。在本發(fā)明實(shí)施例中,本地?cái)?shù)據(jù)庫(kù)不同于本地 知識(shí)庫(kù),本地?cái)?shù)據(jù)庫(kù)用來(lái)存放相關(guān)內(nèi)容列表、內(nèi)容草稿和最終稿件。草稿自動(dòng)生成模塊202 對(duì)每一個(gè)內(nèi)容單元所對(duì)應(yīng)的相關(guān)內(nèi)容列表進(jìn)行相關(guān)性排序,生成內(nèi)容草稿,然后存入到本 地?cái)?shù)據(jù)庫(kù)中。
[0036] 手工編輯模塊300包括內(nèi)容編輯模塊301,根據(jù)用戶對(duì)相關(guān)內(nèi)容列表和內(nèi)容草稿 進(jìn)行的內(nèi)容編輯和修改,確定出版物最終的格式和內(nèi)容。
[0037] 圖2所示為本發(fā)明基于模板的出版物半自動(dòng)生成方法的流程圖,具體包括以下步 驟:
[0038] (1)選擇和確定出版物的數(shù)字內(nèi)容類型;
[0039] (2)選擇和確定出版物的版面整體布局;
[0040] (3)根據(jù)用戶在上兩步的選擇,對(duì)所選擇的數(shù)字內(nèi)容類型和版面整體布局信息使 用標(biāo)記語(yǔ)言生成模板描述文件;
[0041] (4)根據(jù)數(shù)字內(nèi)容中每個(gè)內(nèi)容單元的關(guān)鍵詞從互聯(lián)網(wǎng)上抓取相關(guān)信息和從本地知 識(shí)庫(kù)中檢索相關(guān)信息得到信息列表,然后對(duì)信息列表進(jìn)行排序得到相關(guān)內(nèi)容列表;
[0042] (5)對(duì)相關(guān)內(nèi)容列表進(jìn)行相關(guān)性排序,生成內(nèi)容草稿;
[0043] (6)用戶對(duì)相關(guān)內(nèi)容列表和內(nèi)容草稿進(jìn)行內(nèi)容編輯和修改,確定出版物的最終的 格式和內(nèi)容。
[0044] 圖3所示為本發(fā)明數(shù)字內(nèi)容類型選擇的流程圖,具體包括以下子步驟:
[0045] (1-1)選擇出版物的類型,例如報(bào)紙、期刊、圖書(shū)和文獻(xiàn)等;
[0046] (1-2)確定出版物的書(shū)名或者刊名;
[0047] (1-3)判斷出版物是否分章節(jié),是則執(zhí)行步驟(1-4),否則執(zhí)行步驟(1-6);
[0048] (1-4)確定出版物的章節(jié)數(shù)和每章每節(jié)的標(biāo)題;
[0049] (1-5)將出版物的每節(jié)劃分成多個(gè)段落,用戶為每個(gè)段落(即每個(gè)內(nèi)容單元)確定 一組關(guān)鍵詞;
[0050] (1-6)判斷出版物是否分版塊和版面,是則執(zhí)行步驟(1-7),否則執(zhí)行步驟(1-9);
[0051] (1-7)確定出版物的版塊數(shù)和每個(gè)版塊的標(biāo)題;
[0052] (1-8)確定每個(gè)版塊的一組關(guān)鍵詞;
[0053] (1-9)判斷出版物是否有其獨(dú)特內(nèi)容,是則執(zhí)行步驟(1-10),否則流程結(jié)束,在本 發(fā)明實(shí)施例中,獨(dú)特內(nèi)容包括例如:前言和致讀者信;
[0054] (1-10)編寫(xiě)出版物的獨(dú)特內(nèi)容,流程結(jié)束。
[0055] 圖4所示為本發(fā)明版面整體布局設(shè)計(jì)的流程圖,具體包括以下子步驟:
[0056] (2-1)判斷出版物是否有封面,是則執(zhí)行步驟(2-2),否則執(zhí)行步驟(2-3);
[0057] (2-2)確定封面的布局、風(fēng)格、標(biāo)題字體、字號(hào)、顏色和位置;
[0058] (2-3)判斷出版物是否為圖書(shū)類,是則執(zhí)行步驟(2-4),否則執(zhí)行步驟(2-6);
[0059] (2-4)將每章和每節(jié)劃分成多個(gè)獨(dú)立的布局單元;
[0060] (2-5)選擇每個(gè)布局單元的字體、字號(hào)、線條、顏色、行間距和欄式;
[0061] (2-6)判斷出版物是否為期刊類,是則執(zhí)行步驟(2-7),否則流程結(jié)束;
[0062] (2-7)將出版物分成多個(gè)出版欄和版塊,并劃分成多個(gè)獨(dú)立的布局單元;
[0063] (2-8)選擇每個(gè)布局單元的版心、版式、欄式、字體、字號(hào)、顏色和行間距,流程結(jié) 束。
[0064] 圖5所示為本發(fā)明使用標(biāo)記語(yǔ)言進(jìn)行語(yǔ)義描述的流程圖,具體包括以下子步驟: [0065] (3-1)將所有布局單元和內(nèi)容單元載入到待處理隊(duì)列;
[0066] (3-2)判斷待處理隊(duì)列是否為空,是則流程結(jié)束,否則執(zhí)行步驟(3-3);
[0067] (3-3)將布局單元中的布局信息(例如寬、長(zhǎng)、字號(hào)和字體等)轉(zhuǎn)換成如上所述的 標(biāo)記語(yǔ)言輸出到模板描述文件中;
[0068] (3-4)將內(nèi)容單元中的標(biāo)題和該內(nèi)容單元中的關(guān)鍵詞轉(zhuǎn)換成如上所述的標(biāo)記語(yǔ)言 輸出到模板描述文件中,然后執(zhí)行步驟(3-2)。
[0069] 圖6所示為本發(fā)明相關(guān)數(shù)字內(nèi)容抓取的流程圖,具體包括以下子步驟:
[0070] (4-1)載入上述步驟(3-4)和(3-5)生成的模板描述文件;
[0071] (4-2)根據(jù)上述模板描述文件將所有的內(nèi)容單元中的關(guān)鍵詞按照輸入順序排列組 成關(guān)鍵詞隊(duì)列,每個(gè)內(nèi)容單元的一組關(guān)鍵詞為一條記錄;
[0072] (4-3)判斷關(guān)鍵詞隊(duì)列是否為空,是則流程結(jié)束,否則執(zhí)行步驟(4-4);
[0073] (4-4)讀取一條記錄,去掉分隔符,解析該條記錄成一組由空格分隔開(kāi)的關(guān)鍵詞;
[0074] (4-5)使用搜索引擎檢索該組關(guān)鍵詞,得到結(jié)果1 ;
[0075] (4-6)在本地知識(shí)庫(kù)檢索該組關(guān)鍵詞,得到結(jié)果2 ;
[0076] (4-7)將結(jié)果1和結(jié)果2合并得到信息列表,根據(jù)與該組關(guān)鍵詞的相關(guān)性對(duì)信息列 表進(jìn)行由高到低的排序得到相關(guān)內(nèi)容列表,其中一組關(guān)鍵詞和一篇文章的相關(guān)性計(jì)算方法 為:
[0077]
【權(quán)利要求】
1. 一種基于模板的出版物半自動(dòng)生成方法,其特征在于,包括: 步驟1接收用戶選擇和確定的出版物的數(shù)字內(nèi)容類型; 步驟2接收所述用戶選擇和確定所述出版物的版面整體布局; 步驟3對(duì)所述數(shù)字內(nèi)容類型和所述版面整體布局使用標(biāo)記語(yǔ)言生成模板描述文件; 步驟4根據(jù)所述數(shù)字內(nèi)容中每個(gè)內(nèi)容單元的關(guān)鍵詞從互聯(lián)網(wǎng)上抓取相關(guān)信息和從本 地知識(shí)庫(kù)中檢索相關(guān)信息得到信息列表,然后對(duì)所述信息列表進(jìn)行排序得到相關(guān)內(nèi)容列 表,其中,所述內(nèi)容單元為一個(gè)自然段; 步驟5對(duì)所述相關(guān)內(nèi)容列表進(jìn)行相關(guān)性排序,生成內(nèi)容草稿; 步驟6根據(jù)所述相關(guān)內(nèi)容列表和所述內(nèi)容草稿進(jìn)行內(nèi)容編輯和修改,確定所述出版物 的最終的格式和內(nèi)容。
2. 如權(quán)利要求1所述的方法,其特征在于,所述步驟1具體包括以下子步驟: (1-1)選擇所述出版物的類型; (1-2)確定所述出版物的書(shū)名或者刊名; (1-3)判斷所述出版物是否分章節(jié),是則執(zhí)行步驟(1-4),否則執(zhí)行步驟(1-6); (1-4)確定所述出版物的章節(jié)數(shù)和每章每節(jié)的標(biāo)題; (1-5)將所述出版物的每節(jié)劃分成多個(gè)段落,每個(gè)段落確定一組關(guān)鍵詞; (1-6)判斷所述出版物是否分版塊,是則執(zhí)行步驟(1-7),否則執(zhí)行步驟(1-9); (1-7)確定所述出版物的版塊數(shù)和每個(gè)版塊的標(biāo)題; (1_8)確定每個(gè)版塊的一組關(guān)鍵詞; (1-9)判斷所述出版物是否有其獨(dú)特內(nèi)容,是則執(zhí)行步驟(1-10),否則流程結(jié)束,其 中,所述獨(dú)特內(nèi)容包括前言和致讀者信; (1-10)編寫(xiě)所述獨(dú)特內(nèi)容,流程結(jié)束。
3. 如權(quán)利要求1或2所述的方法,其特征在于,所述步驟2具體包括以下子步驟: (2-1)判斷所述出版物是否有封面,是則執(zhí)行步驟(2-2),否則執(zhí)行步驟(2-3); (2-2)確定封面的布局、風(fēng)格、標(biāo)題字體、字號(hào)、顏色和位置; (2-3)判斷所述出版物是否為圖書(shū)類,是則執(zhí)行步驟(2-4),否則執(zhí)行步驟(2-6); (2-4)將每章和每節(jié)劃分成多個(gè)獨(dú)立的布局單元,其中,所述布局單元由具有相同格式 和布局的文字塊組成; (2-5)選擇每個(gè)布局單元的字體、字號(hào)、線條、顏色、行間距和欄式; (2-6)判斷所述出版物是否為期刊類,是則執(zhí)行步驟(2-7),否則流程結(jié)束; (2-7)將所述出版物分成多個(gè)出版欄和版塊,并劃分成多個(gè)獨(dú)立的布局單元; (2-8)選擇每個(gè)布局單元的版心、版式、欄式、字體、字號(hào)、顏色和行間距,流程結(jié)束。
4. 如權(quán)利要求3所述的方法,其特征在于,所述步驟3具體包括以下子步驟: (3-1)將所有布局單元和內(nèi)容單元載入到待處理隊(duì)列; (3-2)判斷所述待處理隊(duì)列是否為空,是則流程結(jié)束,否則執(zhí)行步驟(3-3); (3-3)將每一布局單兀中的布局信息轉(zhuǎn)換為標(biāo)記語(yǔ)言輸出到所述模板描述文件中; (3-4)將每一內(nèi)容單元中的標(biāo)題和關(guān)鍵詞轉(zhuǎn)換為標(biāo)記語(yǔ)言輸出到所述模板描述文件 中,然后執(zhí)行步驟(3-2)。
5. 如權(quán)利要求1或2所述的方法,其特征在于,所述步驟4具體包括以下子步驟: (4-1)載入所述模板描述文件; (4-2)根據(jù)所述模板描述文件將所有內(nèi)容單元中的關(guān)鍵詞進(jìn)行排列組成關(guān)鍵詞隊(duì)列, 每個(gè)內(nèi)容單元的一組關(guān)鍵詞為一條記錄; (4-3)判斷所述關(guān)鍵詞隊(duì)列是否為空,是則流程結(jié)束,否則執(zhí)行步驟(4-4); (4-4)讀取一條記錄,解析所述記錄成一關(guān)鍵詞組; (4-5)使用搜索引擎檢索所述關(guān)鍵詞組,得到第一結(jié)果; (4-6)在本地知識(shí)庫(kù)檢索該組關(guān)鍵詞組,得到第二結(jié)果; (4-7)將所述第一結(jié)果和所述第二結(jié)果合并得到所述信息列表,根據(jù)與所述關(guān)鍵詞組 的相關(guān)性對(duì)所述信息列表進(jìn)行由高到低的排序得到所述相關(guān)內(nèi)容列表,其中所述相關(guān)性的 計(jì)算方法為:
(4-8)將所述關(guān)鍵詞組的MD5值作為一條數(shù)據(jù)庫(kù)記錄的主鍵,并將所述相關(guān)內(nèi)容列表 作為所述數(shù)據(jù)庫(kù)記錄的內(nèi)容存儲(chǔ)到本地?cái)?shù)據(jù)庫(kù)中,然后執(zhí)行所述步驟(4-3)。
6. 如權(quán)利要求1所述的方法,其特征在于,所述步驟5具體包括以下子步驟: (5-1)載入所述模板描述文件; (5-2)根據(jù)所述模板描述文件將所有內(nèi)容單元中的關(guān)鍵詞進(jìn)行排列組成關(guān)鍵詞隊(duì)列, 每個(gè)內(nèi)容單元的一組關(guān)鍵詞為一條記錄; (5-3)判斷所述關(guān)鍵詞隊(duì)列是否為空,是則流程結(jié)束,否則執(zhí)行步驟(5-4); (5-4)計(jì)算所述關(guān)鍵詞的MD5值,根據(jù)所述MD5值讀取在本地?cái)?shù)據(jù)庫(kù)中的所述相關(guān)內(nèi)容 列表; (5-5)取檢索結(jié)果的前s條,將前t條文檔根據(jù)自然段分割成p個(gè)段落,其中t〈S ; (5-6)根據(jù)和所述關(guān)鍵詞的相關(guān)性對(duì)所述p個(gè)段落進(jìn)行由高到低的排序; (5-7)取排序后的p個(gè)段落中的前q段組成內(nèi)容草稿,其中q〈p,以所述組關(guān)鍵詞的MD5 值為主鍵和以所述內(nèi)容草稿為內(nèi)容存儲(chǔ)到本地?cái)?shù)據(jù)庫(kù)中,然后執(zhí)行所述步驟(5-3)。
7. 如權(quán)利要求6所述的方法,其特征在于,所述步驟6具體包括以下子步驟: (6-1)載入所述模板描述文件和本地?cái)?shù)據(jù)庫(kù)中的所述相關(guān)內(nèi)容列表和所述內(nèi)容草稿, 生成編輯隊(duì)列,所述編輯隊(duì)列的每條記錄包含內(nèi)容單元和從所述本地?cái)?shù)據(jù)庫(kù)中所檢索出的 內(nèi)容單元所對(duì)應(yīng)的相關(guān)內(nèi)容列表和內(nèi)容草稿; (6-2)判斷所述編輯隊(duì)列是否為空,是則執(zhí)行步驟(6-7),否則執(zhí)行步驟(6-3); (6-3)讀取一條記錄,解析出所述記錄的內(nèi)容單元和對(duì)應(yīng)的相關(guān)內(nèi)容列表與內(nèi)容草 稿; (6-4)調(diào)用編輯軟件,正文顯示所述關(guān)鍵詞和所述內(nèi)容草稿,旁欄顯示所述相關(guān)內(nèi)容列 表,同時(shí)根據(jù)布局單元中的內(nèi)容對(duì)所述內(nèi)容草稿進(jìn)行格式調(diào)整; (6-5)所述用戶根據(jù)自己的需要進(jìn)行編輯和調(diào)整; (6-6)將所述用戶的改動(dòng)保存到已完成隊(duì)列形成終審草稿,再執(zhí)行步驟(6-2); (6-7)將所述已完成隊(duì)列中的所述終審草稿保存到所述本地?cái)?shù)據(jù)庫(kù)中; (6-8)根據(jù)所述模板描述文件和所述本地?cái)?shù)據(jù)庫(kù)中的所述已完成隊(duì)列,生成出版物的 電子預(yù)覽版; (6-9)所述用戶選擇是否同意根據(jù)所述電子預(yù)覽版生成所述出版物,是則執(zhí)行步驟 (6-10),否則執(zhí)行步驟(6-1); (6-10)根據(jù)所述電子預(yù)覽版生成和打印所述出版物。
8. -種基于模板的出版物半自動(dòng)生成系統(tǒng),包括模板定制模塊、草稿生成模塊和手工 編輯模塊,其特征在于: 所述模板定制模塊,根據(jù)用戶選擇的數(shù)字內(nèi)容類型和版面整體布局使用標(biāo)記語(yǔ)言生成 模板描述文件; 所述草稿生成模塊,根據(jù)所述模板描述文件,在互聯(lián)網(wǎng)和本地知識(shí)庫(kù)中檢索相關(guān)信息 得到信息列表,然后對(duì)所述信息列表進(jìn)行相關(guān)性排序生成相關(guān)內(nèi)容列表,對(duì)所述相關(guān)內(nèi)容 列表進(jìn)行相關(guān)性排序生成內(nèi)容草稿;以及 所述手工編輯模塊,用于對(duì)所述相關(guān)內(nèi)容列表和所述內(nèi)容草稿進(jìn)行編輯和修改,確定 所述出版物最終的格式和內(nèi)容。
9. 如權(quán)利要求8所述的基于模板的出版物半自動(dòng)生成系統(tǒng),其特征在于,所述模板定 制模塊包括: 數(shù)字內(nèi)容類型選擇模塊,用于選擇和確定所述數(shù)字內(nèi)容類型,用戶通過(guò)選擇所述出版 物的類型、章節(jié)、標(biāo)題、段落和填寫(xiě)每個(gè)段落的關(guān)鍵詞等信息來(lái)確定所述出版物的所述數(shù)字 內(nèi)容類型,其中每個(gè)自然段為一個(gè)內(nèi)容單元; 版面整體布局設(shè)計(jì)模塊,用于選擇和確定版面整體布局,具有相同格式和布局的文字 塊組成一個(gè)布局單元,用戶通過(guò)選擇所述出版物的封面和每個(gè)布局單元的字體、字號(hào)、線條 和顏色等信息來(lái)確定所述出版物的所述版面整體布局;以及 語(yǔ)義描述模塊,根據(jù)所述數(shù)字內(nèi)容類型和所述版面整體布局,使用標(biāo)記語(yǔ)言生成模板 描述文件。
10. 如權(quán)利要求9所述的基于模板的出版物半自動(dòng)生成系統(tǒng),其特征在于,所述草稿生 成模塊包括: 相關(guān)數(shù)字內(nèi)容抓取模塊,根據(jù)每個(gè)內(nèi)容單元的一組關(guān)鍵詞從所述互聯(lián)網(wǎng)上抓取相關(guān)信 息和從所述本地知識(shí)庫(kù)檢索相關(guān)信息,將以上兩部分信息合并得到所述信息列表;以及 草稿自動(dòng)生成模塊,選取每一個(gè)內(nèi)容單元所對(duì)應(yīng)的相關(guān)內(nèi)容列表,根據(jù)與所述內(nèi)容單 元的關(guān)鍵詞的相關(guān)性進(jìn)行排序,生產(chǎn)所述內(nèi)容草稿,并存入本地?cái)?shù)據(jù)庫(kù)中。
【文檔編號(hào)】G06F17/24GK104123269SQ201410337781
【公開(kāi)日】2014年10月29日 申請(qǐng)日期:2014年7月16日 優(yōu)先權(quán)日:2014年7月16日
【發(fā)明者】鄒復(fù)好, 周可, 曹丙章, 鄭創(chuàng)偉, 鄭勝, 謝志成, 曾宇鵬 申請(qǐng)人:華中科技大學(xué), 深圳報(bào)業(yè)集團(tuán)