欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

推斷布局意圖的制作方法

文檔序號:11530731閱讀:264來源:國知局
推斷布局意圖的制造方法與工藝



背景技術:

當今電子文檔中的大多數(shù)類型的內容已經使用明確格式化信息而不是格式意圖信息來定義。例如,演示文檔可以包括已被明確格式化為粗體或斜體的文本,而不是被定義為強調的文本。作為另一示例,文字處理文檔可以包括明確地指示兩個圖像應當被放置在頁面上的特定位置中的數(shù)據(jù)而不是指示圖像意在作為前后比較而并排呈現(xiàn)的數(shù)據(jù)。

當嘗試改變意圖或重新布局已經使用明確格式化信息而不是格式意圖信息定義的文檔內容時,可能難以在具有顯著不同的顯示大小、能力和/或寬高比的設備上最佳地呈現(xiàn)文檔內容。例如,使用明確格式化信息來定義以在縱向方向上適合8.5"×11"打印頁面的文檔中的內容可能難以以橫向打印模式呈現(xiàn)在智能手機或平板設備上。當試圖呈現(xiàn)使用明確格式化信息而不是格式意圖信息來定義的文檔內容時,也可能存在其他挑戰(zhàn)。

關于這些考慮和其他考慮,提出了本文做出的公開內容。



技術實現(xiàn)要素:

本文描述了推斷布局意圖的技術。通過實現(xiàn)本文所公開的技術,可以從明確格式化的文檔元素中推斷文檔作者的布局意圖(本文中其也可以被稱為“表達意圖”或“作者的格式化意圖”)。然后可以使用針對文檔中的明確格式化的文檔元素的推斷的布局意圖來生成基于意圖的文檔。然后可以利用該基于意圖的文檔來以保留文檔作者的原始布局意圖的方式有效地呈現(xiàn)文檔。此外,因為基于意圖的文檔是根據(jù)布局意圖而不是通過使用明確格式化來定義的,所以可以以各種尺寸和方向,并且可以在不同類型的具有不同屏幕類型和高寬比的設備上有效地呈現(xiàn)文檔。此外,在一些配置中,文檔中的內容元素的意境(mood)和/或樣式可以被修改,同時仍然保留文檔作者的原始格式化意圖。

為了從具有明確格式化的文檔元素的文檔中生成基于意圖的文檔,在一些配置中首先確定文檔的布局類型。例如,但不限于此,啟發(fā)式算法和/或機器學習分類器可以用于確定文檔的布局是否為“紙狀的”或“演示狀的”。機器學習分類器可以是基于人類對訓練文檔構成的語料庫中的文檔布局的分類來訓練。

一般而言,紙狀的文檔布局是意在以從上到下的方式(例如,以英語語言)被線性消費的布局。演示狀的文檔布局通常包括意在按順序示出的離散“幻燈片”。演示狀的文檔布局還通常具有以與紙狀的文檔布局中重復內容不同的方式從幻燈片到幻燈片重復的內容。還可以在其他配置中識別除了紙狀的和演示狀的布局之外的文檔布局類型。

一旦文檔的布局類型已經確定,就可以確定文檔中明確格式化的文檔元素的布局意圖。例如但不限于此,文本(包括格式化屬性)可以被區(qū)分和聚類。另外,可以利用頻率和/或統(tǒng)計知識來將意圖分配給不同的聚類。還可以確定文檔中的明確格式化的粗體或斜體文本旨在提供對文本的強調。例如,文檔可能具有除了是非斜體格式的語塊或單詞外其所有文本為斜體。在這種情況下,斜體文本可能被認為是非強調的,并且太頻繁的非斜體文本可能被認為是強調。可替代地,可以確定明確格式化的粗體或斜體文本旨在建立節(jié)主題、文檔的標題或指定直接引用。

在一些配置中,文檔元素之間的二維(“2d”)和/或三維(“3d”)空間關系可以用于推斷文檔作者關于那些元素或其他元素的布局意圖。同樣地,例如,演示狀的文檔中的文檔元素之間的時間關系可以用于推斷文檔作者關于那些文檔元素或其他文檔元素的布局意圖。還可以以其他方式確定文檔作者關于明確格式化的文檔元素的各種其他類型的布局意圖。

在一些配置中,一個或多個啟發(fā)式算法和/或一個或多個機器學習分類器確定文檔中明確格式化的文檔元素的布局意圖。例如,但不限于此,啟發(fā)式算法可以檢查文檔中的文檔元素的模式或配置,以確定針對包含在其中的明確格式化的文檔元素的推斷的布局意圖。

用于推斷布局意圖的啟發(fā)式算法和/或機器學習分類器可以基于包含明確格式化的文檔元素的文檔的所確定的布局類型來選擇和/或配置。以這種方式,用于推斷該明確格式化的文檔元素的布局意圖的軟件部件可以基于確定的文檔布局類型來進行定制。用于確定布局意圖的機器學習分類器還可以基于人類對訓練文檔語料庫中的文檔中的明確格式化文檔元素的布局意圖的分類進行訓練。

在一些配置中,使用針對文檔中的部分或全部明確格式化的文檔元素的推斷的布局意圖來創(chuàng)建基于意圖的文檔。在一個配置中,基于意圖的文檔包括標記,該標記根據(jù)推斷的生成基于意圖的文檔所依據(jù)的文檔的作者的布局意圖來定義基于意圖的文檔的內容。在上文給出的示例中,確定了粗體或斜體文本的作者的布局意圖是為了對文本的強調,例如,基于意圖的文檔可以包括文本以及相關聯(lián)的標記,其指示文本在呈現(xiàn)時將被強調。以類似的方式,如果確定了非格式化文本的作者的布局要提供強調,還如上文給出的示例,標記可以與非格式化的文本相關聯(lián),其指示該文本在呈現(xiàn)時要被強調。在上文給出的示例中,確定了粗體或斜體文本的作者的布局意圖要定義節(jié)主題,基于意圖的文檔可以包括文本和相關的標記,其指示該文本要在呈現(xiàn)時被用作節(jié)主題。其他類型的標記也可以在基于意圖的文檔中使用,以便定義文檔元素及其相關聯(lián)的布局意圖。

在一些配置中,還為每個推斷的布局意圖生成一個或多個確定性分數(shù)。確定性分數(shù)是針對明確格式化的文檔元素的推斷的布局意圖為文檔作者的真實的布局意圖的確定性的度量。確定性分數(shù)在呈現(xiàn)基于意圖的文檔并且潛在地出于其他目的時可以被利用。例如,但不限于此,具有最高確定性分數(shù)的布局意圖可以用于在基于意圖的文檔中初始地呈現(xiàn)文檔元素。然后,用戶可以指示用于特定文檔元素的布局是不正確的(例如,文本被顯示為被強調而不是作為期望的節(jié)主題)。在這種情況下,具有下一個最高確定性分數(shù)的明確格式化的文檔元素的布局意圖然后可以用于呈現(xiàn)文檔元素。在其他配置中,還可以以其他方式使用確定性分數(shù)。

應當理解,上文描述的主題還可以被實現(xiàn)為計算機控制的裝置、計算機過程、計算系統(tǒng)或作為諸如計算機可讀介質的制品。通過閱讀以下具體實施方式和對相關的附圖的綜述,這些和各種其它特征將是顯而易見的。

提供本發(fā)明內容來以簡化形式介紹一系列概念,這些概念在下文的具體實施方式中進一步描述。本發(fā)明內容不旨在確定所要求保護的主題的主要特征或基本特征,也不旨在將本發(fā)明內容用于限制所要求保護的主題的范圍。此外,所要求保護的主題不限于解決在本公開內容的任何部分中指出的任何或所有缺點的實現(xiàn)。

附圖說明

圖1是示出了例示本文描述的一種機制的方面的例程的流程圖,該種機制用于使用推斷的布局意圖從其中文檔元素已經使用明確格式化信息來定義的文檔中生成基于意圖的文檔;

圖2是示出了文檔布局分類服務的配置和操作的方面的軟件架構圖,該文檔布局分類服務可以用于對將被轉換為基于意圖的文檔的文檔的布局進行分類;

圖3是示出了例示文檔布局分類服務的操作的方面的例程的流程圖,該文檔布局類型服務用于對將被轉換為基于意圖的文檔的文檔的布局進行分類;

圖4是示出了文檔轉換服務的配置和操作的方面的軟件架構圖,該文檔轉換服務用于從包括明確格式化的文檔元素的文檔生成基于意圖的文檔;

圖5是示出了例示文檔轉換服務的操作的方面的例程的流程圖,該文檔轉換服務用于從包括明確格式化的文檔元素的文檔生成基于意圖的文檔;

圖6是例示了能夠實現(xiàn)本文給出的技術的方面的計算系統(tǒng)的說明性計算機硬件和軟件架構的計算機架構圖;

圖7是例示了能夠實現(xiàn)本文給出的技術的方面的分布式計算環(huán)境的圖;以及

圖8是例示了能夠實現(xiàn)本文給出的技術的方面的計算設備架構的計算機架構圖。

具體實施方式

以下詳細描述涉及用于推斷布局意圖的技術。盡管在結合計算機系統(tǒng)上的操作系統(tǒng)和應用程序的執(zhí)行而執(zhí)行的程序模塊的一般上下文中呈現(xiàn)了本文所描述的主題,但本領域技術人員將認識到,可以結合其他類型的程序模塊來執(zhí)行其他實現(xiàn)方式。通常,程序模塊包括執(zhí)行特定任務或實現(xiàn)特定抽象數(shù)據(jù)類型的例程、程序、組件、數(shù)據(jù)結構和其他類型的結構。此外,本領域技術人員將理解,本文描述的主題可以用其他計算機系統(tǒng)配置(包括手持式設備、多處理器系統(tǒng)、基于微處理器的或可編程的消費電子設備、小型計算機、大型計算機等)來實施。

在以下的詳細描述中,參考形成其一部分的附圖,并且其通過圖示的具體配置或示例來示出?,F(xiàn)在參考附圖,其中貫穿幾個圖中相同的附圖標記表示相同的元件,將描述用于推斷布局意圖的各種技術的方面。具體而言,圖1是示出了例示本文描述的一種機制的方面的例程100的流程圖,該種機制用于使用推斷的布局意圖來從其中文檔元素已經使用明確格式化信息來定義的文檔生成基于意圖的文檔。

應當理解,本文關于圖1和其他附圖描述的邏輯操作被實現(xiàn)為(1)計算機實現(xiàn)的動作序列或在計算系統(tǒng)上運行的程序模塊和/或實現(xiàn)為(2)計算系統(tǒng)內的互連的機器邏輯電路或電路模塊。該實現(xiàn)方式是取決于計算系統(tǒng)的性能和其他要求的選擇問題。因此,本文所描述的邏輯操作被不同地稱為狀態(tài)操作、結構設備、動作或模塊。這些操作、結構設備、動作和模塊可以在軟件、固件、專用數(shù)字邏輯及其任何組合中實現(xiàn)。還應當理解,可以執(zhí)行比圖中所示和本文描述的更多或更少的操作。這些操作也可以以與本文所描述的順序不同的順序來執(zhí)行。

例程100開始于操作102,其中,接收包括已使用明確格式化信息(其在本文中可被稱為“明確格式化的文檔元素”)定義的文檔元素并且將被轉換為基于意圖的文檔的文檔。明確格式化的文檔元素是文檔作者明確指定了格式化屬性和/或其他屬性的文檔中的元素。文檔作者可以例如定義文本并對文本應用粗體、斜體、顏色或其他類型的格式化。作為另一個示例,文檔作者可以關于相關的文本塊指定圖像在文檔中的確切位置。

例如,響應于接收到在基于意圖的呈現(xiàn)/創(chuàng)作應用中打開文檔的請求,可以接收包含明確格式化的文檔元素的文檔?;谝鈭D的呈現(xiàn)/創(chuàng)作應用利用文檔作者的格式化意圖以便于呈現(xiàn)基于意圖的文檔?;谝鈭D的呈現(xiàn)/創(chuàng)作應用還可以允許用戶創(chuàng)作和/或修改基于意圖的文檔和/或執(zhí)行關于基于意圖的文檔或其中使用明確格式化來表達格式化的其他文檔類型的其他類型的功能。

為了打開包括已經在基于意圖的呈現(xiàn)/創(chuàng)作應用中使用明確格式化信息定義的文檔元素的文檔,可能有必要將文檔轉換為基于意圖的文檔。如上文簡要討論的,基于意圖的文檔包括標記,該標記根據(jù)推斷的生成基于意圖的文檔所依據(jù)的文檔的作者的布局意圖而不是通過使用明確格式化的信息來定義基于意圖的文檔內容。

在操作102處接收的文檔也可以與呈現(xiàn)文檔的請求一起被接收以展示給用戶。例如,但不限于此,用戶可以提交在智能手機或平板計算設備上查看文檔的請求。如上文簡要討論的,最初使用明確格式化信息定義以在縱向方向上適合8.5"×11"打印頁面的文檔中的內容可能難以以橫向模式呈現(xiàn)在智能手機或平板設備上。然而,因為基于意圖的文檔是根據(jù)布局意圖而不是通過使用明確格式化來定義的,所以可以以各種尺寸和方向并且可以在具有不同屏幕類型和寬高比的各種類型的設備上有效地呈現(xiàn)文檔。下文將提供關于該過程的其它細節(jié)。

應當理解,在操作102處接收的文檔可以是文字處理文檔、演示文檔、電子表格文檔、超文本標記語言(“html”)文檔、視頻、便攜式文檔格式(“pdf”)文檔或包括已經使用明確格式化信息定義的文檔元素的任何其他類型的文檔。另外,還應當理解,文檔可以包括已經使用明確格式化信息定義的一些文檔元素和根據(jù)作者的意圖定義的其他文檔元素。這樣做的一個例子是利用定義作者將文本用作主題的意圖的主題樣式。在該示例中,已經使用明確格式化信息定義的文檔元素可能會使用下文描述的過程來進行轉換,而根據(jù)作者意圖定義的那些文檔元素不會被轉換。

從操作102,例程100進行到操作104,其中,確定在操作102處接收的并具有明確格式化的文檔元素的文檔的布局類型。例如但不限于此,可以利用啟發(fā)式算法和/或機器學習分類器來確定具有明確格式化的元素的文檔的布局是“紙狀的”(paper-like)還是“演示狀的”(presentation-like)。如上文簡要討論的,紙狀的文檔布局是旨在以從上到下的方式(例如,以英語語言)被線性消費的布局。演示狀的文檔布局通常包括意在按順序示出的離散“幻燈片”。演示狀的文檔布局還可以具有以與在紙狀的文檔布局中的內容不同的方式從幻燈片到幻燈片(slide-to-slide)重復的內容。也可以在其它配置中識別除紙狀和演示狀的之外的文檔布局類型。下文將參照圖2和圖3提供關于本文公開的用于對文檔的布局類型進行分類的一種機制的額外的細節(jié)。

一旦已經確定在操作102處接收的文檔的布局類型,則例程100從操作104前進到操作106,在操作106中生成文檔的基于意圖的版本。為了生成文檔的基于意圖的版本,可以確定文檔中明確格式化的文檔元素的布局意圖。例如,但不限于此,可以確定文檔中明確地格式化的粗體或斜體文本旨在提供對文本的強調。替代地,可以確定明確地格式化的粗體或斜體文本旨在建立文檔的節(jié)主題或標題。類似地,可以利用文檔元素之間的2d和/或3d空間關系來推斷文檔的作者的布局意圖。同樣地,例如,可以利用演示狀的文檔中的文檔元素之間的時間關系來推斷文檔作者的布局意圖。文檔作者關于各種其他類型的明確格式化的文檔元素的布局意圖也可以以其他方式來確定。

如下文將更詳細地描述的,可以利用一個或多個啟發(fā)式算法和/或一個或多個機器學習分類器來確定文檔中明確格式化的文檔元素的布局意圖。例如,但不限于此,啟發(fā)式算法可以檢查文檔中的文檔元素的模式或配置,以確定其中包含的明確格式化的文檔元素的推斷的布局意圖??梢曰谒_定的包含明確格式化的文檔元素的文檔的布局類型來選擇和/或配置用于推斷布局意圖的啟發(fā)式算法和/或機器學習分類器。用于確定布局意圖的機器學習分類器可以基于人類對訓練文檔語料庫中的文檔中明確格式化的文檔元素的布局意圖的分類來訓練。

在一些配置中,使用針對文檔中的部分或全部明確格式化的文檔元素的推斷的布局意圖來創(chuàng)建基于意圖的文檔。在一種配置中,基于意圖的文檔包括標記,該標記根據(jù)推斷的生成基于意圖的文檔所依據(jù)的文檔的作者的布局意圖來定義基于意圖的文檔的內容。另外,在一些配置中,還為每個推斷的布局意圖生成一個或多個確定性分數(shù),并且將其包括在基于意圖的文檔中。如上文簡要提及和下文更詳細地描述的,確定性分數(shù)定義了針對明確格式化的文檔元素的推斷布局意圖是文檔作者的實際布局意圖的確定性。當呈現(xiàn)基于意圖的文檔時,并且潛在地出于其他目的,可以利用確定性分數(shù)。下文將參照圖4和圖5提供關于上文描述的用于生成文檔的基于意圖的版本的機制的額外的細節(jié)。

從操作106,例程100進行到操作108,其中在操作104和操作106處生成的基于意圖的文檔可以被提供給基于意圖的呈現(xiàn)/創(chuàng)作應用。如上文簡要討論的,基于意圖的呈現(xiàn)/創(chuàng)作應用可以以適合于它將被呈現(xiàn)在上面的計算設備的方式呈現(xiàn)基于意圖的文檔。基于意圖的文檔的呈現(xiàn)以保留文檔作者的布局意圖的方式執(zhí)行。另外,基于意圖的呈現(xiàn)/創(chuàng)作應用還可以以保留文檔作者的原始意圖的方式美化基于意圖的文檔的呈現(xiàn)。下文還將提供關于該過程的其它細節(jié)。例程100隨后從操作108進行到操作110,在操作110處結束。

圖2是示出文檔布局分類服務202的配置和操作的方面的軟件架構圖,文檔布局分類服務202可以用于對將被轉換為基于意圖的文檔的文檔204的布局進行分類。如圖2所示,文檔布局分類服務202接收包括明確格式化的文檔元素的文檔204。文檔布局分類服務202隨后可以分析所接收的文檔204的布局,以便對其布局進行分類。具體地,可以生成定義文檔204的所識別的布局類型的文檔布局分類210。

在圖2所示的配置中,文檔布局分類服務202利用一個或多個啟發(fā)式文檔布局分類模塊206,并且潛在地利用一個或多個基于機器學習的文檔布局分類器208,以便生成文檔布局分類210。啟發(fā)式文檔布局分類模塊206是實現(xiàn)用于確定文檔的布局類型的啟發(fā)式文檔布局算法的軟件模塊。基于機器學習的文檔布局分類器208是已經被訓練以識別文檔204的布局類型的機器學習分類器。基于機器學習的文檔布局分類器208可以基于人類對訓練文檔的語料庫(圖2中未示出)中的文檔布局的分類來訓練。

在一個特定配置中,啟發(fā)式文檔布局分類模塊206和基于機器學習的文檔布局分類器208被配置為將文檔204分類為具有紙狀布局或演示狀的布局。如上文所討論的,紙狀文檔布局是意在以從上到下的方式(例如,以英語語言)被線性消費的布局。還如上文所討論的,演示狀的文檔布局通常包括意在按順序示出的離散“幻燈片”。應當理解,啟發(fā)式文檔布局分類模塊206和基于機器學習的文檔布局分類器208也可以被配置為在其他配置中識別除了紙狀的和演示狀的布局之外的文檔布局類型。

還應當理解,在一些配置中,關于基于文檔的文件類型對文檔204的布局沒有做出假設。例如,不會假設字處理文檔204具有紙狀布局類型。類似地,演示文檔204也不會被自動假設為具有演示類型布局。這是因為文字處理文檔可能具有演示狀的布局。類似地,演示文檔可能具有紙狀布局。因此,在各種配置中利用文檔204的實際布局而不是文檔204的文件類型來確定文檔布局分類210。然而,應當理解,文檔布局分類服務202可以給出一些在文檔布局分類210的確定期間對文檔204的文件類型的權重。

在圖2所示的示例中,文檔布局分類服務202被實現(xiàn)為web服務。在該實現(xiàn)方式中,文檔布局分類服務202可以暴露各種類型的web服務應用編程接口(“api”)以便訪問其功能的方面。然而,應當理解,該配置僅僅是說明性的并且可以以其他方式提供由文檔布局分類服務202實現(xiàn)的功能。例如,但不限于此,該功能可以直接包括在計算設備(諸如智能電話、平板電腦、臺式或膝上型計算機)上本地執(zhí)行的基于意圖的呈現(xiàn)/創(chuàng)作應用中。替代地,該功能可以通過基于意圖的呈現(xiàn)/創(chuàng)作應用來提供,該基于意圖的呈現(xiàn)/創(chuàng)作應用作為基于web的應用提供并且通過web瀏覽器或其他適當?shù)膽脕碓L問。在其他配置中,該功能也可以以其他方式提供。

在圖2所示的示例性配置中,啟發(fā)式文檔布局分類模塊206和基于機器學習的文檔布局分類器208被顯示在文檔布局分類服務202外部。然而,應當理解,這些部件可能在其他配置中與文檔布局分類服務202集成。另外,應當理解,除了啟發(fā)法和機器學習之外的機制可以用于其他配置中以對文檔204的布局進行分類。

如下文將更詳細地描述的,可以利用所確定的文檔204的文檔布局分類210來定制本文公開的用于將文檔204轉換為基于意圖的文檔的機制。下文將參照圖3和圖4提供關于該方面的額外的細節(jié)。

圖3是示出了例示文檔布局分類服務202的操作的方面的例程300的流程圖,文檔布局分類服務202用于對包含明確格式化的文檔元素的文檔204的布局進行分類。例程300開始于操作302,其中,包括明確格式化的文檔元素的文檔204在文檔布局分類服務202處被接收。如上文所討論的,文檔204可以響應于在基于意圖的呈現(xiàn)/創(chuàng)作應用中呈現(xiàn)文檔204的請求或響應于其他類型的刺激而被提供給文檔布局分類服務202。從操作302,例程300進行到操作303。

在操作303處,執(zhí)行文檔的分解和分析以識別文檔中的格式。對于文本,這將包括如文本的字體、磅值、重量和/或顏色之類的東西。這些數(shù)據(jù)點中的一些也可以從原始文檔204計算。例如,htmlweb文檔可以利用嵌套的css樣式,其需要被計算以確定例如實際的顏色或字體。還可以分析html結構以理解圖像相對于文本的相對定位。

例程300隨后從操作303進行到操作304,其中,文檔布局分類服務202執(zhí)行啟發(fā)式文檔布局分類模塊206,以便執(zhí)行一個或多個基于啟發(fā)法的文檔布局分類算法。如上文所討論的,啟發(fā)式文檔布局分類模塊206利用啟發(fā)法嘗試對文檔204的布局進行分類。例如,但不限于此,可以利用各種啟發(fā)法來確定文檔204的布局是紙狀的或演示狀的。

從操作304,例程300進行到操作306,其中,文檔布局分類服務202可以執(zhí)行基于機器學習的文檔布局分類器208,以便對文檔204的布局類型進行分類。如上文所討論的,基于機器學習的文檔布局分類器208可以基于人類對訓練文檔語料庫中的文檔布局的分類來訓練?;谠撚柧毜慕Y果,基于機器學習的文檔布局分類器208能夠將文檔204的布局分類為紙狀或演示狀。如上文所討論的,在其他配置中基于機器學習的文檔布局分類器208還可以將文檔204的布局分類為另一類型的分類。

從操作306,例程300進行到操作308,其中,文檔布局分類服務202基于由啟發(fā)式文檔布局分類模塊206和/或基于機器學習的文檔布局分類器208執(zhí)行的處理的結果來生成文檔布局分類210。如上所描述,文檔布局分類210包括指示為文檔204確定的布局類型的數(shù)據(jù)。例如,但不限于此,文檔布局分類210可以指示文檔204是否具有紙狀布局或演示狀的布局。其他布局類型也可以在其他配置中指示。

從操作308,例程300進行到操作310,其中,文檔布局分類服務202輸出文檔204的文檔布局分類210。例如,但不限于此,文檔布局分類服務202可以將文檔布局分類210輸出到用于將文檔204轉換為基于意圖的文檔的文檔轉換服務。下文將參照圖4和圖5描述關于在文檔204的轉換期間文檔布局分類210的使用的額外的細節(jié)。從操作310,例程300進行到操作312,在操作312處結束。

應當理解,上文描述的用于對文檔204的布局進行分類的機制僅僅是說明性的,并且也可以利用其他機制。例如,但不限于此,在一些配置中,在對文檔204的布局類型進行分類時,可以考慮各種文化因素,諸如文檔是從右到左還是從左到右讀取。還應當理解,可以確定某些類型的文檔204的布局類型而不實際呈現(xiàn)文檔204。對于諸如pdf文檔的其他類型的文檔204,可以在存儲器中呈現(xiàn)文檔204,以便對文檔的布局類型進行分類。

圖4是示出文檔轉換服務402的配置和操作的方面的軟件架構圖,文檔轉換服務402用于從包括明確格式化的文檔元素的文檔204生成基于意圖的文檔408。如圖4所示,文檔轉換服務402在一種配置中提供用于將包含明確格式化的文檔元素的文檔204轉換為基于意圖的文檔408的功能。

在圖4所示的配置中,文檔轉換服務402被實現(xiàn)為web服務。在該實現(xiàn)方式中,文檔轉換服務402可以暴露各種類型的web服務api以便訪問其功能的方面。然而,應當理解,該配置僅僅是說明性的,并且可以以其他方式提供由文檔轉換服務402實現(xiàn)的功能。例如,但不限于此,所公開的功能可以直接包括在計算設備(諸如智能電話、平板電腦、臺式或膝上型計算機)上本地執(zhí)行的基于意圖的呈現(xiàn)/創(chuàng)作應用中。替代地,可以通過基于意圖的呈現(xiàn)/創(chuàng)作應用來提供該功能,該應用作為基于web的應用提供并且通過web瀏覽器或其他適當?shù)膽脕碓L問。在其他配置中,該功能也可以以其他方式提供。

如圖4所示,文檔轉換服務402將包括明確格式化的文檔元素的文檔204和用于文檔204的文檔布局分類210作為輸入。文檔204的文檔布局分類210可以參照圖2和圖3以上文描述的方式生成。如上文提及的,也可以利用其他機制來對包含明確格式化的文檔元素的文檔204的布局進行分類。

在一種配置中,文檔轉換服務402利用一個或多個啟發(fā)式文檔元素布局意圖模塊404a-404n(其在本文中可統(tǒng)稱為“模塊404”),以便確定與文檔204中的明確格式化的文檔元素相關聯(lián)的布局意圖。模塊404可以實現(xiàn)啟發(fā)式算法,其被設計為從文檔204中的明確格式化的文檔元素推斷布局意圖。例如但不限于此,模塊404可以檢查文檔204中的文檔元素的模式或配置,以確定對本文中包含的明確格式化的文檔元素的推斷的布局意圖。類似地,這些模塊可以參考文檔元素在文檔402內的位置、這些文檔元素與其他文檔元素的空間位置和時間關系、這些文檔元素在文檔中的位置和和/或類似的文檔元素與不同的文檔元素之間的其他關系來分析這些文檔元素,以便推斷布局意圖。

在一些實現(xiàn)方式中,文檔轉換服務402基于文檔布局分類210來選擇和/或配置模塊404。例如但不限于此,文檔轉換服務402可以選擇和/或配置模塊404,以確定具有紙狀的布局的文檔中的明確格式化的文件元素的布局意圖。類似地,文檔轉換服務402可以選擇和/或配置模塊404,以確定具有演示狀的布局的文檔中的明確格式化的文檔元素的布局意圖。以這種方式,模塊404的操作可以被配置為最佳地確定具有不同布局類型的文檔204中的文檔元素的布局意圖。

模塊404中的一些模塊可以被配置為基于文檔204內的標題的格式化來推斷布局意圖。例如,在具有演示狀的布局的文檔204中,如果若干幻燈片具有相同(或幾乎與差異的白名單相同)的標題,則所有幻燈片可以被推斷為具有單個標題的同一節(jié)的一部分。在另一個示例中,如果在具有演示狀的布局的文檔204中的若干連續(xù)幻燈片上重復圖像或文本,則該材料可以被推斷為導航或側邊欄內容并且可以僅被包括在基于意圖的文檔408中一次。

在具有紙狀的布局的文檔204中,如果短行文本(包括空白)不同于周圍文本并且不是與文檔204中的標題和/或主題匹配的格式,則文本可以被推斷為醒目引文(pull-quote)。如本領域技術人員已知的,醒目引文是來自通常以某種方式強調的同一頁面的引用。如果文本被引號包圍,則該推斷的布局意圖的確定性分數(shù)412將增加。如果文本的格式與被引號包圍的另一個識別的醒目引文相匹配,則該推斷的布局意圖的確定性分數(shù)412也將增加。

應當理解,上文描述的說明性啟發(fā)式算法僅僅是說明性的。啟發(fā)式算法的其他類型也可以由模塊404實現(xiàn),以在其他配置中推斷其他類型的明確格式化的文檔元素的布局意圖。

如圖4所示,文檔轉換服務402還可以或者替代地利用一個或多個基于機器學習的文檔元素布局意圖分類器406a-406n(其可以統(tǒng)稱為“分類器406”)。分類器406是機器學習分類器,其已經被訓練為分辨出關于文檔204中的明確格式化的文檔元素的作者的意圖。為了提供該功能,分類器406可以基于人類對訓練文檔語料庫(圖4中未示出)中的文檔中明確格式化的文檔元素的布局意圖的分類來訓練。

在一些實現(xiàn)方式中,文檔轉換服務402基于文檔布局分類210來選擇和/或配置分類器406。例如但不限于此,文檔轉換服務402可以選擇和/或配置分類器406,以確定具有紙狀的布局的文檔中的明確格式化的文檔元素的布局意圖。類似地,文檔轉換服務402可以選擇和/或配置分類器406,以確定具有演示狀的布局的文檔中的明確格式化的文檔元素的布局意圖。以這種方式,分類器406的操作可以被配置為最佳地確定具有不同布局類型的文檔204中的文檔元素的布局意圖。

在各種實施例中,模塊404和/或分類器406被配置為推斷文檔作者意圖強調一個或多個明確格式化的文檔元素。例如,某些以粗體或斜體顯示的文本可能被未加粗或強調的段落中的其他文本所包圍。在該示例中,模塊404或分類器406可以推斷出作者意圖強調該文本。還可以推斷特定斜體的使用以識別參考工作、船的名稱、新術語、用戶提及、外來字或符號(例如,希臘語或拉丁語符號)、代數(shù)符號和/或數(shù)學常數(shù)。文本還可以被推斷為如上文陳述的示例中所描述的醒目引文。還如上文所討論的,文檔204中缺乏明確格式化也可以是用于強調的信號。在一些配置中這可以在格式化聚類中根據(jù)相對熵(entropy)來確定。每個格式化聚類是確定文本跨度格式化的所有屬性的獨特集??梢詮呐c文檔204相關聯(lián)的css或直接從文檔204的內容計算聚類。

模塊404和/或分類器406還可以被配置為根據(jù)文檔204中的文本的大小、縮進、間隔、格式和/或其他屬性來推斷定義標題和/或層級的文本。層級的示例可以包括但不限于章、子章、子子章等。以這種方式,文檔作者創(chuàng)建大綱或其他類型的結構的意圖可以從明確格式化的文本推斷出并被用于創(chuàng)建定義了作者的意圖的基于意圖的文檔408。

模塊404和/或分類器406還可以被配置為評估文檔204中的2d或3d空間或非空間以推斷作者的表達意圖。還可以分析彼此重疊的文檔元素以確定作者的表達意圖。還可以以類似的方式分析文檔元素之間的時間關系,以確定相關聯(lián)的表達意圖。例如,在具有演示狀的布局的文檔中,元素可能隨著時間的推移在幻燈片上累積。在該示例中,文檔元素的時間順序可能是從中可以推斷出表達的意圖的相關的信息。在這方面,可能有必要呈現(xiàn)內存中的一些文檔類型,以便于識別文檔元素之間的空間和/或時間關系。

在圖4所示的示例性配置中,模塊404和分類器406被示出在文檔轉換服務402的外部。然而,應當理解,在其他配置中,這些部件可以與文檔轉換服務402集成。另外,應當理解,除了啟發(fā)法和機器學習之外的機制可以在其他配置中被用于對文檔204中的明確格式化的文檔元素的布局意圖進行分類。

還如圖4所示,文檔轉換服務402可以利用模塊404和分類器406的輸出,以便生成基于意圖的文檔408。基于意圖的文檔408包括來自文檔204的內容(例如,文本、圖像、視頻等)或對內容的位置的引用,以及描述對文檔204中的部分或全部明確格式化的文檔元素的推斷的布局意圖的數(shù)據(jù)。例如,在一種配置中,基于意圖的文檔408包括標記410,標記410根據(jù)生成基于意圖的文檔408所依據(jù)的文檔204的作者的推斷的布局意圖定義其中包含的文檔元素。作為具體示例,如果模塊404或分類器406確定文檔204中的粗體或斜體文本的作者的布局意圖是提供對文本的強調,則基于意圖的文檔410包括標記410,其識別文本并指示文本在呈現(xiàn)時將被強調。根據(jù)基于意圖的文檔408將被呈現(xiàn)的方向、目標設備的能力和/或其他考慮或因素,可以在呈現(xiàn)時間確定文本實際被強調的方式。還可以修改呈現(xiàn)文本的方式,以便增加或修改文檔204的樣式和/或美學。

作為另一示例,如果模塊404或分類器406確定粗體或斜體文本的布局意圖將定義節(jié)主題,則基于意圖的文檔408可以包括標記410,其定義文本并指示文本在呈現(xiàn)時將被用作節(jié)主題。根據(jù)基于意圖的文檔408將被呈現(xiàn)的方向、目標設備的能力和/或其他考慮或因素,可以在呈現(xiàn)時間確定節(jié)主題實際呈現(xiàn)的方式。還可以在基于意圖的文檔408中指定其他類型的標記410,以便定義其他類型的文檔元素及其相關聯(lián)的布局意圖。

如圖4所示,一旦轉換過程完成,文檔轉換服務402可以將基于意圖的文檔408提供給基于意圖的呈現(xiàn)/創(chuàng)作應用414。繼而,基于意圖的呈現(xiàn)/創(chuàng)作應用414可以呈現(xiàn)基于意圖的文檔408。如上文簡要討論的,基于意圖的呈現(xiàn)/創(chuàng)作應用414可以利用基于意圖的標記410,以便以適合于目標呈現(xiàn)平臺的方式呈現(xiàn)基于意圖的文檔408。例如但不限于此,基于意圖的呈現(xiàn)/創(chuàng)作應用414可以呈現(xiàn)基于意圖的文檔,以用作網(wǎng)站416上的網(wǎng)頁消費,用于以縱向或橫向方向在智能手機418上消費,或者用于以縱向或橫向方向在平板設備420上的消費。

在一些配置中,文檔轉換服務402還被配置為針對每個推斷的布局意圖生成一個或多個確定性分數(shù)412。如上文簡要提及的,確定性分數(shù)是明確格式化的文檔元素的推斷的布局意圖是文檔作者的實際布局意圖的確定性的度量。確定性分數(shù)412可以是0與1之間的數(shù)字,例如,其中,0是推斷的布局意圖正確的最低概率且1推斷的布局意圖正確的最高概率。

應當理解,在一些配置中,一個文檔元素的置信度分數(shù)412可能受到其他文檔元素的影響。例如,可以針對第一文檔元素計算置信分數(shù)412。但是,如果在文檔204中找到其他類似元素,那些元素的配置及其相關聯(lián)的置信分數(shù)412可以針對第一文檔元素改變所計算的置信分數(shù)412。在一些配置中,文檔402中內容的語義含義也可以影響置信分數(shù)412。

當呈現(xiàn)基于意圖的文檔408并且潛在地出于其他目的時,基于意圖的呈現(xiàn)/創(chuàng)作應用414可以利用確定性分數(shù)412。例如但不限于此,基于意圖的呈現(xiàn)/創(chuàng)作應用414可以利用具有最高相關聯(lián)的確定性分數(shù)412的布局意圖,以便在基于意圖的文檔408中初始地呈現(xiàn)文檔元素。然后,用戶可以指示特定文檔元素的布局是不正確的(例如,文本被顯示為強調而不是作為期望的節(jié)主題)。在這種情況下,基于意圖的呈現(xiàn)/創(chuàng)作應用414可以使用具有下一個最高確定性分數(shù)412的明確格式化的文檔元素的布局意圖,以便重新呈現(xiàn)文檔元素。替代地,可以通過選擇下一個最高分數(shù)中的幾個來向用戶顯示最可能的替代選項。在其他配置中,基于意圖的呈現(xiàn)/創(chuàng)作應用414還可以以其他方式利用確定性分數(shù)412。

在另一種配置中,基于意圖的呈現(xiàn)/創(chuàng)作應用414還可以向文檔轉換服務402提供對推斷的布局意圖做出的任何校正422,以用于優(yōu)化文檔轉換服務402的操作的方面。例如,如果用戶指示針對基于意圖的文檔中的文檔元素的特定推斷的布局意圖不正確,則該信息可以被提供給文檔轉換服務402,并且被用于在未來轉換期間推斷相同或相似的文檔元素的布局意圖時改進文檔轉換服務402的性能。

圖5是示出了例示文檔轉換服務402的操作的方面的例程500的流程圖,該文檔轉換服務402用于從包括明確格式化的文檔元素的文檔204中生成基于意圖的文檔408。例程500開始于操作502,其中,文檔轉換服務402接收文檔204和相關的文檔布局分類210。例程500然后從操作502進行到操作503,其中,執(zhí)行對文檔的分解和分析以與上文關于操作303所描述的類似的方式識別文檔中的格式化。例程500然后進行到操作504,在操作504處,文檔轉換服務基于文檔布局分類210指定的分布類型來選擇和/或配置模塊404。如上文所討論的,可以使用具有在文檔布局分類210中指定的類型的布局類型的文檔204來選擇和/或配置模塊404以用于最佳操作。

從操作504,例程500進行到操作506,在操作506處,文檔轉換服務402基于文檔布局分類210中指定的布局類型來選擇和/或配置分類器406。如上文所討論的,還可以使用具有文檔布局分類210中指定的類型的布局類型的文檔204來選擇和/或配置分類器406以用于最佳操作。

從操作506,例程500進行到操作508,在操作508處,執(zhí)行模塊404和/或分類器406。如上文所討論的,模塊404和分類器406操作以推斷文檔204中的明確格式化的文檔元素的布局意圖。模塊404可以利用啟發(fā)式算法來推斷文檔204中的文檔元素的布局意圖,而分類器406可以利用機器學習技術。如上文所提及的,模塊404和分類器406還可以針對每個推斷的布局意圖生成一個或多個確定性分數(shù)412。

從操作508,例程500進行到操作510,在操作510處,文檔轉換服務402基于模塊404和/或分類器406的執(zhí)行結果來生成基于意圖的文檔408。如上文所討論的,基于意圖的文檔408包括基于意圖的標記410,其定義文檔元素以及與文檔元素相關聯(lián)的推斷的布局意圖(如果有的話)?;谝鈭D的文檔408還可以包括對應于每個推斷的布局意圖的確定性分數(shù)412。如上文所討論的,文檔轉換服務402還可以將基于意圖的文檔408提供給基于意圖的呈現(xiàn)/創(chuàng)作應用414或用于呈現(xiàn)和/或修改的另一軟件部件。從操作510,例程500進行到操作512,在操作512處例程500結束。

圖6是示出能夠執(zhí)行本文所描述的用于推斷布局意圖的軟件部件的計算機600的架構的計算機架構圖。圖6中所例示的架構是用于服務器計算機、移動電話、電子閱讀器、智能電話、臺式計算機、上網(wǎng)本計算機、平板計算機、膝上型計算機或適用于執(zhí)行本文提出的軟件部件的另一類型的計算設備的架構。在這方面,應當理解,圖6中所示的計算機600可以用于實現(xiàn)能夠執(zhí)行本文所提出的任何軟件部件的計算設備。

圖6中所例示的計算機600包括中央處理單元602(“cpu”)、包括隨機存取存儲器606(“ram”)和只讀存儲器(“rom”)608的系統(tǒng)存儲器604以及將存儲器604耦合到cpu602的系統(tǒng)總線610。包含例如在啟動期間幫助在計算機600內的元件之間傳送信息的基本例程的基本輸入/輸出系統(tǒng)被存儲在rom608中。計算機600還包括用于存儲操作系統(tǒng)614的大容量存儲設備612和一個或多個應用程序,該一個或多個應用程序包括但不限于文檔分類布局服務202、文檔轉換服務402和/或基于意圖的呈現(xiàn)/創(chuàng)作應用414。雖然在圖6中未示出,但是大容量存儲設備612還可以被配置為存儲文檔204、基于意圖的文檔408和/或其他數(shù)據(jù)。

大容量存儲設備612通過連接到總線610的大容量存儲控制器(未示出)連接到cpu602。大容量存儲設備612及其相關聯(lián)的計算機可讀介質為計算機600提供非易失性存儲。雖然本文包含的對計算機可讀介質的描述指的是諸如硬盤或cd-rom驅動器的大容量存儲設備,但是本領域技術人員應當理解,計算機可讀介質可以是任何可用的計算機存儲介質或通信介質,其可以由計算機600訪問。

通信介質包括諸如載波或其他傳輸機制的調制數(shù)據(jù)信號中的計算機可讀指令、數(shù)據(jù)結構、程序模塊或其他數(shù)據(jù),并且包括任何傳輸介質。術語“調制的數(shù)據(jù)信號”意指具有以對信號中的信息進行編碼的方式改變或設置其特性中的一個或多個特性的信號。舉例來說而非限制,通信介質包括諸如有線網(wǎng)絡或直接有線連接的有線介質,以及諸如聲學、rf、紅外和其他無線介質的無線介質。上述任一項的組合也應包括在計算機可讀介質的范圍內。

舉例來說而非限制,計算機存儲介質可以包括以用于存儲諸如計算機可讀指令、數(shù)據(jù)結構、程序模塊或其他數(shù)據(jù)等信息的任何方法或技術實現(xiàn)的易失性和非易失性、可移動和不可移動介質。例如,計算機介質包括但不限于ram、rom、eprom、eeprom、閃存或其他固態(tài)存儲器技術、cd-rom、數(shù)字多功能盤(“dvd”)、hd-dvd、藍光、或其它光存儲、磁帶盒、磁帶、磁盤存儲或其它磁存儲設備或可用于存儲所期望信息并可由計算機600訪問的任何其它介質。為了權利要求的目的,短語“計算機存儲介質”及其變形不包括波或信號本身和/或通信介質。

根據(jù)各種配置,計算機600可以使用通過諸如網(wǎng)絡618的網(wǎng)絡到遠程計算機的邏輯連接在聯(lián)網(wǎng)環(huán)境中操作。計算機600可以通過連接到總線610的網(wǎng)絡接口單元620連接到網(wǎng)絡618。應當理解,網(wǎng)絡接口單元620還可以用于連接到其他類型的網(wǎng)絡和遠程計算機系統(tǒng)。計算機600還可以包括輸入/輸出控制器616,其用于接收和處理來自包括鍵盤、鼠標或電子觸筆(未在圖6中示出)的多個其他設備的輸入。類似地,輸入/輸出控制器616可以向顯示屏、打印機或其它類型的輸出設備(也未在圖6中示出)提供輸出。

應當理解,本文所描述的軟件部件可以在加載到cpu602中并執(zhí)行時將cpu602和整個計算機600從通用計算系統(tǒng)轉變成為促進本文提供的功能而定制的專用計算系統(tǒng)。cpu602可以由任何數(shù)量的晶體管或其他分立電路元件構成,其可以單獨地或共同地采取任何數(shù)量的狀態(tài)。更具體地,cpu602可以響應于包含在本文公開的軟件模塊內的可執(zhí)行指令而作為有限狀態(tài)機操作。這些計算機可執(zhí)行指令可以通過指定cpu602如何在狀態(tài)之間轉換來轉變cpu602,從而轉變構成cpu602的晶體管或其他分立硬件元件。

對本文中呈現(xiàn)的軟件模塊的編碼也可以轉變本文呈現(xiàn)的計算機可讀介質的物理結構。在本說明書的不同實現(xiàn)方式中,物理結構的具體轉變可能取決于各種因素。這些因素的示例可以包括但不限于用于實現(xiàn)計算機可讀介質的技術,無論計算機可讀介質被表征為主存儲還是輔存儲等。例如,如果計算機可讀介質被實現(xiàn)為基于半導體的存儲器,則本文公開的軟件可以通過轉變半導體存儲器的物理狀態(tài)而被編碼在計算機可讀介質上。例如,軟件可以轉變構成半導體存儲器的晶體管、電容器或其它分立電路元件的狀態(tài)。軟件還可以轉變這些部件的物理狀態(tài),以便在其上存儲數(shù)據(jù)。

作為另一示例,本文公開的計算機可讀介質可以使用磁或光技術來實現(xiàn)。在這些實現(xiàn)方式中,當軟件在其中被編碼時,本文提出的軟件可以轉變磁介質或光介質的物理狀態(tài)。這些轉變可以包括改變給定磁介質內的特定位置的磁特性。這些轉變還可以包括改變給定光介質內的特定位置的物理特征或特性,以改變這些位置的光學特性。在不脫離本說明書的范圍和精神的情況下,物理介質的其它轉變是可能的,提供前述示例僅用于促進該討論。

鑒于上文描述,應當理解,許多類型的物理轉變在計算機600中發(fā)生,以便存儲和執(zhí)行本文提出的軟件部件。還應當理解,計算機600可以包括其他類型的計算設備(包括手持式計算機、嵌入式計算機系統(tǒng)、諸如智能電話和表格的移動設備以及本領域技術人員已知的其他類型的計算設備)。還可以考慮到,計算機600可以不包括圖6所示的所有部件,可以包括圖6中未明確示出的其他部件,或者可以利用與圖6所示完全不同的架構。

圖7例示了能夠執(zhí)行本文所描述的用于推斷布局意圖的軟件部件的說明性分布式計算環(huán)境700。因此,可以使用圖7所例示的分布式計算環(huán)境700來提供本文所描述的關于文檔布局分類服務202、文檔轉換服務402和/或本文所描述的任何其他軟件部件的功能。

根據(jù)各種實現(xiàn)方式,分布式計算環(huán)境700包括在網(wǎng)絡704上、與網(wǎng)絡704通信或作為網(wǎng)絡704的一部分操作的計算環(huán)境702。一個或多個客戶端設備706a-706n(以下統(tǒng)稱為和/或一般地稱為“客戶端706”)可以經由網(wǎng)絡704和/或其他連接(圖7中未例示)與計算環(huán)境702通信。在所例示配置中,客戶端706包括諸如膝上型計算機、臺式計算機或其他計算設備的計算設備706a;板狀或平板計算設備(“平板計算設備”)706b;諸如移動電話、智能電話或其它移動計算設備的移動計算設備706c;服務器計算機706d;和/或其他設備706n。應當理解,任何數(shù)量的客戶端706可以與計算環(huán)境702通信。本文參照圖6和圖8例示和描述了客戶端706的兩個示例性計算架構。應當理解,本文所例示和描述的圖示的客戶端706和計算架構是說明性的,并且不應被解釋為以任何方式受到限制。

在所例示的配置中,計算環(huán)境702包括應用服務器708、數(shù)據(jù)存儲710和一個或多個網(wǎng)絡接口712。根據(jù)各種實現(xiàn)方式,應用服務器708的功能可以由作為網(wǎng)絡704的一部分或與網(wǎng)絡704通信的一個或多個服務器計算機提供。應用服務器708可以托管各種服務、虛擬機、門戶和/或其他資源。在所例示的配置中,應用服務器708托管一個或多個虛擬機714,該一個或多個虛擬機714用于托管應用或其他功能。根據(jù)各種實現(xiàn)方式,虛擬機714托管一個或多個應用和/或軟件模塊(諸如文檔布局分類服務202和文檔轉換服務402)。應當理解,該配置是說明性的,并且不應當被解釋為以任何方式限制。應用服務器708還可以托管或提供對一個或多個門戶網(wǎng)站、鏈接頁面、網(wǎng)站和/或其他信息(“門戶網(wǎng)站”)716的訪問。

根據(jù)各種實現(xiàn)方式,應用服務器708還包括一個或多個郵箱服務718和一個或多個消息傳送服務720。郵箱服務718可以包括電子郵件(“電子郵件”)服務,郵箱服務718還可以包括各種個人信息管理(“pim”)服務,其包括但不限于日歷服務、聯(lián)系人管理服務、協(xié)作服務和/或其他服務。消息傳送服務720可以包括但不限于即時消息傳送(“im”)服務、聊天服務、論壇服務和/或其他通信服務。

應用服務器708還可以包括一個或多個社交網(wǎng)絡服務722。社交網(wǎng)絡服務722可以包括各種社交網(wǎng)絡服務,其包括但不限于用于共享或發(fā)布狀態(tài)更新、即時消息、鏈接、照片、視頻和/或其他信息的服務;用于評論或展示對文章、產品、博客或其他資源的興趣的服務;和/或其他服務。在一些配置中,社交網(wǎng)絡服務722由facebook社交網(wǎng)絡服務、linkedin職業(yè)網(wǎng)絡服務、myspace社交網(wǎng)絡服務、foursquare地理網(wǎng)絡服務、yammer辦公室同事網(wǎng)絡服務等提供或包括這些服務。在其他配置中,社交網(wǎng)絡服務722由其他服務、站點和/或可能或可能不被明確稱為社交網(wǎng)絡提供商的提供商提供。例如,一些網(wǎng)站允許用戶在諸如閱讀發(fā)表的文章、評論商品或服務、發(fā)布、協(xié)作、游戲等的各種活動和/或環(huán)境期間通過電子郵件、聊天服務和/或其他方式彼此交互。其他服務是可能的并且是預期的。

社交網(wǎng)絡服務722還可以包括評論、博客和/或微博服務。這些服務的示例包括但不限于yelp評論服務、kudzu審查服務、yammer企業(yè)微博服務、twitter消息傳送服務、googlebuzz服務和/或其他服務。應當理解,上文的服務列表并不詳盡,并且為了簡潔起見,本文中沒有提及許多額外的和/或替代的社交網(wǎng)絡服務722。因此,上文描述的配置是說明性的,并且不應當被解釋為以任何方式受到限制。

如圖7所示,應用服務器708還可以托管其他服務、應用、門戶和/或其他資源(“其他資源”)724。其他資源724可以包括但不限于文檔布局分類服務202、文檔轉換服務402和/或本文所描述的任何其他軟件部件。因此可以理解,計算環(huán)境702可以提供本文提供的用于利用各種郵箱、消息傳送、社交網(wǎng)絡、生產力和/或其他服務或資源來推斷布局意圖的本文公開的概念和技術的集成。例如,利用本文公開的概念和技術可以提供桌面或移動網(wǎng)站以用于將文檔204轉換為基于意圖的文檔408并且用于查看和潛在地編輯基于意圖的文檔408。使用本文描述的技術,包括明確格式化的元素的文檔204可以以適合于設備的屏幕、方向和/或其他功能的方式呈現(xiàn)在各種客戶端設備706上。作為具體示例,本文公開的功能可以與提供基于web的文字處理應用、基于web的演示應用結合使用或與另一種類型的基于web的內容消費或創(chuàng)建應用結合使用。

如上文所提及的,計算環(huán)境702可以包括數(shù)據(jù)存儲710。根據(jù)各種實現(xiàn)方式,數(shù)據(jù)存儲710的功能由在網(wǎng)絡704上操作或與網(wǎng)絡704通信的一個或多個數(shù)據(jù)庫提供。該數(shù)據(jù)存儲710的功能還可以由被配置為托管計算環(huán)境702的數(shù)據(jù)的一個或多個服務器計算機提供。數(shù)據(jù)存儲710可以包括主機或提供一個或多個實際或虛擬數(shù)據(jù)存儲726a-726n(以下統(tǒng)稱為和/或一般地稱為“數(shù)據(jù)存儲726”)。數(shù)據(jù)存儲726被配置為托管由應用服務器708和/或其他數(shù)據(jù)使用或創(chuàng)建的數(shù)據(jù)。例如,數(shù)據(jù)存儲726可以用于存儲文檔204、基于意圖的文檔408以及任何相關聯(lián)的內容。

計算環(huán)境702可以與網(wǎng)絡接口712通信或由其進行訪問。網(wǎng)絡接口712可以包括用于支持兩個或更多個計算設備(包括但不限于客戶端706和應用服務器708)之間的通信的各種類型的網(wǎng)絡硬件和軟件。應當理解,網(wǎng)絡接口712還可以用于連接到其他類型的網(wǎng)絡和/或計算機系統(tǒng)。

應當理解,本文所描述的分布式計算環(huán)境700可以利用任何數(shù)量的虛擬計算資源和/或其他分布式計算功能來實現(xiàn)本文描述的軟件元件的任何方面,該虛擬計算資源和/或其他分布式計算功能可以被配置為執(zhí)行本文公開的軟件部件的任何方面。根據(jù)本文公開的概念和技術的各種實現(xiàn)方式,分布式計算環(huán)境700將本文描述的軟件功能作為服務提供給客戶端706。應當理解,客戶端706可以包括實機或虛擬機,其包括但不限于服務器計算機、網(wǎng)絡服務器、個人計算機、移動計算設備、智能電話和/或其他設備。因此,本文公開的概念和技術的各種實現(xiàn)方式使得配置成訪問分布式計算環(huán)境700的任何設備能夠利用本文所述的用于推斷布局意圖的功能。

現(xiàn)在轉到圖8,圖8是用于計算設備的說明性計算設備架構800,其能夠執(zhí)行本文所描述的用于推斷布局意圖的各種軟件部件。計算設備架構800適用于部分由于形成因素、無線連接性和/或電池供電的操作而促進移動計算的計算設備。在一些配置中,計算設備包括但不限于移動電話、平板電腦設備、板狀設備、便攜式視頻游戲設備等。此外,計算設備架構800適用于圖7所示的任何客戶端706。此外,計算設備架構800的方面適用于例如本文參照圖6所描述的傳統(tǒng)臺式計算機、便攜式計算機(例如膝上型計算機、筆記本電腦、超便攜式計算機和上網(wǎng)本)、服務器計算機和其他計算機系統(tǒng)。例如,本文下面公開的單觸摸和多點觸摸方面可以適用于利用觸摸屏或諸如啟用觸摸的軌跡板或啟用觸摸鼠標的一些其他啟用觸摸設備的桌面計算機。

圖8所例示的計算設備架構800包括處理器802、存儲器部件804、網(wǎng)絡連接部件806、傳感器部件808、輸入/輸出部件810和電源部件812。在所例示配置中,處理器802與存儲器部件804、網(wǎng)絡連接部件806、傳感器部件808、輸入/輸出(“i/o”)部件810和電源部件812通信。盡管在圖8中例示的各個部件之間沒有顯示連接,但是部件可以相互作用以執(zhí)行設備功能。在一些配置中,部件被布置成通過一個或多個總線(未示出)進行通信。

處理器802包括中央處理單元(“cpu”),其被配置為處理數(shù)據(jù)、執(zhí)行一個或多個應用程序的計算機可執(zhí)行指令并與計算設備架構800的其他部件進行通信,以便執(zhí)行本文描述的各種功能。處理器802可以用于執(zhí)行本文呈現(xiàn)的軟件部件的方面,并且特別地,執(zhí)行至少部分地利用啟用觸摸的輸入的那些方面。

在一些配置中,處理器802包括被配置為加速由cpu執(zhí)行的操作的圖形處理單元(“gpu”),該操作包括但不限于執(zhí)行通用科學和工程計算應用以及諸如高分辨率視頻(例如,720p、1080p、4k及更高版本)、視頻游戲、3d建模應用等的圖形密集型計算應用所執(zhí)行的操作。在一些配置中,處理器802被配置為與分立的gpu(未示出)進行通信。在任何情況下,可以根據(jù)協(xié)處理cpu/gpu計算模型來配置cpu和gpu,其中,應用的順序部分在cpu執(zhí)行并且計算密集部分由gpu加速。

在一些配置中,處理器802是片上系統(tǒng)(“soc”)以及本文下面描述的一個或多個其他部件或者包括在片上系統(tǒng)(“soc”)以及本文下面描述的一個或多個其他部件中。例如,soc可以包括處理器802、gpu、網(wǎng)絡連接部件806中的一個或多個網(wǎng)絡連接部件以及傳感器部件808中的一個或多個傳感器部件。在一些配置中,處理器802部分地利用封裝堆迭(“pop”)集成電路封裝技術來裝配。此外,處理器802可以是單核或多核處理器。

處理器802可以根據(jù)arm架構創(chuàng)建,可從英國劍橋的armholdings獲得許可。替代地,可以根據(jù)諸如可從加利福尼亞州山景城的英特爾公司獲得的x86架構以及其他來創(chuàng)建處理器802。在一些配置中,處理器802是可從加利福尼亞州圣地亞哥的高通公司獲得的snapdragonsoc、可從加利福尼亞州圣克拉拉的nvidia公司獲得的tegrasoc、可從韓國首爾的三星samsung公司獲得的hummingbirdsoc、可從德克薩斯州達拉斯的德州儀器公司獲得的開放多媒體應用平臺(“omap”)soc,上面soc中的任一個的定制版本或專用soc。

存儲器部件804包括ram814、rom816、集成存儲存儲器(“集成存儲”)818和可移動存儲存儲器(“可移動存儲”)820。在一些配置中,ram814或其一部分、rom816或其一部分和/或ram814和rom816的某種組合集成在處理器802中。在一些配置中,rom816被配置為存儲固件、操作系統(tǒng)或其一部分(例如操作系統(tǒng)內核)和/或引導加載器以從集成存儲818或可移動存儲820加載操作系統(tǒng)內核。

集成存儲818可以包括固態(tài)存儲器、硬盤或固態(tài)存儲器和硬盤的組合。集成存儲818可以被焊接或以其他方式連接到邏輯板,在此邏輯板上還可以連接處理器802和本文描述的其他部件。因此,集成存儲818集成在計算設備中。集成存儲818被配置為存儲本文描述的操作系統(tǒng)或其部分、應用程序、數(shù)據(jù)和其他軟件部件。

可移動存儲820可以包括固態(tài)存儲器、硬盤或固態(tài)存儲器和硬盤的組合。在一些配置中,提供可移動存儲820來代替集成存儲818。在其他配置中,可移除存儲820被提供為額外的可選存儲。在一些配置中,可移除存儲820與集成存儲818邏輯地組合,使得總可用存儲可以作為集成存儲818和可移除存儲820的總組合容量提供給用戶并向用戶顯示。

可移除存儲820被配置為插入到可移動存儲存儲器插槽(未示出)或其他機構中,通過該機構可移動存儲器820被插入和固定,以促進可移除存儲820可以在其上與諸如處理器802的計算設備的其他部件通信的連接。可移動存儲820可以以各種存儲卡格式實現(xiàn),該各種存儲卡格式包括但不限于pc卡、壓縮閃速(compactflash)卡、記憶棒、安全數(shù)字(“sd”)、minisd、microsd、通用集成電路卡(“uicc”)(例如,用戶標識模塊(“sim”)或通用sim(“usim”))、專用格式等。

可以理解,一個或多個存儲器部件804可以存儲操作系統(tǒng)。根據(jù)各種配置,操作系統(tǒng)包括但不限于來自微軟公司的windowsmobile操作系統(tǒng)、windowsphone操作系統(tǒng)或windows操作系統(tǒng)、來自加拿大安大略省的滑鐵盧的行動研究公司(researchinmotion)的blackberry操作系統(tǒng)、來自加利福尼亞州庫比蒂諾的蘋果公司的ios以及來自加利福尼亞州山景城的谷歌公司的android操作系統(tǒng)??深A期其他操作系統(tǒng)。

網(wǎng)絡連接部件806包括無線廣域網(wǎng)部件(“wwan部件”)822、無線局域網(wǎng)部件(“wlan部件”)824以及無線個人局域網(wǎng)部件(“wpan部件”)826。網(wǎng)絡連接部件806促進到網(wǎng)絡828的通信和來自網(wǎng)絡828的通信,網(wǎng)絡828可以是wwan、wlan或wpan。盡管例示了單個網(wǎng)絡828,但網(wǎng)絡連接部件806可以促進與多個網(wǎng)絡的同時通信。例如,網(wǎng)絡連接部件806可以通過wwan、wlan或wpan中的一個或多個來促進與多個網(wǎng)絡的同時通信。

網(wǎng)絡828可以是例如利用一種或多種移動電信技術的移動電信網(wǎng)絡的wwan,其用于通過wwan部件822利用計算設備架構800向計算設備提供語音和/或數(shù)據(jù)服務。移動電信技術可以包括但不限于全球移動通信系統(tǒng)(“gsm”)、碼分多址(“cdma”)one、cdma2000、通用移動電信系統(tǒng)(“umts”)、長期演進(“l(fā)te”)和全球微波接入互操作性(“wimax”)。此外,網(wǎng)絡828可以利用各種信道接入方法(其可以或可以不被前述的標準使用),其包括但不限于時分多址(“tdma”)、頻分多址(“fdma”)、cdma、寬帶cdma(“w-cdma”)、正交頻分多路復用(“ofdm”)、空分多址(“sdma”)等。數(shù)據(jù)通信可以使用通用分組無線業(yè)務(“gprs”)、全球演進的增強型數(shù)據(jù)速率(“edge”)、包括高速下行鏈路分組接入(“hsdpa”)、增強型上行鏈路(“eul”)或其他稱為高速上行鏈路分組接入(“hsupa”)、演進hspa(“hspa+”)、lte的高速分組接入(“hspa”)協(xié)議族以及各種其他當前和未來的無線數(shù)據(jù)接入標準來提供。網(wǎng)絡828可以被配置為提供具有上述技術的任何組合的語音和/或數(shù)據(jù)通信。網(wǎng)絡828可以被配置為或適于根據(jù)下一代技術來提供語音和/或數(shù)據(jù)通信。

在一些配置中,wwan部件822被配置為向網(wǎng)絡828提供雙重多模式連接。例如,wwan部件822可以被配置為向網(wǎng)絡828提供連接,其中,網(wǎng)絡828通過gsm和umts技術或通過其他技術組合來提供服務。替代地,可以使用多個wwan部件822來執(zhí)行這樣的功能,和/或提供額外的功能來支持其他不兼容的技術(即,不能被單個wwan部件支持)。wwan部件822可以促進與多個網(wǎng)絡(例如,umts網(wǎng)絡和lte網(wǎng)絡)的類似連接。

網(wǎng)絡828可以是根據(jù)一個或多個電氣和電子工程師協(xié)會(“ieee”)802.11標準操作的wlan,諸如ieee802.11a、802.11b、802.11g、802.11n和/或未來的802.11標準(在本文中統(tǒng)稱為wi-fi)。還考慮了802.11標準草案。在一些配置中,利用一個或多個無線wi-fi接入點來實現(xiàn)wlan。在一些配置中,一個或多個無線wi-fi接入點是與作為wi-fi熱點的wwan連接的另一個計算設備。wlan部件824被配置為經由wi-fi接入點連接到網(wǎng)絡828。這樣的連接可以通過各種加密技術確保安全,這些加密技術包括但不限于wi-fi受保護訪問(“wpa”)、wpa2、有線等效保密(“wep”)等。

網(wǎng)絡828可以是根據(jù)紅外數(shù)據(jù)協(xié)會(“irda”)、藍牙、無線通用串行總線(“usb”)、z波、zigbee或一些其他短距離無線技術操作的wpan。在一些配置中,wpan部件826被配置為促進經由wpan與諸如外圍設備、計算機或其他計算設備的其它設備進行通信。

傳感器部件808包括磁力計830、環(huán)境光傳感器832、接近度傳感器834、加速度計836、陀螺儀838和全球定位系統(tǒng)傳感器(“gps傳感器”)840??深A期的是,諸如但不限于溫度傳感器或震動檢測傳感器的其它傳感器也可以并入計算設備架構800中。

磁力計830被配置成測量磁場的強度和方向。在一些配置中,磁力計830向存儲在存儲器部件804中的一個存儲器部件內的指南針應用程序提供測量結果,以便向用戶提供包括基本方向(北、南、東、西)的參考系中的精確方向??梢韵虬ㄖ改厢槻考膶Ш綉贸绦蛱峁╊愃频臏y量結果??梢灶A期由磁力計830獲得的測量結果的其它用途。

環(huán)境光傳感器832被配置成測量環(huán)境光。在一些配置中,環(huán)境光傳感器832向存儲在一個存儲器部件804內的應用程序提供測量結果,以便自動調節(jié)顯示器的亮度(如下文所描述)以補償?shù)凸夂透吖猸h(huán)境??梢灶A期由環(huán)境光傳感器832獲得的測量結果的其它用途。

接近度傳感器834被配置為在沒有直接接觸的情況下檢測靠近計算設備的對象或物體的存在。在一些配置中,接近度傳感器834檢測用戶身體(例如,用戶面部)的存在,并將該信息提供給存儲在存儲器部件804中的一個存儲器部件內的應用程序,存儲器部件804利用接近度信息來啟用或禁用計算設備的某些功能。例如,電話應用程序可以響應于接收到接近度信息而自動禁用觸摸屏(下文描述的),使得在通話期間,用戶的臉部不會無意中結束呼叫或啟用/禁用電話應用程序內的其他功能??梢灶A期由接近度傳感器834檢測到的接近度的其它用途。

加速度計836被配置為測量適當?shù)募铀俣?。在一些配置中,來自加速度?36的輸出由應用程序用作控制應用程序的某些功能的輸入機制。例如,應用程序可以是視頻游戲,其中,字符、其一部分或對象被移動或以其他方式被操縱以響應于通過加速度計836接收的輸入。在一些配置中,來自加速度計836的輸出被提供給用于在橫向模式與縱向模式之間切換、計算坐標加速度或檢測下降的應用程序??梢灶A期加速度計836的其它用途。

陀螺儀838被配置為測量和保持方向。在一些配置中,來自陀螺儀838的輸出由應用程序用作控制應用程序的某些功能的輸入機制。例如,陀螺儀838可用于精確地識別視頻游戲應用或某些其他應用的3d環(huán)境內的移動。在一些配置中,應用程序利用來自陀螺儀838和加速度計836的輸出來增強對應用程序的某些功能的控制??梢灶A期陀螺儀838的其它用途。

gps傳感器840被配置為從gps衛(wèi)星接收信號以用于計算位置。由gps傳感器840計算的位置可以由需要或受益于位置信息的任何應用程序使用。例如,由gps傳感器840計算的位置可以與導航應用程序一起使用,以提供從位置到目的地的方向或從目的地到位置的方向。此外,gps傳感器840可以用于向諸如e911服務的外部基于位置的服務提供位置信息。gps傳感器840可以獲得通過wi-fi、wimax和/或蜂窩三角測量技術(其利用一個或多個網(wǎng)絡連接部件806來幫助gps傳感器840獲得定位)來生成的位置信息。gps傳感器840還可以用在輔助gps(“a-gps”)系統(tǒng)中。

i/o部件810包括顯示器842、觸摸屏844、數(shù)據(jù)i/o接口部件(“數(shù)據(jù)i/o”)846、音頻i/o接口部件(“音頻i/o”)848、視頻i/o接口部件(“視頻i/o”)850和相機852。在一些配置中,顯示器842和觸摸屏844被組合在一起。在一些配置中,數(shù)據(jù)i/o部件846、音頻i/o部件848和視頻i/o部件850中的兩個或多個被組合在一起。i/o部件810可以包括被配置為支持下文描述的各種接口的分立處理器,或者可以包括處理器802內置的處理功能。

顯示器842是被配置為以視覺形式呈現(xiàn)信息的輸出設備。特別地,顯示器842可以呈現(xiàn)圖形用戶界面(“gui”)元素、文本、圖像、視頻、通知、虛擬按鈕、虛擬鍵盤、消息傳送數(shù)據(jù)、互聯(lián)網(wǎng)內容、設備狀態(tài)、時間、日期、日歷數(shù)據(jù)、偏好、地圖信息、位置信息和能夠以視覺形式呈現(xiàn)的任何其他信息。在一些配置中,顯示器842是利用任何有源或無源矩陣技術和任何背光技術(如果使用的話)的液晶顯示器(“l(fā)cd”)。在一些配置中,顯示器842是有機發(fā)光二極管(“oled”)顯示器。可以預期其他顯示器類型。

觸摸屏844是被配置為檢測觸摸的存在和位置的輸入設備。觸摸屏844可以是電阻式觸摸屏、電容式觸摸屏、表面聲波觸摸屏、紅外觸摸屏、光學成像觸摸屏、分散信號觸摸屏、聲學脈沖識別觸摸屏,或者可以利用任何其他觸摸屏技術。在一些配置中,觸摸屏844被作為透明層包含在顯示器842的頂部上,以使用戶能夠使用一個或多個觸摸來與呈現(xiàn)在顯示器842上的對象或其他信息進行交互。在其他配置中,觸摸屏844是包括在計算設備的表面上的觸摸板,該計算設備不包括顯示器842。例如,計算設備可以具有包含在顯示器842的頂部上的觸摸屏和與顯示器842相對的表面上的觸摸板。

在一些配置中,觸摸屏844是單觸摸的觸摸屏。在其他配置中,觸摸屏844是多點觸摸的觸摸屏。在一些配置中,觸摸屏844被配置為檢測離散觸摸、單觸摸手勢和/或多點觸摸手勢。為方便起見,本文統(tǒng)稱為“手勢”?,F(xiàn)在將描述幾個手勢。應當理解,這些手勢是說明性的,并不意圖限制所附權利要求的范圍。此外,所描述的手勢、額外的手勢和/或替代手勢可以在與觸摸屏844一起使用的軟件中實現(xiàn)。因此,開發(fā)者可以創(chuàng)建特定于特定應用程序的手勢。

在一些配置中,觸摸屏844支持輕敲手勢,其中,用戶在顯示器842上呈現(xiàn)的項目上輕敲觸摸屏844一次。由于各種原因可以使用輕敲手勢,其包括但不限于打開或啟動用戶輕敲的任何事物。在一些配置中,觸摸屏844支持雙擊手勢,其中,用戶在顯示器842上呈現(xiàn)的項目上輕敲觸摸屏844兩次。由于各種原因可以使用雙擊手勢,其包括但不限于分階段放大或縮小。在一些配置中,觸摸屏844支持輕敲和保持手勢,其中,用戶輕敲觸摸屏844并保持接觸持續(xù)至少預定義的時間。由于各種原因可以使用輕敲和保持手勢,其包括但不限于打開特定上下文的菜單。

在一些配置中,觸摸屏844支持平移手勢,其中,用戶將手指放置在觸摸屏844上,并且在觸摸屏844上移動手指的同時保持與觸摸屏844的接觸。平移手勢可以用于各種原因包括但不限于以受控的速率移動通過屏幕、圖像或菜單。也可以考慮多個手指平移手勢。在一些配置中,觸摸屏844支持輕彈手勢,其中,用戶在用戶希望屏幕移動的方向上滑動手指??梢杂捎诟鞣N原因使用輕彈手勢,其包括但不限于水平或垂直滾動通過菜單或頁面。在一些配置中,觸摸屏844支持捏合和拉伸手勢,其中,用戶使用觸摸屏844上用兩個手指(例如,拇指和食指)進行捏合運動或將兩個手指分開??梢杂捎诟鞣N原因使用捏合和拉伸手勢,其包括但不限于逐漸地放大或縮小網(wǎng)站、地圖或圖片。

雖然已經參考使用一個或多個手指來執(zhí)行手勢而呈現(xiàn)上文描述的手勢,但是可以使用諸如腳趾的其他附件或諸如觸筆的對象等來與觸摸屏844進行交互。因此,上文的手勢應當被理解為是說明性的,并且不應當被解釋為以任何方式限制。

數(shù)據(jù)i/o接口部件846被配置為促進將數(shù)據(jù)輸入到計算設備并從計算設備輸出數(shù)據(jù)。在一些配置中,例如出于同步操作的目的,數(shù)據(jù)i/o接口部件846包括被配置為在計算設備與計算機系統(tǒng)之間提供有線連接的連接器。連接器可以是諸如usb、微型usb、迷你usb等的專用連接器或標準連接器。在一些配置中,連接器是用于使計算設備與諸如插接站、音頻設備(例如,數(shù)字音樂播放器)或視頻設備的另一設備對接的插接連接器。

音頻i/o接口部件848被配置為向計算設備提供音頻輸入和/或輸出能力。在一些配置中,音頻i/o接口部件846包括被配置為收集音頻信號的麥克風。在一些配置中,音頻i/o接口部件846包括被配置為提供用于耳機或其它外部揚聲器的連接的耳機插孔。在一些配置中,音頻接口部件848包括用于輸出音頻信號的揚聲器。在一些配置中,音頻i/o接口部件846包括光音頻電纜。

視頻i/o接口部件850被配置為向計算設備提供視頻輸入和/或輸出能力。在一些配置中,視頻i/o接口部件850包括被配置為從另一設備(例如,諸如dvd或藍光播放器的視頻媒體播放器)接收視頻作為輸入或者將視頻作為輸出發(fā)送到另一設備(例如,監(jiān)視器、電視機或其他外部顯示器)的視頻連接器。在一些配置中,視頻i/o接口部件850包括用于輸入/輸出視頻內容的高清多媒體接口(“hdmi”)、迷你hdmi、微型hdmi、顯示端口或專用連接器。在一些配置中,視頻i/o接口部件850或其部分與音頻i/o接口部件848或其部分組合在一起。

相機852可以被配置為捕獲靜止圖像和/或視頻。相機852可以利用電荷耦合器件(“ccd”)或互補金屬氧化物半導體(“cmos”)圖像傳感器來捕獲圖像。在一些配置中,相機852包括閃光燈,以幫助在低光環(huán)境中拍攝照片。相機852的設置可以被實現(xiàn)為硬件或軟件按鈕。

雖然未例示,但還可以在計算設備架構800中包括一個或多個硬件按鈕。硬件按鈕可用于控制計算設備的某些操作方面。硬件按鈕可以是專用按鈕或多用途按鈕。硬件按鈕可以是機械的或基于傳感器的。

所示的電源部件812包括一個或多個電池854,其可以連接到電池量表856。電池854可以是可再充電的或一次性的。可充電電池類型包括但不限于鋰聚合物、鋰離子、鎳鎘和鎳金屬氫化物。每個電池854可以由一個或多個單元制成。

電池量表856可被配置為測量諸如電流、電壓和溫度的電池參數(shù)。在一些配置中,電池量表856被配置為測量電池放電速率、溫度、年齡和其他因素的影響,以在一定百分比的誤差內預測剩余壽命。在一些配置中,電池量表856向應用程序提供測量結果,該應用程序被配置為利用測量結果向用戶呈現(xiàn)有用的電源管理數(shù)據(jù)。電源管理數(shù)據(jù)可以包括使用的電池的百分比、剩余電池的百分比、電池狀況、剩余時間、剩余容量(例如,瓦特小時)、電流消耗和電壓中的一個或多個。

電源部件812還可以包括電源連接器,其可以與前述i/o部件810中的一個或多個i/o部件組合在一起。電源部件812可以經由電源i/o部件844與外部電源系統(tǒng)或充電設備相接。

本文提供的公開內容還可以被認為包括以下條款中闡述的主題:

條款1:一種計算機實現(xiàn)的方法,該方法用于從具有一個或多個明確格式化的文檔元素的文檔生成基于意圖的文檔,該方法包括:

通過計算機將文檔分類為具有多個布局類型中的一個布局類型;

通過計算機確定文檔中的一個或多個明確格式化的文檔元素的推斷的布局意圖,至少部分地基于對文檔的分類來確定推斷的布局意圖;以及

通過計算機使用所確定的針對文檔中的一個或多個明確格式化的文檔元素的推斷的布局意圖來生成基于意圖的文檔。

條款2:根據(jù)條款1所述的計算機實現(xiàn)的方法,其中,文檔至少部分地基于在計算機上執(zhí)行一個或多個啟發(fā)式算法而被分類為具有多個布局類型中的一個布局類型,該一個或多個啟發(fā)式算法檢查文檔的布局以將該文檔分類為具有多個布局類型中的一個布局類型。

條款3:根據(jù)條款1和2所述的計算機實現(xiàn)的方法,其中,文檔至少部分地基于在計算機上執(zhí)行一個或多個機器學習分類器而被分類為具有多個布局類型中的一個布局類型,該一個或多個機器學習分類器利用機器學習將文檔分類為具有多個布局類型中的一個布局類型。

條款4:根據(jù)條款1-3所述的計算機實現(xiàn)的方法,其中,機器學習分類器基于人類對訓練文檔語料庫的布局的分類來訓練。

條款5:根據(jù)條款1-4所述的計算機實現(xiàn)的方法,其中,針對一個或多個明確格式化的文檔元素的推斷的布局意圖至少部分地基于在計算機上執(zhí)行一個或多個啟發(fā)式算法,一個或多個啟發(fā)式算法檢查文檔中的文檔元素的模式或配置以確定文檔中的一個或多個明確格式化的文檔元素的推斷的布局意圖。

條款6:根據(jù)條款1-5所述的計算機實現(xiàn)的方法,其中,至少部分地基于文檔被分類為具有多個布局類型中的一個布局類型來選擇或配置一個或多個啟發(fā)式算法。

條款7:根據(jù)條款1-6所述的計算機實現(xiàn)的方法,其中,至少部分地通過在計算機上執(zhí)行一個或多個機器學習分類器來確定對一個或多個明確格式化的文檔元素的推斷的布局意圖,該一個或多個機器學習分類器利用機器學習來確定針對文檔中一個或多個明確格式化的文檔元素的推斷的布局意圖。

條款8:根據(jù)條款1-7所述的計算機實現(xiàn)的方法,其中,至少部分地基于文檔被分類為具有多個布局類型中的一個布局類型來選擇或配置一個或多個機器學習分類器。

條款9:根據(jù)條款1-8所述的計算機實現(xiàn)的方法,其中,一個或多個機器學習分類器基于人類對訓練文檔語料庫中的明確格式化的文檔元素的布局意圖的分類來訓練。

條款10:根據(jù)條款1-9所述的計算機實現(xiàn)的方法,還包括:針對文檔中的一個或多個明確格式化的文檔元素的推斷的布局意圖生成確定性分數(shù)。

條款11:一種具有存儲在其上的計算機可執(zhí)行指令的計算機存儲介質,該計算機可執(zhí)行指令在被計算機執(zhí)行時,使得計算機執(zhí)行以下操作:

將文檔的布局分類為多個布局類型中的一個布局類型,所述文檔具有包含在其中的一個或多個明確格式化的文檔元素;

確定針對文檔中一個或多個明確格式化的文檔元素的推斷的布局意圖,至少部分地基于對文檔的布局的分類來確定所推斷的布局意圖;以及

通過計算機使用所確定的針對文檔中一個或多個明確格式化的文檔元素的推斷的布局意圖來從文檔生成基于意圖的文檔。

條款12:根據(jù)條款11所述的計算機存儲介質,其中,通過以下方式將文檔的布局分類為多個布局類型中的一個布局類型:

一個或多個啟發(fā)式文檔布局分類算法;或

一個或多個基于機器學習的文檔布局分類器,其已經使用人類對訓練文檔語料庫的布局的分類來訓練。

條款13,根據(jù)條款11-12所述的計算機存儲介質,其中,針對文檔中一個或多個明確格式化的文檔元素的推斷的布局意圖通過以下方式來確定:

檢查或配置文檔中的文檔元素以確定針對文檔中一個或多個明確格式化的文檔元素的推斷的布局意圖的一個或多個啟發(fā)式算法;或

利用機器學習來確定針對文檔中的一個或多個明確格式化的文檔元素的推斷的布局意圖的一個或多個機器學習分類器,該機器學習分類器已經基于人類對訓練文檔語料庫中的明確格式化的文檔元素的布局意圖的分類來訓練。

條款14:根據(jù)條款11-13所述的計算機存儲介質,其中,基于對文檔布局的分類來選擇或配置一個或多個啟發(fā)式算法或一個或多個機器學習分類器。

條款15:根據(jù)條款11-14所述的計算機存儲介質,還具有存儲在其上的計算機可執(zhí)行指令,該計算機可執(zhí)行指令在被計算機執(zhí)行時,使得計算機生成與對文檔中的一個或多個明確格式化的文檔元素的推斷的布局意圖相關聯(lián)的確定性分數(shù)。

條款16:一種用于從具有一個或多個明確格式化的文檔元素的文檔生成基于意圖的文檔的系統(tǒng),該系統(tǒng)包括:

具有處理器并且被配置為在所述處理器上執(zhí)行文檔布局分類服務以對所述文檔的布局進行分類的至少一臺計算機;以及

具有處理器并且被配置為在該處理器上執(zhí)行文檔轉換服務以執(zhí)行以下操作的至少一臺計算機:

確定針對文檔中的一個或多個明確格式化的文檔元素的推斷的布局意圖,以及

使用所確定的對文檔中的一個或多個明確格式化的文檔元素的推斷的布局意圖來生成基于意圖的文檔。

條款17:根據(jù)條款16所述的系統(tǒng),其中,所述文檔布局分類服務被配置為將文檔的布局分類為紙狀的布局或演示狀的布局。

條款18:根據(jù)條款16-17的系統(tǒng),其中,文檔布局分類服務被配置為利用一個或多個啟發(fā)式算法或一個或多個機器學習分類器來將文檔的布局分類為紙狀的布局或演示狀的布局。

條款19:根據(jù)條款16-18的系統(tǒng),其中,文檔轉換服務還被配置為利用一個或多個啟發(fā)式算法或一個或多個機器學習分類器,以確定對文檔中的一個或多個明確格式化文檔元素的推斷的布局意圖。

條款20:根據(jù)條款16-19的系統(tǒng),其中,基于將文檔的布局分類為紙狀的布局或演示狀的布局來選擇或配置一個或多個啟發(fā)式算法或一個或多個機器學習分類器。

第21條:一種系統(tǒng),包括:

用于將文檔的布局分類為多個布局類型中的一個布局類型的模塊,該文檔具有包含在其中的一個或多個明確格式化的文檔元素;

用于確定對文檔中的一個或多個明確格式化的文檔元素的推斷布局意圖的模塊,至少部分地基于對文檔的布局的分類來確定推斷的布局意圖;以及

用于通過計算機使用所確定的對文檔中的一個或多個明確格式化的文檔元素的推斷的布局意圖來從文檔生成基于意圖的文檔的模塊。

條款22:根據(jù)條款21所述的系統(tǒng),其中,通過以下方式來將文檔的布局分類為多個布局類型中的一個布局類型:

一個或多個啟發(fā)式文檔布局分類算法;或

一個或多個基于機器學習的文檔布局分類器,其已經使用人類對訓練文檔語料庫的布局的分類來訓練。

條款23:根據(jù)條款21-22所述的系統(tǒng),其中,對文檔中一個或多個明確格式化的文檔元素的推斷的布局意圖由以下方式確定:

一種或多種啟發(fā)式算法,其檢查或配置文檔中的文檔元素,以確定對文檔中一個或多個明確格式化的文檔元素的推斷的布局意圖;或

一個或多個機器學習分類器,其利用機器學習來確定對文檔中一個或多個明確格式化的文檔元素的推斷的布局意圖,該機器學習分類器已經基于人類對訓練文檔語料庫中的明確格式化的文檔元素的布局意圖的分類來訓練。

條款24:根據(jù)條款21-23所述的系統(tǒng),其中,基于對文檔的布局的分類來選擇或配置一個或多個啟發(fā)式算法或一個或多個機器學習分類器。

條款25:根據(jù)條款21-24所述的系統(tǒng),包括用于生成與文檔中的一個或多個明確格式化的文檔元素的推斷的布局意圖相關聯(lián)的確定性分數(shù)的模塊。

基于前述內容,應當理解,本文已經公開了用于推斷布局意圖的技術。盡管已經以特定于計算機結構特征、方法學和變革行為、特定計算機器和計算機可讀介質的語言描述了本文提出的主題,但是應當理解,在所附權利要求中限定的本發(fā)明不一定限于本文所描述的具體特征、動作或介質。相反,具體特征、動作和介質被公開為實現(xiàn)權利要求的示例性形式。

上文描述的主題僅通過說明的方式提供,而不應被解釋為限制性的。在不脫離所附權利要求中闡述的本發(fā)明的真實精神和范圍的情況下,可以對本文所描述的主題進行各種修改和改變,而無需遵循所例示和所描述的示例性配置和應用。

當前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
灵丘县| 墨玉县| 铁岭县| 密云县| 顺平县| 昌宁县| 循化| 沾化县| 平乐县| 长治市| 五原县| 云梦县| 突泉县| 义马市| 娄烦县| 塔城市| 察哈| 兴海县| 彭山县| 齐河县| 明星| 塔河县| 安宁市| 平湖市| 开江县| 安泽县| 修水县| 盖州市| 卫辉市| 监利县| 青神县| 郓城县| 图们市| 明光市| 新疆| 本溪市| 南宫市| 镇巴县| 盐亭县| 涟水县| 惠安县|