專利名稱:跨越高速外圍互連總線的視頻渲染的制作方法
技術(shù)領(lǐng)域:
本發(fā)明通常涉及計算器件,特別是涉及包含圖形處理器的計算器件,該圖形處理 器互連于高速外圍總線。
背景技術(shù):
近年來,計算硬件已經(jīng)變得越來越集成了。計算機外圍通常形成如集成芯片組中 與中央處理器共同操作的部分。通常,計算機音訊、圖形適配器和接口形成該集成芯片組的 一部分。這種集成降低該計算器件的成本和尺寸。在此同時,圖形處理器是穩(wěn)定地發(fā)展,以提供增強的效能和特征。先進的圖形處理 器已幾乎與中央處理器同樣復(fù)雜了。因此,盡管集成的潮流,高效能圖形處理器仍通常形成 在外圍卡上。集成圖形處理器比較起來相當(dāng)簡單,并且沒有提供形成在外圍卡上的高效能 圖形處理器的特征或效能。在附加(add-on)外圍卡出現(xiàn)的情況下,集成圖形組件(當(dāng)出現(xiàn) 時)通常是多余的并因此是失能的(disabled)。類似地,當(dāng)圖形適配器(不論是集成的或外部的)升級時,較不具效力的適配器通 常沒有適用余地,因此,這些會被拋棄或失能。因此,仍需降低組件的多余性。
發(fā)明內(nèi)容
依據(jù)本發(fā)明的方面,由一個圖形處理器產(chǎn)生的圖形是跨越高速擴充/互連總線傳 送至幀緩沖器。來自該幀緩沖器的該渲染過的幀是經(jīng)由與該幀緩沖器通信的顯示器接口而 呈現(xiàn)在顯示器上。方便地,另一個現(xiàn)存的(集成的)圖形適配器/子系統(tǒng)的顯示器接口可用來將該 渲染過的幀呈現(xiàn)在互連顯示器上。以這種方式,該圖形處理器可形成圖形適配器中不需包含顯示器接口或可能甚至 幀緩沖器的部分。同樣地,該圖形處理器可被更流行的圖形處理器取代。該圖形處理器可形成圖形適配器中包含在外圍擴充卡上的部分。在一個實施例中,計算器件可包含第一和第二圖形適配器。將被顯示在顯示器上 的圖像被傳送至可被該第二圖形適配器訪問的存儲器。該第二適配器的顯示器接口是用來 將該第二圖形適配器的存儲器中的圖像呈現(xiàn)在該多個顯示器中至少一者。以這種方式,形 成該顯示器接口和該第二適配器的端口(port)的器件電子設(shè)備可因此利用。渲染過的圖 形可以一次傳送一幀或一圖形基元(primitive)的方式被傳送。在后者的例子中,圖形是直接地由該第二圖形適配器所訪問的存儲器中被有效地渲染。該存儲器可為系統(tǒng)存儲器或 適配器存儲器。依據(jù)另一個實施例,該第二適配器的圖形處理器可失能或置于低電源模式,而該 第一圖形處理器則渲染跨越該高速互連總線傳送的幀。依據(jù)本發(fā)明的另一個方面,形成第一圖形適配器的一部分的圖形處理器是操作以 分別在第一和第二顯示器上繪制第一和第二圖像。該第一顯示器可與該第一圖形適配器的 第一顯示器接口互連。該第二顯示器可與第二圖形適配器的第二顯示器接口互連。該方法 包含渲染該第一圖形適配器的存儲器中的該第一和第二圖像;將來自于該第一適配器的該 存儲器的該第二圖像傳送至該第二圖形適配器的幀緩沖器;以及,使用該第二圖形適配器 的該第二顯示器接口,將來自于該第二圖形適配器的該幀緩沖器的該第二圖像顯示在該第 二顯不器上。依據(jù)本發(fā)明的另一個方面,計算器件包含處理器;與該處理器通信的計算機可 讀取存儲器;第一圖形適配器;與該第一圖形適配器通信的第一適配器存儲器;用來將圖 像呈現(xiàn)在第一顯示器上的第一顯示器接口 ;第二圖形適配器;用來將圖像呈現(xiàn)在第二顯示 器上的第二顯示器接口 ;與該第一和第二圖形適配器互連的高速總線。程序代碼是儲存在 該計算機可讀取存儲器中,并可被該處理器執(zhí)行。該程序代碼當(dāng)執(zhí)行時,使該第一圖形適配 器渲染該第一適配器存儲器中的第一和第二圖像;使來自于該第一適配器存儲器的該第二 圖像傳送至該第二圖形適配器的幀緩沖器;以及,使該第二圖形適配器的該第二顯示器接 口被編程以將來自于該第二圖形適配器的該幀緩沖器的該第二圖像顯示在該第二顯示器 上。依據(jù)另一個方面,該第一適配器將第一圖像直接渲染至可由該第二適配器訪問的 該系統(tǒng)存儲器中。該第二適配器將該第二圖像渲染至該相同的存儲器中。該第二適配器顯 示來自于該系統(tǒng)存儲器的圖像。依據(jù)本發(fā)明的另一個方面,提供一種操作計算器件的方法,該計算器件包含處理 器、與該處理器通信的存儲器、將該處理器互連至圖形處理器的外圍互連總線、以及顯示器 接口。而該方法包含在該存儲器中建立幀緩沖器;指示該圖形處理器渲染視頻幀;將該視 頻幀經(jīng)由該外圍互連總線傳送至該幀緩沖器中;以及,將來自于該幀緩沖器的該幀經(jīng)由該 顯示器接口呈現(xiàn)在顯示器上。依據(jù)本發(fā)明的再一個方面,提供一種計算器件。該計算器件包含中央處理器、與 該中央處理器通信的存儲器、將該中央處理器互連至圖形處理器的外圍互連總線、顯示器 接口、儲存在該存儲器中的計算機可執(zhí)行指令,適配該計算器件使該圖形處理器渲染視頻 幀;將該視頻幀經(jīng)由該外圍互連總線傳送至幀緩沖器中;以及將來自于該幀緩沖器的幀經(jīng) 由該顯示器接口顯示在顯示器上。依據(jù)本發(fā)明的另一個方面,提供一種計算器件。該計算器件包含中央處理器;與該 處理器通信的存儲器;第一幀緩沖器;將該處理器互連至圖形子系統(tǒng)的外圍互連總線,該 圖形子系統(tǒng)缺少本地界定幀緩沖器至該圖形子系統(tǒng)的存儲器;以及,與該存儲器通信的顯 示器接口。該存儲器儲存計算機可執(zhí)行指令,該計算機可執(zhí)行指令適配該圖形處理器渲染 視頻幀,并將該視頻幀經(jīng)由該外圍互連總線傳送至該第一幀緩沖器中。依據(jù)本發(fā)明的另一個方面,提供一種圖形子系統(tǒng),包含圖形處理器、及外圍互連總線接口,用來將該圖形子系統(tǒng)互連至主處理器,該圖形子系統(tǒng)缺少本地界定幀緩沖器至 該圖形子系統(tǒng)的存儲器;以及,該圖形子系統(tǒng)操作以渲染視頻幀,并將該視頻幀經(jīng)由該外圍 互連總線傳送至幀緩沖器中。依據(jù)本發(fā)明的另一個方面,提供一種操作第一圖形處理器以分別在第一和第二顯 示器上繪制第一和第二圖像的方法。該第二顯示器是與第二圖形適配器的顯示器接口互 連。而該方法包含渲染與該第一圖形處理器通信的存儲器中的該第一和第二圖像;將該第 二圖像傳送至該第二圖形適配器的幀緩沖器;以及,編程該第二圖形適配器的該顯示器接 口,以將來自于該第二圖形適配器的該幀緩沖器的該第二圖像顯示在該第二顯示器上。本領(lǐng)域中具有通常技術(shù)者,在看過接下來的本發(fā)明特定實施例的描述與伴隨圖式 后,本發(fā)明的其它方面和特征將變得明顯。
在以下僅通過范例來顯示本發(fā)明的實施例的圖式,其中,圖1為計算器件的簡化方框圖,其為本發(fā)明的實施例的范例;圖2為圖1的該計算器件的軟件的簡化邏輯方框圖;圖3為圖1的該計算器件的一部分的簡化方框圖;圖4為圖1的該計算器件的一部分的進一步示意方框圖;圖5A為顯示在圖1的該計算器件所實施的步驟的流程圖,其為本發(fā)明的實施例的 范例;圖5B示意地描繪圖5A的步驟在圖1的器件的組件上的作用;圖6A為顯示在圖1的計算器件所實施的步驟的流程圖,其為本發(fā)明的實施例的范 例;圖6B示意地描繪圖6A的步驟在圖1的器件的組件上的作用;圖7和圖8為顯示在圖1的計算器件所實施的步驟的流程圖,其為本發(fā)明的進一 步實施例的范例;圖9為計算器件的一部分的進一步部分簡化示意方框圖,其為本發(fā)明的進一步實 施例的范例;圖10顯示在圖9的計算器件所實施的步驟的流程圖,其為本發(fā)明的實施例的范 例;以及圖11A、圖IlB為顯示圖9的器件的操作的簡化方框圖;以及圖12為計算器件的一部分的進一步部分簡化示意方框圖,其為本發(fā)明的進一步 實施例的范例。
具體實施例方式圖1為計算器件的簡化示意方框圖,其為本發(fā)明的實施例的范例。計算器件10是 基于傳統(tǒng)的Intel x86架構(gòu)。然而,將會變得明顯,本發(fā)明可容易地實作在具有PowerPC、 AMD x86或其它架構(gòu)的的計算器件中。計算器件10包含處理器12,通過集成接口電路14和20互連至系統(tǒng)存儲器16和 外圍。
在范例計算器件10中的處理器12為傳統(tǒng)的中央處理單元,并且可例如為與該 INTEL x86家族微處理器兼容的微處理器。集成接口電路14和20通常分別指北橋和南橋,且提供處理器12至外圍和存儲器 的接口。如所顯示的,北橋14互連該處理器12 ;存儲器16 ;經(jīng)由高速互連總線22的復(fù)數(shù) 個擴充插槽18 ;以及南橋20。南橋20互連至低速外圍和互連,例如經(jīng)由集成IDE/SATA 24 的磁盤驅(qū)動器、經(jīng)由集成通用串行總線(USB)端口 26的通用串行總線器件;以及,經(jīng)由低速 互連總線28的例如符合PCI或ISA標準的其它外圍。南橋20可包含集成音訊組件30、網(wǎng) 絡(luò)接口(未顯示)、等等。范例的互連總線22為PCI express (PCIe)總線,其帶寬在每秒百萬字節(jié)的范圍 內(nèi),并允許數(shù)據(jù)傳送在此帶寬讀取和寫入。舉例來說,現(xiàn)有的PCIe總線速度允許雙向數(shù)據(jù) 在高達266MHz或533MHz的總線速度下傳送,以允許高達每秒2. 1百萬字節(jié)或每秒4. 2百萬 字節(jié)的數(shù)據(jù)速率。在繪示的實施例中,北橋14進一步包含集成圖形適配器34,集成圖形適配器34適 于將計算器件10互連至第一顯示器32,第一顯示器32的形式為監(jiān)視器、IXD面板、電視、等寸。如以下所詳述的,經(jīng)由互連總線22互連且形成例如互連總線22上的擴充插槽18 中的外圍擴充卡50的一部分的額外圖形適配器52可進一步為計算器件10的一部分。在繪示的實施例中,計算器件10執(zhí)行儲存在存儲器16中的軟件。如圖2所顯示 的,范例軟件100包含儲存在存儲器16中的操作系統(tǒng)102、圖形庫104和應(yīng)用軟件106。范 例的操作系統(tǒng)包含Windows Vista,Windows XP ;Windows NT4. 0、Windows ME ;Windows 98、 Windows 2000、Windows 95、或 Linux 操作系統(tǒng)。范例的圖形庫包含 Microsoft DirectX libraries和OpenGL libraries。計算機存儲器16(圖1)和互連的磁盤驅(qū)動器(未顯示) 包含隨機訪問存儲器、只讀存儲器和磁盤儲存存儲器的適合組合,其被器件10用來以本發(fā) 明的實施例的范例方式儲存和執(zhí)行和器件10適配的操作系統(tǒng)和圖形適配器驅(qū)動器程序。 范例的軟件100(圖2)例如可儲存在只讀存儲器中或從外在的外圍(例如與IDE/SATA端口 24通信的磁盤驅(qū)動器)加載。計算機可讀介質(zhì)27可為光學(xué)儲存介質(zhì)、磁性軟盤(magnetic diskette)、磁帶、ROM 盒帶(cartridge)、等等。圖形庫104或操作系統(tǒng)102進一步包含圖形驅(qū)動器軟件108,用來與圖形適配器 34和52低階通信。該軟件具有數(shù)層,較高階層使用較低階層以提供特定功能。應(yīng)用可利 用操作系統(tǒng)102和圖形庫104以渲染2D或3D圖形。渲染從上下文看是包含繪制、不然就 是創(chuàng)造用于呈現(xiàn)的圖形圖像,且可例如包含多邊形渲染(polygon rendering)、光線追蹤 (ray-tracing)、圖像譯碼(image decoding)、線繪制(line drawing)、等等。將會變得明 顯,本發(fā)明的實施例的軟件范例可形成圖形庫104和/或驅(qū)動器軟件108的一部分。在范 例實施例中,范例軟件可形成OpenGL library和相關(guān)的驅(qū)動器的一部分。OpenGL在The Official Guide to Learning OpenGL,第1. 1版有特別的詳述,該內(nèi)容并入于此作為參 考。然而,具有通常技術(shù)者將了解本發(fā)明的實施例的范例方法可形成Microsoft Direct3D libraries、不使用慣用庫或慣用程序的應(yīng)用(例如游戲)、或其它任何3D應(yīng)用或庫的一部 分。描繪集成圖形適配器34的計算器件10的一部分(和尤其是北橋14)的進一步簡化方框圖是顯示在圖3。如所顯示的,北橋14包含高速總線接口 36和存儲器控制器38,將 橋14互連至互連總線22和系統(tǒng)存儲器16。北橋14進一步包含集成圖形適配器34,集成 圖形適配器34接著包含圖形處理器40、命令處理器42和顯示器接口 44。圖形處理器40可采用三維(3D)圖形處理器的形式,該三維圖形處理器可渲染配 置在系統(tǒng)存儲器16內(nèi)的幀緩沖器46中的三維圖像,并可包含用于加速渲染圖形的多重管 線(pipeline)和管線階段。在正常單一監(jiān)視操作中,命令是以傳統(tǒng)的方式由命令處理器42傳給圖形處理器 40。舉例來說,命令處理器42可包含用來界定存儲器16中的命令隊列(command queue) 47 的寄存器47。應(yīng)用軟件106或操作系統(tǒng)102使用庫104來渲染圖形圖像。驅(qū)動器軟件108 產(chǎn)生圖形處理器特定的命令,并將這些放置在該命令隊列47中,且同時更新命令處理器42 的寄存器,以反映該隊列的尾端。圖形處理器42以管線的方式異步處理隊列的命令,以為 了渲染幀緩沖器46內(nèi)的圖像。當(dāng)圖形處理器40能夠處理該隊列中的下一個命令時,他提 供訊號至命令處理器42,命令處理器42接著抓取該隊列47中的下一個命令,并將隊列指示 字前進至命令處理器42的寄存器中。顯示器接口 44經(jīng)由存儲器控制器38采樣該幀緩沖器46并將圖像呈現(xiàn)在具有VGA 端口、復(fù)合的視頻端口、DVI端口、HDMI、顯示器端口、等等形式的一個或多個視頻輸出端口 48上,用以在例如具有電視、監(jiān)視器、等等形式的視頻器件(例如圖1的顯示器32)顯示一 個或多個圖像。以這種方式,可呈現(xiàn)幀緩沖器46中由圖形處理器40所渲染的圖像。將會了解到,顯示器接口 44可為任何用來轉(zhuǎn)換緩沖器中用以在顯示器器件上顯 示的數(shù)據(jù)的適合接口。舉例來說,顯示器接口 44可采用RAMDAC的形式。顯示器接口 44通 常是可編程的,例如通過復(fù)數(shù)個寄存器,以允許驅(qū)動器軟件108或類似的軟件或圖形處理 器40設(shè)定存儲器16中的開始地址,以在其顯示器輸出呈現(xiàn)。同樣地,接口 44圖素深度(例 如,每圖素有幾個位)和屏幕分辨率通常也是可編程的。將會了解到,可在存儲器16中放置兩個幀緩沖器,以取代放置單一幀緩沖器46。 該緩沖器可交替地使用以更平順地呈現(xiàn)渲染過的圖像。顯示器接口 44在任何時候僅顯示 該兩個緩沖器中的一個緩沖器的內(nèi)容。被顯示的緩沖器通常稱為前緩沖器。圖形處理器40 渲染圖像,以顯示至該所謂的后緩沖器,亦即沒有被顯示器接口 44正在顯示的幀緩沖器。 在渲染幀完成后,前和后緩沖器對調(diào)顯示器接口 44被編程以呈現(xiàn)該先前的后緩沖器。以 這種方式,由圖形處理器40所渲染的接續(xù)幀間的轉(zhuǎn)換可看起來較平順。值得注意的是,寄存器和被適配器34所使用的存儲器46的幀緩沖器均對應(yīng)至全 存儲器空間中的地址。本發(fā)明的范例;然而,計算器件10進一步包含形成在外圍擴充卡50上的圖形適配 器52,外圍擴充卡50可經(jīng)由高速互連總線22上的擴充插槽插置于器件10中,以與北橋14 通信,如圖1所顯示的。圖形適配器52當(dāng)互連至北橋14時,是示意地顯示于圖4中。如所 顯示的,圖形適配器52包含圖形處理器54、視頻存儲器56、命令處理器58、存儲器控制器 60、及顯示器接口 62。一個或多個端口 64、66允許適配器52互連至一個或多個顯示器器 件,例如顯示器68(圖1)。命令處理器58和顯示器接口 62分別與命令處理器42和顯示器接口 44以相同的 方式運作。圖形處理器54與圖形處理器40以相同的方式操作,以其正常的操作模式。圖
8形適配器52包含其自己的存儲器56及存儲器控制器60,以提供至存儲器56和系統(tǒng)存儲 器16的訪問。本地存儲器56是使用來保留一個或多個用于由圖形處理器54所使用的圖 形適配器52的緩沖器70,緩沖器70可作為幀緩沖器。用于圖形處理器54的命令隊列57 也可建立在系統(tǒng)存儲器16中。再次地,本地存儲器56可通過存儲器控制器60尋址在全系統(tǒng)存儲器空間中的地 址。同樣地,由命令處理器54和顯示器接口 62所使用的寄存器也可尋址在全地址空間的 地址內(nèi)。如已經(jīng)注意到的,由適配器34所使用的寄存器和幀緩沖器46是對應(yīng)至全存儲器 空間。因此,命令處理器58和圖形處理器54可寫入至由顯示器接口 44和命令處理器42 所使用的幀緩沖器46和寄存器。此外,圖形處理器54與存儲器控制器60 —起操作以實施塊傳送操作,以將數(shù)據(jù)在 系統(tǒng)和適配器存儲器16、56的存儲器地址之間傳送。為了努力提供節(jié)約的集成組件,集成圖形適配器34提供有限的功能。舉例來說, 集成圖形控制器的分辨率、3D圖形能力、等等是相當(dāng)?shù)挠邢?。因此,相較于圖形適配器52, 集成圖形適配器34通常具有相當(dāng)少的圖形處理能力。舉例來說,相較于適配器52,適配器 34可更緩慢地操作,以提供較少的特征、等等?,F(xiàn)在,集成適配器34或適配器52其自己可(也可不)允許經(jīng)由多個端口(例如 端口 48)互連至多個實體顯示器器件。然而,每一個適配器可互連至至少一個實體顯示器。 所以,本發(fā)明的實施例的范例,加載至存儲器16的適配器驅(qū)動器軟件108使圖形適配器52 作為主要(或第一)圖形適配器,主要圖形適配器渲染圖形,以呈現(xiàn)在顯示器32和68上, 而圖形適配器34則作為第二或從屬適配器。將會變得明顯,在此主要/從屬操作模式中,集成圖形適配器34實質(zhì)上是失能的。 然而,板上(on-board)圖形適配器34的組件(和尤其是顯示器接口 44)仍可被使用來驅(qū) 動互連的監(jiān)視器和其它顯示器器件。像這樣,卡50不需包含多重顯示器端口和顯示器驅(qū)動 器。取而代之的是,顯示器接口 44及其端口 48可用來驅(qū)動至少一個監(jiān)視器或顯示器32, 除了顯示器68或由卡50所驅(qū)動的顯示器68外。如果適配器52包含多重端口(例如端口 64、66),處理器52可額外地渲染圖像,以通過這些端口來加以呈現(xiàn)。當(dāng)然,驅(qū)動器軟件108 也可允許適配器34以其傳統(tǒng)的操作模式操作,如上述。也可由或通過應(yīng)用軟件106來選擇 適配器34(和因此適配器52)的操作模式。具體言之,在主要/從屬操作模式中,本發(fā)明的實施例的范例,存儲器16中驅(qū)動器 軟件108將作用的幀緩沖器70和次要適配器緩沖器72放置于適配器52的存儲器56中, 如圖4所示意地描繪。該作用的幀緩沖器70如用于適配器52的傳統(tǒng)幀緩沖器作用著,并 因此儲存幀,以顯示于適配器52的顯示器68上。像這樣,圖形處理器54以傳統(tǒng)的方式渲 染存儲器56中的作用的幀緩沖器70中的二維或三維圖形。卡50的顯示器接口 62轉(zhuǎn)換作 用的幀緩沖器70的內(nèi)容,以顯示在互連的監(jiān)視器或顯示器器件上。選擇性地,作用的幀緩 沖器70可被前和后緩沖器所取代,如上述。圖形處理器54進一步渲染圖像,以在次要適配器幀緩沖器72的顯示器器件32上 顯示。總結(jié)渲染次要適配器幀緩沖器72中的幀,次要適配器幀緩沖器72的內(nèi)容被傳送至 幀緩沖器46,以由圖形適配器34的顯示器接口 44呈現(xiàn),如下述。在第一實施例中,存儲器16中的圖形適配器驅(qū)動器軟件108實施圖5A所描繪的步驟S500。具體言之,驅(qū)動器軟件108產(chǎn)生命令,以在步驟S502中引導(dǎo)圖形處理器54渲 染存儲器56的次要適配器緩沖器72。這些命令是放置在適配器52的命令隊列57,并由圖 形處理器54以與命令將被隊列于隊列47內(nèi)幾乎相同的方式執(zhí)行,如上述。一旦該幀被渲 染后,驅(qū)動器軟件108進一步產(chǎn)生一個命令(或數(shù)個命令),以使處理器54將次要適配器 幀緩沖器72的內(nèi)容位塊傳送(BITBLT)存儲器56中放置如用于圖形適配器34的幀緩沖器 46的那個區(qū)域中(步驟S504)。圖形適配器34的顯示器接口 44接著已經(jīng)預(yù)編程以將其幀緩沖器46的內(nèi)容顯示 至互連的監(jiān)視器或端口 48處的顯示器。方便地接下來,互連至端口 48和端口 46的顯示器 32和68上所顯示的圖像由圖形處理器54渲染或繪制。步驟S504在緩沖器72和幀緩沖器 46上的效應(yīng)是顯示于圖5B中。在第二實施例中,實施描繪于圖6A中的步驟S600。起初,前和后幀緩沖器是放置 在適配器52的存儲器16中。為了方便起見,這些是指定為緩沖器46a和46b,并且繪示在 圖6B中。在步驟S602中,處理器54再次地渲染任何幀,以由如上述參考步驟S502的存儲 器56的次要適配器幀緩沖器72中的顯示器接口 44所呈現(xiàn)??偨Y(jié)渲染幀以顯示于器件32上,驅(qū)動器軟件108編程圖形處理器54,以將存儲器 56中次要適配器幀緩沖器72的內(nèi)容位塊傳送(BITBLT)至存儲器16的該之后現(xiàn)在的后緩 沖器,以用于步驟S604中的圖形適配器34。在該BITBLT完成后,驅(qū)動器編程處理器54,以 編程顯示器接口 44的寄存器對調(diào)適配器34的后緩沖器和前緩沖器(也就是,使用該后緩 沖器作為該前緩沖器),在步驟S606中。此可藉由直接地再編程顯示器接口 44的寄存器、以 確認由顯示器接口 44用來呈現(xiàn)數(shù)據(jù)所使用的起始地址來加以完成。圖形適配器34的顯示 器接口 44接著將其緩沖器的內(nèi)容呈現(xiàn)至在端口 48處的互連監(jiān)視器(也就是,顯示器68)。 該之前的前緩沖器接著使用作為用于適配器34的后緩沖器,而由處理器54所渲染用于顯 示于顯示器32上的下一個幀將初始地被傳送至步驟S604的此后緩沖器。當(dāng)然,驅(qū)動器軟 件108維持每一個緩沖器46a和46b的起始位置作為前和后緩沖器。步驟S604和S606在 緩沖器46a和46b上的效應(yīng)是示意地顯示在圖6B中。在沒有同步的情況下,使用單一緩沖器46或直接編程適配器34的顯示器接口 44 可導(dǎo)致看得見的撕裂。也就是,顯示器接口 44的寄存器編程的垂直回掃期間(vertical blanking interval)以外的任何時間,均看得到撕裂,這是因為顯示器參數(shù)在由接口 44所 輸出的幀的中間會改變。因此,在第三實施例中,可實施圖7中所描繪的步驟S700。再次地,前和后緩沖器 46a、46b是初始地放置在由適配器34所使用的存儲器16中。處理器54再次地渲染圖像, 以在本地存儲器56的緩沖器72內(nèi)的器件32顯示,如上述關(guān)于步驟S502和S602。在完成渲染幀以顯示在顯示器32上后,存儲器16中的驅(qū)動器軟件108編程圖形 處理器54,以將存儲器56中次要適配器幀緩沖器72的內(nèi)容位塊傳送至步驟S704的圖形適 配器34的存儲器16中的之后現(xiàn)有后緩沖器。驅(qū)動器軟件108進一步將命令置放在適配器 34的命令隊列47中,以對調(diào)前和后緩沖器(步驟S706)。然而,命令處理器42的寄存器并 非由驅(qū)動器軟件108更新,以反映命令隊列47中尚未處理的命令。取而代之的是,驅(qū)動器 軟件108提供命令至圖形處理器54(步驟S708),以在步驟S706中所啟動的位塊傳送完成 時更新命令處理器42的命令隊列寄存器。此接著使命令處理器42提供指令至處理器40,以將其后緩沖器對調(diào)成前緩沖器。圖形處理器40接著執(zhí)行隊列的命令,以對調(diào)適配器34 的后和前緩沖器(也就是,藉由再編程顯示器接口 44的寄存器,以將其之前后緩沖器的內(nèi) 容呈現(xiàn)至互連監(jiān)視器或端口 48處的顯示器)。在第四實施例中,實施圖8中所描繪的步驟S800。再次地,前和后緩沖器初始是放 置在適配器34的存儲器16中。處理器54再次地渲染圖像,以用于本地存儲器56的緩沖 器72中的顯示器32,如上述。驅(qū)動器軟件108進一步將命令放置在適配器34的隊列47中,以使圖形處理器40 將存儲器56中次要幀緩沖器72的內(nèi)容位塊傳送(BITBLT)至系統(tǒng)存儲器16中放置作為用 于圖形適配器34的現(xiàn)有后幀緩沖器的那個區(qū)域。驅(qū)動器軟件108也將命令放置在隊列47 中,以使圖形處理器40通過編程顯示器接口 44以對調(diào)適配器34的前和后緩沖器,以使用 該后緩沖器作為前緩沖器。然而,命令處理器42中界定該隊列指示字的寄存器直到幀已經(jīng) 在緩沖器72中被渲染后才更新。所以,在總結(jié)渲染用于顯示器32的幀,圖形處理器54提供命令來更新界定用于命 令處理器42的該隊列指示字的命令寄存器,以反映適配器34的命令隊列中的尚未處理的 命令。圖形處理器40接著執(zhí)行該隊列的命令,以將緩沖器72的內(nèi)容位塊傳送至其后緩沖 器,以對調(diào)其后和前緩沖器(也就是,藉由再編程顯示器接口 44的寄存器,以將其之前的后 緩沖器的內(nèi)容呈現(xiàn)至互連監(jiān)視器或端口 48處的顯示器)。如將要了解到的,上述實施例允許主圖形處理器擔(dān)負在多重獨立的幀緩沖器上繪 制二或三維圖形圖像的責(zé)任。從屬圖形適配器可用來顯示在一個幀緩沖器中所創(chuàng)造的圖 像。驅(qū)動額外的顯示器所需要的器件電子組件和端口可由從屬圖形適配器34提供。以這 種方式,包含在從屬圖形控制器中的電子組件可有效地用來允許驅(qū)動多重顯示器。傳統(tǒng)上,緩沖器70和72可用來界定單一表面,在該單一表面上,應(yīng)用軟件106可 將單一圖形圖像渲染成顯示跨越兩個或更多個與圖形適配器52和34互連的顯示器48和 64上。驅(qū)動器軟件108可相應(yīng)地將可用的屏幕尺寸報告給應(yīng)用軟件106,相同于緩沖器70 和緩沖器72的尺寸。因此,如果緩沖器70的分辨率為Hi1*!!,而緩沖器72的分辨率為m2*n, 則驅(qū)動器軟件108可將可用的屏幕尺寸Oi^m2)*!!報告給應(yīng)用軟件106的應(yīng)用。如果緩沖 器70和72占據(jù)存儲器56中相鄰的Oi^m2)*!!個圖素位置,則由驅(qū)動器軟件108所實施的 渲染會被簡化。應(yīng)用軟件106可接著使用驅(qū)動器軟件108,以使圖形處理器40渲染較大的 圖像,該較大的圖像的分辨率為組成由緩沖器70和72所界定的平面的Oi^m2)*!!個圖素。 緩沖器70和72因此儲存圖像對,其中,該圖像對的每個圖像形成該較大的圖像中由該應(yīng)用 所渲染的一部分??偨Y(jié)渲染每一個較大的圖像,驅(qū)動器軟件108可依據(jù)上述的步驟S500、 S600.S700或S800將緩沖器72中的圖像傳送給幀緩沖器46,用于顯示在顯示器32上。緩 沖器70中的該圖像可以正常的方式顯示在顯示器68上。觀看放置在一起的顯示器32和 68的最后用戶認識到由應(yīng)用106所渲染的該較大的圖像。將會了解到,具有游戲形成的應(yīng) 用106可利用多重顯示器,而不需要修正。如果前和后緩沖器為顯示器68所使用,則可放置和使用兩個不同的緩沖器,以代 替緩沖器72,以確保保留將被顯示在顯示器32上的該表面部分的該緩沖器在存儲器56中 是鄰接該緩沖器,其中,將被顯示在顯示器68上的該表面部分會被渲染。步驟S602、S604、 S702、S704或S802、S704可相應(yīng)地被修正為將保留該剛完成的圖像的該緩沖器位塊傳送至后緩沖器46a或46b。方便地,現(xiàn)有的應(yīng)用軟件106不需修正。取而代之的是,該應(yīng)用軟件 可只是依賴該報告的較大的屏幕尺寸。驅(qū)動器軟件108使該渲染表面跨越多重顯示器。也將會被了解到,雖然該描繪的實施例利用集成圖形控制器作為從屬圖形適配 器,但該從屬圖形適配器可輕易地是經(jīng)由總線(該總線具有足夠的帶寬,以允許將圖形幀 傳送至該從屬幀緩沖器內(nèi))而與圖形適配器52通信的另一個圖形適配器。像這樣,該從屬 圖形處理器可形成如另一個與PCIe兼容的擴充卡。所以,舉例來說,當(dāng)圖形卡升級時,較舊 的擴充卡可能仍被使用,以他們的能力來驅(qū)動互連的顯示器。類似地,該互連總線不需要是 PCIe互連總線,但可為任何其它適合的總線,只要該總線的帶寬允許數(shù)據(jù)以與顯示器接口 44所使用的刷新率的速率在幀緩沖器之間傳送即可。同樣地,雖然幀緩沖器46 (和前和后 緩沖器46a和46b)已經(jīng)描述成為形成在系統(tǒng)存儲器16中,他們可容易地形成如存儲器中 本地至適配器34的一部分。在本發(fā)明的又一個實施例中,渲染跨越總線22可允許由高速總線22所互連的圖 形適配器(或子系統(tǒng))取代集成適配器/子系統(tǒng)。為了達到此目的,圖9為本發(fā)明的另一個實施例的計算器件10’范例的一部分的 簡化方框圖范例。計算器件10'詳述于美國專利申請案第11/421,005號。簡言之,然而,器件10'包含兩個圖形子系統(tǒng)30'和40'。圖形子系統(tǒng)30'包含 圖形引擎/處理器32'、存儲器控制器72'、顯示器接口 74'和總線接口 78'。第二圖形 子系統(tǒng)40'是經(jīng)由高速總線22'(例如PCIe總線)而與圖形子系統(tǒng)30'通信。圖形子系 統(tǒng)40'包含其自己的圖形引擎/處理器42';存儲器控制器52';顯示器接口 54'。圖形 子系統(tǒng)40'進一步與圖形存儲器50'通信。將會變得明顯,子系統(tǒng)40'是適配來將圖形渲 染跨越總線22'而至存儲器14'。器件10'可方便地形成如具有膝上型或較小計算器件的形式的便攜式計算器 件。像這樣,單一外罩可包含DC電源、顯示器26'和上述的主機板和組件。該第二圖形子 系統(tǒng)40'可附加至罩住該計算器件的其余部分的單一外罩,或可形成系泊部位(docking station)中只形成部分器件10'的一部分(當(dāng)器件10'實體互連至該部分時)。器件10'可操作在至少兩種電源消耗模式較高電源消耗模式和較低電源消耗 模式。在描繪的實施例中,當(dāng)器件10'是由連接至AC(主要)供應(yīng)器的電源供應(yīng)電源時,器 件10'可假定為較高電源模式;當(dāng)器件10'是由使用一個或多個電池、燃料電池、等等的 DC電源供應(yīng)電源時,器件10'是假定為較低電源消耗模式?;蛘?,電源消耗模式可依據(jù)例 如,用戶偏好、被執(zhí)行的軟件應(yīng)用的類型、電池電位、等等或其它選擇,而由用戶選擇或由軟 件控制??刂破骷?0’的操作的軟件的機構(gòu)是揭露在美國專利申請案第11/421,005號,并 且分享類似的軟件100,如上述。部分該軟件控制器件10'的操作如同器件10’在高和低電源消耗狀態(tài)轉(zhuǎn)換。具體 言之,圖10繪示本發(fā)明的實施例的范例軟件方框S800',軟件方框S800'由器件10’的系 統(tǒng)存儲器中的軟件控制的中央處理器(例如圖1中的處理器12-)所實施。方框S800'可 在每一次器件10’進行狀態(tài)改變時實施,因此,其子系統(tǒng)30'和40'應(yīng)相應(yīng)地組構(gòu)。如所 顯示的,在方框S802'中,該軟件判定器件10'是否應(yīng)假定為較高電源消耗模式、或為其 較低電源消耗模式。
12
當(dāng)器件10'假定(或轉(zhuǎn)換)為其高電源消耗模式時,執(zhí)行方框S804' -S810'。在 方框S804中,圖形子系統(tǒng)40'是置于其全操作(高電源消耗)模式,如果其尚未在此模式。 此可通過將適當(dāng)?shù)挠嵦柦?jīng)由控制圖形子系統(tǒng)40'的驅(qū)動器提供給電源控制器60'而加以 執(zhí)行。接下來,圖形子系統(tǒng)40'在方框S806和S808中致能。再次地,此可通過將互連關(guān)聯(lián) 于圖形子系統(tǒng)30’的任何顯示器邏輯地失能(方框S804)、及將連接于圖形子系統(tǒng)40’的該 顯示器邏輯地致能(方框S808)而加以執(zhí)行。方框S806和S808可再次地由適當(dāng)?shù)牟僮飨?統(tǒng)API calls(例如,美國專利申請案第11/421,005號所描述的EnumDisplayDevicesO和 ChangeDisplaySettingsEXO calls)來加以執(zhí)行、或透過與硬件直接通信來加以執(zhí)行。需注意的是,沒有實體的顯示器是連接至圖形子系統(tǒng)40'。控制圖形子系統(tǒng) 40’的操作的驅(qū)動器軟件是組構(gòu)以渲染圖形子系統(tǒng)30’的緩沖器中的圖像,而非渲染步驟 S810’中的關(guān)聯(lián)存儲器50'中的圖像。方便地,在高速總線22'(實作為例如PCIe總線) 出現(xiàn)的情況下,這種渲染有可能跨越總線22',部分是因為由該總線所致能的傳送速度。該渲染可一個基元一個基元地跨越該總線而被引導(dǎo)至該幀緩沖器中,以因此跨越 總線22'傳送該渲染的圖像。此可通過將緩沖器14'放置在可由子系統(tǒng)40’訪問的存儲 器、及提供緩沖器14’的地址給用于子系統(tǒng)40’的該驅(qū)動器軟件來加以促成?;蛘撸瑢?變得明顯,該幀可在一個緩沖器中被渲染,并由直接存儲器訪問(等等)而傳送跨越總線 22'。并且,用于圖形子系統(tǒng)30'的驅(qū)動器進一步組構(gòu)以使圖形子系統(tǒng)30'的顯示器 接口 74'采樣存儲器14'中的該幀緩沖器,以將由存儲器14'中的該幀緩沖器內(nèi)的圖形 子系統(tǒng)40'所渲染的圖像呈現(xiàn)在互連的顯示器26'上。同時,用于圖形子系統(tǒng)30'的驅(qū)動 器可引導(dǎo)圖形子系統(tǒng)30'的圖形引擎32'維持實質(zhì)的休眠或閑置。此操作模式是示意地 顯示在圖IlA中,其中,僅圖形子系統(tǒng)40'和圖形子系統(tǒng)30'的作用的方框劃有斜線。將為明顯的,在圖IlA的實施例中,沒有使用存儲器50'和顯示器接口 54'。像這 樣,這些功能方框可從子系統(tǒng)40'消除,以允許成本降低。該結(jié)果的子系統(tǒng)40'不需包含 顯示器接口,并且將缺少界定幀緩沖器本地至子系統(tǒng)40'的存儲器。制造這種圖形子系統(tǒng) 可能是有利的,因為子系統(tǒng)40'可被制造以補足由子系統(tǒng)30'所提供的功能。舉例來說, 子系統(tǒng)可提供有提供三維圖形或視頻譯碼能力的圖形引擎42'。圖形引擎32'可不包含 這些能力。同時,由圖形引擎32'所提供的二維圖形能力不需要包含在子系統(tǒng)40'中。消 費者接著可于需要額外功能時才附加圖形子系統(tǒng)30'。當(dāng)器件10'轉(zhuǎn)換至、或假定為其低電源消耗模式時,執(zhí)行方框S812' -S818'。廣 義言之,圖形子系統(tǒng)40'是部分地或完全地失能,并且是置于其低電源消耗模式,而渲染是 再次地由圖形子系統(tǒng)30'所實施。這樣做后,互連關(guān)聯(lián)于圖形子系統(tǒng)30'的任何顯示器可 在方框S812'中致能,而實體地連接至圖形子系統(tǒng)40'的任何顯示器則可在方框S814’中 邏輯地失能。接下來,控制圖形子系統(tǒng)30'的操作的驅(qū)動器軟件再次地被組構(gòu),以使圖形子 系統(tǒng)30'渲染存儲器14'中的圖像。顯示器接口 74'繼續(xù)采樣存儲器14',以將圖像呈 現(xiàn)在與端口 78'互連的顯示器26'上。同樣的,處理器12'首先提供適當(dāng)?shù)挠嵦栔岭娫纯?制器60'(方框S818'),以將圖形子系統(tǒng)40'置于其低電源狀態(tài)。以其最簡單的形式, 電源控制器(未顯示)斷開至圖形子系統(tǒng)40'的電源、或?qū)D形子系統(tǒng)40'置于較低電源 睡眠模式。再次地,在此較低電源消耗模式中,電壓被節(jié)流(throttled),和/或所有或部分的圖形子系統(tǒng)40'的電源下降和/或由圖形子系統(tǒng)40'所使用的選擇的時鐘減慢。具體 言之,圖形子系統(tǒng)40'的圖形引擎42'維持閑置或?qū)嵸|(zhì)地閑置(例如,其可被減慢、失能或 降低電源)。此操作模式是示意地繪示在圖9B中,其中,僅適配器40'和圖形子系統(tǒng)30' 的作用的功能方框劃有斜線。該不作用/閑置的功能方框可完全地失能、或操作在降低的 電壓或時鐘速度。選擇性地,一部分的圖形子系統(tǒng)30'可于圖形引擎32'沒有使用時失能。在圖形 子系統(tǒng)40'負責(zé)渲染圖像的任何時刻,此可通過將圖形引擎32'和其它組件置于一個或 多個電壓島(該電壓島可通過GPIO或類似電路來加以失能)來加以促成。其它的變化也應(yīng)是明顯的。舉例來說,在圖IlA中所繪示的高電源模式中,圖形子 系統(tǒng)30'和圖形子系統(tǒng)40'兩者均可渲染至存儲器14'或存儲器50'。以這種方式,該 兩個圖形子系統(tǒng)30'和40'可和諧地操作,每一者渲染存儲器14'中交替的圖像或渲染 存儲器14'中每一幀的交替部分(例如,掃描線)。在其它實施例中,額外的顯示器可連接至圖形子系統(tǒng)30'和40',以允許同時使 用以高電源消耗模式操作的多重顯示器,如上述。以這種方式,顯示器接口 54'可使用來 驅(qū)動第二顯示器。在轉(zhuǎn)換至較低電源消耗模式后,器件10'可組構(gòu)為如圖IlB所繪示的操作。類似地,器件10'(或10)可包含連接至總線22'(或22)的多重額外的圖形子 系統(tǒng),所有這些圖形子系統(tǒng)均可作用在該高電源消耗模式,并且可通過圖形子系統(tǒng)30'的 顯示器接口 74'渲染圖形。在轉(zhuǎn)換至該較低電源消耗模式后,這些可被失能,而渲染可留給 圖形子系統(tǒng)30'的圖形引擎32'。在圖12所繪示的另一個實施例中,計算器件10'可包含直接存儲器訪問(DMA)控 制器90。DMA控制器90可將數(shù)據(jù)從存儲器50’傳送至存儲器14'。以這種方式,在較高 電源消耗模式的器件10'中,圖形子系統(tǒng)40'可渲染圖像至存儲器50'。這些渲染的圖 像可接著由DMA控制器90傳送至存儲器14'中的幀緩沖器。DMA控制器90'可形成部分 的圖形子系統(tǒng)30'或40'(例如圖形引擎32'或42'的DMA引擎),或為置放于計算器 件10'中。數(shù)據(jù)可從存儲器50'經(jīng)由跨越總線20'或直接傳送至存儲器14'。顯示器接 口 74'將繼續(xù)如上述的操作,以采樣存儲器14'中的幀緩沖器,以將該渲染的圖像呈現(xiàn)在 顯示器26'上。再次地,以其較高電源消耗模式操作的圖10的器件10'的作用方框在圖 12中劃有斜線。當(dāng)然,上述的實施例只是用來顯示,而決不是用來限制的。實現(xiàn)本發(fā)明的該描述的 實施例可接受許多形式的修正、部件的配置、操作的細節(jié)或順序。而本發(fā)明意欲將所有這種 修正涵蓋在其范圍中,如權(quán)利要求書所界定的。
權(quán)利要求
一種操作計算器件的方法,該計算器件包括處理器、與該處理器通信的存儲器、將該處理器互連至圖形處理器的外圍互連總線、和顯示器接口,該方法包括在該存儲器中建立幀緩沖器;指示該圖形處理器渲染視頻幀;將該視頻幀經(jīng)由該外圍互連總線傳送至該幀緩沖器內(nèi);以及將來自該幀緩沖器的該幀經(jīng)由該顯示器接口呈現(xiàn)在顯示器上。
2.如權(quán)利要求1所述的方法,其中,該指示該圖形處理器包括將幀渲染至第二幀緩沖 器內(nèi),以及將來自該第二幀緩沖器的該幀傳送至該幀緩沖器。
3.如權(quán)利要求2所述的方法,其中,該圖形處理器是第一圖形適配器的一部分,而該第 二幀緩沖器是在第二圖形適配器的本地存儲器中。
4.如權(quán)利要求1所述的方法,其中,該傳送包括指示該圖形處理器包括經(jīng)由該外圍互 連總線直接渲染至該幀緩沖器內(nèi)。
5.如權(quán)利要求1所述的方法,其中,該指示包括指示該圖形處理器將該視頻幀經(jīng)由該 外圍互連總線傳送至該幀緩沖器內(nèi)。
6.如權(quán)利要求1所述的方法,其中,該指示包括指示直接存儲器訪問控制器,以將該視 頻幀傳送至該幀緩沖器內(nèi)。
7.如權(quán)利要求1所述的方法,進一步包括編程該顯示器接口,以將該幀緩沖器中的該 幀呈現(xiàn)在該顯示器上。
8.如權(quán)利要求3所述的方法,其中,該呈現(xiàn)包括編程該顯示器接口,以顯示來自該第二 幀緩沖器的圖像。
9.如權(quán)利要求1所述的方法,其中,該指示該圖形處理器包括指示該圖形處理器以渲 染與該圖形處理器通信的緩沖器中的該幀,以及其中,該傳送包括直接存儲器訪問將該幀 從該緩沖器傳送至該幀緩沖器。
10.一種計算器件,包括 中央處理器;存儲器,與該中央處理器通信; 外圍互連總線,將該中央處理器互連至圖形處理器; 顯示器接口;計算機可執(zhí)行指令,儲存在該存儲器中,適配該計算器件使該圖形處理器渲染視頻幀;將該視頻幀經(jīng)由該外圍互連總線傳送至幀緩沖器內(nèi);將來自該幀緩沖器的該渲染過的幀經(jīng)由該顯示器接口呈現(xiàn)在顯示器上。
11.如權(quán)利要求10所述的計算器件,其中,該顯示器接口形成外圍擴充接口的一部分。
12.如權(quán)利要求11所述的計算器件,其中,該圖形處理器形成與該外圍互連總線通信 的外圍擴充插槽中的外圍擴充卡的一部分。
13.如權(quán)利要求10所述的計算器件,其中,該圖形處理器形成圖形子系統(tǒng)的一部分,該 部分缺少幀緩沖存儲器和顯示器接口。
14.如權(quán)利要求10所述的計算器件,其中,該視頻幀通過將該視頻幀直接渲染至該幀 緩沖器的方式,經(jīng)由該外圍互連總線傳送至該幀緩沖器內(nèi)。
15.一種計算器件,包括 中央處理器;存儲器,與該處理器通信; 第一幀緩沖器;外圍互連總線,將該處理器互連至圖形子系統(tǒng),該圖形子系統(tǒng)缺少將幀緩沖器本地界 定至該圖形子系統(tǒng)的存儲器;以及 顯示器接口,與該存儲器通信;該存儲器儲存適配該圖形處理器的計算機可執(zhí)行指令,以渲染視頻幀,并將該視頻幀 經(jīng)由該外圍互連總線傳送至該第一幀緩沖器內(nèi)。
16.如權(quán)利要求15所述的計算器件,其中,該圖形子系統(tǒng)形成在與該外圍互連總線互 連的外圍擴充卡上。
17.如權(quán)利要求15所述的計算器件,進一步該顯示器接口形成外圍擴充接口的一部分。
18.如權(quán)利要求15所述的計算器件,其中,該顯示器接口形成外圍擴充接口上的該圖 形子系統(tǒng)的一部分,該部分將該中央處理器互連至該外圍互連總線。
19.一種圖形子系統(tǒng),包括圖形處理器、和外圍互連總線接口,用來將該圖形子系統(tǒng)互連至主處理器,該圖形子系 統(tǒng)缺少將幀緩沖器本地界定至該圖形子系統(tǒng)的存儲器;以及該圖形子系統(tǒng)操作以渲染視頻幀,并將該視頻幀經(jīng)由該外圍互連總線傳送至幀緩沖器內(nèi)。
20.一種計算機可讀介質(zhì),儲存計算可執(zhí)行指令,該計算可執(zhí)行指令適配計算器件以執(zhí) 行如權(quán)利要求1所述的方法。
全文摘要
由一個圖形處理器產(chǎn)生的圖形經(jīng)由高速互連總線而傳送至幀緩沖器。來自該幀緩沖器的該渲染過的幀經(jīng)由與該幀緩沖器通信的顯示器接口而呈現(xiàn)在顯示器上。另一個存在的(例如,集成的)圖形適配器/子系統(tǒng)的顯示器接口可用來將該渲染過的幀呈現(xiàn)于互連的顯示器上。
文檔編號G09G5/395GK101965610SQ200880125863
公開日2011年2月2日 申請日期2008年12月1日 優(yōu)先權(quán)日2007年11月30日
發(fā)明者G·謝, I·利特奇馬諾夫, J·朗, J·程, J·黃, M·特里西德, M·簡, P·穆瑪, R·扎布聚茨, R·薩爾特切瓦, S·馬林科維奇, T·拉維奧萊特, X·翁 申請人:Ati技術(shù)無限責(zé)任公司