專利名稱:分布式通信系統(tǒng)的節(jié)點、連接到通信系統(tǒng)的節(jié)點及監(jiān)測裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種分布式通信系統(tǒng)的節(jié)點,還涉及一種分布式通 信系統(tǒng)以及連接到該通信系統(tǒng)的節(jié)點的監(jiān)測裝置。
背景技術(shù):
目前存在一些在分布式通信系統(tǒng)中使用的協(xié)議。特別地,在汽 車領(lǐng)域中使用時間觸發(fā)協(xié)議。這種協(xié)議的一個是FlexRay協(xié)議。 FlexRay通信協(xié)議在汽車等領(lǐng)域中是汽車行業(yè)對不斷增加的可靠性、 高速數(shù)據(jù)通信需求的解決辦法。FlexRay通信協(xié)議是基于TDMA機(jī)制 來協(xié)調(diào)所述通信系統(tǒng)的參與裝置的訪問。但是,F(xiàn)lexRay通信協(xié)議避 免了在汽車通信系統(tǒng)中使用主同步節(jié)點來實現(xiàn)分散的對故障更魯棒 (more fault robust)的總線結(jié)構(gòu)。當(dāng)啟動通信系統(tǒng)時,這需要通信系 統(tǒng)中的所有參與節(jié)點的相互同步來實現(xiàn)與全球時間基準(zhǔn)的一致。
FlexRay通信協(xié)議通過使用啟動和同步幀來提供 一 種用于這種 啟動階段的機(jī)制。此外,F(xiàn)lexRay協(xié)議允許傳輸符號以避免沖突。通 常,使用與時隙相關(guān)的幀來傳輸數(shù)據(jù),其中每個幀包括頭部和數(shù)據(jù)部 分。
在基于FlexRay通信協(xié)議操作這種通信系統(tǒng)期間,人們已經(jīng)認(rèn) 識到在起始階段尤其可能出現(xiàn)單個節(jié)點失效的情況,其中這種失效可 妨礙節(jié)點的啟動從而降低有效性,或者這種失效將導(dǎo)致影響整個通信 系統(tǒng)的叢集的形成從而造成網(wǎng)絡(luò)局部隔開。FlexRay通信協(xié)議是所謂 的雙信道傳輸系統(tǒng)。當(dāng)在一個節(jié)點的兩個輸出信道上輸出不同或者不 同定時的同步幀,則可能建立相互同步的節(jié)點組,該節(jié)點組與其他節(jié) 點組不同步。因此,通信系統(tǒng)中的另一組可使用不同的基準(zhǔn)時間,因 為其是基于時間移位的同步幀的。如果未檢出通信系統(tǒng)中的這種叢集 的形成,則可能導(dǎo)致通信系統(tǒng)的有效性或可靠性的降低。
4短暫的或永久性的硬件錯誤(如陷落位元或反轉(zhuǎn)位元、定時錯 誤或偽重置)可引起啟動階段同步期間的其他差錯或者是數(shù)據(jù)傳輸期 間的一般差錯。
在FlexRay協(xié)議中,為每個節(jié)點安排一定的時隙來傳輸其數(shù)據(jù)。 在該節(jié)點傳輸其數(shù)據(jù)期間,將沒有其他節(jié)點通信。因此,非常需要所 有節(jié)點接受該時隙結(jié)構(gòu)和在通信系統(tǒng)啟動期間定義的通信系統(tǒng)的基 于全球基準(zhǔn)時間的一般調(diào)度計劃。
當(dāng)前,存在兩種防止導(dǎo)致整個通信系統(tǒng)失效的單個節(jié)點失效的 解決方案。存在幾種使用所謂總線監(jiān)控器的結(jié)構(gòu),該總線控制器平行 于節(jié)點的每個控制器而添加,如果由于在某時隙期間允許另一節(jié)點傳
輸而不允許某節(jié)點訪問媒介,則總線監(jiān)控器觀察通信控制器對媒介的 訪問并阻止節(jié)點訪問媒介。這種總線監(jiān)控器必須根據(jù)其節(jié)點的狀態(tài)和 媒介應(yīng)該具有的狀態(tài)來形成其自己的判斷意見。因此,總線監(jiān)控器具 有與節(jié)點的通信控制器基本相同的復(fù)雜度??偩€監(jiān)控器與通信控制器 接收相同的來自主機(jī)的命令。因此,總線監(jiān)控器不能檢測主機(jī)的差錯。 此外,為了檢測節(jié)點是否在非法的時隙中傳輸,總線監(jiān)控器僅僅粗略 地檢查傳輸路徑上的幀的時序而不檢查其內(nèi)容。因此總線監(jiān)控器不能 直接檢測出通信控制器中由于中斷的計數(shù)器產(chǎn)生的如小的時序差錯 或錯誤的幀內(nèi)容的錯誤。
第二種機(jī)制是通過由節(jié)點的主機(jī)(CPU)單獨執(zhí)行來監(jiān)測從通 信控制器到主機(jī)傳遞的數(shù)據(jù)。該主機(jī)監(jiān)測表示控制器可能失效的不一 致性。
但是,上述兩種解決方案都存在缺點。如上述的總線監(jiān)控器使 控制器的復(fù)雜度加倍。但是它可保護(hù)網(wǎng)絡(luò)避免不限于啟動期間的各種 狀態(tài)中的幾乎所有可能的失效。第二種解決方案中主機(jī)基于由通信控 制器提供的信息檢測失效,但是必須承受依靠通信控制器提供的信息 的事實。因此,第二種解決方案對許多檢測差錯來說足夠,但是通信 控制器的更復(fù)雜的差錯可能偽造該信息或者簡單重復(fù)以前的正確信 息。因此,主機(jī)可能是基于不可靠的信息來確定的,這導(dǎo)致通信控制 器的不正確的操作,可能導(dǎo)致整個網(wǎng)絡(luò)的失效。因此,需要一種解決方案,該解決方案可提供增加的錯誤檢測 并且能避免僅基于通信控制器提供的信息來檢測和減少錯誤,并且具 有明顯低于總線監(jiān)控器的復(fù)雜度。
發(fā)明內(nèi)容
因此,本發(fā)明的目的是提供一種分布式通信系統(tǒng)的節(jié)點、 一種-分布式通信系統(tǒng)和監(jiān)測裝置,增加錯誤檢測并降低復(fù)雜度以對需要非
100%失效安全解決方案的系統(tǒng)提供較高的有效性。
所述目的通過獨立權(quán)利要求的技術(shù)特征解決。
本發(fā)明基于提供小的硬件元件的思想,下文稱其為監(jiān)測裝置(也 可看作端檢測器),優(yōu)選地在與通信控制器相同的硅片上提供該監(jiān)測 裝置,并且該監(jiān)測裝置通過監(jiān)測通信控制器的輸入和輸出線路之一來 .分析通信控制器的行為,即通信控制器的內(nèi)部狀態(tài)和/或通信控制器 提供給主機(jī)的信息。如果監(jiān)測裝置識別出可能使其他節(jié)點的通信中斷 的通信控制器的未定義行為,該監(jiān)測裝置將.向主機(jī)發(fā)送通信控制器的 錯誤的或有缺陷的行為的信號。接著主機(jī)負(fù)責(zé)執(zhí)行所需的行為,例如 關(guān)閉通信控制器或以其他方式阻止該通信控制器的進(jìn) 一 步傳輸。因 此,提供一種容易降低成本的解決方案以適用于在分布式通信系統(tǒng)中 檢測預(yù)定數(shù)量的差錯。
特別地,監(jiān)測裝置使用計數(shù)器、定時器和分析邏輯的混合來核 實通信控制器中重要處理的正確性。通過使用本發(fā)明的結(jié)構(gòu)特別是監(jiān) 測裝置,由于監(jiān)測裝置使用了通信控制器的預(yù)處理信息,因此降低了 用于確定中間狀態(tài)和節(jié)點狀態(tài)的復(fù)雜度。此外,監(jiān)測裝置使用通信控 制器的輸入和輸出信息來確定其行為是否正確。
此外,通過調(diào)整通信控制器所提供的信息量來觀察,可實現(xiàn)不 同級別的差錯保護(hù)。
特別地,將用于差錯檢測的監(jiān)測裝置靠近所監(jiān)督的通信控制器 放置允許使用內(nèi)部線路(如調(diào)試線路)并觀察所監(jiān)督的通信控制器的 內(nèi)部狀態(tài)來獲得情況的更清楚的描繪。
監(jiān)測裝置表示利用周期性的和額外的差錯檢測任務(wù)防止主機(jī)變得超負(fù)荷的專用硬件。因此,監(jiān)測裝置可使用錯誤減少來允許主機(jī)實 現(xiàn)將要執(zhí)行的更復(fù)雜的策略。因為監(jiān)測裝置僅提供通信控制器運行錯 誤的信息,主機(jī)可決定關(guān)閉控制器、重置控制器、配置控制器(例如 僅對輸入/輸出信道之一),或者決定配置控制器以非同步方式運行 來僅允許接收操作。
在本發(fā)明的優(yōu)選實施例中,所述監(jiān)測裝置可使用來自通信控制 器的各種信息用于其監(jiān)督。在監(jiān)測裝置中使用越多的預(yù)處理信息,監(jiān) 測裝置的復(fù)雜度越低,但是同時監(jiān)測裝置也變得更容易受通信控制器
的Byzantine差錯的影響。監(jiān)測裝置的復(fù)雜度取決于通過監(jiān)測裝置監(jiān) 測多少差錯和哪些差錯。
因此必須對將要實現(xiàn)的需要的差錯保護(hù)權(quán)衡下文中配置的復(fù)雜 度成本。
監(jiān)測裝置可檢測到的第一種差錯是由主機(jī)造成的可能妨礙叢集 啟動的差錯。主機(jī)的錯誤命令的產(chǎn)生造成在啟動過程中節(jié)點無法并 入。此外,由于連續(xù)地輸出命令(如準(zhǔn)備就緒READY),錯誤地 操作主機(jī)可妨礙任何其他節(jié)點的冷啟動。因此,節(jié)點將永遠(yuǎn)不能從冷 啟動的嘗試中跑出。這種行為的 一 種原因可能是主機(jī)的吋鐘運行太 快。因此,監(jiān)測裝置在預(yù)定時間內(nèi)檢查READY命令數(shù),其中可通過 在READY和RUN命令之間強(qiáng)制實施最小時延來克服這個問題。為 了避免這種差錯,監(jiān)測裝置監(jiān)測提供給通信控制器的主機(jī)命令。特別 地,監(jiān)測裝置對從主機(jī)接收的READY命令計數(shù)并且針對預(yù)定閥值來 檢查單位時間內(nèi)的READY命令或者READY命令之間的時間。如果 違背(violate)或超出了特定閥值,則很可能主機(jī)是失控的(buggy) 并且正在以有缺陷的方式運行。該主機(jī)行為可以如下方式造成該節(jié)點 阻止網(wǎng)絡(luò)的所有其他節(jié)點的啟動通信控制器將在主機(jī)的RUN命令 之后嘗試啟動網(wǎng)絡(luò),但是由于主機(jī)接著的READY (約等于重置)命 令而放棄其啟動。這將導(dǎo)致整個網(wǎng)絡(luò)啟動的放棄。如果足夠快地重復(fù) 該RUN-READY序列,通信控制器將總需要媒介作為網(wǎng)絡(luò)的第一節(jié) 點而接著放棄啟動。因此網(wǎng)絡(luò)將由于一個錯誤的主機(jī)不能啟動。
為了監(jiān)督主機(jī)命令,由于該監(jiān)測裝置已檢測到主機(jī)可能正在錯誤地運行并可能因此錯誤地對錯誤報告錯誤地作出反應(yīng),因此向外部 控制單元或向控制對象報告檢測到的錯誤是很有必要的或者是很有 益的??商鎿Q地,監(jiān)測裝置自身可在安全的狀態(tài)中(如在失效沉默模 式中)采取措施來驅(qū)動監(jiān)督的通信控制器。
監(jiān)測裝置還可提供的可能是對通信控制器的內(nèi)部狀態(tài)的監(jiān)督, 以檢測可能導(dǎo)致叢集形成的失效。為此,監(jiān)測裝置保持其表示通信控 制器應(yīng)處于的狀態(tài)的自身狀態(tài)可變,并且根據(jù)控制器發(fā)送的事件(如
并入成功)和主機(jī)發(fā)送的命令(如WAKEUP或RUN)來改變。監(jiān)測 裝置使用該內(nèi)部狀態(tài)來執(zhí)行控制,使得由通信控制器執(zhí)行的狀態(tài)改變 自身(如從READY狀態(tài)到NORMAL—ACTIVE狀態(tài)的非直接轉(zhuǎn)換)
與監(jiān)測裝置所保持的狀態(tài)一致(如在通信控制器沒有發(fā)送前一個并入 成功事件的情況下不從INTIALIZE—SCHEDULE轉(zhuǎn)換到 INTEGRATION—COLDSTART—CHECK)。這允許在狀態(tài)機(jī)中檢測可 能造成通信控制器錯誤地進(jìn)行協(xié)議定義禁止的安全保護(hù)的差錯。
存在另一種檢測可能造成叢集形成的失效的可能。監(jiān)測裝置保 持其自身的循環(huán)和時隙值并且根據(jù)通信控制器提供的事件(如循環(huán)開 始)來使其增加。監(jiān)測裝置也可使用上述其自身的狀態(tài)變量。監(jiān)測裝 置通過調(diào)試線路來檢測與通信控制器表示的值相應(yīng)的這些計數(shù)器的 值。由于僅允許通信控制器在預(yù)定狀態(tài)中重置這些計數(shù)器中的 一 個, 如果在不允許重置的情況下由通信控制器表示的計數(shù)器與由監(jiān)測裝 置保持的計數(shù)器不同,則可以很容易地通過監(jiān)測裝置來檢測通信控制 器的有缺陷的操作。在這種情況下,監(jiān)測裝置將向主機(jī)發(fā)送有缺陷操 作的信號。該步驟防止了一些陷落位元/反轉(zhuǎn)位元的錯誤。盡管對于 最終的保護(hù),由于位元在通信控制器的傳輸途徑中也可能陷落/反轉(zhuǎn), 因此監(jiān)測裝置需要解碼在通信控制器的傳輸信道上發(fā)送的幀并且檢 測所使用的正確循環(huán)/時隙ID。如果在稍后的變化中,傳輸?shù)臅r隙或 循環(huán)ID不符合由監(jiān)測裝置保持的各計數(shù)器,則發(fā)送錯誤信號。
在本發(fā)明的另一個實施例中,可檢測通信節(jié)點的所謂的連續(xù)不 斷的(babbling)符號傳輸。如上述,在FlexRay通信協(xié)議中,可傳 輸包括頭部和數(shù)據(jù)部分的幀。此外,F(xiàn)lexRay通信協(xié)議允許傳輸特殊
8符號。有沖突避免符號(CAS)和喚醒符號(WUS)。如果在總線
上傳輸這種符號,所有其他節(jié)點將識別這些符號并且將停止自身喚醒 或啟動網(wǎng)絡(luò)的嘗試。同時這種符號將與其他節(jié)點發(fā)送的幀抵觸并破壞 它們。因此,很可能發(fā)生錯誤的通信控制器的情況,通信控制器將永
遠(yuǎn)發(fā)送阻止所有其他節(jié)點的正當(dāng)傳輸?shù)倪@種CAS符號。在這種情況 下,指定的監(jiān)測裝置可觀察通信控制器的傳輸信道及其自身的內(nèi)部狀 態(tài)(如上述兩種可能的實施例)。長期的低速傳輸表示CAS/WUS的 傳輸。計數(shù)傳輸?shù)姆枖?shù)。基于通信控制器處在的狀態(tài),如果傳輸多 于特定數(shù)量的這種符號,則向主機(jī)發(fā)送錯誤信號。這將防止該通信控 制器由于重復(fù)符號接收重置其等待協(xié)議而阻止其他節(jié)點啟動。在防止 連續(xù)不斷的CAS/WUS的情況下,對特定持續(xù)時間的低速傳輸周期進(jìn) 行檢測將消除對將要在監(jiān)測裝置中實現(xiàn)的復(fù)雜解碼電路的需要,因為 長期低速傳輸?shù)臋z測明顯比實際幀的解碼容易。特別地,如果監(jiān)測裝 置注意到通信控制器處于喚醒狀態(tài)并且發(fā)送多于預(yù)定數(shù)量(如63) 的符號,則通知主機(jī)。此外,如果監(jiān)測裝置注意到通信控制器不處于 喚醒狀態(tài)并且發(fā)送多于一個WAKEUP符號,則通知主機(jī)。
在本發(fā)明的另 一 個優(yōu)選實施例中,監(jiān)測裝置可防止網(wǎng)絡(luò)形成由 去同步的同步幀傳輸造成的叢集。由于Fl exR a y通信協(xié)議是 一 種雙信 道協(xié)議,需要每個主機(jī)同時在兩個信道上傳輸同步幀,所有節(jié)點使用 同步幀來獲得全球時間基準(zhǔn)。在相同的時隙內(nèi)傳輸同步幀是不夠的, 實際上還必須在兩個信道上同時開始同步幀的傳輸。因此,監(jiān)測裝置 可觀察兩個傳輸信道和時隙計數(shù)器。如果通信控制器在每個信道上不 同的時間在被表示為同步幀的靜態(tài)段的時隙中開始傳輸,則向主機(jī)指 示差錯。這防止了叢集的形成,除非選擇網(wǎng)絡(luò)的其他節(jié)點來同步不同 信道。
關(guān)于防止由于兩個傳輸信道之間的去同步形成叢集,也可以在 沒有監(jiān)測裝置的解碼電路的情況下來實現(xiàn)對兩個傳輸信道的監(jiān)測,因 為觀察可能與要傳輸?shù)膶嶋H數(shù)據(jù)分別指示的傳輸啟動(如FlexRay中 的RxEn與TxD)即可。
此外,在另一優(yōu)選實施例中,可核實同步幀的接收。為此,監(jiān)測裝置使用由通信控制器接收和預(yù)處理的數(shù)據(jù)來解碼所接收信息的 幀頭部。因此,將監(jiān)測裝置與通信控制器連接,以接收在通信控制器 中接收并轉(zhuǎn)換后的更好的選通位元。計數(shù)一個循環(huán)中由監(jiān)測裝置解碼 的同步幀頭部數(shù)。由于監(jiān)測裝置看到的一些頭部可能已屬于同步的無 效幀,因此由監(jiān)測裝置確定的同步幀頭部數(shù)形成通信控制器可向主機(jī) 發(fā)送的同步幀數(shù)的上限。如果通信控制器向主機(jī)發(fā)送其已看到更多的 同步幀的信號,監(jiān)測裝置可通知錯誤運行的主機(jī)。這避免了在通信控 制器實際上沒有看到足夠的同步幀時,聲明已看到足夠的同步幀并將 其模式改變?yōu)樵试S傳輸。這將導(dǎo)致叢集形成或者導(dǎo)致網(wǎng)絡(luò)中僅有一些 節(jié)點啟動。
監(jiān)測裝置的存在還可以低成本引入進(jìn)一步的對局部相關(guān)差錯的 檢查。在本發(fā)明的另一個實施例中,監(jiān)測裝置還可包括幀格式檢查器, 該幀格式檢查器將觀察通信控制器的輸出信道的傳輸,并且檢査是否 為正確和預(yù)期的低/高序列,并且表示幀的低/高序列是否發(fā)生改變。 監(jiān)測裝置使用這種幀格式檢查器可容易地收集合理地確認(rèn)期望的幀 傳輸實際發(fā)生的信息。將復(fù)雜的位序列映射為在傳輸信道上傳輸?shù)牟?分通信要素的簡單模式,以使其在監(jiān)測裝置中可容易地進(jìn)行比較。如 果期望的幀傳輸沒有發(fā)生,監(jiān)測裝置向主機(jī)發(fā)送信號,接著主機(jī)可快 速地嘗試解決該問題(如通過在另一時隙中重復(fù)傳輸),而不必等待 否定應(yīng)答信息。
此外,監(jiān)測裝置可檢測在錯誤時隙或錯誤循環(huán)中發(fā)送的幀。如 上所述,僅允許節(jié)點根據(jù)調(diào)度在預(yù)定時隙傳輸數(shù)據(jù)。為了檢測這種差
錯,監(jiān)測裝置使用TxD信號來解碼通過通信控制器傳輸?shù)膸念^部。 監(jiān)測裝置檢査時隙ID和循環(huán)ID是否與監(jiān)測裝置保持的時隙和循環(huán) 的計數(shù)(參見上文) 一致。此外,在監(jiān)測裝置中執(zhí)行頭CRC的CRC 校驗。ID校驗或CRC校驗的失效是幀在錯誤時隙發(fā)送的特定信號。 在這兩種情況下均通知主機(jī)。很容易看出,可以將這種機(jī)制延伸到復(fù) 制同在傳輸期間的接收時執(zhí)行的完整校驗來檢測由早期的協(xié)議引擎 引起的傳輸差錯。
最后,盡管將數(shù)據(jù)傳遞到通信控制器,也可能發(fā)生協(xié)議引擎發(fā)
10送NULL幀。在這種情況下,監(jiān)測裝置將針對從主機(jī)接收的命令來
解碼從主機(jī)接收的幀頭中的空幀位和第一凈荷字。
但是,本發(fā)明還可用于非時間觸發(fā)協(xié)議,如WLAN。在這種情 況下,監(jiān)測裝置可通過解碼并且比較主機(jī)向通信控制器提供的數(shù)據(jù)與 通信控制器最終發(fā)出的數(shù)據(jù),在通信控制器發(fā)出的分組幀中檢查節(jié)點 是否發(fā)送了正確的內(nèi)容。此外,本發(fā)明不限于有線的媒介或總線。本 發(fā)明也可基于無線通信技術(shù)操作。
下文將參考圖示的實施例通過非限定性示例更詳細(xì)地描述本發(fā)明。
圖l示出了分布式通信系統(tǒng)的示例;
圖2說明了具有總線監(jiān)控器的節(jié)點;
圖3a說明了使用基于差錯檢測的主機(jī)的節(jié)點;
圖3b說明了使用基于差錯檢測的總線監(jiān)控器的節(jié)點;
圖4說明了本發(fā)明的第一實施例的節(jié)點;
圖5說明了根據(jù)本發(fā)明的監(jiān)測裝置的結(jié)構(gòu);
圖6說明了根據(jù)本發(fā)明的用于檢測錯誤運行的主機(jī)的監(jiān)測裝置 的實施例;
圖7說明了根據(jù)本發(fā)明的用于檢測通信控制器的內(nèi)部狀態(tài)的監(jiān) 測裝置的實施例;
圖8說明了根據(jù)本發(fā)明的用于檢測通信控制器的錯誤同步幀報 告的監(jiān)測裝置的實施例;
圖9說明了根據(jù)本發(fā)明的通信控制器的內(nèi)部結(jié)構(gòu)。
具體實施例方式
圖1說明了用于本發(fā)明的通信系統(tǒng)。將圖1中說明的通信系統(tǒng) 分為多個子網(wǎng)(A-D),每個子網(wǎng)由無源總線或者由星形耦合器支持。
參考圖2,更詳細(xì)地描述這種子網(wǎng)中使用的節(jié)點10。典型的容 錯時間觸發(fā)網(wǎng)絡(luò)通常由兩個通信信道A、 B組成,節(jié)點10連接到這兩個信道。每個節(jié)點10由總線驅(qū)動器17、通信控制器15以及用于 每個總線驅(qū)動器的總線監(jiān)控裝置14和主機(jī)13。所述總線驅(qū)動器17 傳輸由通信控制器15提供給其所連接的信道的位元和字節(jié),并且接 著向通信控制器15提供其從信道A、 B接收的信息。將通信控制器 15連接到兩個信道,并且向主機(jī)13發(fā)送相關(guān)數(shù)據(jù)并從主機(jī)13接收 數(shù)據(jù)。接著,通信控制器15將數(shù)據(jù)合集為幀并且向總線驅(qū)動器17 發(fā)送所述數(shù)據(jù)。信道數(shù)量與本發(fā)明無關(guān)。對這兩個信道、節(jié)點10的 結(jié)構(gòu)的說明僅僅為了能對本發(fā)明更好地概述q本發(fā)明不局限于所描述 節(jié)點中的存在或不存在的部分,也不受其限制。通信控制器15包括 所謂協(xié)議引擎18,為了方便第二層(數(shù)據(jù)鏈路層)訪問協(xié)議,協(xié)議 引擎18提供節(jié)點10。與本發(fā)明最相關(guān)的是使用預(yù)定TDMA機(jī)制或 者通信調(diào)度訪問媒介的功能。必須配置通信系統(tǒng)中的用于每個節(jié)點 10的通信調(diào)度,以避免在通信系統(tǒng)中傳輸數(shù)據(jù)時節(jié)點IO之間的相互 沖突??偩€監(jiān)控器14是一種具有獨立配置數(shù)據(jù)組的裝置,僅在通信 調(diào)度指定的時隙期間使能總線上的傳輸。主機(jī)13包括數(shù)據(jù)源和接收 器,并且通常不與協(xié)議活動連接。主機(jī)13僅做出通信控制器15不能 單獨做出的決定。
要基于時間觸發(fā)TDMA訪問網(wǎng)絡(luò),就如FlexRay協(xié)議的需要一 樣,節(jié)點IO之間的同步是首要的。通常每個節(jié)點IO都有其自己的時 鐘,盡管通常希望各時鐘相等,但是由于由溫度、電壓波動以及制造 公差的影響,其時間基準(zhǔn)可與其他節(jié)點io的不同。
每個節(jié)點10的通信控制器15包括同步機(jī)制,其中節(jié)點10監(jiān)聽 與其相連接的信號并且可適用于同步或者影響共同的始終頻率和偏 移。
通信系統(tǒng)中的網(wǎng)絡(luò)啟動由所謂冷啟動節(jié)點處理,其中一個開始 通信循環(huán)而其他的響應(yīng)。該節(jié)點由配置或者由一些確定幾個潛在節(jié)點 中的某個節(jié)點執(zhí)行啟動的算法來選擇。這種算法通常由所連接的信道 上的傳輸幀或類似的結(jié)構(gòu)組成,無論何時都不存在可檢測的通信調(diào) 度。從而冷啟動節(jié)點的通信控制器15必須監(jiān)聽所有連接的信道并且 必須同時在所有連接的潛在冗余信道上傳輸其包括同步幀的啟動數(shù)據(jù)。如果通信控制器15接收到表示啟動的特定同步幀或類似的結(jié)構(gòu), 則將從觀察的通信采納定時機(jī)制并且將其集成到系統(tǒng)中。
從圖2中可容易地看出,包括總線監(jiān)控器的節(jié)點的復(fù)雜度很高。
因此,根據(jù)本發(fā)明需要提供可在主機(jī)13或通信控制器15運行 錯誤的情況下保護(hù)通信系統(tǒng)的監(jiān)測裝置16。
在圖3a和3b中,說明節(jié)點中兩種通常用于差錯減少的方法。
在圖3a中,說明一種總線監(jiān)控器解決方案。由于總線監(jiān)控器14 與通信控制器15具有幾乎相同的復(fù)雜度,總線監(jiān)控器14自身可基于 通信調(diào)度監(jiān)測是否允許通信控制器15在特定時隙發(fā)送。因此直接將 總線監(jiān)控器耦接到通信系統(tǒng),以識別通信系統(tǒng)的狀態(tài)。此外,在檢測 到任何錯誤的情況下,總線監(jiān)控器14可斷開通信控制器14的傳輸路 徑。但是,總線監(jiān)控器14所需要的成本和空間很高。此外,在大多 數(shù)應(yīng)用中都不需要這種10 0 %的失效安全解決方案。
在圖3b中,說明一種基于軟件的錯誤減少解決方案。通信控制 器15連接到主機(jī)13,其中主機(jī)13監(jiān)測由通信控制器15提供給主機(jī) 13的信息。根據(jù)接收到的信息,主機(jī)13可評估通信控制器15的行 為是否正確。在通信控制器15的運行不正確的情況下,主機(jī)13可通 過斷開傳輸路徑來中止通信控制器15的傳輸操作。但是,通信控制 器15是否正確運行時根據(jù)通信控制器5自身提供的信息來確定的。 因此,該信息可能是不正確的,因此連接或斷開通信控制器15的決 定也是不太可靠的。
因此,本發(fā)明建議提供圖4中說明的監(jiān)測裝置16。監(jiān)測裝置16 耦接到通信控制器15的傳輸路徑,直接耦接到通信控制器15并連接 到向主機(jī)13提供信息的信息輸出。
因此,監(jiān)測裝置16可通過檢查計數(shù)器、定時器以及由通信控制 器或其輸入和輸出線路的預(yù)處理信息提供的狀態(tài)來檢測預(yù)定差錯。
在監(jiān)測裝置16檢測到通信控制器15不正確的行為的情況下, 向主機(jī)13報告該行為。因此,主機(jī)13將停止通信控制器15或者可 以重置通信控制器15。可替換地或除此之外,類似圖3b中的主機(jī)斷 開Tx路徑的解決方案也可行,但是該解決方案基于來自監(jiān)測裝置的信息而不是基于來自控制器自身的信息。
可以在與通信控制器15相同的硅片上實現(xiàn)監(jiān)控裝置16,但是不 需要將其布置在硅片上。由于限制部件的數(shù)量,可容易地將監(jiān)測裝置
16與通信控制器15 —起實現(xiàn)。因此用于監(jiān)測狀態(tài)的連接線路很短以
避免進(jìn)一步由連接或傳輸問題引起的差錯。
在圖5中提供了這種監(jiān)測裝置16的內(nèi)部部件的簡要說明。監(jiān)測 裝置16從通信控制器15并且特別是從通信控制器15中協(xié)議引擎18 引出的調(diào)試線路接收預(yù)處理信息。此外,監(jiān)測裝置16從通信控制器 15的總線驅(qū)動器接口接收信息或數(shù)據(jù)。最后,監(jiān)測裝置16從通信控 制器15中的控制器主機(jī)接口接收信息。
將這些信息提供給用于數(shù)據(jù)解碼的數(shù)據(jù)解碼和評估單元53。如 上所述,在FlexRay協(xié)議中,通常在包含頭部和數(shù)據(jù)部分的幀中發(fā)送 數(shù)據(jù)。因此,為了檢測數(shù)據(jù)結(jié)構(gòu),必須解碼幀結(jié)構(gòu)來評估頭部的內(nèi)容。 數(shù)據(jù)解碼和評估單元53根據(jù)通信控制器15所提供的信息來解碼信 息。數(shù)據(jù)解碼和評估單元53同時也評估通信控制器的發(fā)送事件,以 命令狀態(tài)復(fù)制保留(State Copy Maintenance)單元52如何改變其狀 態(tài)來連續(xù)地跟蹤通信控制器的狀態(tài)。
此外,數(shù)據(jù)解碼和評估單元53評估通信控制器15提供的數(shù)據(jù) 并且向正確性檢查單元51提供評估結(jié)果。正確性檢查單元51耦接到 狀態(tài)復(fù)制保留單元52,其中存儲狀態(tài)之間的預(yù)定轉(zhuǎn)換、相關(guān)定時器 的值以及計數(shù)器的值。根據(jù)這些存儲的信息,正確性檢查單元51可 比較數(shù)據(jù)解碼和評估單元53提供的數(shù)據(jù)與存儲在狀態(tài)復(fù)制保留單元 52中的數(shù)據(jù)?;诒容^結(jié)果,在監(jiān)測裝置16中評估通信控制器15 的行為是否正確。在通信控制器15錯誤操作的情況下通過正確性檢 査單元51的輸出向主機(jī)13提供報警信號。
圖6描述了監(jiān)測裝置16的實施例,該監(jiān)測裝置16用于通過監(jiān) 測主機(jī)命令來檢測主機(jī)的錯誤行為。這些命令被提供給命令解碼器 62,其用于識別從主機(jī)13傳輸?shù)酵ㄐ趴刂破?5的命令。在識別出命 令為READY的情況下,向READY計數(shù)器61提供增值信號。監(jiān)測 裝置16包括超時定時器43,每當(dāng)超過預(yù)定時間(如每秒)則減小
14READY計數(shù)器61使其趨于零。在READY計數(shù)器61超出預(yù)定門限 (如3)的情況下,通知主機(jī)13釆取所需措施。但是,特別地在通 過計數(shù)每單位時間從主機(jī)13接收的READY命令或者通過測量 READY命令之間的時間來監(jiān)督主機(jī)13的行為的情況下,再向額外 的監(jiān)督單元(未示出)提供一個差錯信號以采取所需要的措施來重置 或關(guān)閉錯誤操作的主機(jī)13是很有用的。
圖7說明了監(jiān)測裝置16的實現(xiàn),其中通信控制器15提供多個 用于檢測通信控制器15的可能導(dǎo)致叢集形成的時隙或循環(huán)計數(shù)問題 的信息。所有這些信息直接從通信控制器15的內(nèi)部終端提供。監(jiān)測 裝置16包括時隙計數(shù)器72,用于當(dāng)從通信控制器15接收時隙開始 信號時通過增加計數(shù)器來計數(shù)時隙。此外還有循環(huán)計數(shù)器71,其在 從通信控制器15接收到循環(huán)開始后增加。將兩個計數(shù)值(時隙、循 環(huán))提供給比較和重置單元73。比較和重置單元73進(jìn)一步接收靜態(tài) 時隙的數(shù)量、通信控制器的協(xié)議操作控制(POC)單元的狀態(tài)、時隙 ID和循環(huán)ID?;谶@些信號,比較和重置單元73可比較通信控制 器15的時隙和循環(huán)計數(shù)值與其自己的時隙和循環(huán)計數(shù)值。在不匹配 的情況下,例如如果在允許不重置的狀態(tài)期間重置了通信控制器15 的時隙計數(shù)器,則檢測到差錯,向主機(jī)13發(fā)送信號。
圖8說明了偽同步幀報告的檢測。如果通信控制器15在接收路 徑上接收到了同步幀,則確認(rèn)該同步幀并向主機(jī)13報告同步幀的接 收。但是,可能發(fā)生通信控制器15沒有接受同步幀或者沒有正確地 識別同步幀而向主機(jī)13報告同步幀的正確接收的情況。在這種情況 下,通信控制器15是錯誤操作的。為了檢測這種同步幀接收和同步 幀報告之間的不匹配,監(jiān)測裝置16使用通信控制器15的預(yù)處理接收 數(shù)據(jù)。通信控制器15包括解碼器單元,其中所接收的位元在通信控 制器15中進(jìn)一步處理之前是選通的。將這些預(yù)處理的接收數(shù)據(jù)位元 提供給監(jiān)測裝置16,檢測裝置16可基于這些選通位元來識別所接收 的頭部是否屬于同步幀。接著在單元81中計數(shù)一個循環(huán)期間通信控 制器接受的同步幀頭部的數(shù)量。如果通信控制器15向主機(jī)報告其已 接收了多個同步幀(不是實際所接收的同步幀的準(zhǔn)確數(shù)目),則向主機(jī)通知通信控制器15的這個不正確的行為。
此外,如果網(wǎng)絡(luò)中在所有啟動節(jié)點已退出后只有非啟動節(jié)點繼 續(xù)發(fā)送同步幀,則存在由于沒有啟動幀而導(dǎo)致的想要再并入的節(jié)點不 能并入的問題。同時由于存在持續(xù)的幀而阻止了網(wǎng)絡(luò)重新冷啟動的可 能。為了檢測這種情況并且允許仍然在網(wǎng)的主機(jī)通過完全關(guān)閉網(wǎng)絡(luò)來 修復(fù),監(jiān)測裝置16還可用啟動位組來計數(shù)幀。這將通過類似于計數(shù)
器81的第二計數(shù)器來實現(xiàn),當(dāng)計數(shù)達(dá)到5時由計數(shù)器82觸發(fā)。如果 在一個循環(huán)中包括這種啟動位的幀的數(shù)量為零,通知主機(jī),并且如果 這種情況繼續(xù)幾個循環(huán),則可確定開始全面關(guān)閉網(wǎng)絡(luò)。
圖9示出了用于本發(fā)明的通信控制器15的內(nèi)部結(jié)構(gòu)。 通信控制器15包括控制器主機(jī)接口 91,用于通過連接線路107 來管理通信控制器15與主機(jī)15之間的數(shù)據(jù)流??刂破髦鳈C(jī)接口 91 從協(xié)議引擎18接收狀態(tài)信息。該狀態(tài)信息包括從協(xié)議引擎18向控制 器主機(jī)接口 91傳輸?shù)拿睢_@種命令通過線路97提供給監(jiān)測裝置 16。特別地,通過在監(jiān)測裝置16中監(jiān)測通過線路97協(xié)議引擎18提 供給控制器主機(jī)接口 91的信息,可如圖8所示向命令解碼器84提供 命令,以檢測通信控制器15是否向主機(jī)13報告了一個錯誤的接收的 同步幀的數(shù)量。
控制器主機(jī)接口 91向協(xié)議引擎18提供從主機(jī)13接收的信息和 命令。這些命令通過線路96 (CHI-PE命令)提供給監(jiān)測裝置中的命 令解碼器(圖6),其中監(jiān)測主機(jī)13是否在其錯誤行為的情況下持 續(xù)地向通信控制器15提供READY命令。
協(xié)議引擎8包括協(xié)議操作控制單元92、媒介訪問控制單元93、 時間產(chǎn)生單元94以及編碼/解碼單元95。此外,在協(xié)議引擎18中還 存在其他對本發(fā)明不重要的模塊,因此不作任何說明。協(xié)議操作控制 單元92定義協(xié)議引擎18進(jìn)行的狀態(tài)序列。其中定義了協(xié)議引擎單元 18從何狀態(tài)可以轉(zhuǎn)到下一狀態(tài)。不經(jīng)過該協(xié)議操作控制單元92,通 過線路98向監(jiān)測裝置16提供POC狀態(tài)。特別地,在圖7中說明的 實施例中使用該POC狀態(tài)。在該實施例中,監(jiān)測通信控制器15是否 產(chǎn)生導(dǎo)致一些節(jié)點的叢集形成的計數(shù)問題。將協(xié)議操作控制器92的狀態(tài)提供給比較和重置單元73,其中比較通信控制器15的時隙值和 循環(huán)值與監(jiān)測裝置16的內(nèi)部值,通知主機(jī)13不匹配的情況。
媒介訪問控制單元93判斷是否向/從總線發(fā)送或接收信息。在主 機(jī)13向總線提供要傳輸?shù)臄?shù)據(jù)的情況下,媒介訪問控制單元93計數(shù) 總線上的時隙并且在用于各節(jié)點10的各保留時隙中控制使CHI 91 把來自主機(jī)13的信息向編碼器/解碼器95轉(zhuǎn)發(fā)的時間,編碼器/解碼 器95用于向總線傳輸信息。
媒介訪問控制單元93通過線路99和線路100分別向監(jiān)測裝置 16提供時隙ID號和時隙邊界(大致等效于Slot—start)。分別向比較 和重置單元73以及時隙計數(shù)器72提供時隙邊界和時隙ID信號,以 檢測通信控制器15的任何計數(shù)問題。
此外,通信控制器15的協(xié)議引擎18包括時間產(chǎn)生單元94,用 于計數(shù)滴答的時間(microtick)以產(chǎn)生滴答的時間。滴答的時間是通 信控制器15中最小的時間單位,而滴答的時間是節(jié)點之間使用的網(wǎng) 絡(luò)時間單元。時間產(chǎn)生單元94也負(fù)責(zé)確定網(wǎng)絡(luò)所處的循環(huán)并且通過 線路101和線路102分別向監(jiān)測裝置16并且特別向比較和重置單元 73以及循環(huán)計數(shù)器71提供循環(huán)ID信號和循環(huán)開始信號。
最后,通信控制器15包括編碼器/解碼器95,其中分別準(zhǔn)備用 于通過TxD或RxD路徑傳輸?shù)臄?shù)據(jù)并且準(zhǔn)備通過TxD或RxD路徑 從總線接收的數(shù)據(jù)。每當(dāng)從編碼器/解碼器95接收到任何數(shù)據(jù)后解碼 新位元時,編碼器/解碼器單元95通過線路103向位計數(shù)器82提供 位選通信號,必須監(jiān)測所接收的數(shù)據(jù)是否包括幀并且特別地是否包括 同步幀。因此,需要監(jiān)測幀頭部的第四位是否置位,其表示所接收的 幀為同步幀。因此,編碼器/解碼器單元95也通過線路105向位計數(shù) 器82提供潛在幀開始的信號,以啟動監(jiān)測裝置16中的位計數(shù)器82。 此外,編碼器/解碼器單元95通過線路104提供表示網(wǎng)絡(luò)正處于空閑 狀態(tài)并允許監(jiān)測裝置16停止評估所接收的位的CHIRP信號。選通所 接收的數(shù)據(jù)位,并且通過RxD線路106提供給如圖8中所示的監(jiān)測 裝置16中的同步幀計數(shù)器81。根據(jù)來自時間產(chǎn)生單元94的線路102 上的循環(huán)開始信號,當(dāng)一個新的循環(huán)開始吋重置同步幀計數(shù)器81。
17因此,監(jiān)測裝置16可重置同步幀計數(shù)器81以計數(shù)通信控制器15所 接收的同步幀的數(shù)量,并且在同步數(shù)比較器83中比較所接收的同步 幀的數(shù)量。在報告給主機(jī)13的同步幀的數(shù)量大于通信控制器15所接 收的同步幀的數(shù)量時,通知主機(jī)通信控制器15的該錯誤行為。
盡管是逐個地說明各個實施例,但是也可以很容易地組合如圖 6-8中所示的監(jiān)測裝置16的部件。因此,可以監(jiān)測通信控制器15是 否連續(xù)地發(fā)送如CAS/WUS的符號并且還可以檢査主機(jī)13是否連續(xù) 地發(fā)送READY命令。需要檢測裝置檢測的差錯越特殊,則監(jiān)測裝置 需要實現(xiàn)得越復(fù)雜,但是,監(jiān)測裝置中的一些計數(shù)器可用于不同的差 錯檢測,因此監(jiān)測裝置16的部分可實現(xiàn)雙重功能。
權(quán)利要求
1.一種分布式通信系統(tǒng)的節(jié)點(10),所述通信系統(tǒng)包括多個節(jié)點(10),每個節(jié)點耦接到一種通信媒介;每個節(jié)點(10)至少包括-耦接到接收和傳送路徑的通信控制器(15),-用于執(zhí)行應(yīng)用的主機(jī)(13),以及-監(jiān)測裝置(16),至少耦接到通信控制器(15)的接收或傳送路徑、通信控制器(15)和主機(jī)(13)之間的接口(91)以及通信控制器(15)的內(nèi)部線路之一,其中提供監(jiān)測裝置(16)用于評估通信控制器(15)所提供的信息,以監(jiān)測通信控制器(15)的至少一個狀態(tài),其中在檢測到非定義狀態(tài)的情況下通知主機(jī)(13)執(zhí)行與通信控制器(15)的該狀態(tài)相關(guān)的預(yù)定措施。
2. 如權(quán)利要求l所述的節(jié)點,其中監(jiān)測裝置(16)適用于接收 通信控制器(15)的預(yù)處理信息,以根據(jù)監(jiān)測裝置(16)中存儲的信 息與從通信控制器(15)接收到的信息之間的比較結(jié)果來確定通信控 制器(15)的至少一種狀態(tài),其中預(yù)處理信息包括通信控制器(15) 從通信系統(tǒng)接收的至少一個輸入信息、通信控制器(15)的至少一個 內(nèi)部狀態(tài)以及輸出到節(jié)點(10)的主機(jī)(13)的信息。
3. 如權(quán)利要求1或2所述的節(jié)點,其中通信系統(tǒng)根據(jù)基于時間 的協(xié)議運行,特別地基于FlexRay協(xié)議,其中允許每個節(jié)點(10)根 據(jù)預(yù)定時間調(diào)度來傳輸數(shù)據(jù)。
4. 如權(quán)利要求1至3之一所述的節(jié)點,其中監(jiān)測裝置(16)接 收通信控制器(15)的預(yù)處理信息,該預(yù)處理信息在監(jiān)測裝置(16) 中解碼并與存儲的信息進(jìn)行比較,其中根據(jù)比較結(jié)果確定通信控制器(15)的狀態(tài),其中在不匹配或者錯誤的狀態(tài)改變的情況下通知主機(jī)(13)。
5. 如權(quán)利要求1至4之一所述的節(jié)點,其中在主機(jī)被監(jiān)測裝置 (16)通知的情況下,主機(jī)(13)適用于執(zhí)行關(guān)閉通信控制器(15)、重置通信控制器(15)和中斷通信控制器(15)的傳輸路徑中的至少 一種措施。
6. 如權(quán)利要求1至5之一所述的節(jié)點,其中在檢測到主機(jī)(13) 與通信控制器(15)之間的錯誤的情況下,通知外部監(jiān)督裝置來控制 檢測為錯誤運行的通信控制器(15)和/或主機(jī)(13)。
7. 如權(quán)利要求1至6之一所述的節(jié)點,其中監(jiān)測裝置(16)包 括計數(shù)器(71, 72)、定時器(63)、存儲器(52)以及比較器(51, 73)中的至少一個。
8. 如權(quán)利要求1至7之一所述的節(jié)點,其中監(jiān)測裝置(16)與 通信控制器(15)形成在相同芯片上。
9. 一種基于時間觸發(fā)協(xié)議操作的分布式通信系統(tǒng),包括至少一 個如權(quán)利要求1至8之一所述的節(jié)點。
10. —種監(jiān)測裝置,其被耦接到與通信系統(tǒng)相連接的節(jié)點(10) 的通信控制器(15),其中監(jiān)測裝置(16)適用于接收通信控制器(15) 的預(yù)處理信息,以根據(jù)監(jiān)測裝置(16)中存儲的信息與從通信控制器(15)接收到的信息之間的比較結(jié)果來確定通信控制器(15)的至少 一種狀態(tài),其中預(yù)處理信息包括通信控制器(15)從通信系統(tǒng)接收的 至少一個輸入信息、通信控制器(15)的至少一個內(nèi)部狀態(tài)以及輸出 到節(jié)點(10)的主機(jī)(13)的信息。
全文摘要
本發(fā)明涉及一種在時間觸發(fā)協(xié)議下運行的分布式通信系統(tǒng)中的節(jié)點,還涉及到分布式通信系統(tǒng)以及耦接到這種通信系統(tǒng)的節(jié)點的監(jiān)測裝置。為了提供一種增強(qiáng)了錯誤檢測并降低了復(fù)雜度的分布式通信系統(tǒng)的節(jié)點、分布式通信系統(tǒng)以及監(jiān)測裝置,以為需要非100%故障安全解決方案的系統(tǒng)提供較高的可靠性,本發(fā)明提出一種節(jié)點,包括耦接到接收和傳送路徑的通信控制器(15)、用于執(zhí)行應(yīng)用的主機(jī)(13)以及耦接到通信控制器(15)的傳輸路徑、通信控制器(15)和主機(jī)(13)之間的接口(91)以及通信控制器(15)的內(nèi)部線路至少之一的監(jiān)測裝置(16),其中提供監(jiān)測裝置(16)用于評估通信控制器(15)提供的信息,以監(jiān)測通信控制器(15)的至少一種狀態(tài),其中在監(jiān)測到非定義狀態(tài)的情況下通知主機(jī)(13)執(zhí)行與通信控制器(15)的狀態(tài)相關(guān)的預(yù)定措施。因此,提供一種容易降低成本的解決方案,用于監(jiān)測分布式通信系統(tǒng)中預(yù)定數(shù)量的差錯。
文檔編號H04L12/40GK101632262SQ200880007885
公開日2010年1月20日 申請日期2008年3月3日 優(yōu)先權(quán)日2007年3月14日
發(fā)明者彼得·富爾曼, 馬庫斯·鮑邁斯特 申請人:Nxp股份有限公司