欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種考慮前視距離的相容工件族的優(yōu)化控制方法與流程

文檔序號(hào):11589266閱讀:299來(lái)源:國(guó)知局

本發(fā)明屬于生產(chǎn)調(diào)度領(lǐng)域,具體的說(shuō)是一種考慮前視距離的相容工件族的優(yōu)化控制方法。



背景技術(shù):

隨著科學(xué)技術(shù)的發(fā)展,生產(chǎn)規(guī)模逐步擴(kuò)大,復(fù)雜性也越來(lái)越高,因此對(duì)生產(chǎn)過(guò)程的管理、監(jiān)控和決策的要求有所提高。生產(chǎn)調(diào)度是將優(yōu)先的資源分配給在一定時(shí)間內(nèi)的不同任務(wù)的決策過(guò)程,它需要在滿足各種系統(tǒng)約束的條件下使某個(gè)或某些性能指標(biāo)最優(yōu)。生產(chǎn)調(diào)度作為現(xiàn)代化生產(chǎn)作業(yè)中的核心內(nèi)容,對(duì)提高生產(chǎn)效率、提高生產(chǎn)資源的利用率、降低生產(chǎn)成本等具有重要的作用,因此生產(chǎn)調(diào)度在現(xiàn)實(shí)生產(chǎn)環(huán)境中有著廣泛應(yīng)用,如半導(dǎo)體芯片制造系統(tǒng),鋼鐵生產(chǎn),帶托盤的車床加工等。

傳統(tǒng)的調(diào)度方法都是針對(duì)確定性問(wèn)題,即把生產(chǎn)過(guò)程中的很多因素(如工件的到達(dá)時(shí)間,加工時(shí)間等)都當(dāng)成確定已知的來(lái)考慮,并基于此來(lái)制定調(diào)度方案。由于實(shí)際生產(chǎn)中含有很多隨機(jī)性的不確定因素,因此隨機(jī)調(diào)度問(wèn)題在近年來(lái)受到了廣泛的關(guān)注,相容工件族的隨機(jī)調(diào)度是其中很重要的一類。但是在現(xiàn)有的對(duì)隨機(jī)調(diào)度問(wèn)題進(jìn)行優(yōu)化控制的方法中,如一些啟發(fā)式規(guī)則和元啟發(fā)式規(guī)則,較少考慮到未來(lái)工件到達(dá)信息,不能針對(duì)未來(lái)工件的到達(dá)情況對(duì)調(diào)度方案做出及時(shí)調(diào)整,因此還存在著浪費(fèi)生產(chǎn)資源,生產(chǎn)率不夠高的缺點(diǎn)。



技術(shù)實(shí)現(xiàn)要素:

本發(fā)明是為解決上述現(xiàn)有技術(shù)存在的不足之處,提出一種考慮前視距離的相容工件族的優(yōu)化控制方法,以期能在對(duì)相容工件族優(yōu)化控制時(shí)考慮未來(lái)工件到達(dá)信息,從而能提高生產(chǎn)系統(tǒng)的生產(chǎn)效率以及降低生產(chǎn)過(guò)程中的工件流失率。

本發(fā)明為解決技術(shù)問(wèn)題采用如下技術(shù)方案:

本發(fā)明一種考慮前視距離的相容工件族的優(yōu)化控制方法的特點(diǎn)是,所述優(yōu)化控制方法是應(yīng)用于由傳送帶上傳送的m種工件、自動(dòng)撿取裝置、m個(gè)緩沖庫(kù)、容量為k的批處理機(jī)和紅外線感知器所構(gòu)成的單機(jī)生產(chǎn)系統(tǒng)中;所述m種工件分別屬于m個(gè)不同的工件族,并對(duì)所述的m個(gè)工件族按加工率降序排序;任意第m個(gè)緩沖庫(kù)的容量記為nm,并用于存儲(chǔ)屬于第m個(gè)工件族的工件;假設(shè)所述第m個(gè)緩沖庫(kù)中存儲(chǔ)的工件數(shù)為nm,nm∈[0,nm];由m個(gè)緩沖庫(kù)中存儲(chǔ)的工件個(gè)數(shù)構(gòu)成所述單機(jī)生產(chǎn)系統(tǒng)的聯(lián)合狀態(tài)s=(n1,n2,…,nm,…,nm);m≥2;

所述紅外線感知器設(shè)置在傳送帶的末端,以所述紅外線感知器所在的位置為起點(diǎn),并以朝向傳送帶的一段傳送距離作為前視距離lmax表示最大前視距離;

定義選擇加工工件族動(dòng)作為pm表示所述批處理機(jī)加工由前m個(gè)工件族所構(gòu)成的批;

由所述前視距離和選擇加工工件族動(dòng)作構(gòu)成的聯(lián)合動(dòng)作且vs∈d=d1×d2;d表示所述單機(jī)生產(chǎn)系統(tǒng)的動(dòng)作空間;

定義決策時(shí)刻為批處理機(jī)為空閑狀態(tài)且有工件到達(dá)緩沖庫(kù),或批處理機(jī)完成加工的時(shí)刻;

所述優(yōu)化控制方法是按如下步驟進(jìn)行:

步驟1、定義變量k,并初始化k=1;定義初始決策時(shí)刻為第k-1個(gè)決策時(shí)刻;

定義q值表中的元素為狀態(tài)-動(dòng)作對(duì)值,并初始化初始決策時(shí)刻的q值表;

步驟2、利用強(qiáng)化學(xué)習(xí)算法得到最優(yōu)q值表;

步驟2.1、定義計(jì)數(shù)器為g,并初始化g=1;定義最大學(xué)習(xí)次數(shù)為g;定義貪心概率ε;

步驟2.2、在第k-1個(gè)決策時(shí)刻,系統(tǒng)的聯(lián)合狀態(tài)為根據(jù)ε-貪心算法選擇動(dòng)作:以貪心概率ε選擇當(dāng)前q值表中狀態(tài)sk-1對(duì)應(yīng)的最優(yōu)動(dòng)作,以1-ε的概率隨機(jī)選擇動(dòng)作空間d中的其他動(dòng)作;

產(chǎn)生一個(gè)隨機(jī)數(shù),若所述隨機(jī)數(shù)屬于(0,ε),則執(zhí)行所述最優(yōu)動(dòng)作,若所述隨機(jī)數(shù)屬于(ε,1),則執(zhí)行所述其他動(dòng)作,從而得到第k-1個(gè)決策時(shí)刻轉(zhuǎn)移到第k個(gè)決策時(shí)刻轉(zhuǎn)移樣本軌道其中,δk為第k-1個(gè)決策時(shí)刻與第k個(gè)決策時(shí)刻的時(shí)間間隔,為第k-1個(gè)決策時(shí)刻轉(zhuǎn)移到第k個(gè)決策時(shí)刻的過(guò)程中第w個(gè)工件到達(dá)相應(yīng)的緩存庫(kù)后的時(shí)刻與第k個(gè)決策時(shí)刻之間的存儲(chǔ)時(shí)間,lk表示第k-1個(gè)決策時(shí)刻轉(zhuǎn)移到第k個(gè)決策時(shí)刻過(guò)程中傳送帶上流失工件數(shù)的流失代價(jià);

步驟2.3、利用式(1)計(jì)算第k-1個(gè)決策時(shí)刻轉(zhuǎn)移到第k個(gè)決策時(shí)刻過(guò)程中的即時(shí)代價(jià)rk-1,k:

式(1)中,為第k-1個(gè)決策時(shí)刻轉(zhuǎn)移到第k個(gè)決策時(shí)刻過(guò)程中,緩沖庫(kù)內(nèi)所有工件的存儲(chǔ)代價(jià);為第k-1個(gè)決策時(shí)刻轉(zhuǎn)移到第k個(gè)決策時(shí)刻過(guò)程中,到達(dá)緩沖庫(kù)工件的累計(jì)存儲(chǔ)代價(jià);β表示所述流失代價(jià)lk的權(quán)重;

步驟2.4、利用式(2)對(duì)第k-1個(gè)決策時(shí)刻的狀態(tài)-動(dòng)作對(duì)值進(jìn)行更新,并令g+1賦值給g:

式(2)中,α為學(xué)習(xí)步長(zhǎng);dk-1表示差分公式,并有:

式(3)中,v表示所述動(dòng)作空間d中的任一動(dòng)作;

步驟2.5、判斷g>g是否成立,若成立,表示學(xué)習(xí)結(jié)束,并得到最優(yōu)q值表;否則,令k+1賦值給k后,返回步驟2.2;

步驟3、在第k+g個(gè)決策時(shí)刻,系統(tǒng)的聯(lián)合狀態(tài)若所有緩沖庫(kù)為空,則等待下個(gè)工件到達(dá)并存入相應(yīng)緩沖庫(kù)中,否則,根據(jù)所述狀態(tài)sk+g查找所述最優(yōu)q值表,從而選擇相應(yīng)的前視距離和選擇加工工件族動(dòng)作

步驟4、判斷第k+g個(gè)決策時(shí)刻的前視距離內(nèi)是否有工件,若有工件,則等待相應(yīng)工件到達(dá)并存入對(duì)應(yīng)的緩沖庫(kù)中,否則,根據(jù)第k+g個(gè)決策時(shí)刻的選擇加工工件族動(dòng)作選擇相應(yīng)的批送入批處理機(jī)中進(jìn)行加工,并等待加工完成;

步驟5、令k+g+1賦值給k+g,并返回步驟3。

與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果在于:

1.本發(fā)明用于加工相容工件族的單機(jī)生產(chǎn)系統(tǒng)中,通過(guò)控制前視距離來(lái)平衡工件的到達(dá)過(guò)程和工件的加工過(guò)程,而且還能通過(guò)選擇加工工件族動(dòng)作決定批處理機(jī)所加工的批的包含工件情況,以最小化工件的存儲(chǔ)代價(jià)和加工過(guò)程中的工件流失代價(jià)為優(yōu)化目標(biāo),通過(guò)紅外感知器獲取未來(lái)工件到達(dá)信息,以系統(tǒng)中各個(gè)緩沖庫(kù)中工件個(gè)數(shù)為聯(lián)合狀態(tài),紅外感知器的前視距離和加工工件族動(dòng)作為聯(lián)合動(dòng)作,采用強(qiáng)化學(xué)習(xí)算法實(shí)現(xiàn)了對(duì)加工相容工件族的單機(jī)生產(chǎn)系統(tǒng)的優(yōu)化控制,從而有效地提高了生產(chǎn)效率,降低了工件的流失率,降低了庫(kù)存以及縮短了產(chǎn)品的制造周期。

2.本發(fā)明通過(guò)紅外感知器獲取未來(lái)工件到達(dá)信息,避免了因?yàn)椴豢紤]未來(lái)工件到達(dá)而帶來(lái)的誤加工或者誤等待,從而產(chǎn)生了不必要的庫(kù)存以及延長(zhǎng)產(chǎn)品的制造周期。因此,本發(fā)明能夠有效地平衡生產(chǎn)中的加工和等待過(guò)程。

3.本發(fā)明針對(duì)的是生產(chǎn)過(guò)程中生產(chǎn)信息為隨機(jī)的不確定因素,工件隨機(jī)到達(dá),批處理機(jī)加工完一批工件的時(shí)間也是隨機(jī)的,每個(gè)決策時(shí)刻,根據(jù)系統(tǒng)的實(shí)時(shí)狀態(tài)選擇相應(yīng)的動(dòng)作。因此,該發(fā)明相比以往的方法更貼近現(xiàn)實(shí)生產(chǎn)環(huán)境。

4.本發(fā)明采用強(qiáng)化學(xué)習(xí)算法,不需要模型的具體參數(shù),只需根據(jù)生產(chǎn)系統(tǒng)的實(shí)際生產(chǎn)過(guò)程進(jìn)行在線學(xué)習(xí),從而有效地實(shí)現(xiàn)了優(yōu)化控制。

附圖說(shuō)明

圖1為本發(fā)明方法流程圖;

圖2為本發(fā)明在線生產(chǎn)系統(tǒng)的示意圖。

具體實(shí)施方式

本實(shí)施例中,一種考慮前視距離的相容工件族的優(yōu)化控制方法,應(yīng)用于如圖2所示的由傳送帶上傳送的m種工件1、自動(dòng)撿取裝置2、m個(gè)緩沖庫(kù)3、容量為k的批處理機(jī)4和紅外線感知器5所構(gòu)成的單機(jī)生產(chǎn)系統(tǒng)中;生產(chǎn)系統(tǒng)中m種工件2沿著傳送帶隨機(jī)到達(dá),當(dāng)有工件到達(dá)撿取線時(shí),自動(dòng)撿取裝置2將該工件撿取放入3中相應(yīng)緩沖庫(kù),該撿取過(guò)程的時(shí)間不考慮。m種工件分別屬于m個(gè)不同的相容工件族,并對(duì)這m個(gè)工件族按加工率降序排序,相容工件族是指屬于不同族的工件能在同一批中進(jìn)行加工;任意第m個(gè)緩沖庫(kù)的容量記為nm,并用于存儲(chǔ)屬于第m個(gè)工件族的工件;假設(shè)第m個(gè)緩沖庫(kù)中存儲(chǔ)的工件數(shù)為nm,nm∈[0,nm];由m個(gè)緩沖庫(kù)中存儲(chǔ)的工件個(gè)數(shù)構(gòu)成該單機(jī)生產(chǎn)系統(tǒng)的聯(lián)合狀態(tài)s=(n1,n2,…,nm,…,nm);m≥2;所有可取的狀態(tài)構(gòu)成了狀態(tài)空間,系統(tǒng)總的狀態(tài)數(shù)為a。容量為k的批處理機(jī)4表示該處理機(jī)能夠同時(shí)加工上限為k個(gè)的工件,且屬于每個(gè)族的工件都只占用一個(gè)單位容量,批處理機(jī)4加工完一批工件的時(shí)間是隨機(jī)的。

紅外線感知器5設(shè)置在傳送帶的末端,以紅外線感知器5所在的位置為起點(diǎn),并以朝向傳送帶的一段傳送距離作為前視距離lmax表示最大前視距離,用一個(gè)較小的數(shù)δ來(lái)離散化[0,lmax],得到{0,δ,2δ,…,lmax-δ,lmax};圖2中7為最大前視點(diǎn)即最大前視距離對(duì)應(yīng)的點(diǎn)?!薇硎炯t外線感知器5前視無(wú)窮遠(yuǎn)。∞用于系統(tǒng)在實(shí)際運(yùn)行中存在的一種特殊工作狀態(tài):當(dāng)所有緩沖庫(kù)3都為空時(shí),只能等待有工件到達(dá)并放入緩沖庫(kù)3中。

定義選擇加工工件族動(dòng)作為pm表示批處理機(jī)4加工由前m個(gè)工件族所構(gòu)成的批;該批中屬于這m個(gè)工件族的工件個(gè)數(shù)由低加工率優(yōu)先加工規(guī)則決定,具體見文獻(xiàn)《controlofabatchprocessingmachineservingcompatiblejobfamilies》。確定加工的工件后,通過(guò)自動(dòng)撿取裝置2將這些工件從緩沖庫(kù)3中撿取并放入批處理機(jī)4中進(jìn)行加工,同樣不考慮該撿取過(guò)程的時(shí)間。系統(tǒng)在實(shí)際運(yùn)行中還存在一種特殊工作狀態(tài):當(dāng)緩沖庫(kù)3不全為空,且空緩沖庫(kù)中最小的序號(hào)為i,這些狀態(tài)下d2={p1,p2,…,pi-1}。

由前視距離和選擇加工工件族動(dòng)作構(gòu)成的聯(lián)合動(dòng)作且vs∈d=d1×d2;d表示該單機(jī)生產(chǎn)系統(tǒng)的動(dòng)作空間;d中總的動(dòng)作數(shù)為b;

定義決策時(shí)刻為批處理機(jī)4為空閑狀態(tài)且有工件到達(dá)緩沖庫(kù),或批處理機(jī)4完成加工的時(shí)刻;

因此這種考慮前視距離的相容工件族的優(yōu)化控制方法,如圖1所示,是按如下步驟進(jìn)行:

步驟1、定義變量k,并定義初始決策時(shí)刻為第k-1個(gè)決策時(shí)刻;

定義q值表中的元素為狀態(tài)-動(dòng)作對(duì)值,即以系統(tǒng)的狀態(tài)為q值表的行,以系統(tǒng)的動(dòng)作為q值表的列,表中s1表示的是狀態(tài)空間中第一個(gè)狀態(tài)(0,0,…,0,…,0),sa為狀態(tài)空間中最后一個(gè)狀態(tài)(n1,n2,…,nm,…,nm),v1表示的是動(dòng)作空間中第一個(gè)動(dòng)作(0,p1),vb為動(dòng)作空間中最后一個(gè)動(dòng)作(∞,pm);初始化初始決策時(shí)刻的q值表,表中除了狀態(tài)(0,0,…,0,…,0)行,動(dòng)作列,以及狀態(tài)動(dòng)作列,對(duì)應(yīng)的q值表元素為“inf”外,q值表中其他的元素均為“0”;其中,若q(sa,vb)為“inf”表示的是在狀態(tài)sa下,動(dòng)作vb不可取的。

步驟2、利用強(qiáng)化學(xué)習(xí)算法得到最優(yōu)q值表;

步驟2.1、定義計(jì)數(shù)器為g,并初始化g=1;定義最大學(xué)習(xí)次數(shù)為g;定義貪心概率ε;

步驟2.2、在第k-1個(gè)決策時(shí)刻,系統(tǒng)的聯(lián)合狀態(tài)為根據(jù)ε-貪心算法選擇動(dòng)作:以ε的概率選擇當(dāng)前q值表中狀態(tài)sk-1對(duì)應(yīng)的最優(yōu)動(dòng)作,即選擇q值表中狀態(tài)sk-1行下最小q值所對(duì)應(yīng)的動(dòng)作,以1-ε概率隨機(jī)選擇動(dòng)作空間d中的其他動(dòng)作。

產(chǎn)生一個(gè)隨機(jī)數(shù),若隨機(jī)數(shù)屬于(0,ε),則執(zhí)行最優(yōu)動(dòng)作,若隨機(jī)數(shù)屬于(ε,1),則執(zhí)行其他動(dòng)作,從而得到第k-1個(gè)決策時(shí)刻轉(zhuǎn)移到第k個(gè)決策時(shí)刻轉(zhuǎn)移樣本軌道其中,δk為第k-1個(gè)決策時(shí)刻與第k個(gè)決策時(shí)刻的時(shí)間間隔,為第k-1個(gè)決策時(shí)刻轉(zhuǎn)移到第k個(gè)決策時(shí)刻的過(guò)程中第w個(gè)工件到達(dá)相應(yīng)的緩存庫(kù)后的時(shí)刻與第k個(gè)決策時(shí)刻之間的存儲(chǔ)時(shí)間,lk表示第k-1個(gè)決策時(shí)刻轉(zhuǎn)移到第k個(gè)決策時(shí)刻過(guò)程中傳送帶上流失工件數(shù)的流失代價(jià);

步驟2.3、利用式(1)計(jì)算第k-1個(gè)決策時(shí)刻轉(zhuǎn)移到第k個(gè)決策時(shí)刻過(guò)程中的即時(shí)代價(jià)rk-1,k:

式(1)中,為第k-1個(gè)決策時(shí)刻轉(zhuǎn)移到第k個(gè)決策時(shí)刻過(guò)程中,緩沖庫(kù)內(nèi)所有工件的存儲(chǔ)代價(jià);為第k-1個(gè)決策時(shí)刻轉(zhuǎn)移到第k個(gè)決策時(shí)刻過(guò)程中,到達(dá)緩沖庫(kù)工件的累計(jì)存儲(chǔ)代價(jià);β表示流失代價(jià)lk的權(quán)重,通過(guò)調(diào)整β可以協(xié)調(diào)對(duì)存儲(chǔ)代價(jià)和流失代價(jià)這兩個(gè)目標(biāo)的重視程度;

步驟2.4、利用式(2)對(duì)第k-1個(gè)決策時(shí)刻的狀態(tài)-動(dòng)作對(duì)值進(jìn)行更新,并令g+1賦值給g:

式(2)中,α為學(xué)習(xí)步長(zhǎng),一般取0<α<1保證算法的收斂性;dk-1表示差分公式,并有:

式(3)中,v表示動(dòng)作空間d中的任一動(dòng)作;

步驟2.5、判斷g>g是否成立,若成立,表示學(xué)習(xí)結(jié)束,并得到最優(yōu)q值表;否則,令k+1賦值給k后,返回步驟2.2。

步驟3、在第k+g個(gè)決策時(shí)刻,通過(guò)傳感器等設(shè)備獲得緩沖庫(kù)3中各個(gè)緩沖庫(kù)的工件個(gè)數(shù),獲得聯(lián)合狀態(tài)若此時(shí)即所有緩沖庫(kù)為空,只需等待下個(gè)工件到達(dá)撿取線6,由自動(dòng)撿取裝置2撿取該工件并存入緩沖庫(kù)中,否則,根據(jù)狀態(tài)sk+g,查找步驟2所得最優(yōu)q值表,從而選擇相應(yīng)的前視距離和選擇加工工件族動(dòng)作

步驟4、通過(guò)紅外感知器5前視并判斷第k+g個(gè)決策時(shí)刻的前視距離內(nèi)是否有工件,若有工件,則等待相應(yīng)工件到達(dá)撿取線6,由自動(dòng)撿取裝置2撿取該工件并存入對(duì)應(yīng)的緩沖庫(kù)中,否則,根據(jù)第k+g個(gè)決策時(shí)刻的選擇加工工件族動(dòng)作由自動(dòng)撿取裝置2從緩沖庫(kù)3中撿取工件送入批處理機(jī)4中進(jìn)行加工,并等待加工完成;

步驟5、令k+g+1賦值給k+g,并返回步驟3。

當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
商洛市| 梁平县| 孝昌县| 新田县| 乐昌市| 炎陵县| 芷江| 察隅县| 确山县| 灌云县| 南丰县| 顺义区| 巴彦县| 改则县| 肃北| 义马市| 星子县| 太原市| 嘉祥县| 呼伦贝尔市| 甘德县| 鹤壁市| 炉霍县| 铜梁县| 孟津县| 皮山县| 洪洞县| 永州市| 卓资县| 石林| 鄯善县| 建湖县| 道真| 江都市| 托克托县| 上虞市| 纳雍县| 靖西县| 成都市| 大关县| 栖霞市|