本公開涉及被配置為實現人工智能、包括神經網絡的計算機系統(tǒng)。
背景技術:
1、基于機器和深度學習算法的物聯(lián)網(iot)系統(tǒng)正在工業(yè)和消費應用兩者中變得普遍。這種系統(tǒng)的商業(yè)成功與滿足對準確度、精度、召回率和覆蓋率的預期密切相關。高度準確的深度學習系統(tǒng)的開發(fā)直接受到大量且不同的訓練和評估數據集合的可用性的影響。在制造和部署系統(tǒng)之前,需要大量的評估數據來評測系統(tǒng)的性能。大量的標記數據是訓練能夠滿足所期望的性能水平的復雜和大型深度學習模型的關鍵。
技術實現思路
1、本公開的各方面包括一種訓練機器學習(ml)模型的方法,該方法包括獲得數據集,該數據集包括使用兩個或更多個基本真值(ground?truth)感測系統(tǒng)獲得的第一訓練數據和使用被配置為實現ml模型的預測感測系統(tǒng)獲得的第二訓練數據,基于第一訓練數據確定損失函數,該損失函數基于第一訓練數據的最小值和最大值定義零損失區(qū)域,使用ml模型基于第二訓練數據計算預測輸出,使用損失函數基于預測輸出計算ml模型的損失,以及基于所計算的損失更新ml模型。
2、在其他方面,基本真值感測系統(tǒng)包括相機系統(tǒng)、雷達系統(tǒng)和光電池系統(tǒng)中的至少一個,并且預測感測系統(tǒng)包括至少一個音頻傳感器。ml模型被配置為檢測音頻數據流中的特征。確定損失函數包括在基于第一訓練數據的最小值的下限和基于第一訓練數據的最大值的上限之間定義零損失區(qū)域。該方法還包括基于第一訓練數據確定正確性函數。正確性函數被配置為響應于預測輸出在零損失區(qū)域的預定容差內而輸出第一值,并且響應于預測輸出不在零損失區(qū)域的預定容差內而輸出第二值。該方法還包括使用正確性函數計算ml模型的準確度,并進一步基于計算的準確度更新ml模型。兩個或更多個基本真值感測系統(tǒng)被配置為以第一時間間隔視覺地檢測對象,并且預測感測系統(tǒng)被配置為以第一時間間隔檢測與對象相關聯(lián)的音頻特征。
3、一種用于訓練機器學習(ml)模型的系統(tǒng)包括損失函數電路和ml電路,損失函數電路被配置為接收包括使用兩個或更多個基本真值感測系統(tǒng)獲得的第一訓練數據的數據集,并基于第一訓練數據確定損失函數,其中損失函數基于第一訓練數據的最小值和最大值定義零損失區(qū)域,ml電路被配置為實現ml模型。實現ml模型包括接收使用被配置為實現ml模型的預測感測系統(tǒng)獲得的第二訓練數據,以及使用ml模型基于第二訓練數據計算預測輸出。損失函數電路還被配置為使用損失函數基于預測輸出計算ml模型的損失。ml電路被配置為基于所計算的損失更新ml模型。
4、在其他方面,基本真值感測系統(tǒng)包括相機系統(tǒng)、雷達系統(tǒng)和光電池系統(tǒng)中的至少一個,并且預測感測系統(tǒng)包括至少一個音頻傳感器。ml模型被配置為檢測音頻數據流中的特征。為了確定損失函數,損失函數電路被配置為在基于第一訓練數據的最小值的下限和基于第一訓練數據的最大值的上限之間定義零損失區(qū)域。該系統(tǒng)還包括被配置為基于第一訓練數據確定正確性函數的正確性函數電路。正確性函數被配置為響應于預測輸出在零損失區(qū)域的預定容差內而輸出第一值,并且響應于預測輸出不在零損失區(qū)域的預定容差內而輸出第二值。正確性函數電路被配置為使用正確性函數來計算ml模型的準確度,并且其中ml電路被配置為進一步基于所計算的準確度來更新ml模型。兩個或更多個基本真值感測系統(tǒng)被配置為以第一時間間隔視覺地檢測對象,并且預測感測系統(tǒng)被配置為以第一時間間隔檢測與對象相關聯(lián)的音頻特征。
5、一種計算設備被配置為實現和訓練機器學習(ml)模型。計算設備包括處理設備,該處理設備被配置為執(zhí)行存儲在存儲器中的指令以獲得數據集,該數據集包括使用兩個或更多個基本真值感測系統(tǒng)獲得的第一訓練數據和使用被配置為實現ml模型的預測感測系統(tǒng)獲得的第二訓練數據,基于第一訓練數據確定損失函數,其中損失函數基于第一訓練數據的最小值和最大值定義零損失區(qū)域,使用ml模型基于第二訓練數據計算預測輸出,使用損失函數基于預測輸出計算ml模型的損失,并且基于所計算的損失更新ml模型。
6、在其他方面,一種系統(tǒng)包括計算設備,并且還包括兩個或更多個基本真值感測系統(tǒng)和預測感測系統(tǒng)?;菊嬷蹈袦y系統(tǒng)包括相機系統(tǒng)、雷達系統(tǒng)和光電池系統(tǒng)中的至少一個,并且預測感測系統(tǒng)包括至少一個音頻傳感器。ml模型被配置為檢測音頻數據流中的特征。確定損失函數包括在基于第一訓練數據的最小值的下限和基于第一訓練數據的最大值的上限之間定義零損失區(qū)域。該處理設備還被配置為執(zhí)行存儲在存儲器中的指令,以基于第一訓練數據確定正確性函數。正確性函數被配置為響應于預測輸出在零損失區(qū)域的預定容差內而輸出第一值,并且響應于預測輸出不在零損失區(qū)域的預定容差內而輸出第二值,使用正確性函數計算ml模型的準確度,并且進一步基于所計算的準確度更新ml模型。兩個或更多個基本真值感測系統(tǒng)被配置為以第一時間間隔視覺地檢測對象,并且預測感測系統(tǒng)被配置為以第一時間間隔檢測與對象相關聯(lián)的音頻特征。
1.一種訓練機器學習(ml)模型的方法,所述方法包括:
2.根據權利要求1所述的方法,其中所述基本真值感測系統(tǒng)包括相機系統(tǒng)、雷達系統(tǒng)和光電池系統(tǒng)中的至少一個,并且所述預測感測系統(tǒng)包括至少一個音頻傳感器。
3.根據權利要求1所述的方法,其中所述ml模型被配置為檢測音頻數據流中的特征。
4.根據權利要求1所述的方法,其中確定損失函數包括在基于第一訓練數據的最小值的下限和基于第一訓練數據的最大值的上限之間定義零損失區(qū)域。
5.根據權利要求1所述的方法,還包括基于第一訓練數據確定正確性函數,其中所述正確性函數被配置為(i)響應于所述預測輸出在所述零損失區(qū)域的預定容差內而輸出第一值,以及(ii)響應于所述預測輸出不在所述零損失區(qū)域的預定容差內而輸出第二值。
6.根據權利要求5所述的方法,還包括使用所述正確性函數計算所述ml模型的準確度,并進一步基于所計算的準確度更新所述ml模型。
7.根據權利要求1所述的方法,其中:(i)所述兩個或更多個基本真值感測系統(tǒng)被配置為以第一時間間隔視覺地檢測對象,并且(ii)所述預測感測系統(tǒng)被配置為以第一時間間隔檢測與所述對象相關聯(lián)的音頻特征。
8.一種用于訓練機器學習(ml)模型的系統(tǒng),所述系統(tǒng)包括:
9.根據權利要求8所述的系統(tǒng),其中所述基本真值感測系統(tǒng)包括相機系統(tǒng)、雷達系統(tǒng)和光電池系統(tǒng)中的至少一個,并且所述預測感測系統(tǒng)包括至少一個音頻傳感器。
10.根據權利要求8所述的系統(tǒng),其中所述ml模型被配置為檢測音頻數據流中的特征。
11.根據權利要求8所述的系統(tǒng),其中,為了確定損失函數,損失函數電路被配置為在基于第一訓練數據的最小值的下限和基于第一訓練數據的最大值的上限之間定義零損失區(qū)域。
12.根據權利要求8所述的系統(tǒng),還包括正確性函數電路,其被配置為基于第一訓練數據確定正確性函數,其中所述正確性函數被配置為(i)響應于所述預測輸出在所述零損失區(qū)域的預定容差內而輸出第一值,以及(ii)響應于所述預測輸出不在所述零損失區(qū)域的預定容差內而輸出第二值。
13.根據權利要求12所述的系統(tǒng),其中所述正確性函數電路被配置為使用所述正確性函數來計算所述ml模型的準確度,并且其中所述ml電路被配置為進一步基于所計算的準確度來更新所述ml模型。
14.根據權利要求8所述的系統(tǒng),其中:(i)所述兩個或更多個基本真值感測系統(tǒng)被配置為以第一時間間隔視覺地檢測對象,并且(ii)所述預測感測系統(tǒng)被配置為以第一時間間隔檢測與所述對象相關聯(lián)的音頻特征。
15.一種被配置為實現和訓練機器學習(ml)模型的計算設備,所述計算設備包括處理設備,其被配置為執(zhí)行存儲在存儲器中的指令以:
16.一種系統(tǒng),包括權利要求15的計算設備,并且還包括兩個或更多個基本真值感測系統(tǒng)和預測感測系統(tǒng),其中所述基本真值感測系統(tǒng)包括相機系統(tǒng)、雷達系統(tǒng)和光電池系統(tǒng)中的至少一個,并且所述預測感測系統(tǒng)包括至少一個音頻傳感器。
17.根據權利要求15所述的計算設備,其中所述ml模型被配置為檢測音頻數據流中的特征。
18.根據權利要求15所述的計算設備,其中確定損失函數包括在基于第一訓練數據的最小值的下限和基于第一訓練數據的最大值的上限之間定義零損失區(qū)域。
19.根據權利要求15所述的計算設備,其中所述處理設備還被配置為執(zhí)行存儲在存儲器中的指令,以基于第一訓練數據來確定正確性函數,其中所述正確性函數被配置為(i)響應于所述預測輸出在所述零損失區(qū)域的預定容差內而輸出第一值,以及(ii)響應于所述預測輸出不在所述零損失區(qū)域的預定容差內而輸出第二值,使用所述正確性函數來計算所述ml模型的準確度,并且進一步基于所計算的準確度來更新所述ml模型。
20.根據權利要求15所述的系統(tǒng),其中:(i)所述兩個或更多個基本真值感測系統(tǒng)被配置為以第一時間間隔視覺地檢測對象,并且(ii)所述預測感測系統(tǒng)被配置為以第一時間間隔檢測與所述對象相關聯(lián)的音頻特征。