核心導讀
本文描述了集成電路硬件架構度量(SPFM、LFM)和隨機失效概率度量(PMHF)的估算方法--FMEDA (Failure Modes Effects and Diagnostic Analysis),用于評估芯片架構處理隨機硬件失效的有效性和評估芯片架構隨機失效的概率足夠低。
這些指標通常是基于芯片使用假設條件成立前提下評估得到,因此芯片集成商(相關項/系統要素層級)指標計算時應考慮該芯片對其安全目標的影響,芯片安全機制的使用情況,以及芯片使用假設成立的有效性。
FMEDA量化分析涉及的內容非常多,本文章主要討論如何從本西門子手冊SN29500-2:2010評估集成電路的失效率。《芯片功能安全必修課:FMEDA量化分析的最佳實踐》將陸續分為多篇文章更新,敬請關注。
一、FMEDA的實施步驟
芯片隨機硬件失效度量的計算按如下步驟執行:
1)根據集成電路的架構設計,列出所有的集成電路內部模塊(例如CPU)、子模塊(例如寄存器組),可視情況劃分最小的分析模塊(至少劃分到安全機制可以診斷到的顆粒度,必要時更細的顆粒度)。
2)根據選擇的數據源(例如基于IEC/TR 62380:2004、SN 29500-2:2010、試驗數據等)相應的失效率評估模型,計算各模塊、組件的基礎失效率BFR(Basic Failure Rate)。
3)分析集成電路的故障模式(亦可稱為失效模式)及其分布。
4)根據失效模式分析流程圖(來自ISO 26262-10:2018,圖10),分析每個失效模式歸屬的故障類型。
5)確定安全機制及其診斷覆蓋率。
6)計算SPFM、LFM和PMHF,與目標值比較,找出設計上的薄弱環節,以決定是否需要優化硬件設計。
集成電路的故障模式可以參考ISO 26262-5:2018和ISO 26262-11:2018,也可以根據FMEA+HAZOP關鍵詞的方式定義,需要考慮永久故障和瞬態故障。有時難以對集成電路內部每個模塊的故障模式分布進行估算,可以使用面積來估算每種故障模式的分布,這種情況可能需要將模塊細分到一個適當的粒度。例如:ALU下級的DIV子模塊的失效,由于該子模塊占了ALU的30%面積,因此DIV占ALU整體失效30%。但有時候,會根據需要計算到更下一個層級,分析DIV的故障模式(例如邏輯單元物理損壞、數據通路失效等)的分布,這需要更細節的分析,設計前期可粗略地按故障模式數量平均分布,設計后期可以通過仿真精確地得到故障模式分布。
事實上,針對集成電路內部模塊/子模塊,在FMEDA計算過程中常常假定它的所有失效模式都與安全相關,因此能得到每個模塊/子模塊的單點故障、殘余故障和潛伏故障。系統集成商在集成該芯片時,則只需要考慮哪些模塊/子模塊的失效將影響他們的安全目標,因此納入指標(SPFM、LFM、PMHF)的計算范圍內。
FMEDA計算是基于安全目標的,因此借助于FTA的分析結果,可以直接得到違背同一個安全目標的單點故障和多點故障。如果前期沒有做FTA,則也可基于FMEA的基礎上進一步分析每個元器件的故障模式是否違背同一個安全目標。
下面將依據西門子SN 29500-2:2010和IEC/TR 62380:2004兩個標準作為集成電路失效率計算的參考數據來源,分別為:
1)SN 29500-2:2010 Expected values for integrated circuits. (September 2010)
2)IEC/TR 62380:2004 Reliability data handbook-Universal model for reliability prediction of electronics components, PCBs and equipment
二、基于SN 29500-2的計算BFR
1.參考失效率λref
SN 29500-2:2010的表1~5給出了不同類型集成電路在各種參考條件下的參考失效率λref。下面以SN 29500-2:2010表2為例,該表給用戶展現的信息是不同工藝技術、不同晶體管規模在不同的參考等效結溫下的參考失效率λref。
SN 29500-2:2010,表2
2.BFR計算公式
一個元器件的失效率除了受到本身材質、工藝、規模等方面的影響,還與它現實條件下的運行環境相關,例如電壓因素、電流因素、溫度因素以及應力因素等。在SN29500-2:2010第4節中提供了不同工藝技術集成電路的BFR計算公式,具體如下:
其中:
λref:表示基于參考條件的參考失效率,這在SN 29500標準中可查表2得到;
πU:電壓因子,即元器件在電壓應力下的降額系數;
πT:溫度因子,即元器件在溫度應力下的降額系數;
πD:漂移敏感因子,模擬電路或存在模擬電路部分時,需要考慮該因子的影響(漂移敏感電路取2,非漂移敏感電路取1)。
3.應力因子的計算公式
3.1 πU計算公式
在SN 29500-2:2010提供了集成電路πU、πT的計算公式,其中πU的計算公式如下:
SN 29500-2:2010,表6
集成電路πU的計算公式中的常量
集成電路的實際操作電壓(或運行電壓)U是公式4.5和4.6的唯一變量,CMOS數字集成電路選擇表6第一行的常量參數,代入公式4.5實際操作電壓U后即可得到πU;模擬集成電路選擇表6第二行的常量參數,代入公式4.5實際操作電壓U后即可得到πU。
3.2 πT計算公式
πT的計算公式如下:
θU,ref是參考環境溫度;θvj,1是參考等效節溫;θvj,2是實際等效節溫;A, Ea1, Ea2都是常量。其中θvj,1可從SN29500-2:2010表2中獲得,而A,Ea1,Ea2,θU,ref可從SN29500-2:2010表9獲得,如下所示
SN 29500-2:2010,表9
集成電路πT的計算公式中的常量
實際等效結溫θvj,2是公式4.7的唯一變量,可通過如下公式計算得到:
θvj,2 =θu+ △θ
即θvj,2等于芯片所處的環境溫度θu和元件工作時的溫升△θ之和。其中,P為芯片工作時消耗的功率,Rth為集成電路的等效熱阻,即:
△θ = P x Rth
得到等效結溫θvj,2后,除非易失存儲器以外的集成電路,使用選擇表 9第一行的常量參數,代入公式4.7后即可得到πT;對于非易失存儲器IC(如EPROM,FLASH-EPROM,OTPROM,EEPROM,EAROM),使用選擇表9第二行的常量參數,代入公式4.7后即可得到πT。
3.3 Mission Profile對BFR的影響
SN 29500-2:2010第4.3節提出集成電路在“持續工作狀態”和“間斷工作狀態”這兩個概念,可由芯片集成商考慮在實際Mission Profile中是否需要使用πW因子。使用πW因子對BFR進一步修正,其計算公式如下:
其中:
λ:即根據公式4.1~4.4,已經考慮了πU和(或)πT的BFR計算結果;
W:設備中的元器件在應力條件工作的時間比率。當W=1時,πW=1,意味著元器件長期處于應力條件下工作;
R:是一個常量,對于集成電路而言該常量為0.08。該常量的意義是考慮在非應力條件下,元件也會失效;
λ0:在“等待狀態”溫度下的失效率,其計算公式為λ0=λref*πT(θ0),其中λref表示基于參考條件的參考失效率(如表2所列),將等待狀態溫度θ0代入前面的公式4.7得到πT(θ0)。
SN29500并未提及環境溫度的具體參數,可以參考IEC/TR 62380:2004表8的taemean day-light/night(全球晝夜平均溫度)14℃來評估θ0,但這只適用于“室溫環境、待機無發熱、標準地理區域”使用的元件,不適用于“封閉環境、特殊高溫區、待機發熱明顯”的情況。
IEC/TR 62380:2004表8--全球平均溫度
與上述θ0溫度評估不同的是,Mission Profile同樣影響3.2節的θu取值,尤其在汽車使用工況中,芯片周邊經歷的環境溫度并非固定不變的,因此需要考慮多個溫度區間,例如下面提供的例子,θu包括-10℃~80℃環境溫度,通過將每個θu對應的θvj,2(實際參考節溫)代入公式4.7,則可以得到每個環境溫度下的πT,最后根據每個溫度區間所占的時間比例對πT進行加權平均。
θu對應環境溫度示例
4. SN29500應用示例
本節以ISO 26262-11:2018第4.6.2.1.2.2節為例,結合前述內容講解如何得到集成電路的BFR,具體如下:
一個晶體管數量在500k~5M范圍的CMOS微控制器數字集成電路(986432),工作期間的溫度為ΔTj= 26.27℃,假設不考慮供電電壓的影響(即πU=1)。根據上述信息,可通過查找表2得到參考失效率λref(80FIT)和參考等效結溫θvj,1(90℃);可通過查找表9得到常量參數(A, Ea1, Ea2, θU,ref),匯總后如下表所示:
計算示例的信息匯總
假設該集成電路應用于IEC/TR 62380:2004第5.8.3節汽車電機控制Mission Profile,500小時每年的運行時間,則Mission Profile信息可匯總如下:
計算示例的Mission Profile
根據上述信息,按如下步驟計算:
· 第1步:根據示例信息,選擇公式4.3;
· 第2步:根據示例信息,查找參考失效率λref= 80 FIT;
· 第3步:計算πU,本題不考慮電壓應力影響,假設使用電壓與參考電壓一致,則πU= 1;
· 第4步:計算每個環境溫度應力的πT,將示例信息代入公式4.7,計算得到:
Zref = 5.11
Z@32℃= 2.04;πT@32℃= 0.27
Z@60℃= 4.77;πT@60℃= 0.85
Z@85℃= 6.87;πT@85℃= 2.51
· 第5步:計算加權平均后的整體πT,
πT= (2%*πT@32°C+1.5%*πT@60°C+2.3%*πT@85°C)/ (2%+1.5%+2.3%) = 1.31
· 第6步:計算考慮了電壓應力和溫度應力的基礎失效率λ:
λ = λref*πU*πT= 80*1*1.31 = 105 FIT
完成第6步的計算后,得到的是元件在“持續運行”工況下的失效率λ,所以會顯得比較高,ISO 26262-11:2018第4.6.2.1.2.2節的示例是基于此情況計算的。
如果現實條件是“間斷運行”,則需要考慮元件的停機時間,即把3.3節的πW因子考慮到失效率評估中,這里增加第7個計算步驟如下:
· 第7步:考慮πW因子,由示例信息可知,工作時間占比為5.8%,非工作時間占比為94.2%,在非工作時間(即停機狀態下)使用IEC/TR 62380:2004表8全球晝夜平均溫度θu=14℃作為元件的等待狀態溫度θ0,則:
πT(θ0) =πT@14℃= 0.04
λ0= λref*πT(θ0)= 80 * 0.04 = 3.2 FIT
πW=W+R+λ0/λ*(1-W)= 5.8%+0.08+3.2/105*94.2% = 0.17
λW= λ * πW= 105 * 0.17 = 18 FIT
綜上所述,Mission Profile對元件失效率的影響是非常顯著的,在實際估算工作中,應考慮元件實際的應用場景對基礎失效率進行修正。
審核編輯 黃宇
-
芯片
+關注
關注
459文章
52425瀏覽量
439654
發布評論請先 登錄
最新人工智能硬件培訓AI 基礎入門學習課程參考2025版(大模型篇)
BLDC驅動必修課:為何現代MOSFET驅動IC偏愛“上高下高”邏輯???

高壓連接器如無防觸手有多可怕?凌科M28型防觸手工業級連接器解析

電機基本理論與工程實踐
知行科技《基于仿真方法量化AEB系統功能安全閾值》入選智能網聯汽車功能安全典型案例
活動回顧 艾體寶 開源軟件供應鏈安全的最佳實踐 線下研討會圓滿落幕!

MES系統的最佳實踐案例
抗振抗沖擊是工業級連接器的“必修課”,解讀BD系列連接器的抗振性能

邊緣計算架構設計最佳實踐
芯片封裝工藝集成工程師的必修課程指南

天璣9400 支持MediaTek Xtra Range 3.0技術,Wi-Fi 7技術讓信號多穿兩層樓

如何利用智能數據化分析物流狀態增加安全性

評論