当辐射冲击电路

客座编辑导言 • Cecilia Metra • 2016年6月

阅读其他语种的客座编辑导言
西班牙语 | 英语

译者:奥斯瓦尔多·佩雷斯 和 黄铁军


倾听客户编辑导言

英语:

 

西班牙:

 

中文:

When Radiation Hits Electronic Circuits

我在2015年9月今日计算 中,讨论了随着微电子特征尺寸缩减,集成电路性能得到提升,复杂性随之增加,数种现象造成的影响变得显著,开始危及可靠性。那期专门讨论了其中的一种现象:偏置温度不稳定。然而,其他几项挑战也大有关联,例如辐射引发故障造成的影响。

今日计算2016年7月号聚焦于辐射对集成电路可靠性的影响以及解决这个问题的方案。

辐射引发的故障

当太阳活动产生的高能粒子(如质子,重离子,α粒子和中子)撞击集成电路硅基板时,就会在基板产生移动的电子-空穴对。如果在晶体管的有源源极和漏极聚集,这些电子-空穴对就会改变集成电路内部节点的充电状态,并导致电压故障,通常称为辐射引发的故障,这是一种瞬时故障,一种单事件的瞬态电压毛刺。

如果受影响的节点是存储元件,则辐射引发的故障可能引起输出逻辑错误,通常称为软错误(SE),或单事件翻转。如果受影响的节点属于逻辑块,可能就会一直传播到下游取样元件的输入端,然后引起一个SE。当受影响的节点和闩锁元件输入之间电路的电子滤波以及插入逻辑门的逻辑滤波使得辐射引发的故障一直以适当幅度和持续时间传播到闭锁元件时,就会发生这种情况。此外,辐射引发的故障到达闩锁元件输入的时间应满足其设置和保持时间相对于该采样时刻的约束。采样单元输出端的软件错误可能会危及场内整个系统的正常运行,从而伤及可靠性。

这些错误对航空航天领域的电子产品从来都是一个问题,现在也已经成为常规电子产品关注的主要问题。更小的晶体管尺寸意味着电压电源和集成电路节点附带的电容都要等比例缩小,两者都增加了对辐射引发的故障的易感性。研究人员已经投入大量努力对集成电路中辐射引起的故障进行分析和建模,包括估计集成电路的灵敏度,以及开发提高其耐受度的技术。

本期内容

本月主题的四篇文章从理论和实践角度讨论了设计稳健的耐辐射存储器元件、嵌入式处理器和图形单元的创新方法。

“高性能稳健锁存器(High-Performance Robust Latches)”是我与Martin Omaña及Daniele Rossi合写的一篇文章,介绍了两种对辐射引起的故障不敏感的锁存器。第一种锁存器适用于不采用时钟门控(CG)的架构,可降低功耗。事实上,影响某些内部节点的辐射引发故障可以在高阻抗状态离开输出节点。如果CG被激活,由于存在泄露电流,不适当的充电或放电可能将高阻抗节点置于错误的逻辑值,从而输出SE。不采用CG,输出就不会长时间保持在高阻抗状态,也就不会导致泄露电流对关联电容进行充电或放电。第二种锁存器适合于采用CG的架构,因为当辐射诱发故障影响其内部任何节点时,它的输出就不能保持在高阻抗状态。

在“处理器内核多位软错误的开销评估(Evaluating Overheads of Multibit Soft-Error Protection in the Processor Core)”中,Lukasz G. Szafaryn, Brett H. Meyer和Kevin Skadron分析了处理器内核中辐射引起的故障及相关的软错误。他们提出了一种工具来评估各种传统软错误保护技术的面积、延迟和能耗开销,包括几种锁存器的稳健设计方法、纠错码、空间和时间冗余,以及检错码。特别地,该工具使用这些技术的综合实现来评估设计权衡。作者以一个简单的OpenRISC核作为个案,研究影响仅限一个比特的软错误(也称为单比特翻转),以及那些同时影响相邻区域或逻辑组件的多比特软错误(多比特翻转,MBUS)。

Lawrence T. Clark和他同事的“一种通过微体系结构和电路抗辐射的嵌入式微处理器(An Embedded Microprocessor Radiation Hardened by Microarchitecture and Circuits)”提出了一种抗辐射的微处理器核设计,在微架构层面采用传统容错方法(如当指令处于可疑状态时进行翻转检测,以及指令重启),并结合加固电路和适当的物理设计(如强制关键节点分离以避免MBUS)。作者通过质子和重离子束检测进行了检验。

在最后一篇文章“图形处理单元中辐射引起软错误的评估与解决方案(Evaluation and Mitigation of Radiation-Induced Soft Errors in Graphics Processing Units)”中,Daniel Alfonso Gonçalves de Oliveira及其同事们通过对两种商用GPU的案例分析和一系列加速波束测试对辐射引发故障和GPU可靠性进行了分析。论文数据对暴露在天然中子束中的现代GPU的差错率给出了实际估计,并对所采用的体系结构和软件加固方案的有效性进行了评估。分析结果关系到高性能计算和安全攸关应用,相关领域开发人员因为计算速度快,成本低,能效高,开发平台灵活等原因,越来越多采用GPU。

Video Perspectives
Transcript: Spanish (pdf) | Chinese (pdf)

Monica Alderighi offers insights into radiation-induced faults in terrestrial applications.


Yervant Zorian discusses radiation challenges in safety-critical electronic systems.

视频观点

本月主题包括两段来自该领域专家的视频。

第一个视频中,意大利国家天体物理研究所的Monica Alderigh就地面应用中辐射引发的故障发表了见解。

第二个视频中,Synopsys公司的Yervant Zorian讨论了安全攸关电子系统的辐射挑战,谈到了业内正在采用的一些技术解决方案。

希望本期今日计算作为辐射引起故障相关挑战和容忍技术的一个源头激发进一步研究。

客座编辑

Cecilia Metra今日计算主编,意大利博洛尼亚大学电子学教授。她的研究方向是数字系统测试,可靠和容错系统设计,容错,新兴技术和纳米计算,安全系统,能源收集系统,以及光伏系统设计和测试。Metra从博洛尼亚大学获得电子工程和计算机科学博士学位。她是IEEE计算机学会理事会和执行委员会委员。她担任了多个专业期刊的编委,并担任多个IEEE会议和研讨会的主席、程序委员会主席或共同主席、技术委员会委员。Metra是IEEE会士,IEEE计算机学会黄金核心成员,她获得过三枚功勋服务奖和感谢证书。她的联系方法是cecilia.metra@unibo.it

Average (0 Votes)
The average rating is 0.0 stars out of 5.

Article Comments

Please log in to comment.