Cuando la Radiación Impacta en los Circuitos Electrónicos

Introducción del Editor Invitado: Cecilia Metra, Julio 2016

Read the Guest Editors' Introduction in
English  |  Chinese

Translations by Osvaldo Perez and Tiejun Huang


Listen to the Guest Editors' Introduction

English:

 

Spanish:

 

Chinese:

Security, Privacy, and Surveillance

En la introducción de la edición de Septiembre de 2015 de Computing Now, he debatidosobre como la electrónica se empequeñece, y el desempeño y complejidad de loscircuitos integrados, (IC) conducen a la vulnerabilidad de diversos fenómenosque amenazan las confiabilidad en el campo. Tal tema explora un fenómeno enparticular: la inestabilidad en el corrimiento de la temperatura. Asimismo,otros desafíos son igualmente relevantes, entre los que se incluyen lavulnerabilidad a los fallos por radiación inducida.

La edición de Julio de 2016 de Computing Nowexamina los efectos de la radicación en la confiabilidad de los circuitos, asícomo propone aproximaciones para su mejoramiento

Fallos por Radiación Inducida

Cuando las partículas energéticas generadas por laactividad solar, (tales como los protones, iones pesados, partículas alfa yneutrones), impactan sobre un sustrato de silicio, se generan y desplazan paresde hueco-electrón en el sustrato. Si son recolectados por una fuente activa yse drenan por difusión en el transistor, tales pares hueco-electrón, alteran elestado de carga de los nodos internos del IC, causando una discontinuidad en latensión, usualmente referida como fallo por radiación inducida, que es un fallotransitorio, o un transitorio de evento simple.

Si los nodos afectados pertenecen a elementos dememoria, las fallas por radiación inducida pueden causar un error lógico a lasalida, usualmente llamado error suave (SE), o evento simple de conflicto. Silos nodos afectados pertenecen a un bloque lógico podrían propagarse hasta laentrada de un elemento de muestreo de bajada, y luego causar un (SE). Estoocurre cuando el filtrado eléctrico de los circuitos entre el nodo afectado yel elemento cerrojo de la entrada, así como el filtrado lógico de lascompuertas lógicas que quedan interpuestas, son tales que las fallas porradiación inducida se propagan hasta el elemento de cerrojo de la entrada conla amplitud y duración apropiadas. Sin embargo, el tiempo de arribo de losfallos de radiación inducida al elemento de cerrojo de entrada deberíansatisfacer son restricciones de establecimiento y tiempo de retención conrespecto a al instante de muestreo. El SE en el elemento de muestreo podríacomprometer la operación correcta de todo el sistema en su operación, con elconsecuente daño para su confiabilidad.

Aunque estos errores siempre han sido un problemapara la electrónica utilizada en aviación y en la exploración especial, ahoratambién se presentan como preocupaciones mayores para la electrónica depropósito general. Los tamaños de transistores más pequeños implican unescalado descendente para las fuentes de tensión y una reducción de la capacitanciaasociada a los nodos de los CI, incrementando ambos la susceptibilidad a losfallos por radiación inducida. Los investigadores han dedicado esfuerzosintensos para analizar y modelar los fallos por radiación inducida en los CIs,tanto en la estimación de la sensibilidad del CI como en el desarrollo detécnicas dirigidas a la mejora de su tolerancia.

En esta Edición

Los cuatro artículos del tema de este mes discutenlos enfoques innovadores para el diseño robusto de elementos de memoria,procesadores embebidos y unidades graficas tolerantes a la radiación, tanto enla teoría como en la práctica.

En el artículo “Cerrojos Robustos de AltoDesempeño”, del cual soy coautora, junto con Martin Omaña y Daniele Rossi, sepresentas dos cerrojos que son insensibles a los fallos por radiación inducida.El primer cerrojo es adecuado para las arquitecturas que no utilizan clockgating (CG) (puertas para el reloj), para reducir el consumo de potencia. Enrealidad, los fallos por radiación inducida que afectan a algunos nodosinternos pueden dejar a los nodos externos en el estado de alta impedancia. Siel CG estuviera activado, el nodo de alta impedancia podría ser cargado odescargado impropiamente a un valor lógico incorrecto, debido a corrientes deperdida, generando una salida SE potencia. Sin el CG, la salida no permanece enel estado de alta impedancia el tiempo suficiente como para posibilitar lascorrientes de perdida para cargar o descargar la capacitancia asociada. Elsegundo cerrojo es adecuado para las arquitecturas que emplean CG porque susalida no se puede mantener en el estado de alta impedancia cuando los fallospor radiación inducida afectan a cualquiera de los nodos internos.

En el artículo “Evaluando las sobrecargas de laProtección de Errores Suaves en los Núcleos de Procesadores”, Lukas G. Szafaryn,Brett H. Meyes y Kevin Skadron, analizan los fallos por radiación inducida y relacionanla SE en los núcleos de los procesadores. Proponen una herramienta para evaluarel área, el retardo y las sobrecargas por energía de varias técnicas deprotección de SE tradicionales, incluyendo algunos enfoques de diseño robustopara disparadores, códigos de corrección de errores, redundancia espacial ytemporal y códigos de detección de errores. Particularmente, la herramientautiliza implementaciones sintetizadas de estas técnicas para evaluar loscompromisos del diseño. Los autores consideran un núcleo simple OpenRISC comocaso de estudio, examinan el SE que afecta a un bit simple (también referidocomo ofuscamiento de bit simple), así como aquellos que afectan a bits múltiplesde celdas vecinas o componentes lógicos simultáneos (ofuscamiento de bitmúltiples o MBSs).

En el artículo de Lawrence T. Clarck y sus colegas ”Solidificaciónde la Radiación por Mirco arquitectura y Circuitería en un MicroprocesadorEmbebido”, proponen el diseño de la solidificación de la radiación de un núcleode microprocesador, combinando los enfoques tradicionales de tolerancia afallos en el nivel de la micro arquitectura, (tales como la detección de ofuscamientomientras las instrucciones se encuentran en el estado especulativo, así como enla reinicialización de instrucciones), con circuitos solidificados y un diseñofísico apropiado, (como el reforzamiento de la separación en los nodos críticospara evitar los MBUs). Los autores verifican los circuitos de solidificaciónpor medio de una prueba con rayo ancho de protón e iones pesado.

Nota delTraductor: Se ha traducido el termino Hardened por Solidificar, en lugar de Endurecer,ya que el concepto en Ingles es hacer algo más sólido, (y no más duro), desdeel enfoque de la seguridad

En el artículo final “Evaluación y Mitigación deErrores Suaves por Radiación Inducida en las Unidad de Procesamiento Grafico”. DanielAlonso Gonçalves de Oliveira y sus colegas analizan los fallos de radiacióninducida y la confiabilidad del GPU, por medio del estudio analítico de casosde estudio de dos series de GPU comercialmente disponibles y una serie depruebas de haces extensivos acelerados. Los datos proporcionan una estimaciónrealista de la tasa de error de las GPU modernas que quedan expuestas a hacesnaturales de neutrones, así como a una evaluación de la arquitectura adoptadade la efectividad de las soluciones de solidificación por software. Losresultados del análisis resultando son altamente relevantes para la computaciónde alto desempeño y las aplicaciones de salvaguardias críticas, para las cualeslos desarrolladores están adoptando en forma creciente a las GPUs, dada suvelocidad de computación, bajo costo, eficiencia energética y flexibilidad enla plataforma de desarrollo.

Video Perspectives
Transcript: Spanish (pdf) | Chinese (pdf)

Monica Alderighi offers insights into radiation-induced faults in terrestrial applications.


Yervant Zorian discusses radiation challenges in safety-critical electronic systems.

Perspectivas en Video

En el tema de este mes incluimos dos videosrelevantes de expertos en este campo.

En el primer video, Monica Alderighi del InstitutoNacional Italiano de Astrofísica ofrece sus visiones sobre los fallos porradiación inducida en las aplicaciones terrestres.

En el segundo video, Yervant Zorian de Synopsys,discute los desafíos de la radiación en la salvaguardia de los sistemaselectrónicos críticos y repasa algunas de las soluciones técnicas que laindustria está adoptando.

Esperamos que esta edición de Computing Now sirvacomo una fuente para resaltar los mayores desafíos relacionados con los fallospor radiación inducida y las técnicas para tratarlos y estimule unainvestigación adicional en el campo.

Editor Invitado

Cecilia Metra es laEditora en Jefe de Computing Now y profesor de tiempo complete de electrónicaen la Universidad de Boloña, Italia. Sus intereses de Investigación son eldiseño y medición de sistemas digitales, diseño de sistemas confiables yresistentes a errores, tolerancia a fallos, tecnologías emergentes y nanocomputacion,sistemas de seguridad, sistemas para la recolección de energía y sistemasfotovoltaicos. Metra posee un Doctorado en ingeniería electrónica y ciencia dela computación de la Universidad de Boloña. Es miembro del Board of Governorsde la IEEE Computer Society y del Comité Ejecutivo. Participa en varios comitéseditoriales en diversos Journals profesionales y ha servido como chair general,chair de programa, co’chair de programa y miembro del comité técnico endiversas Conferencias, Simposios y Workshops, patrocinados por el IEEE. Metraes miembro Fellow del IEEE y Miembro del Golden Core de la IEEE ComputerSociety, de la cual ha recibido tres premios al Servicio Meritorio y dosCertificados de Apreciación. Se la puede contactar en cecilia.metra@unibo.it.

 

Average (0 Votes)
The average rating is 0.0 stars out of 5.

Article Comments

Please log in to comment.