Downloads provided by UsageCounts
Les unités de traitement graphique sont des solutions disponibles pour les applications de haute performance critiques pour la sécurité, telles que les voitures autonomes. Dans ce domaine d'application, la sécurité fonctionnelle et la fiabilité sont des préoccupations majeures. Ainsi, l'adoption de techniques de tolérance aux pannes est obligatoire pour détecter ou corriger les pannes, car ces dispositifs doivent fonctionner correctement, même en présence de pannes. Les GPU sont conçus et mis en œuvre avec des technologies de pointe, ce qui les rend sensibles aux pannes causées par les interférences de rayonnement, telles que les perturbations d'événements uniques. Ces effets peuvent conduire le système à une panne, ce qui est inacceptable dans les applications critiques pour la sécurité. Par conséquent, des stratégies de détection et d'atténuation efficaces doivent être adoptées pour durcir le fonctionnement du GPU. Dans cet article, nous analysons les effets transitoires dans les registres de pipeline d'une architecture GPU. Nous exécutons quatre applications dans trois configurations GPU, en tenant compte de la source de la panne, de son effet sur le GPU et de l'utilisation de techniques de durcissement logicielles. L'évaluation a été effectuée à l'aide d'un GPU à cœur souple à usage général basé sur l'architecture NVIDIA G80. Les résultats peuvent guider les concepteurs dans la construction d'architectures GPU plus résilientes.
Las unidades de procesamiento de gráficos son soluciones disponibles para aplicaciones críticas para la seguridad de alto rendimiento, como los automóviles autónomos. En este dominio de aplicaciones, la seguridad funcional y la confiabilidad son las principales preocupaciones. Por lo tanto, la adopción de técnicas de tolerancia a fallas es obligatoria para detectar o corregir fallas, ya que estos dispositivos deben funcionar correctamente, incluso cuando hay fallas. Las GPU están diseñadas e implementadas con tecnologías de vanguardia, lo que las hace sensibles a las fallas causadas por la interferencia de radiación, como los trastornos de un solo evento. Estos efectos pueden llevar al sistema a una falla, lo cual es inaceptable en aplicaciones críticas para la seguridad. Por lo tanto, se deben adoptar estrategias efectivas de detección y mitigación para endurecer el funcionamiento de la GPU. En este documento, analizamos los efectos transitorios en los registros de tuberías de una arquitectura de GPU. Ejecutamos cuatro aplicaciones en tres configuraciones de GPU, considerando la fuente de la falla, su efecto en la GPU y el uso de técnicas de endurecimiento basadas en software. La evaluación se realizó utilizando una GPU de núcleo blando de propósito general basada en la arquitectura NVIDIA G80. Los resultados pueden guiar a los diseñadores en la construcción de arquitecturas de GPU más resistentes.
Graphics processing units are available solutions for high-performance safety-critical applications, such as selfdriving cars.In this application domain, functional-safety and reliability are major concerns.Thus, the adoption of fault tolerance techniques is mandatory to detect or correct faults, since these devices must work properly, even when faults are present.GPUs are designed and implemented with cutting-edge technologies, which makes them sensitive to faults caused by radiation interference, such as single event upsets.These effects can lead the system to a failure, which is unacceptable in safetycritical applications.Therefore, effective detection and mitigation strategies must be adopted to harden the GPU operation.In this paper, we analyze transient effects in the pipeline registers of a GPU architecture.We run four applications at three GPU configurations, considering the source of the fault, its effect on the GPU, and the use of software-based hardening techniques.The evaluation was performed using a general-purpose soft-core GPU based on the NVIDIA G80 architecture.Results can guide designers in building more resilient GPU architectures.
وحدات معالجة الرسومات هي حلول متاحة للتطبيقات عالية الأداء للسلامة الحرجة، مثل السيارات ذاتية القيادة. في مجال التطبيق هذا، تعتبر السلامة الوظيفية والموثوقية من الاهتمامات الرئيسية. وبالتالي، فإن اعتماد تقنيات تحمل الأخطاء أمر إلزامي للكشف عن الأخطاء أو تصحيحها، حيث يجب أن تعمل هذه الأجهزة بشكل صحيح، حتى عندما تكون الأعطال موجودة. تم تصميم وحدات معالجة الرسومات وتنفيذها باستخدام تقنيات متطورة، مما يجعلها حساسة للأعطال الناجمة عن التداخل الإشعاعي، مثل اضطرابات الأحداث الفردية. يمكن أن تؤدي هذه التأثيرات إلى فشل النظام، وهو أمر غير مقبول في التطبيقات الحرجة للسلامة. لذلك، يجب اعتماد استراتيجيات فعالة للكشف والتخفيف من أجل تقوية تشغيل وحدة معالجة الرسومات. في هذه الورقة، نقوم بتحليل التأثيرات العابرة في سجلات خطوط الأنابيب لبنية وحدة معالجة الرسومات. نقوم بتشغيل أربعة تطبيقات في ثلاثة تكوينات لوحدة معالجة الرسومات، مع الأخذ في الاعتبار مصدر الخطأ، وتأثيره على وحدة معالجة الرسومات، واستخدام تقنيات الصلابة القائمة على البرامج. تم إجراء التقييم باستخدام وحدة معالجة الرسومات ذات الغرض العام على أساس بنية NVIDIA GR80. يمكن أن يكون دليل التصميم في بناء وحدات معالجة الرسومات أكثر مرونة.
Parallel computing, Computer Networks and Communications, Fault Tolerance, Lithium-ion Battery Management in Electric Vehicles, FOS: Mechanical engineering, Quantum mechanics, Engineering, graphics processing units, Fault injection, FOS: Electrical engineering, electronic engineering, information engineering, Electrical and Electronic Engineering, Embedded system, Fault tolerance, graphics processing units, pipeline registers, single event upsets, Physics, Fault tolerance, pipeline registers, Power (physics), Computer science, Operating system, Fault Tolerance in Electronic Systems, Reliability (semiconductor), Graphics processing unit, Physical Sciences, Automotive Engineering, Computer Science, Graphics, single event upsets, Pipeline (software), Transient Faults, Distributed Fault Tolerance and Consistency in Systems, Single Event Upsets, Software
Parallel computing, Computer Networks and Communications, Fault Tolerance, Lithium-ion Battery Management in Electric Vehicles, FOS: Mechanical engineering, Quantum mechanics, Engineering, graphics processing units, Fault injection, FOS: Electrical engineering, electronic engineering, information engineering, Electrical and Electronic Engineering, Embedded system, Fault tolerance, graphics processing units, pipeline registers, single event upsets, Physics, Fault tolerance, pipeline registers, Power (physics), Computer science, Operating system, Fault Tolerance in Electronic Systems, Reliability (semiconductor), Graphics processing unit, Physical Sciences, Automotive Engineering, Computer Science, Graphics, single event upsets, Pipeline (software), Transient Faults, Distributed Fault Tolerance and Consistency in Systems, Single Event Upsets, Software
| selected citations These citations are derived from selected sources. This is an alternative to the "Influence" indicator, which also reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically). | 6 | |
| popularity This indicator reflects the "current" impact/attention (the "hype") of an article in the research community at large, based on the underlying citation network. | Top 10% | |
| influence This indicator reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically). | Average | |
| impulse This indicator reflects the initial momentum of an article directly after its publication, based on the underlying citation network. | Top 10% |
| views | 4 | |
| downloads | 17 |

Views provided by UsageCounts
Downloads provided by UsageCounts