Zuverlässigkeit von Systemen beim Einsatz von Machine Learning

Beim Einsatz von Machine Learning ist außer der Genauigkeit der gelernten Information auch das darunter liegende Rechensystem von zentraler Bedeutung für die Zuverlässigkeit. Treten Fehler in der Recheninfrastruktur auf, wird die Korrektheit der Anwendung gefährdet.

Im vorliegenden Projekt wird genau dieser Zusammenhang untersucht. In einer ersten Analyse wurde eine konkrete Hardware-Architektur modelliert und es wurden Fehler in das Rechensystem injiziert. Dafür wurden zunächst Künstliche Neuronale Netze mittels der Frameworks Keras und Tensorflow trainiert. Diese Neuronalen Netze werden dann exportiert und in die zugrunde liegenden Operationen zerlegt. Die anschließende Ausführung von Klassifikationen auf der simulierten Hardware-Architektur erlaubt es, Fehler zu injizieren und deren Auswirkung auf Ebene der Anwendung zu bestimmen.

Einfache Hardware Architektur zur Beschleunigung von Machine Learning Anwendungen
Resultate der Fehlerinjektion - je nach Ort der Fehlerinjektion resultiert eine andere Fehlerrate auf Anwendungsebene
Avatar
Görschwin Fey
Professor

Entwurfsautomatisierung, digitale Schaltungen und Systeme, Fehlertoleranz, Robustheit

Related