Datenbestand vom 15. November 2024
Tel: 0175 / 9263392 Mo - Fr, 9 - 12 Uhr
Impressum Fax: 089 / 66060799
aktualisiert am 15. November 2024
978-3-8439-1666-0, Reihe Informationstechnik
Matthias Birk Effiziente Datenverarbeitung auf heterogenen Rechnerarchitekturen für die 3D-Ultraschall-Computertomographie
357 Seiten, Dissertation Karlsruher Institut für Technologie (2014), Softcover, A5
In dieser Arbeit werden erstmals Methoden zur Beschleunigung der Bildrekonstruktion in der 3D-Ultraschall-Computertomographie durch parallele Zielarchitekturen untersucht. Der Hauptfokus liegt in der Verwendung von Graphic Processing Units (GPUs) und Field Programmable Gate Arrays (FPGAs). Für verschiedene Varianten der Schritte einer Rekonstruktion werden optimierte Implementierungen vorgestellt und auf deren Basis die Leistungsfähigkeit sowie die Leistungsaufnahme von GPUs und FPGAs aus einem Halbleiterprozess in 40nm und 28nm bestimmt. Darauf aufbauend wird der Hardwareaufwand eines echtzeitfähigen Rekonstruktionssystems extrapoliert, das aus aktuell verfügbaren Bausteinen besteht oder sich durch Abschätzung zukünftiger Entwicklungen ergibt. Die Basis hierfür bilden die ermittelten Skalierungseigenschaften zwischen den untersuchten Generationen und GPU-Mikroarchitekturen.
Aus der vorliegenden Arbeit geht hervor, dass FPGAs für die untersuchten Algorithmen generell eine niedrigere Leistungsaufnahme und eine höhere Energieeffizienz als eine ähnlich komplexe GPU besitzen. Dahingegen weist keine der beiden Architekturen für alle Algorithmen einen höheren Durchsatz auf. Die umfassend höchste Beschleunigung für die durchlaufene Gesamtsequenz wird durch Einsatz einer heterogenen Bausteinkombination erzielt. Gegenüber eines Mehrkernprozessors ergibt sich unter deren Verwendung für ein Vorschaubild ein Faktor von 4,8 und für einen Stapel von Schichtbildern ein Faktor von 21. Damit lässt sich eine Vorschau in unter einer Sekunde berechnen und der Schichtstapel benötigt weniger als zehn Minuten anstatt zwei Stunden.
Die in dieser Arbeit ermittelten Werte von Durchsatz und Leistungsaufnahme bilden die Grundlage zur Dimensionierung eines eingebetteten Rekonstruktionssystems. Unter Berücksichtigung der erzielten Beschleunigungswerte wird der vorklinische Einsatz der 3D-USCT sowie die weitergehende Forschung zur Optimierung des Prototyps ermöglicht. Die Ergebnisse dieser Arbeit ermöglichten es erstmalig Rekonstruktionen in einer klinisch relevanten Zeit durchzuführen.