Datenbestand vom 10. Dezember 2024
Verlag Dr. Hut GmbH Sternstr. 18 80538 München Tel: 0175 / 9263392 Mo - Fr, 9 - 12 Uhr
aktualisiert am 10. Dezember 2024
978-3-8439-3283-7, Reihe Elektrotechnik
Oliver Lomp Cognitive object recognition based on dynamic field theory
316 Seiten, Dissertation Ruhr-Universität Bochum (2017), Hardcover, A5
Unser Gehirn ist erstaunlich gut darin, die große Menge visueller Informationen zu verarbeiten, die von unseren Augen aufgenommen wird. Diese Leistung in künstlichen Sehsystemen nachzubilden ist eine große Herausforderung. Moderne Ansätze bilden dabei schnelle Vorwärtspfade des Kategorisierungssystems im visuellen Cortex nach. Andere wichtige Fähigkeiten des Sehsystems werden dabei oft nicht modelliert, zum Beispiel die Fähigkeit, neue Objekte schnell zu lernen und in neuen Posen zu erkennen. Dies ist zum Teil auf Lücken in unserem Verständnis der funktionellen Architektur biologischer Sehsysteme zurückzuführen. Ein Modell, dessen Ziel es ist, einige dieser Lücken zu schließen nutzt lokale Histogramme für gleichzeitiges Erkennen und schätzen der Objektpose. Es basiert auf der dynamischen Feldtheorie, einer mathematischen Methode zur Modellierung kognitiver Prozesse. Ich erweitere dieses Objekterkennungsmodell um die Fähigkeit, aufmerksamkeitsbasiert Objekte in einer Szene sequenziell zu betrachten, sowie ein Arbeitsgedächtnis für die erkannten Identitäten.
Ergebnis dieser Erweiterung ist ein großes dynamisches System das vollständig auf den Prinzipien der dynamischen Feldtheorie beruht. Ich evaluiere dieses System mithilfe einer eigens erstellten Datenbank und zeige, dass auch vom kombinierten System weiterhin akzeptable Erkennungsraten erreicht werden.
Ich beschreibe außerdem eine Erweiterung, die es dem System erlaubt eine Repräsentation zu nutzen, die die räumliche Anordnung der Merkmale der Objekte besser erhält als die zuvor genutzten lokalen Histogramme. Diese Repräsentation erdet das System stärker in neuronalen Prinzipien der Sprache der dynamischen Feldtheorie. Sie erlaubt die Skalierung des Inputs, sowie die Orientierung über den gesamten Winkelbereich zu schätzen. Weiterhin werden bisher unbehandelte Grenzfälle aufgedeckt. Zu deren Behandlung führe ich Änderungen an den neuronalen Dynamiken des Objekterkennungssystems ein. Ich demonstriere, dass das System mit der neuen Repräsentation bessere Erkennungsleistung liefert. Weiterhin analysiere ich die Eigenschaften des Systems um einen Vergleich mit dem menschlichen Sehsystem zu ziehen. Dabei zeige ich poseninvariantes Verhalten, welches in der Literatur sonst ansichtsbasierten Systemen zugeschrieben wird.