Dokument: Process Automation and Quality Assurance in Computer Vision for Real World Applications

Titel:

Process Automation and Quality Assurance in Computer Vision for Real World Applications

Weiterer Titel:

Prozessautomatisierung und Qualitätssicherung in der Computer Vision für Echte-Welt-Anwendungen

URL für Lesezeichen:

https://docserv.uni-duesseldorf.de/servlets/DocumentServlet?id=63239

URN (NBN):

urn:nbn:de:hbz:061-20230726-101907-0

Kollektion:

Dissertationen

Sprache:

Englisch

Dokumententyp:

Wissenschaftliche Abschlussarbeiten » Dissertation

Medientyp:

Text

Autor:

Bogomasov, Kirill [Autor]

Dateien:

[Dateien anzeigen]	Adobe PDF
[Details]	11,30 MB in einer Datei
[ZIP-Datei erzeugen]
Dateien vom 26.07.2023 / geändert 26.07.2023

Beitragende:

Prof. Dr. Conrad, Stefan [Gutachter]
Prof. Dr. Dickscheid, Timo [Gutachter]

Stichwörter:

Computer Vision, Künstliche Intelligenz

Dewey Dezimal-Klassifikation:

000 Informatik, Informationswissenschaft, allgemeine Werke » 004 Datenverarbeitung; Informatik

Beschreibungen:

Proceeding digitization leads to a growing amount of computationally processible and
storable information. In fact, at no time the amount of data was as huge as it is
today during the Digital Revolution and far beyond the volume, which is manually
manageable. Visual data is one of the most important among all data types because of
its unsophisticated interpretability for humans and high information density. However,
there is also a major drawback. Working on visual data is computationally expensive.
The progressive development of the hardware in recent years, especially the graphic
units, as well as its affordability allow complex analysis in terms of visual inspection.
Consequentially, automation and quality assurance of processes get feasible based on
the image data interpretation.
This work deals with the following question: How can image data be computationally
processed, analyzed and interpreted to allow automation of a
conventionally manual process and assure its quality? To answer this question,
we consider three independent image source areas: medical imaging, underwater
photographs and natural images. The showcased selection presents its strengths in
different image characteristics representative for particular data. The medical imaging,
consisting of CT- and MRI-recordings, is presented as 3D images and therefore contain
depth information while being standardized to specific scanners. The underwater photographs
compose a large-scale collection of images belonging to a coral reef monitoring
project around the world and naturally differing in quality regarding sharpness and
color balance. The natural images are taken from an ongoing sales process by rather
primitive hardware and therefore contain several differences regarding visual obstacles
and lower resolution as well as image quality in general.
Due to different data characteristics, diverse approaches are required. During
examining the research question, we tackle a series of challenging classification and
object detection tasks. As a result, in this thesis we present multiple novel machine
learning and deep learning algorithms. Concerning medical imaging, we investigate
severity scoring for lung tuberculosis in CT-recording and compare traditional feature
engineering and deep learning. Moreover, we introduce a unique algorithm for the
orientation estimation of prostate cancer patients in MRI-recordings. Apart from the
medical application field, we present two competitive approaches for maritime inventory
monitoring. Furthermore, we propose a novel approach for efficient counting and
classification in retail applications. All research results presented in this work can be
assigned to the field of AI and have the main focus on computer vision.
Overall, our approaches on various real-world data show convincing results regarding the main research question and show the potentials as well as limitations in applying computer vision to solve quality assurance of processes and automation tasks. Furthermore, we propose several algorithms which are at least competitive to the state-state-of-the-art
or even are state-of-the-art in the field of deep learning and computer vision.

Die fortschreitende Digitalisierung führt zu einer wachsenden Menge an maschinell verarbeitbaren
und speicherbaren Informationen. Die tatsächliche Datenmenge war zu keiner
Zeit so groß wie heute während der digitalen Revolution. Die Tendenz bleibt steigend.
Dabei ist deren Menge bereits heute größer als jene, die manuell verarbeitbar wäre. Unter
allen dabei entstandenen Datenarten gehören Bilddaten aufgrund ihrer vorteilhaften
Eigenschaften wie zum Beispiel der einfachen Interpretierbarkeit für Menschen und der
hohen Informationsdichte, zu den wichtigsten aller Datenarten. Dennoch sind gerade
diese sehr rechenlastig und erfordern für die Verarbeitung entsprechende Hardware. Die
fortschreitende Entwicklung dieser in den letzten Jahren, insbesondere der grafischen
Einheiten sowie ihre Erschwinglichkeit, nicht nur für große Rechenzentren, sondern auch
für einfache Nutzende, schaffen Grundlage für komplexe visuelle Analysen und Inspektionen.
Damit werden Automatisierung und Qualitätssicherung von Prozessen, die auf
der Bilddateninterpretation basieren, realisierbar. Folglich beschäftigt sich diese Arbeit
mit folgender Frage: Wie lassen sich Bilddaten rechnergestützt verarbeiten,
analysieren und interpretieren, um eine Automatisierung von traditionell
manuell durchgeführten Prozessen und deren Qualität zu sichern? Um diese
Frage beantworten zu können, werden drei unabhängige Bildquellenbereiche betrachtet:
medizinische Bilder, Unterwasseraufnahmen und gewöhnliche 2D-Aufnahmen. Die
Auswahl weißt unterschiedliche charakteristische Bildeigenschaften vor, die für diese
Datentypen repräsentativ sind. Die medizinische Datengrundlage setzt sich aus CTund
MRT-Bildern, die als 3D Aufnahmen vorliegen, zusammen und besitzt deshalb
eine Tiefeninformation, die für die entsprechenden Aufnahmegeräte (Scanner) standardisiert
ist. Die Unterwasserbilder bilden eine weitere Kategorie. Der vorliegende
Datensatz setzt sich zusammen aus hochauflösenden Bildern von Korallenriffen, die auf
der ganzen Welt im Rahmen eines Bestandsüberwachungsprojekts gesammelt wurden
und sich dementsprechend in der Qualität hinsichtlich der Schärfe und der Farbbalance
stark unterschieden. Die Sammlung der gewöhnlichen 2D-Bilder stammt aus
dem laufenden Verkaufsprozess unterschiedlicher Supermärkte. Die Bilder wurden
durch eine kostengünstige Hardware aufgenommen und verfügen über eine geringere
Auflösung. Zusätzlich besteht eine Reihe von Schwierigkeiten in Bezug auf visuelle
Hindernisse. Aufgrund unterschiedlicher Eigenschaften, die die verschiedenen Bildtypen
mit sich bringen, sind in Bezug auf die Fragestellung unterschiedliche Herangehensweisen
erforderlich. Während der Untersuchung der Forschungsfrage gehen wir eine Reihe
herausfordernder Klassifikations- und Objekterkennungsaufgaben unter Berücksichtigung
dieser Nuancen an. Die Lösungen dieser Aufgaben stellen wir in dieser Arbeit in
Form von mehreren neuartigen Maschine Learning und Deep Learning Algorithmen vor. Auf den medizinischen Daten der Radiologie, wurde der Frage nachgegangen,
wie sich automatisch der Schweregrad der Lungentuberkulose anhand von CT-Bildern
ermitteln lässt. Dabei wurde traditionelles Feature Engineering und Deep Learning
gegenübergestellt. Darüber hinaus führen wir einen einzigartigen Algorithmus zur
Bestimmung der Orientierung von MRT-Aufnahmen von an Prostatakrebs erkrankten
Patienten ein. Neben dem medizinischen Anwendungsbereich werden zwei State-ofthe-
Art Ansätze für die Bestandsüberwachung von Korallen vorgestellt. Außerdem
präsentieren wir einen neuartigen Ansatz für effizientes Zählen und Klassifizieren für
den Einsatz im Einzelhandel. Alle in dieser Arbeit vorgestellten Forschungsergebnisse
lassen sich dem Bereich der KI zuordnen und haben den Schwerpunkt Computer Vision.
Insgesamt zeigen unsere Ansätze auf den verschiedenen Datensätzen aus der realen Welt
im Hinblick auf die Hauptforschungsfrage überzeugende Ergebnisse und decken sowohl
die Potenziale als auch die Grenzen der Verwendung von Computer Vision zu Zwecken
der Qualitätssicherung und der Automatisierung von Prozessen auf. Darüber hinaus
stellen wir mehrere Algorithmen vor, die entweder konkurrenzfähig zu den aktuellen
State-of-the-Art Verfahren im Bereich von Deep Learning und Computer Vision sind
oder sogar selbst State-of-the-Art Verfahren bilden.

Lizenz:

Dieses Werk ist lizenziert unter einer Creative Commons Namensnennung 4.0 International Lizenz

Fachbereich / Einrichtung:

Mathematisch- Naturwissenschaftliche Fakultät » WE Informatik » Datenbanken und Informationssysteme

Dokument erstellt am:

26.07.2023

Dateien geändert am:

26.07.2023

Promotionsantrag am:

10.01.2023

Datum der Promotion:

13.07.2023

Heinrich-Heine-Universität Düsseldorf

Dokument: Process Automation and Quality Assurance in Computer Vision for Real World Applications