Dokument: Process Automation and Quality Assurance in Computer Vision for Real World Applications
Titel: | Process Automation and Quality Assurance in Computer Vision for Real World Applications | |||||||
Weiterer Titel: | Prozessautomatisierung und Qualitätssicherung in der Computer Vision für Echte-Welt-Anwendungen | |||||||
URL für Lesezeichen: | https://docserv.uni-duesseldorf.de/servlets/DocumentServlet?id=63239 | |||||||
URN (NBN): | urn:nbn:de:hbz:061-20230726-101907-0 | |||||||
Kollektion: | Dissertationen | |||||||
Sprache: | Englisch | |||||||
Dokumententyp: | Wissenschaftliche Abschlussarbeiten » Dissertation | |||||||
Medientyp: | Text | |||||||
Autor: | Bogomasov, Kirill [Autor] | |||||||
Dateien: |
| |||||||
Beitragende: | Prof. Dr. Conrad, Stefan [Gutachter] Prof. Dr. Dickscheid, Timo [Gutachter] | |||||||
Stichwörter: | Computer Vision, Künstliche Intelligenz | |||||||
Dewey Dezimal-Klassifikation: | 000 Informatik, Informationswissenschaft, allgemeine Werke » 004 Datenverarbeitung; Informatik | |||||||
Beschreibungen: | Proceeding digitization leads to a growing amount of computationally processible and
storable information. In fact, at no time the amount of data was as huge as it is today during the Digital Revolution and far beyond the volume, which is manually manageable. Visual data is one of the most important among all data types because of its unsophisticated interpretability for humans and high information density. However, there is also a major drawback. Working on visual data is computationally expensive. The progressive development of the hardware in recent years, especially the graphic units, as well as its affordability allow complex analysis in terms of visual inspection. Consequentially, automation and quality assurance of processes get feasible based on the image data interpretation. This work deals with the following question: How can image data be computationally processed, analyzed and interpreted to allow automation of a conventionally manual process and assure its quality? To answer this question, we consider three independent image source areas: medical imaging, underwater photographs and natural images. The showcased selection presents its strengths in different image characteristics representative for particular data. The medical imaging, consisting of CT- and MRI-recordings, is presented as 3D images and therefore contain depth information while being standardized to specific scanners. The underwater photographs compose a large-scale collection of images belonging to a coral reef monitoring project around the world and naturally differing in quality regarding sharpness and color balance. The natural images are taken from an ongoing sales process by rather primitive hardware and therefore contain several differences regarding visual obstacles and lower resolution as well as image quality in general. Due to different data characteristics, diverse approaches are required. During examining the research question, we tackle a series of challenging classification and object detection tasks. As a result, in this thesis we present multiple novel machine learning and deep learning algorithms. Concerning medical imaging, we investigate severity scoring for lung tuberculosis in CT-recording and compare traditional feature engineering and deep learning. Moreover, we introduce a unique algorithm for the orientation estimation of prostate cancer patients in MRI-recordings. Apart from the medical application field, we present two competitive approaches for maritime inventory monitoring. Furthermore, we propose a novel approach for efficient counting and classification in retail applications. All research results presented in this work can be assigned to the field of AI and have the main focus on computer vision. Overall, our approaches on various real-world data show convincing results regarding the main research question and show the potentials as well as limitations in applying computer vision to solve quality assurance of processes and automation tasks. Furthermore, we propose several algorithms which are at least competitive to the state-state-of-the-art or even are state-of-the-art in the field of deep learning and computer vision.Die fortschreitende Digitalisierung führt zu einer wachsenden Menge an maschinell verarbeitbaren und speicherbaren Informationen. Die tatsächliche Datenmenge war zu keiner Zeit so groß wie heute während der digitalen Revolution. Die Tendenz bleibt steigend. Dabei ist deren Menge bereits heute größer als jene, die manuell verarbeitbar wäre. Unter allen dabei entstandenen Datenarten gehören Bilddaten aufgrund ihrer vorteilhaften Eigenschaften wie zum Beispiel der einfachen Interpretierbarkeit für Menschen und der hohen Informationsdichte, zu den wichtigsten aller Datenarten. Dennoch sind gerade diese sehr rechenlastig und erfordern für die Verarbeitung entsprechende Hardware. Die fortschreitende Entwicklung dieser in den letzten Jahren, insbesondere der grafischen Einheiten sowie ihre Erschwinglichkeit, nicht nur für große Rechenzentren, sondern auch für einfache Nutzende, schaffen Grundlage für komplexe visuelle Analysen und Inspektionen. Damit werden Automatisierung und Qualitätssicherung von Prozessen, die auf der Bilddateninterpretation basieren, realisierbar. Folglich beschäftigt sich diese Arbeit mit folgender Frage: Wie lassen sich Bilddaten rechnergestützt verarbeiten, analysieren und interpretieren, um eine Automatisierung von traditionell manuell durchgeführten Prozessen und deren Qualität zu sichern? Um diese Frage beantworten zu können, werden drei unabhängige Bildquellenbereiche betrachtet: medizinische Bilder, Unterwasseraufnahmen und gewöhnliche 2D-Aufnahmen. Die Auswahl weißt unterschiedliche charakteristische Bildeigenschaften vor, die für diese Datentypen repräsentativ sind. Die medizinische Datengrundlage setzt sich aus CTund MRT-Bildern, die als 3D Aufnahmen vorliegen, zusammen und besitzt deshalb eine Tiefeninformation, die für die entsprechenden Aufnahmegeräte (Scanner) standardisiert ist. Die Unterwasserbilder bilden eine weitere Kategorie. Der vorliegende Datensatz setzt sich zusammen aus hochauflösenden Bildern von Korallenriffen, die auf der ganzen Welt im Rahmen eines Bestandsüberwachungsprojekts gesammelt wurden und sich dementsprechend in der Qualität hinsichtlich der Schärfe und der Farbbalance stark unterschieden. Die Sammlung der gewöhnlichen 2D-Bilder stammt aus dem laufenden Verkaufsprozess unterschiedlicher Supermärkte. Die Bilder wurden durch eine kostengünstige Hardware aufgenommen und verfügen über eine geringere Auflösung. Zusätzlich besteht eine Reihe von Schwierigkeiten in Bezug auf visuelle Hindernisse. Aufgrund unterschiedlicher Eigenschaften, die die verschiedenen Bildtypen mit sich bringen, sind in Bezug auf die Fragestellung unterschiedliche Herangehensweisen erforderlich. Während der Untersuchung der Forschungsfrage gehen wir eine Reihe herausfordernder Klassifikations- und Objekterkennungsaufgaben unter Berücksichtigung dieser Nuancen an. Die Lösungen dieser Aufgaben stellen wir in dieser Arbeit in Form von mehreren neuartigen Maschine Learning und Deep Learning Algorithmen vor. Auf den medizinischen Daten der Radiologie, wurde der Frage nachgegangen, wie sich automatisch der Schweregrad der Lungentuberkulose anhand von CT-Bildern ermitteln lässt. Dabei wurde traditionelles Feature Engineering und Deep Learning gegenübergestellt. Darüber hinaus führen wir einen einzigartigen Algorithmus zur Bestimmung der Orientierung von MRT-Aufnahmen von an Prostatakrebs erkrankten Patienten ein. Neben dem medizinischen Anwendungsbereich werden zwei State-ofthe- Art Ansätze für die Bestandsüberwachung von Korallen vorgestellt. Außerdem präsentieren wir einen neuartigen Ansatz für effizientes Zählen und Klassifizieren für den Einsatz im Einzelhandel. Alle in dieser Arbeit vorgestellten Forschungsergebnisse lassen sich dem Bereich der KI zuordnen und haben den Schwerpunkt Computer Vision. Insgesamt zeigen unsere Ansätze auf den verschiedenen Datensätzen aus der realen Welt im Hinblick auf die Hauptforschungsfrage überzeugende Ergebnisse und decken sowohl die Potenziale als auch die Grenzen der Verwendung von Computer Vision zu Zwecken der Qualitätssicherung und der Automatisierung von Prozessen auf. Darüber hinaus stellen wir mehrere Algorithmen vor, die entweder konkurrenzfähig zu den aktuellen State-of-the-Art Verfahren im Bereich von Deep Learning und Computer Vision sind oder sogar selbst State-of-the-Art Verfahren bilden. | |||||||
Lizenz: | ![]() Dieses Werk ist lizenziert unter einer Creative Commons Namensnennung 4.0 International Lizenz | |||||||
Fachbereich / Einrichtung: | Mathematisch- Naturwissenschaftliche Fakultät » WE Informatik » Datenbanken und Informationssysteme | |||||||
Dokument erstellt am: | 26.07.2023 | |||||||
Dateien geändert am: | 26.07.2023 | |||||||
Promotionsantrag am: | 10.01.2023 | |||||||
Datum der Promotion: | 13.07.2023 |