Refine
Document type
- Conference Proceeding (10)
- Report (2)
- Article (peer-reviewed) (1)
- Bachelor Thesis (1)
- Master's Thesis (1)
Keywords
- Manufacturing (7)
- Machine learning (5)
- Reference model (3)
- Assembly line (2)
- Machine Learning (2)
- Maschinelles Lernen (2)
- AI in manufacturing (1)
- AutoML Tool (1)
- Bildverarbeitung (1)
- Clustering (1)
Course of studies
In this thesis, new methods for text classification are examined and compared to the current software of the DNB. Due to technical changes in the area machine learning in recent years, improvements in text classification have been achieved. The objective is to improve the subject groups allocation of the DNB and to allow a hierarchical classification based on the DDC system. The decision was made on the HDLTex tool, as the structure of the DNB data set and the DDC system, which supports a hierarchical classification, are perfectly designed for it. The use of RNN networks on both hierarchical levels improved the current software situation. Furthermore, the approach was examined, if a combination of the predictions of the two hierarchies levels leads to an additional improvement, which, however, produced a negative result. Both beginners and experts find themselves as readers of this master's thesis in the target group again.
In dieser Arbeit werden neue Verfahren zur Textklassifizierung untersucht und der aktuellen Software der DNB gegenübergestellt. Durch technische Veränderungen im Bereich Machine Learning in den letzten Jahren, konnten Verbesserungen in der Textklassifizierung erzielt werden. Dabei soll die Sachgruppenvergabe der DNB verbessert und anhand des DDC Systems eine hierarchische Klassifizierung ermöglicht werden. Die Entscheidung fiel auf das HDLTex Tool, da die Struktur des Datensatzes der DNB und das DDC System, welche eine hierarchische Klassifizierung unterstützt, perfekt darauf ausgelegt sind. Durch die Nutzung von RNN Netzen auf beiden Hierarchieebenen konnte eine Verbesserung zu der aktuellen Software erzielt werden. Weiterhin wurde der Ansatz untersucht, ob eine Kombinierung der Vorhersagen der beiden Hierarchieebenen zu einer aufbauenden Verbesserung führt, welches jedoch ein negatives Ergebnis hervorbrachte. Sowohl Anfänger als auch Experten finden sich als Leser dieser Masterarbeit in der Zielgruppe wieder.
Der SmartCrawler ist ein auf Java basierendes Programm, das von dem Unternehmen PAMA Technologies GmbH verwendet wird, um Bilder aus dem Internet zu laden. Diese Bilder werden im Anschluss daran benutzt, um bestimmte Personen oder Gegenstände wiederzuerkennen. Beim Herunterladen der Bilder, kommt es zu verschiedenen Fehlern, deren Ursache untersucht wurde. Daraufhin sind die Fehlerursachen benannt und der Zusammenhang erklärt worden. Die beschriebenen Fehler beim Herunterladen der Bilder, müssen behoben werden, um ein Modell zur Wiedererkennung bestmöglich zu trainieren.
In meiner Arbeit sollen der SmartCrawler-Prozess verbessert und Tools für weitere Aufgabenfelder untersucht sowie getestet werden. Ziel ist, Fehlerquellen des SmartCrawler zu identifizieren und mit geeigneten Vorschlägen zu beheben. Im Anschluss werden verschiedene Technologien in Bezug auf Gesichtserkennung, Bildbeschreibung und Machine-Learning- Tools getestet. Sie werden anhand von Beispielen zur Einsatzmöglichkeit von Gesichtserkennung und Bildbeschreibung dargestellt. Im Verlauf der Arbeit wird auch das Machine-Learning-Tool vorgestellt und exemplarisch hinterlegt. Da es sich hier um eine praktische Arbeit handelt, werden verschiedene Tools auf ihre Leistungen getestet und bewertet. Als Ergebnis wird dem Leser ein resultierender Workflow präsentiert. Der Workflow enthält den SmartCrawler-Prozess und das anschließende Training eines Modells mit CNTK.
Ein weiteres Ziel ist, dem Leser Möglichkeiten zu bieten, auf dieser Arbeit aufzubauen. Es soll für den Leser möglich sein, die richtige Anwendung für seine Bedürfnisse zu finden und eventuell eigene Projekte auf Basis dieser Arbeit zu erstellen. Weiterhin kann auch der Einsatz von CNTK vom Leser in eigenen Bereichen geprüft werden.
Shapley Values based Regional Feature Importance Measures Driving Error Analysis in Manufacturing
(2022)
Comparison of algorithms for error prediction in manufacturing with automl and a cost-based metric
(2022)