Refine
Year of publication
- 2017 (2) (remove)
Document type
- Bachelor Thesis (2)
Language
- German (2) (remove)
Has full text
- Yes (2) (remove)
Is part of the Bibliography
- No (2)
Keywords
- Maschinelles Lernen (2) (remove)
Course of studies
Der SmartCrawler ist ein auf Java basierendes Programm, das von dem Unternehmen PAMA Technologies GmbH verwendet wird, um Bilder aus dem Internet zu laden. Diese Bilder werden im Anschluss daran benutzt, um bestimmte Personen oder Gegenstände wiederzuerkennen. Beim Herunterladen der Bilder, kommt es zu verschiedenen Fehlern, deren Ursache untersucht wurde. Daraufhin sind die Fehlerursachen benannt und der Zusammenhang erklärt worden. Die beschriebenen Fehler beim Herunterladen der Bilder, müssen behoben werden, um ein Modell zur Wiedererkennung bestmöglich zu trainieren.
In meiner Arbeit sollen der SmartCrawler-Prozess verbessert und Tools für weitere Aufgabenfelder untersucht sowie getestet werden. Ziel ist, Fehlerquellen des SmartCrawler zu identifizieren und mit geeigneten Vorschlägen zu beheben. Im Anschluss werden verschiedene Technologien in Bezug auf Gesichtserkennung, Bildbeschreibung und Machine-Learning- Tools getestet. Sie werden anhand von Beispielen zur Einsatzmöglichkeit von Gesichtserkennung und Bildbeschreibung dargestellt. Im Verlauf der Arbeit wird auch das Machine-Learning-Tool vorgestellt und exemplarisch hinterlegt. Da es sich hier um eine praktische Arbeit handelt, werden verschiedene Tools auf ihre Leistungen getestet und bewertet. Als Ergebnis wird dem Leser ein resultierender Workflow präsentiert. Der Workflow enthält den SmartCrawler-Prozess und das anschließende Training eines Modells mit CNTK.
Ein weiteres Ziel ist, dem Leser Möglichkeiten zu bieten, auf dieser Arbeit aufzubauen. Es soll für den Leser möglich sein, die richtige Anwendung für seine Bedürfnisse zu finden und eventuell eigene Projekte auf Basis dieser Arbeit zu erstellen. Weiterhin kann auch der Einsatz von CNTK vom Leser in eigenen Bereichen geprüft werden.
Vergleich maschineller Lernalgorithmen in Anwendung auf die 3D-Gestenerkennung per Leap Motion
(2017)
Die Gestensteuerung ermöglicht eine intuitive sowie natürliche Interaktion zwischen Mensch und Maschine. Um die Bewegungen des Nutzers im dreidimensionalen Raum erkennen und klassifizieren zu können, sind Sensoren nötig, deren Signale es gilt zu verarbeiten. Diese Verarbeitung geschieht mittlerweile überwiegend durch Algorithmen des maschinellen Lernens, welche mit Hilfe von eingelernten Daten selbstständig Vorhersagen über neue Eingabesignale treffen können.
In dieser Arbeit werden die Eigenschaften und die damit zusammenhängende Erkennungsgenauigkeit solcher Algorithmen untersucht und verglichen. Dabei sollen die Support Vector Machine und das neuronale Netz berücksichtigt werden, welche mit Hilfe der Open Source Bibliotheken TensorFlow und scikit-learn implementiert wurden. Als Untersuchungsgegenstand dienen die Positionskoordinaten von insgesamt 350 dynamischen Gesten. Diese wurden mit dem Tiefenensor Leap Motion mittels einer eigens entwickelten Software aufgezeichnet und entsprechend vorverarbeitet. Auf diese Software, sowie den Prozess der Datensammlung, der Vorverarbeitung und letztendlich der Klassifizierung wird in der Arbeit ausführlicher eingegangen.
Die durchgeführten Tests zeigen, dass beide Algorithmen in der Lage waren eine Erkennungsgenauigkeit von bis zu 93,40% zu erreichen. Die Support Vector Machine schnitt durchschnittlich mit 87,15%, gegenüber dem neuronalen Netz mit 80,47%, besser ab.