@mastersthesis{Gerling2017, type = {Bachelor Thesis}, author = {Gerling, Alexander}, title = {Fehleranalyse im SmartCrawler-Prozess und Toolvergleich zum Erstellen einer Logo- oder Personenwiedererkennung mithilfe von Machine Learning}, institution = {WIB - Wirtschaftsinformatik}, pages = {61}, year = {2017}, abstract = {Der SmartCrawler ist ein auf Java basierendes Programm, das von dem Unternehmen PAMA Technologies GmbH verwendet wird, um Bilder aus dem Internet zu laden. Diese Bilder werden im Anschluss daran benutzt, um bestimmte Personen oder Gegenst{\"a}nde wiederzuerkennen. Beim Herunterladen der Bilder, kommt es zu verschiedenen Fehlern, deren Ursache untersucht wurde. Daraufhin sind die Fehlerursachen benannt und der Zusammenhang erkl{\"a}rt worden. Die beschriebenen Fehler beim Herunterladen der Bilder, m{\"u}ssen behoben werden, um ein Modell zur Wiedererkennung bestm{\"o}glich zu trainieren. In meiner Arbeit sollen der SmartCrawler-Prozess verbessert und Tools f{\"u}r weitere Aufgabenfelder untersucht sowie getestet werden. Ziel ist, Fehlerquellen des SmartCrawler zu identifizieren und mit geeigneten Vorschl{\"a}gen zu beheben. Im Anschluss werden verschiedene Technologien in Bezug auf Gesichtserkennung, Bildbeschreibung und Machine-Learning- Tools getestet. Sie werden anhand von Beispielen zur Einsatzm{\"o}glichkeit von Gesichtserkennung und Bildbeschreibung dargestellt. Im Verlauf der Arbeit wird auch das Machine-Learning-Tool vorgestellt und exemplarisch hinterlegt. Da es sich hier um eine praktische Arbeit handelt, werden verschiedene Tools auf ihre Leistungen getestet und bewertet. Als Ergebnis wird dem Leser ein resultierender Workflow pr{\"a}sentiert. Der Workflow enth{\"a}lt den SmartCrawler-Prozess und das anschließende Training eines Modells mit CNTK. Ein weiteres Ziel ist, dem Leser M{\"o}glichkeiten zu bieten, auf dieser Arbeit aufzubauen. Es soll f{\"u}r den Leser m{\"o}glich sein, die richtige Anwendung f{\"u}r seine Bed{\"u}rfnisse zu finden und eventuell eigene Projekte auf Basis dieser Arbeit zu erstellen. Weiterhin kann auch der Einsatz von CNTK vom Leser in eigenen Bereichen gepr{\"u}ft werden.}, language = {de} }