• search hit 3 of 5
Back to Result List

Evaluation und Optimierung der automatischen Sachgruppenvergabe mithilfe des HDLTex Tools

  • In this thesis, new methods for text classification are examined and compared to the current software of the DNB. Due to technical changes in the area machine learning in recent years, improvements in text classification have been achieved. The objective is to improve the subject groups allocation of the DNB and to allow a hierarchical classification based on the DDC system. The decision was made on the HDLTex tool, as the structure of the DNB data set and the DDC system, which supports a hierarchical classification, are perfectly designed for it. The use of RNN networks on both hierarchical levels improved the current software situation. Furthermore, the approach was examined, if a combination of the predictions of the two hierarchies levels leads to an additional improvement, which, however, produced a negative result. Both beginners and experts find themselves as readers of this master's thesis in the target group again. In dieser Arbeit werden neue Verfahren zur Textklassifizierung untersucht und der aktuellen Software der DNB gegenübergestellt. Durch technische Veränderungen im Bereich Machine Learning in den letzten Jahren, konnten Verbesserungen in der Textklassifizierung erzielt werden. Dabei soll die Sachgruppenvergabe der DNB verbessert und anhand des DDC Systems eine hierarchische Klassifizierung ermöglicht werden. Die Entscheidung fiel auf das HDLTex Tool, da die Struktur des Datensatzes der DNB und das DDC System, welche eine hierarchische Klassifizierung unterstützt, perfekt darauf ausgelegt sind. Durch die Nutzung von RNN Netzen auf beiden Hierarchieebenen konnte eine Verbesserung zu der aktuellen Software erzielt werden. Weiterhin wurde der Ansatz untersucht, ob eine Kombinierung der Vorhersagen der beiden Hierarchieebenen zu einer aufbauenden Verbesserung führt, welches jedoch ein negatives Ergebnis hervorbrachte. Sowohl Anfänger als auch Experten finden sich als Leser dieser Masterarbeit in der Zielgruppe wieder.

Export metadata

Additional Services

Share in Twitter Search Google Scholar
Metadaten
Author:Alexander Gerling
URN:urn:nbn:de:bsz:fn1-opus4-44995
Advisor:Andreas Heß
Document Type:Master's Thesis
Language:German
Year of Completion:2018
Granting Institution:Hochschule Furtwangen
Date of final exam:2018/08/30
Release Date:2018/11/08
Tag:Maschinelles Lernen
Degree Program:BAM - Business Application Architectures
Access Rights:Frei verfügbar
Licence (German):License LogoEs gilt das UrhG