Repository-Mining: Welche Daten man aus Software-Repositories extrahieren kann und wie man sie nutzt.
Abstract
In der Softwareentwicklung fallen viele Daten an, die elektronisch archiviert werden, wie zum Beispiel in Versionskontrollsystemen, Issue-Tracker, Chat-Logs, Online-Diskussions-Foren oder Ausführungs-Logs. Software-Repository-Mining beschäftigt sich mit der Extraktion und Analyse von Daten, die in solchen Archiven gespeichert sind. Damit soll es möglich werden, Muster und Zusammenhänge in diesen Daten aufzudecken, um Aspekte der Software-Entwicklung verstehen und verbessern zu können. Viele dieser Daten sind strukturiert, das heißt, folgen einer klaren Syntax, und können somit relativ einfach maschinell verarbeitet werden. Andere sind in natürlicher Sprache verfasst und sind nur schwer und selten vollständig und präzise auszuwerten.
Dieser Vortrag stellt Methoden vor, wie Daten aus Software-Archiven extrahiert und ausgewertet werden können. Er beschreibt einige wissenschaftliche Arbeiten
CV
-