Vor zwei Wochen habe ich bereits kurz das Thema meiner Bachelorarbeit vorgestellt. Und wie ich ahnen kann, haben Sie alle sehnlichst auf die Ergebnisse meiner Arbeit gewartet. Well, here you are:
Im Folgenden sind exemplarisch einige Fragestellungen und Ergebnisse des Analyse-Teils der Arbeit dargestellt.
Welche N-Gramme werden in der jeweiligen Kategorie am häufigsten als Aspect markiert?
Zu erkennen ist, dass die Aspects stark von der Produktkategorie abhängig sind. Zu sehen sind aber auch im Produktkontext semantisch sehr ähnliche N-Gramme wie battery/battery life oder works/working.
Welche Aspects sind „universell“, sprich in allen Kategorien häufig vertreten
Durch das Sortieren der extrahierten Aspects nach ihrem produktgruppenübergreifenden durchschnittlichen Rang, lassen sich Aspects finden, die unabhängig von der Produktkategorie häufig sind. Sichtbar werden vor allem „allgemeine“ Aspects wie price, quality, service oder shipping.
Welche Cluster gibt es in der Kategorie „Cell Phones“?
Ein Clustering mit K-Means und einer Clusteranzahl von 30 resultiert in einer Aufteilung, die als näherungsweise Gruppierung von Aspects interpretiert werden kann. Zu erkennen ist etwa, dass camera und pictures oder battery und battery life aufgrund ihrer hohen semantischen Ähnlichkeit in einem Cluster liegen.
Cell Phones: Wie positiv oder negativ sind die Sentimentlabels zu einem Cluster im Durchschnitt? Wie stark ist der Einfluss des jeweiligen Clustersentiments auf die Sternebewertung des Reviews? (jeweils zwischen -1 und +1)
Die vom Modell vorhergesagten Sentimentlabels (positiv, negativ, neutral, …) lassen sich sich auch numerisch darstellen (als -1, 0, 1, …). So lässt sich anschließend ein Mittelwert des Sentiments zu einem Cluster berechnen. Sichtbar im Fall von Cell Phones ist etwa, dass eine Erwähnung des Clusters „Garantie“ meist mit einem negativen Sentiment einhergeht. Dem gegenüber steht bspw. „Preis & Qualität“ mit einem eher positiven Sentiment.
Zudem kann man den Zusammenhang (die Korrelation) dieses numerischen Sentimentmittelwertes mit der Sternebewertung des Reviews untersuchen. So lässt sich beispielsweise feststellen, dass das Sentiment zum Cluster „Funktionsfähigkeit“ einen starken Einfluss auf die Sternebewertung hat. Ist das Sentiment zur Funktionsfähigkeit hoch/niedrig, so ist in der Regel auch die Sternebewertung hoch/niedrig). Bei „Garantie“ kann man hingegen sehen, dass es einen weniger starken Zusammenhang mit dem Rating gibt.
Plush Figures: Welche Adjektive sind Indikationen für besonders polare Sentimente zu den jeweiligen Clustern? („Opinion Words“)
Durch die automatisierte Erkennung von Wortarten mithilfe von Part-of-Speech-Tagging sowie die anschließenden Untersuchung des mittleren Clustersentiments in Sätzen gruppiert nach den Adjektiven, die in ihnen vorkommen, lassen sich Adjektive ermitteln, die ein Indikator für ein besonders positives oder negatives Sentiment zu einem Cluster sind. Erkennen lassen sich beispielsweise im Cluster „Farben/Licht“ die Adjektive bright oder vibrant als Indikatoren für ein positives und same oder black für ein negatives Clustersentiment.
Fazit meiner Bachelorarbeit:
Die Anwendung von Text Mining zur Extraktion strukturierter Daten aus Quellen in natürlicher Sprache wie Online Reviews ist und bleibt ein spannendes Thema, das mehr und mehr Einzug in angewandte Systeme findet. Unternehmerische Bereiche wie die Marktforschung oder Forschung und Entwicklung können von den leistungsstarken Systemen der letzten Jahre profitieren. So können sie eine akkurate automatisierte Extraktion von Informationen aus sehr großen Datenbeständen betreiben und mit dieser Einblicke in Feedback und Wünsche ihrer Kunden gewinnen sowie fundierte und datenbasierte Entscheidungen treffen.