Text Mining Wissensrohstoff Text Gerhard Heyer Universität Leipzig [email protected] Institut für Informatik Stimmungsanalyse Kommunikationstheoretischer Hintergrund 2 Stimmungsanalyse Das Organonmodell von Bühler (Sprachtheorie) • Grundlage sprachlicher Kommunikation sind sprachliche Ausdrücke • Sprachliche Ausdrücke haben drei Dimensionen: – den Sender (Sprecher, Schreiber) – den Empfänger (Hörer, Leser) – die referenzierte Sache (Objekte und Ereignisse, Eigenschaften, Tatsachen, …) • In Bezug auf einen Sender, (intendierten) Empfänger und die referenzierte Sache haben sprachliche Ausdrücke daher eine dreifache Funktion: – Symptom – Apell – Symbol Prof. Dr. G. Heyer Text Mining – Wissensrohstoff Text 3 Stimmungsanalyse Organonmodell – Schematische Darstellung Prof. Dr. G. Heyer Text Mining – Wissensrohstoff Text 4 Stimmungsanalyse Linguistische Aspekte • Wir finden daher sprachliche Ausdrücke in Form von – Ausrufen (Symptom) – Bewertungen (Apell) – Aussagen (Symbol) • Beispiel ECKHARD BERGER (stockend) Ich weiß nicht, was passieren wird… aber ich habe Angst… Angst vor meinen Kollegen: Jürgen Wiesehöfer… Michael Nauen… und Sven Lienecke. Wenn mir etwas zustößt, dann… (eine quälende Pause, dann) diese drei Männer sind gefährlich… (leise) möglicherweise Mörder. Prof. Dr. G. Heyer Text Mining – Wissensrohstoff Text Drehbuch SoKo Leipzig Folge 6, 2004 5 Stimmungsanalyse Weiteres Beispiel Prof. Dr. G. Heyer Text Mining – Wissensrohstoff Text 6 Stimmungsanalyse Aufgaben • Identifizieren von sentiment targets • Identifizieren von sentiment expressions (Wörter, Sätze) und deren Modifikatoren • Berechnung eines sentiment index für sentiment expressions • Berechnung eines sentiment index für komplexe sentiment expressions (Abschnitte, Texte) • Identifizieren und parametrisieren von Einflussfaktoren bei der Interpretation von sentiment expressions, z. B. – Kontext (Fachdomäne, Interessen des Bewerters, Perspektive, …) – Medium (soziale Netzwerke, email, Film, …) – Sprachregister (Höflichkeit, Kanalrestriktionen, Kompetenzrestriktionen, …) Prof. Dr. G. Heyer Text Mining – Wissensrohstoff Text 7 Stimmungsanalyse Anwendungen • Text und Interview basiertes Marketing (Markenbildung und – veränderung, Kundenerwartungen) • Text basierte Marktanalysen • Text und Interview basierte sozialwissenschaftliche Erhebungen (European Social Science Monitor) • Wichtige Ergänzung zur Analyse von Trends und sozialen Netzwerken • eHumanities Prof. Dr. G. Heyer Text Mining – Wissensrohstoff Text 8 Stimmungsanalyse Projekte und Werkzeuge 9 Stimmungsanalyse Projekte und Werkzeuge Stimmungsanalyse Reuters Sentiment Analysis Workflow News stories collected in realtime Stories are standardised Word sense disambiguation performed on each story Linguistic analysis performed on each story to produce sentiment Sentiment feature vector produced to describe each document Feature vector matched against machine learning vector in order to classify story sentiment Analysis results delivered to clients Stimmungsanalyse Projekte und Werkzeuge Stimmungsanalyse Projekte und Werkzeuge Stimmungsanalyse Dow Jones/RavenPack Sentiment Analysis Workflow Live News Feeds News stories serialised to storage devices. Thousands of news stories collected daily Data is standardised with timestamps, headlines, text... Stories are machine read and analysed to detech sentmient Results are used to produce time-series trends Analysed data sent to clients Overall results are analysed for trends, repeating patterns and algorithmic patterns. Stimmungsanalyse Sentiment Analyse Die nachfolgenden Folien basieren auf Folien von Robert Remus und Khurshid Ahmad 15 Stimmungsanalyse Einführung Einführung --- Definition Sentiment Analysis Sentiment Analysis refers to a broad area of NLP, CL and TM. Generally speaking, it aims to determine the attitude of a speaker or a writer with respect to some topic. The attitude may be their judgment or evaluation, their affective state or their intended emotional communication. http://en.wikipedia.org/wiki/Sentimentanalysis Prof. Dr. G. Heyer Text Mining – Wissensrohstoff Text 16 Stimmungsanalyse Überblick --- Literaturlandschaft Was umfasst der Begriff der Sentiment Analysis und das oft synonym gebrauchte Opinion Mining in der Literatur? Subjectivity Analysis: Hat eine textuelle Einheit bspw. ein Wort, eine Phrase, ein Satz, ein Dokument einen subjektiven oder objektiven Charakter? Polarity Analysis: Bringt eine textuelle Einheit eine positive, negative oder neutrale Stimmung zum Ausdruck? Beide Fragestellungen werden vornehmlich als Instanzen eines (Text-)Klassifikationsproblems angesehen Prof. Dr. G. Heyer Text Mining – Wissensrohstoff Text 17 Stimmungsanalyse Subjectivity Analysis Subjectivity Analysis Einflussreichste Arbeiten: Wiebe et al. (2004), Wiebe & Riloff (2005) Diese klassifizieren Sätze u.a. anhand sog. Subjectivity Clues: „Ich glaube, die Qualität ist minderwertig.“ Wiebe et al. (2004) „lernen“ solche Ich-Du-Kookkurrenzen und andere subjectivity clues, bspw. niederfrequente Wortformen, aus einem großen Korpus Prof. Dr. G. Heyer Text Mining – Wissensrohstoff Text 18 Stimmungsanalyse Polarity Analysis Polarity Analysis --- Typische Verfahren I Frühe einflussreiche Studie: Pang et al. (2002) Diese klassifiziert kurze Texte mittels typischer statistischer Verfahren, u.a. Support Vector Machines, die auf einer handannotierten Trainingsmenge angelernt wurden. Regelbasierte Ansätze, bspw. Kennedy & Inkpen (2006) suchen in Sätzen nach polaren Wörtern und beziehen Modifikatoren wie Negationen, Abschwächungen und Verstärkungen in die Analyse ein: „Das ist keine schöne Vorstellung“ Prof. Dr. G. Heyer Text Mining – Wissensrohstoff Text 19 Stimmungsanalyse Polarity Analysis Polarity Analysis --- Typische Verfahren II Nasukawa & Yi (2003): [Polarity] analysis involves identification of - sentiment expressions, - polarity strength of the expressions, and - their relationship to the subject. Die ersten, die den Begriff der Sentiment Analysis in dieser Form verwendeten, waren [Nasukawa & Yi 2003] Prof. Dr. G. Heyer Text Mining – Wissensrohstoff Text 20 Stimmungsanalyse Polarity Analysis Polarity Analysis --- Benötigte Ressourcen Regelbasierte Studien benötigen Wörterbücher, die positiv und negativ konnotierte Termini aufführen. Solche Ressourcen sind a priori nicht für alle Sprachen frei verfügbar. Wie können wir sie erstellen? - manuelle Auflistung - Transfer bereits existierender fremdsprachlicher Ressourcen - automatisches Lernen, bspw. durch Bootstrapping Prof. Dr. G. Heyer Text Mining – Wissensrohstoff Text 21 Stimmungsanalyse Lexikalische Ressourcen ‘Modern’ day dictionaries of affect: • emotion as dimension and • emotion as ‘finite category’ — good–bad axis: termed the dimension of valence, evaluation or pleasantness — active–passive axis (termed the dimension of arousal, activation or intensity) — strong–weak axis (termed the dimension of dominance or submissiveness) Prof. Dr. G. Heyer Text Mining – Wissensrohstoff Text 22 Stimmungsanalyse Dictionaries of Affect ‘Modern’ day dictionaries of affect are used in computing the frequency of sentiment words in a text and the attempt usually is ensure that one picks up sentences that pick up the ‘correct’/unambiguous sense of the sentiment word — General Inquirer [Stone et al. 1966]; — Dictionary of Affect [Whissell 1989]; — WordNet Affect [Strappavara and Valitutti 2004]; — SentiWordNet [Esuli and Sebastiani 2006]. Prof. Dr. G. Heyer Text Mining – Wissensrohstoff Text 23 Stimmungsanalyse General Inquirer The General Inquirer is a software system for analysing texts for ascertaining the psychological attitude/orientation/behaviour of the writer of a text as implicit in his or her writing. The system has a large database of words and each word is tagged primarily in terms of whether the word is generally used positively or negatively. But there are many fine gradations within the tags – ranging from tags to describe active/passive orientation and whether the word belongs to a specific subject category like economics, or that the word is used usually by academics or found in legal documents Prof. Dr. G. Heyer Text Mining – Wissensrohstoff Text 24 Stimmungsanalyse General Inquirer Categories Name No. of Words Positiv 1,915 positive outlook. Negativ 2,291 negative outlook Pstv 1045 positive outlook Affil Ngtv Hostile Strong Meaning 557 affiliation or supportiveness. 1160 Negative outlook 833 an attitude or concern with hostility or aggressiveness 1902 implying strength Power 689 Positive Hostile 833 concern with hostility or aggressiveness Weak 755 Negative Submit 284 submission to authority or power, dependence on others, vulnerability to others, or withdrawal. 25 Stimmungsanalyse SentiWS SentiWS [Remus et. al. 2010] SentiWS kurz für SentimentWortschatz ist ein deutschsprachiges Wörterbuch - führt 1650 positiv und 1818 negativ konnotierte Wörter auf - gibt ihre Wortart und ihre Flexionsformen an - gewichtet jeden Eintrag bzgl. seiner Ausdrucksstärke im Intervall [-1, +1] Seit Juni 2010 ist SentiWS frei verfügbar unter http://wortschatz.informatik.uni-leipzig.de/download/ Prof. Dr. G. Heyer Text Mining – Wissensrohstoff Text 26 Stimmungsanalyse SentiWS SentiWS --- Quellen SentiWS fußt auf einer Studie, die sich mit den Wechselwirkungen zwischen Stimmungen in Zeitungstexten sowie Blogposts und den Bewegungen im DAX 30 auseinandersetzt (Remus et al. 2009) Die Kategorien Positiv und Negativ des englischsprachigen General Inquirer wurden per Google Translate automatisch übersetzt, domänenspezifische Begriffe à la Finanzkrise wurden hinzugefügt Erweitert wird SentiWS durch signifikante Kookkurrenzen in Kundenrezensionen. Weiterhin erweitert wird SentiWS durch Überlappungen der bereits identifizierten Begriffe mit semantischen Gruppen des Deutschen Kollokationswörterbuchs (Quasthoff 2010) Prof. Dr. G. Heyer Text Mining – Wissensrohstoff Text 27 Stimmungsanalyse SentiWS SentiWS --- Gewichtung I Halbüberwachte Gewichtung der semantischen Orientierung eines Wortes SO A( w) pwordPwords A( w, pword ) A(w, nword ) nwordNwords mit Pwords einer Menge positiv konnotierter Wörter und Nwords einer Menge negativ konnotierter Wörter w wird mit einer positiven semantischen Orientierung markiert, wenn SO-A(w) positiv ist und mit einer negativen semantischen Orientierung, wenn SO-A(w) negativ ist. Der absolute Wert von SO-A(w) zeigt die Stärke der semantischen Orientierung. Prof. Dr. G. Heyer Text Mining – Wissensrohstoff Text 28 Stimmungsanalyse SentiWS SentiWS --- Gewichtung II A(w1, w2) wird durch Pointwise Mutual Information (PMI) bestimmt: p( w1 & w2) PMI ( w1, w2) log 2 p( w1) p( w2) Paradigmen für seed words nach [Turney Littmann, 2003] (übersetzt): Pwords = gut, schön, richtig, glücklich, erstklassig, positiv, großartig, ausgezeichnet, lieb, exzellent, phantastisch Nwords = schlecht, unschön, falsch, unglücklich, zweitklassig, negativ, scheiße, minderwertig, böse, armselig, mies Prof. Dr. G. Heyer Text Mining – Wissensrohstoff Text 29 Stimmungsanalyse SentiWS SentiWS --- Gewichtung III Beispiele einiger Wörter inkl. der Gewichtung ihrer Ausdrucksstärke bzw. Polarität (allgemeiner Wortschatz bzw. Automobilforen): Wort Gewichtung Wort Gewichtung Schulden - 0.8905 Panne - 0,9010 betrügen - 0.8368 Schaden - 0,5299 freundlich +0.9273 fehlerhaft - 0,3581 Freude +1,0000 Vertrauen +0,3512 Zufriedenheit +0,2207 hervorragend +0,5891 Prof. Dr. G. Heyer Text Mining – Wissensrohstoff Text 30 Stimmungsanalyse SentiWS SentiWS --- Anwendungen • Analyse von Automobilforen und –blogs zusammen mit der Daimler Forschung in Ulm (Folien von R.Remus) • Einfache Polaritätsanalyse am Beispiel einer Auswertung von Tiefeninterviews im Marketing (zusammen mit Uni HH) Prof. Dr. G. Heyer Text Mining – Wissensrohstoff Text 31 Stimmungsanalyse SentiWS SentiWS --- Evaluation Eine Evaluation der Gewichtungen gestaltet sich schwierig. Warum? Beispiel: Zufällige Auswahl von je 5 positiv und negativ konnotierten Wörtern 7 Probanden wurden dazu aufgefordert, zwei Rangfolgen zu bestimmen, die die Worte ihrer Ausdrucksstärke nach ordnen. Die gemessene Übereinstimmung (Cohens κ) zwischen den Rangfolgen der Probanden ist 0,314 . Cohens Kappa ist ein Maß für die Reliabilität von Annotationen mehrerer Annotatoren -- drückt also die Abweichung von der zufällig erwarteten Übereinstimmung zwischen ihnen aus. Ein Wert von 0,314 wird in der Literatur (bspw. [Landis Koch, 1977]) als sehr geringe Übereinstimmung angesehen. Prof. Dr. G. Heyer Text Mining – Wissensrohstoff Text 32 Stimmungsanalyse SentiWS SentiWS --- Evaluation Folgerung: Da es Menschen schwer fällt, einheitliche Rangfolgen festzulegen, ist es schwer, einen Goldstandard zur Evaluation von Sentiments zu definieren. Eine unterschiedliche Gewichtung erscheint dennoch intuitiv (vgl. Ausdrucksstärke „unklug“ vs. „bescheuert“) … … Prof. Dr. G. Heyer Text Mining – Wissensrohstoff Text 33 Stimmungsanalyse Praxisbeispiel: Analyse von Kundenerwartungen Vgl. Torsten Teichert, Gerhard Heyer, Katja Schöntag und Patrick Mairif: Co-Word Analysis for assessing consumer associations: A case study in market research. In: Affective Computing and Sentiment Analysis, Springer Science+Business Media B.V. , 2011 34 Stimmungsanalyse Background • Interviews for specific marketing tasks • Manually rated and evaluated – Concept features (metaphors) – Emotional rating – Clustering of concepts • For each interview, features are manually counted and fed into SPSS for factorial analysis • Purpose of the present work: Test and evaluate the efficiency of NLP for detecting and clustering concept features 35 Stimmungsanalyse Sentiment analysis in marketing • Goal of marketing: gain insight into consumers’ thoughts and feelings regarding specific brands and products • Widespread use of elicitation and analysis techniques • As opposed to many text analysis applications, data are not obtained from secondary (internet) sources but from 30 personal in-depth interviews with female consumers • However, interviews yield a large amount of qualitative data that is hard to handle and needs to be structured in order to be analyzed 36 Stimmungsanalyse Methods and assumptions • Product categories are assumed to be emotionally laden reaching far beyond mere functional aspects • Data elicitation and processing techniques are based on methods derived from human associative memory models and network analysis • Human Associative Memory (HAM) is a widely accepted model with an increasing number of studies based upon it – information is stored in nodes which are linked (associated) with each other forming a complex network of associations – mental activity spreads from active concepts to all related concepts 37 Stimmungsanalyse HAM in marketing • In the case of brands, the stimulating element can be a brand’s logo: the brand’s associative network is activated and becomes accessible and retrievable • Activation then spreads to adjacent nodes • This spread of activation produces a chain, or flow, of thoughts • A representation of this flow of thoughts can be obtained from the flow of speech, for example when eliciting brand or product associations during an interview. • Elicitation techniques help accessing subconscious memory of episodic, autobiographic, visual and sensory nature as well as a metaphoric description of thoughts, sentiments, and emotions 38 Stimmungsanalyse Problems of evaluating questionnaires • Researchers manually interpret the interviewees’ statements – Ambiguity of statements and expressions – Subjective rating of the elicited data results • Low replicability of the results • By convention, inter-rater-reliabilities of 70 percent and above are acceptable • Inter-rater-reliability is comparatively low for emotional aspects as opposed to more rational expressions 39 Stimmungsanalyse Goals and the role of NLP • Text analysis tools offer a solution to this problem • Reduce the level of subjectivity (to a minimum) – feature extraction – categorization processes • Raise replicability level • Reach higher level of reliability • The concept of Human Associative Memory guides the data processing and evaluation process 40 Stimmungsanalyse Goals and the role of NLP Four main assumptions: 1. Words or concepts mentioned together are linked in the mind. 2. The more salient a concept is, the more often it is mentioned during the course of an interview. 3. The stronger the association between two concepts, the more often they are mentioned together. 4. Valence of a concept is indicated by positive or negative 41 Stimmungsanalyse Specific requirements 1. Extraction of features and consolidation of extracted features into meaningful categories. 2. Processing of the data using a co-wordanalysis on a paragraph level as basis for the development of associative networks. 3. Consideration of valence expressions for the weighting of individual features. 42 Stimmungsanalyse Architecture Stop words Definition of text sources Extraction of features and definition of value concepts within sentences Base form per feature (Lemmatisation) Frequency information per feature Update Synonyms Value concepts Base forms Update Adding synonymvectors to features Clustering of features with similar synonymvectors Clusters of features Statistical processing of clusters 43 Stimmungsanalyse Architecture Stop words Definition of text sources Extraction of features and definition of value concepts within sentences Base form per feature (Lemmatisation) Base forms Frequency information per feature Update Synonyms Adding synonymvectors to features Clustering of features with similar synonymvectors Value concepts Update Synonyms are computed as similarity of global context of word forms Clusters of features Statistical processing of clusters 44 Stimmungsanalyse Architecture Stop words Definition of text sources Extraction of features and definition of value concepts within sentences Base form per feature (Lemmatisation) Frequency information per feature Update Synonyms Value concepts Base forms Update Adding synonymvectors to features Clustering of features with similar synonymvectors Clusters of features Clustering with graph based methods (Chinese whispers algorithms) Statistical processing of clusters 45 Stimmungsanalyse Example: World of shoes 46 Stimmungsanalyse Example: World of shoes 47 Stimmungsanalyse Example: Absolute counts 48 Stimmungsanalyse Example: Synonyms (similar contexts) 49 Stimmungsanalyse Example: Clusters of similar features 50 Stimmungsanalyse Processing of clusters • For each piece of text, the occurrence and co-occurrence of clusters of similar features is counted • For each piece of text, a factorial analysis is carried out • The result is visualized using NetDraw 51 Stimmungsanalyse Example: Final coneptual graph for shoes 52 Stimmungsanalyse Example: Specific findings • The product category of shoes activates a number of highly emotional associations in the female consumers’ minds. • The purchasing process (marked in blue): – “satisfy/please”, “wear/try on”, “spend time”, “discover”, “examine”, “watch/perceive”, “satisfaction/gratification”, “enjoy”, and “bliss.” – Simply put: the process of selecting and buying shoes makes female consumers happy and gives them a feeling of deep satisfaction. • Service quality and store ambience can therefore be strong differentiating factors for a shoe or shoe store brand. 53 Stimmungsanalyse Conclusions • A total of 1,938 different features could be extracted from the transcribed interviews. • Manual coding resulted in 133 and 112 categories for the two raters respectively. • Inter-rater-reliability was 65.3 percent – inter-rater-reliability was 60.6 percent for emotional aspects – while for rational aspects, it was 66.7 percent. 54 Stimmungsanalyse Conclusions – The impact of NLP • The automatic categorization resulted in 185 categories or clusters • 100 of the 148 manually developed categories, i.e. 67.6 percent, were identical or similar to the automatically developed categories • Results are comparable to manual coding • But take only a fraction of time and effort • The network representation of the main concepts offers a quick yet comprehensive overview of the complete pool of concepts 55 Stimmungsanalyse Literatur Church, K. W. & Hanks, P. (1990). Word Association Norms, Mutual Information, and Lexicography. Computational Linguistics, 16(1), 22--29. Kennedy, A. & Inkpen, D. (2006). Sentiment Classification of Movie Reviews Using Contextual Valence Shifters. Computational Intelligence, 22(2), 110--125. Nasukawa, T. & Yi, J. (2003). Sentiment Analysis: Capturing Favorability Using Natural Language Processing. In Proceedings of the 2nd International Conference on Knowledge Capture (pp. 70--77). Pang, B., Lee, L., Vaithyanathan, S. (2002). Thumbs up? Sentiment Classification using Machine Learning Techniques. In Proceedings of the 40th Annual Meeting of the ACL (pp. 79--86). Quasthoff, U. (2010). Deutsches Kollokationswörterbuch. Berlin, New York: deGruyter. 56 Stimmungsanalyse Literatur Remus, R., Ahmad, K., Heyer, G. (2009). Sentiment in German-language News and Blogs, and the DAX. In Proceedings of the Conference on Text Mining Services (TMS), Ausgabe XIV of Leipziger Beiträge zur Informatik (pp. 149--158). Remus, R., Quasthoff, U., Heyer, G. (2010). SentiWS -- a German-language Resource for Sentiment Analysis. In Proceedings of LREC 2010. Torsten Teichert, Gerhard Heyer, Katja Schöntag und Patrick Mairif: CoWord Analysis for assessing consumer associations: A case study in market research. In: Affective Computing and Sentiment Analysis, Springer Science+Business Media B.V., 2011 Turney, P. (2002). Thumbs Up or Thumbs Down? Semantic Orientation Applied to Unsupervised Classification of Reviews. In Proceedings of the 40th Annual Meeting of the ACL (pp. 417--424). Prof. Dr. G. Heyer Text Mining – Wissensrohstoff Text 57 Stimmungsanalyse Literatur Turney, P. & Littman, M. (2003). Measuring Praise and Criticism: Inference of Semantic Orientation from Association. ACM Transactions on Information Systems (TOIS), 21(4), 315--346. Wiebe, J. Riloff, E. (2005). Creating Subjective and Objective Sentence Classifiers from Unannotated Texts. In Proceedings of the Sixth International Conference on Intelligent Text Processing and Computational Linguistics (CICLing), pp. 486-497. Wiebe, J., Wilson, T., Bruce, R., Bell, M., Martin, M. (2004). Learning Subjective Language. Computational Linguistics, 30(3), 277--308. Prof. Dr. G. Heyer Text Mining – Wissensrohstoff Text 58
© Copyright 2025 Paperzz