Sentimentanalyse - Excel-tips

Sentimentanalyse in Excel! Er is een gratis invoegtoepassing van Microsoft Labs waarmee u sentimentanalyse in Excel kunt uitvoeren. Wat als u honderden enquêteopmerkingen moet doorzoeken om te zien wat mensen van uw bedrijf vinden? Excel kan een waarschijnlijkheid toewijzen die aangeeft hoe positief of negatief elke opmerking is.

Bekijk video

  • Het is gemakkelijk om enquêtegegevens te kwantificeren als het meerkeuze is
  • U kunt een draaitabel gebruiken om erachter te komen welk percentage elk antwoord heeft
  • Maar hoe zit het met antwoorden in vrije tekst? Deze zijn moeilijk te verwerken als u er honderden of duizenden heeft.
  • Sentimentanalyse is een machine-gebaseerde methode om te voorspellen of een antwoord positief of negatief is.
  • Microsoft biedt een tool die sentimentanalyse in Excel uitvoert: Azure Machine Learning.
  • Traditionele sentimentanalyse vereist dat een mens 5% van de uitspraken analyseert en categoriseert.
  • Traditionele sentimentanalyse is niet flexibel - u zult het woordenboek voor elke branche opnieuw opbouwen.
  • Excel gebruikt MPQA Subjectivity Lexicon (lees daarover op http: // bit. Ly / 1SRNevt)
  • Dit algemene woordenboek bevat 5.097 negatieve en 2.533 positieve woorden
  • Elk woord krijgt een sterke of zwakke polariteit toegewezen
  • Dit werkt prima voor korte zinnen, zoals tweets of Facebook-berichten
  • Het kan voor de gek gehouden worden door dubbele negatieven
  • Ga om te installeren naar Invoegen, Excel Store en zoek naar Azure Machine Learning
  • Specificeer een invoerbereik en twee lege kolommen voor het uitvoerbereik.
  • De kop voor het invoerbereik moet overeenkomen met het schema: tweet_text
  • Begeleidend artikel op: http://sfmagazine.com/post-entry/may-2016-excel-sentiment-analysis/

Videotranscriptie

Leer Excel van Podcast, aflevering 2062: sentimentanalyse in Excel

Oh hey, het was een Thanksgiving-avond en we zaten rond de pompoentaart en Jes, een vriend van ons, begon te praten over sentimentanalyse op Twitter-gegevens. En ik zei: "Hé, je weet dat Excel een manier heeft om sentimentanalyse uit te voeren." En ik realiseerde me dat ik geen goede video over deze of enige andere video hierover had, dus deze video gaat over het doen van sentimentanalyse in Excel.

Nu is de eerste vraag: wat is in vredesnaam sentimentanalyse? En als u een enquête onder uw klanten doet en ze hebben een meerkeuzeselectie waarbij ze kunnen kiezen uit 1 tot 5, dan is dat echt heel gemakkelijk te analyseren. U kunt gewoon een kleine draaitabel maken: Voeg de draaitabel in, Bestaand werkblad hier, klik op OK. We willen de vraag daar of het antwoord op de vraag weten, en dan hoeveel antwoorden er waren voor elk, en dat geeft ons het absolute aantal. U kunt hier zelfs binnenkomen en dit wijzigen van Veldinstellingen naar Waarden weergeven als% van het kolomtotaal, zoals dat.

Oké, dus je kunt voor elk antwoord zien welk percentage van de mensen een antwoord krijgt. Oké, maar sentimentanalyse is bedoeld voor als je een heel lang antwoord hebt waarin je zegt: "Hé, oké, weet je, vertel ons waarom je ons dat antwoord hebt gegeven?" En ze, weet je, gebruiken zinnen of alinea's. Als je er honderden of duizenden hebt, is het erg moeilijk voor iemand om ze allemaal te lezen en erachter te komen wat er aan de hand is, oké?

Er zijn dus twee verschillende soorten sentimentanalyse. In het verleden gebruikte je normaal gesproken een door mensen begeleid leeralgoritme. Dus als je 5.000 antwoorden had, ga dan door, weet je, 200 van die antwoorden en kies de positieve en negatieve woorden en zinnen. Je bouwt in wezen een woordenboek van de positieve en negatieve woorden; maar weet je, dit was erg beperkend. Als je dit deed voor een plaats waar een auto werd gerepareerd en vervolgens een andere klant had, weet je wel, die het tapijt heeft schoongemaakt, dan zijn die twee woordenboeken totaal verschillend. Je moet machine learning of het door mensen begeleide leren keer op keer doen. Dus Excel gebruikt dit ding genaamd de MPQA Subjectivity Lexicon en je kunt dit op Google gebruiken. Het heeft de informatie erover - 5.097 negatieve woorden, 2533 positieve woorden. En dus,het werkt geweldig voor korte zinnen of tweets of Facebook-berichten. Maar een ding dat me is opgevallen, is dat als iemand in dubbele negatieven schrijft, ik niet kan zeggen dat ik deze functie niet haat, wel, het machine learning zal daar mislukken. En ach, ik faal. Ik kan niet zeggen of ze gelukkig zijn of niet.

Oké, dus hier is wat we doen. Ga in Excel 2013 of Excel 2016 naar het tabblad Invoegen, ga naar de Store, wanneer het zoekvak verschijnt, zoek naar Azure Machine en u krijgt daar Azure Machine Learning. We klikken op Toevoegen. Oké, en er zijn twee verschillende tools beschikbaar: de Titanic Survivor Predictor, wat leuk is; en de Excel-invoegtoepassing Text Sentiment Analysis. Laten we die gebruiken. Oké, hier zijn een paar dingen die je zullen doen struikelen. Uw titel: neem een ​​alinea om uw antwoord uit te leggen. Het moet overeenkomen met het schema en het schema zegt dat de kop tweet_text moet zeggen. Dus hier: tweet_text, natuurlijk, hoofdlettergevoelige zaken, oké. En sluit vervolgens het schema en vervolgens Voorspellen, Invoer: A1 tot 100, Mijn gegevens hebben kopteksten, Uitvoer: GegevensB1, Inclusief de kopteksten. Ze gaan ons 2 kolommen geven.Zorg ervoor dat je daar 2 lege kolommen hebt; anders overschrijft het de gegevens. U heeft 2 keuzes: een paar rijen tegelijk of als een batch. Dit zijn er maar honderd, dus het maakt niet uit. Ik kies Predict en BAM! Net zo snel.

Oké, we krijgen 2 kolommen: we krijgen een sentiment en een score, oké. Laten we de scores hier dus weergeven als percentages met een aantal decimalen. Oké, dus 47.496, dit gaat van 0 naar 100%. Bijna 100 is extreem positief, dichtbij 0 is extreem negatief, oké? Dus hier hebben we er een met een klein probleem, dat maakt me gek. Kan de oplossing niet vinden, dus u kunt zien waarom dat als extreem negatief wordt beoordeeld. Laten we er een bekijken die buitengewoon positief is. Oké, dus je weet het, dus we hebben hier enkele blije woorden: alsjeblieft en bedankt, uitroeptekens enzovoort. Dat draagt ​​misschien bij aan de hoge score. Oké, dus is het perfect? Nee, maar het geeft je een snelle, snelle manier om je te vertellen, weet je, hoeveel mensen buitengewoon blij of extreem negatief zijn over die antwoorden.

En natuurlijk, nogmaals, hier kunnen we dit doen met een draaitabel: Invoegen, Draaitabel, ga hier naar een bestaand werkblad, klik op OK, en we zijn geïnteresseerd in het sentiment, en dan is misschien de gemiddelde score voor elk van deze. Dus we veranderen dit onder Veldinstellingen in een gemiddelde, klik op OK. En dus, of misschien zelfs een graaf. Ik denk dat we de graaf willen weten, hoeveel mensen. Dus we nemen een ander veld, en dus weten we hoeveel mensen negatief waren. Ooh, hoeveel mensen waren neutraal, hoeveel mensen waren positief en wat de gemiddelde score van elk van hen was.

Oké, dus als je enquêtegegevens hebt en het is een multiple choice, dan kun je eenvoudig een draaitabel gebruiken om erachter te komen welk percentage elk antwoord heeft. Maar voor antwoorden met vrije tekst is het moeilijk te verwerken. Als je er honderden of duizenden hebt, is sentimentanalyse een machinale methode om te voorspellen of een antwoord positief of negatief is. Microsoft biedt hiervoor een gratis tool aan. Werkt in Excel 2013 of Excel 2016, genaamd Azure Machine Learning. Meestal moeten 5% van de verklaringen handmatig met de hand worden doorgenomen en gecategoriseerd. Het is niet flexibel, je moet voor elke nieuwe dataset opnieuw categoriseren, maar Excel gebruikt deze MPQA Subjectivity Lexicon. Het is een algemeen woordenboek. Het gaat werken voor korte zinnen, tweets, Facebook-berichten. Ik kan me laten misleiden door dubbele negatieven. Dus ga gewoon naar de Excel Store,zoek naar Azure Machine Learning. Specificeer een invoer en twee kolommen voor een uitvoerbereik. Vergeet in dit specifieke geval niet om de kop te wijzigen zodat deze overeenkomt met het schema, tweet_text.

Oké, dus daar ga je. De volgende keer dat u een grote hoeveelheid gegevens moet analyseren, kunt u Azure Machine Learning gebruiken, de gratis invoegtoepassing voor Excel 2013. Bedankt voor uw bezoek, we zien u de volgende keer voor een nieuwe netcast.

Download bestand

Download het voorbeeldbestand hier: Podcast2062.xlsm

Interessante artikelen...