Populære Innlegg

Redaksjonens - 2019

Twitter-oppførsel kan forutsi brukernes inntektsnivå, viser ny forskning

Anonim

Ordene folk bruker på sosiale medier, kan avsløre skjult mening for de som vet hvor de skal se.

annonse


Lingvistene har lenge vært fascinert av dette begrepet, forbinder en persons ord til alder, kjønn, til og med sosioøkonomisk status. Nå har datavitenskapere fra University of Pennsylvania og andre steder gått et skritt lenger, og kobler den elektroniske oppførselen til mer enn 5000 Twitter-brukere til deres inntektsbrakett. De publiserte sine resultater i tidsskriftet PLOS ONE .

Daniel Preotiuc-Pietro en postdoktorale forsker i Penns Positive Psychology Center i School of Arts & Sciences ledet forskningen, samarbeidet med Svitlana Volkova fra Johns Hopkins University, Vasileios Lampos og Nikolaos Aletras fra University College London og Yoram Bachrach fra Microsoft Research.

Laget tok en motsatt tilnærming til hva psykologer og språkbrukere historisk har gjort: I stedet for å stille direkte spørsmål, så forskerne på deltagerens sosiale medier, ofte med intime detaljer til tross for mangelen på personvern disse uttakene har råd til. Forskere fra Penns verdens velværeprosjekt, hvor Preotiuc-Pietro er en del, er nysgjerrig på sosiale medier som et forskningsverktøy som kan støtte, eller til og med erstatte, dyr, begrenset og potensielt forutbestemt oppmåling.

For dette forsøket startet forskerne ved å se på Twitter-brukerens selvbeskrevne yrker.

I Storbritannia, sorterer et jobbkodesystem okkupasjon i ni klasser. Ved hjelp av det hierarkiet bestemte forskerne gjennomsnittlig inntekt for hver kode, og søkte deretter et representativt utvalg fra hver. Etter manuelt å fjerne tvetydige profiler - for eksempel, oppføringer som refererer til filmen Coal Miner's datter, gruppert som "coal miner" for yrke, endte teamet med 5 191 Twitter-brukere og mer enn 10 millioner tweets å analysere.

"Det er det største datasettet av sitt slag for denne typen forskning, " sa Preotiuc-Pietro. "Datasettet gjorde det mulig for oss å gjøre noe ingen egentlig har gjort før."

Derfra opprettet de en statistisk naturlig språkbehandlingsalgoritme som trakk inn ord som folk i hver kodeklasse bruker tydelig. De fleste har en tendens til å bruke de samme eller lignende ordene, så algoritmens jobb var å "forstå" som var mest prediktive for hver klasse. Mennesker analyserte disse grupperinger og ga dem kvalitative signifikatorer.

Noen av resultatene validerte det som allerede er kjent, for eksempel at en persons ord kan avsløre alder og kjønn, og at disse er knyttet til inntekt. Men Preotiuc-Pietro sa at det var også noen overraskelser; For eksempel, de som tjener mer, pleier å uttrykke mer frykt og sinne på Twitter. Oppfattede optimister har lavere gjennomsnittlig inntekt. Tekst fra de som har lavere inntektsgrupper innebærer flere sverdord, mens de i høyere parentes ofte diskuterer politikk, bedrifter og ideell verden.

Aletras bemerket et helhetlig bilde som dukket opp om Twitter-bruk.

"Lavere inntektsbrukere eller de som har en lavere sosioøkonomisk status, bruker Twitter mer som en kommunikasjonsmiddel blant seg selv, " sa han. "Høyinntektsfolk bruker det mer til å formidle nyheter, og de bruker det mer profesjonelt enn personlig."

Sterke korrelasjoner som disse, mellom hva forskerne beskriver som elektronisk uttrykk og offline demografi - for eksempel yrkesgruppering eller inntektsnivå - viste seg også å være spennende, tilføyde Lampos. "Dette arbeidet forsøker å markere noen av de potensielle årsaksfaktorene i disse relasjonene."

Slike funn vil fungere som en grunnlinje for fremtidig arbeid, hvorav noen vil undersøke hvordan oppfatninger om brukerinntekt tilpasser seg virkeligheten.

annonse



Historie Kilde:

Materialer levert av University of Pennsylvania . Merk: Innholdet kan redigeres for stil og lengde.


Tidsreferanse :

  1. Daniel Preoţiuc-Pietro, Svitlana Volkova, Vasileios Lampos, Yoram Bachrach, Nikolaos Aletras. Studiere brukerinntekter gjennom språk, oppførsel og påvirke sosiale medier . PLOS ONE, 2015; 10 (9): e0138717 DOI: 10.1371 / journal.pone.0138717