Gilla ett inlägg på Facebook. Det blir en pusselbit i kartläggningen av dina ideologiska, kommersiella, kulturella och politiska preferenser. Pusslet lägger de som har de största resurserna.

Ingen kan betvivla att först Internet och Word Wide Web och ovanpå detta nya sociala medier som Facebook och Twitter revolutionerat stora folkgruppers sätt att kommunicera och umgås. De har också en bevisad potential att organisera allt från fredliga demonstrationer till militanta revolter. Den nya IT-tekniken har släppt loss en våg av folklig kreativitet på detta område.

Bra. Men motståndaren är välorganiserad och har därtill mycket större resurser att lära sig behärska den nya tekniken, och de stora, till personer knutna datamängder den ackumulerar - digerdata ("Big data"). Vad som brister i kreativitet och engagemang uppvägs av stora anslag och systematiskt arbete. Vi har sett exempel på detta på underrättelseområdet genom Snowdens avslöjanden av NSA:s - och FRA:s - verksamhet. Andra har kanske märkt att reklamen på Facebook, Google eller Twitter är märkligt målanpassad till den surfande.

I den vetenskapliga webbpublikationen First Monday beskriver sociologen och IT-forskaren Zeynep Tufekci i detalj vad digerdata i kombination med nya analystekniker inneburit inom ett område - valkampanjer.

Att systematisk datainsamling är ett viktigt inslag inför valkampanjer liksom för annan marknadsföring är, som Tufekci konstaterar, ingen nyhet och har under lång tid varit en tillväxtbransch. Noggranna analyser av valresultat och egna opinionsundersökningar med syfte att identifiera viktiga målgrupper av presumtiva väljare har varit redskapen. Men de har varit rätt grova vad gäller att finindela målgrupper och att på djupet penetrera hur de tänker och hur de kan påverkas att rösta "rätt". Exempelvis skyddar valhemligheten från analyser av valresultat nedanför valkretsnivå. Sedvanliga telefon-, intervju- och brevenkäter är dyra och tidskrävande. Ska man tränga på djupet i hur och varför folk tänker och tycker som de gör så blir frågebatterierna långa och motståndet mot att besvara dem, det så kallade bortfallet, ökar. Den totala volymökningen av enkäter (där den kommersiella marknadsföringssektorn torde dominera stort) har också medfört en ökande trötthet bland folk att svara på enkäter, med åtföljande stigande bortfall. Det är för övrigt också ett växande problem för "seriösa" enkäter för forskning och offentlig statistik.

Förutom dessa trögheter och grovheter i datainsamlandet begränsades tidigare också de politiska kampanjmakarnas möjligheter att använda informationen. Öppningarna för propaganda dominerades av ett litet antal massmediekanaler i form av tv- och radio och tidningar, vilka var och en riktade sig till rätt stora och heterogena grupper.

Tufecki visar att IT-utvecklingen nu nått en nivå som möjliggör en helt "ny dynamik för övertalning, övervakning, kampanjarbete och social ingenjörskonst" för att bedriva valkampanjer. Den kvalitativa förändringen kan sammanfattas i sex punkter.

9003_01.jpg

1. Digerdata (Big Data). Digerdata är, menar Tufecki, inte bara jämfört med tidigare en mycket större mängd av persondata som dessutom är mycket snabbare tillgängliga. Det är också en kvalitativ skillnad på typen av data. Den tidigare dominerande datakällan, enkäter, kan individen själv fatta ett medvetet beslut om att besvara eller ej. Dessa kunde i vissa fall samköras med registerdata anskaffade på annat sätt, exempelvis data om kreditkortsinköp eller tidningsprenumerationer. På sådana samkörningar kunde grova samband mellan större grupper ibland klarläggas, men såväl stickprovsstorlek som att data bara gällde ett fåtal saker begränsade starkt förklaringsvärdet och därmed värdet som beslutsunderlag för kampanjarbetet.

Med Internet och därefter de nya sociala mediernas framväxt har det skapats en enorm tillväxt av så kallade "användarskapade" persondata. Stordelen av detta produceras av individer som inte har för avsikt att dela med sig av politiska ståndpunkter. Men de ger massor av indirekt information om livsstil, konsumtionsmönster och attityder med bäring på politik. De skapas vid internethandel, googlande, surfande på webbsidor, deltagande i diskussionsgrupper och sociala medier, med mera. Annat, som deltagande i öppet politiska diskussionsgrupper eller Facebookgrupper, eller politiska yttranden till sina FB-vänner, är av deltagaren i fråga vanligen avsett för begränsade publiker, men kan "skördas" för helt andra syften.

Den nya typen av personinformation är inte bara enormt mycket större än enkäternas ofta relativt små stickprov, vilket möjliggör analyser för mindre delgrupper av folk. Den är också mycket mera rik och mångfaldig till sitt innehåll - från besöksfrekvenser på webbsidor över vilka nätverk man har med andra personer till tydliga yttranden (semantisk information, typ "vinst i skolan är bara skit"). Därför kan mera komplexa analyser göras.

2. Nya beräkningsmetoder utvecklas. Dessa nya stora och heterogena datamängder har varit svåra att hantera och analysera med existerande metoder, men har just därför stimulerat en snabb teknologisk utveckling. Tufecki urskiljer fyra nyckelområden där avgörande framsteg skett:

- Nya datalagringsmetoder, som tillåter lagring av mycket stora datamängder och, framför allt, snabb och pålitlig åtkomst till dem.

- Databearbetningsmetoder som möjliggör automatisk bearbetning av komplex semantisk information, en typ av information som tidigare var mycket arbetsintensiv att bearbeta.

- En stark utveckling av den sociala nätverksanalysen, det vill säga metoder för att kartlägga och analysera sådant som vilka bloggar som länkar till vilka, vilka som kommenterar vilka på ett diskussionsforum, eller vilka som är vänner med vilka på Facebook. Sådana analyser kan exempelvis användas för att identifiera nyckelpersoner eller -grupper vilka är centralt placerade och därför inflytelserika i sociala nätverk. De kan vara värdefulla att speciellt bearbeta i en valkampanj.

- Dessa nya metoder för att underlätta automatisk databearbetning har skapat möjligheter för mycket mera omfattande "korrelationsanalyser" mellan olika typer av personinformation. För valkampanjstrateger kan detta vara mycket värdefullt, exempelvis för att identifiera vilka intressen de genom nätverksanalys identifierade nyckelpersonerna har, så att de kan bearbetas med skräddarsydda argument.

3. Bättre modeller. När man för att dra slutsatser av en viss datamängd - till exempel data om personers åsikter och beteenden under en viss tid på en viss plats - utnyttjar kunskap som skapats på annat sätt eller på annan tid och plats kallas det att modellera. Detta är inget nytt, och det används exempelvis i de prognoser som under valvakorna brukar presenteras på grundval av SVT:s vallokalsundersökningar, där hänsyn tas till tidigare röstningsbeteende i de valdistrikt som valts ut för enkäten1. Men Tufecki visar att modelleringsverktygen tagit nya stora kliv framåt för att kunna hantera digerdata och dess nya möjligheter. Nu modellereras inte bara gruppers beteenden och egenskaper, nu modelleras på individnivå.

Exempelvis har modeller utvecklats som, enbart baserade på personers sätt att använda "gilla" i Facebook, med god träffsäkerhet förutsäger en lång rad personliga egenskaper såsom ålder, kön, sexuell läggning, etnisk tillhörighet, religiösa och politiska åsikter, personlighetsdrag, droganvändning med mera. Jämfört med traditionella enkäter ger denna typ av informationsutvinning från sociala medier en mycket rikare bild av en den potentiella väljaren. Den kan omfatta sidor av personligheten som få skulle vilja berätta om vid en öppen enkätfråga.

Säkert har en och annan läsare redan varit med om att via nätet ta emot riktad reklam där marknadsförare tycks ha en förunderlig förmåga att gissa ens tänkbara behov. En bekant till mig fick således nyligen reklam från avsändare som uppenbart känner till att hon nyligen brutit benet. Detta är exempel på vad modellering från data på sociala medier och andra Internetkällor kan ge. I valsammanhang är Obamas omvalskampanj 2012 det stora internationella genombrottet för dessa nya metoder.

4. Beteendevetenskapliga framsteg. Dock är all denna information på personnivå av begränsad betydelse utan medel att påverka på samma nivå. Att sociala medier rent tekniskt ger sådana möjligheter är uppenbart, som benbrottsexemplet ovan illustrerar. Men Tufecki pekar också på att den nya typen av information om vad folk tycker, tänker och känner som kan utvinnas ur digerdata, gör det möjligt att bygga kampanjstrategier som går utöver förenklade antaganden om individer som styrda av rationella överväganden, exempelvis vilka inkomstlägen som förlorar eller vinner på en viss skatteförändring. Genom att sådana rationella, ofta "plånboksrelaterade" kampanjargument kompletteras med kampanjande byggt på kunskap om individers mer eller mindre känslomässiga och irrationella bevekelsegrunder, möjliggörs en mera skräddarsydd propaganda. Speciellt marginalväljare, inklusive de som vacklar mellan sofflocket och det kampanjande partiet, kan vinnas med sådana argument, enligt Tufecki.

Med start i Obamas kampanj 2008 har därför ett ökat antal beteendevetare rekryterats till kampanjstaberna. Tillsammans med de ökade möjligheterna som den moderna IT-miljön ger för målstyrd och specialanpassad information har det lett till effektivare kampanjer (för de valmaskinerier som har råd att nyttja möjligheterna). Exempelvis är skrämseltaktik ofta effektivt - men den kan ha motsatt effekt på vissa målgrupper. Lösningen är given: använd skrämseltaktik på de grupper där det fungerar, men ha ett annat tonläge mot de där den inte kan förväntas fungera.

5. Experiment i realtid. Trots digerdata och trots nya och bättre modeller så är varje situation ny och unik, och därtill kan de existerande beslutsunderlagen peka åt olika håll. Men även här kommer den moderna IT-miljön med sin snabbhet och sina rika återkopplingsmöjligheter till hjälp. Med Tufeckis ord: "On-linevärlden har öppnat dörrarna till billig, storskalig realtidstestning av den politiska kommunikationens och övertalningskonstens effektivitet, något avgörande nytt i politiska kampanjer."

Det kan gå till som följer: Man skapar ett flertal versioner av den bild eller det budskap man vill sprida, och sprider de olika versionerna till olika utslumpade kontrollgrupper, som alltså får var sin version av bilden eller budskapet. Man mäter i realtid responsen, till exempel på Facebook i form av antal "gilla" eller antal delningar till andra av budskapet. Den version som ger bäst respons blir det budskap som går ut brett, inom den aktuella målgruppen.

Redan 2007 använde Obamas kampanj denna typ av experimenterande. Man skapade tidigt i kampanjen 24 varianter av startsidan för kampanjwebbplatsen, skickade ut varje version till 13 000 mottagare och testade vilken som gav mest svar i form av folk som skrev upp sig för att få löpande information, samt donerade bidrag. Den vinnande kombinationen, som innehöll ett foto av presidenten med fru och barn, fick 40 procent fler att skriva på och en motsvarande ökning av bidragsfrekvensen samt folk som anmälde sig som kampanjvolontärer. Som ett resultat kom Obamas familj att spela en dominerande roll i den resterande kampanjens informationsmaterial.

6. Makten över plattformar och algoritmer. Flertalet av de plattformar på vilka de dominerande interaktiva sociala medierna har utvecklats ägs av privata företag vilka har kontroll över mycket av det som yttras. De fungerar med algoritmer som är okända för såväl den breda allmänheten som utomstående IT-kunnig expertis. På Facebook och Twitter styr sådana algoritmer exempelvis vilka inlägg som systemen själva puffar extra för. Och de stora datamängder som plattformarna ackumulerar kontrolleras på det stora hela av deras ägare, och är till salu för olika syften inklusive valkampanjer med tjock plånbok. Givetvis kan de också användas av företagens ägare för politisk lobbying i eget intresse.

Samma effekt finns med sökmotorer som Google, där sökresultaten kan rankas så att önskade budskap hamnar på första sidan. Detta kan göras genom att man ändrar rankningsalgoritmerna på ett sätt som är svårt att binda till ett visst intresse, och hur som helst är algoritmerna väl bevarade affärshemligheter.

Vi har alltså fått en situation där en massa människor "frivilligt" lämnar ut data om sig själva, som sedan kan användas av plattformsägarna och dem de vill gynna eller säljer informationen till, utan insyn för den enskilde eller för det allmänna. En inte obetydlig maktförskjutning.

Tufecki hävdar avslutningsvis att bristen på insyn i kombination med de föregående fem punkterna tillåter kampanjmakare att inte bara skräddarsy information, men i praktiken spela dubbelspel, det vill säga ge ett budskap till en målgrupp, men ett helt annat, och kanske rent av mot det första stridande, budskap till en annan målgrupp. De nya sociala mediernas segmenterade karaktär gör dubbelspelet svårt att avslöja.

Vi har då kommit långt från de oberoende medborgarnas fria samtal på det gemensamma "torget".

Källa: Zeynep Tufekci (2014). Engineering the public: "Big data, surveillance and computational politics." First Monday, 7 Juli 2014.

För detaljer, "se svt.se"

Copyright problem med bilder

Merparten av bilderna i äldre tidskriftsartiklar är i karantän men senaste numret för e-prenumeranter innehåller alla bilder. Vi publicerar godkända bilder allteftersom. 

Mest läst av skribenten