SKUP 2011

662 journalister samles denne helgen i Tønsberg for å få med seg 75 seminarer med 99 forelesere, samt finne ut hvem av de 66 bidragene som vinner årets SKUP.

Selv er jeg med som deltager, foreleser og en av de 66 konkurrentene, og alle mine tre personligheter gleder seg veldig.

I forbindelse med SKUP setter vi opp en egen midlertidig utgave av Gravemaskinen som vi kaller for SKUP-maskinen. Den er ikke helt ferdig konfigurert ennå, men jeg regner med å få den på plass i løpet av morgendagen.

Den vil bli brukt både under mitt foredrag 15:30-16:30 på lørdag, samt på diverse ad-hoc analyser og graveprosjekter jeg tenkte å sysle litt med under konferansen.

Det kan gå hardt for seg når meningsbærende journalister møtes til dyst, og for å være på den sikre siden pakket jeg ned litt ekstra utstyr til konferansen:

Det var nok ikke så dumt tenkt, men likevel ikke godt nok

Jeg har som ambisjon å både blogge og tvitre aktivt gjennom hele helgen, så hvis du er interessert i journalistikk kan du følge med her eller på Twitter gjennom knaggen #skup2011.

Mest om USA, Iran, Afghanistan og Russland så langt

Wikileaks slipper fortløpende de lekkede dokumentene fra den såkalte Cablegate.

Enn så lenge er det relativt få av en kvart millioner dokumenter som er lagt ut. I følge Dagsavisen’s speiling er det snakk om 3.436 av 251.287 dokumenter.

I mine øyne er dette et overraskende lavt tall. Hvorvidt det skyldes at Wikileaks er så seriøse som de selv påstår i forarbeidet før dokumentene slippes, eller om det er amerikanske myndigheter som har lykkes i å bremse ned aktiviteten vet jeg ikke.

Det er mange måter å se på de åpent tilgjengelige dokumentene, og jeg har nå laget en liten oversikt over hvilke land som er mest omtalt:

At USA selv topper listen er ingen overraskelse ettersom der er USA’s dokumenter som er på avveie. De vil nødvendigvis toppe listen.

Mer interessant er det å se hvilke land som følger etter. Dette er jo ikke listen over omtale i alle dokumentene, men omtale i de dokumentene som WikiLeaks har publisert. Det betyr at oversikten over hvilke land som er omtalt gir en viss pekepinn på hvor WikiLeaks og publiseringspartnerne har rettet sitt fokus.

Vi ser f.eks. at Norge ikke er spesielt hyppig omtalt, samt at de 10 mest omtalte landene stort sett er relatert til land som hyppig frekventerte nyhetene også før WikiLeaks lekkasjen.

På mange måter kan det virke litt som at interessen for WikiLeaks har dabbet av noe i de norske redaksjonene, noe som muligens kan skyldes at Aftenposten sitter på rubb og stubb. Det betyr jo at det blir vanskeligere for f.eks. VG og Dagbladet å finne noe unikt som ikke Aftenposten lett kan toppe etterpå.

Sånn sett er det kanskje en journalistisk ulempe at en enkelt norsk redaksjon sitter på mer informasjon enn de andre. Kanskje ville det vært bedre om det var to norske redaksjoner, slik at det ble litt konkurranse om å finne de journalistiske poengene?

På den annen side er det fullt mulig å finne nye redaksjonelle poeng og nyheter i det eksisterende materialet. Det er bare å se på innholdet fra en annen vinkel…

Årets beste stillingsannonse

PST gjorde en fantastisk jobb da de lagde denne stillingsannonsen:

Den er genial på flere nivåer, og jeg er spesielt imponert over måten den lokker teknologer til å søke, samtidig som stillingsannonsen avslører de som bare kan faget.

Jeg skal ikke avsløre alle feilene de har lagt inn, og jeg er faktisk ikke sikker på om jeg har funnet alle. Det er også flere jeg mistenker å være feil som PST trolig ikke har tenkt på da de lagde den…

For de som ikke forstår gresk, så er teksten en SQL-syntaks. Det er et dataspråk som brukes til å hente ut (eller redigere) informasjon i databaser. Ved å skrive stillingsannonsen på denne måten utelukkes dermed alle som ikke vet det, eller som ikke klarer å finne de tekniske feilene i syntaksen.

Samtidig luker annonsen ut alle søkere som eventuelt finner de tekniske feilene, men som ikke tenker seg om. Stillingsannonsen inneholder flere feil laget for å teste søkernes samfunnsforståelse.

Den mest opplagte av disse er “where soundex(.a.etternavn) = soundex(‘HJELMESÆN’)”. “WHERE” er en spesifisering av filtrering av hvilke data som skal hentes ut fra databasen, og soundex er en funksjon som regner ut hvor likt to tekstsnutter høres ut.

Ved å bare hente ut etternavn som har en viss likhet med et norskklingende navn som “HJELMESÆN”, signaliserer denne stillingsannonsen at de bare er interessert i søkere med norskklingende navn…

Det er selvsagt feil, ettersom det er både politisk og faglig korrekt å etterstrebe en variert sammensetning av ansatte i en etat som PST.

Denne stillingsannonsen vil forhåpentligvis tiltrekke mange kvalifiserte søkere. Vi trenger et kompetent PST, og selv om jeg ved flere anledninger har vært kritisk til etatens IT-kunnskaper, så gir dette meg et visst håp om at det er noen smarte folk der som har både gode IT-kunnskaper og sosial kompetanse. At de også har god humor ser jeg på som en stor bonus.

Hvis noen skulle begynne å lure på om jeg har søkt eller om jeg kommer til å søke, så er svaret nei.

Jeg svært negativ til PST’s iver for å få Datalagringsdirektivet innført på det de burde vite er et sviktende faglig grunnlag. Mitt engasjement i Stopp Datalagringsdirektivet gjør også at de neppe ville stolt på meg, uavhengig av om det er en reel bekymring eller ikke. Det spiller uansett ingen rolle, ettersom jeg ikke vil være med på å jobbe med det som er Datalagringsdirektivets eneste reelle saklige argument: utveksling av etterretningsinformasjon med andre lands overvåkningspoliti.

Dessuten er slike stillingsannonser den perfekte måten å samle inn informasjon. Det må jo nødvendigvis gjøres en grundig undersøkelse av personene som søker, og hvis man søker uten å få jobben så har man med viten og vilje gitt fra seg ekstremt mye informasjon om seg selv…

Jeg har landet en DC10

I helgen var jeg på FlightSim LAN 2011 for å sjekke ut Norges mest ihuga flysimulatorentusiaster i forbindelse med en frilansreportasje for Teknisk Ukeblad.

Det var et imponerende miljø, og jeg er særdeles imponert over hvor langt disse gutta har klart å ta hobbyen sin. Jeg sysler med min egen flysimulator, men jeg har langt igjen før jeg er på samme nivå.

Det er vanskelig å trekke frem en spesiell opplevelse av de mange jeg hadde, men jeg sysler med tanken om å skrive ut noen flere frilansartikler basert på både erfaringene jeg gjorde meg, samt notatene jeg har fra alle jeg intervjuet. På tross av 9 siterte kilder og 11 omtalte personer i min artikkel for Teknisk Ukeblad, er det mye mer som jeg tror kan være interessant for andre lesere.

Tiden strekker imidlertid ikke helt til akkurat nå, så jeg tror jeg i dag skal nøye meg med å legge ut et videoopptak som min copilot gjorde da jeg fikk prøve meg i entusiastenes egen DC10-simulator.

Opptaket er gjort under dårlige lysforhold med min iPhone, men den viser i hvert fall at jeg greide å lande.

Flysimulatoren fikk de gratis av Continental for mange år siden da selskapet faset DC10 ut til fordel for nyere fly. Det tok entusiastene 5 år før de klarte å starte den for første gang, og nå har de koblet den opp mot Flight Simulator 2004.

Slik ser den ut på utsiden:

Og slik ser den ut på innsiden:

Jeg forventer å bli trodd når jeg sier at det var dritkult å fly den!

Redaksjonelt regnskap for BT’s leserombud

Terje Angelshaug var tidligere leserombud i Bergens Tidende (BT). Han har lang presseerfaring, og er ikke redd for å si hva han mener.

Nå har han skrevet en omfattende analyse av pressen sett i forhold til mediestøtte, og den vil jeg anbefale på det sterkeste til alle med interesse for journalistikk.

For meg inneholder analysen hans også elementer som er direkte relatert til meg og Gravemaskinen. Angelshaug tar opp behovet for redaksjonelle regnskap, noe jeg jobber med i mine journalyser basert på data fra Gravemaskinen, samt i min masteroppgave på BI der jeg skriver om nettopp redaksjonelle samfunnsregnskap.

På den positive siden er jeg glad for at Angelshaug peker på hvor viktig det er med slike redaksjonelle regnskap.

Basert på BT-lesernes mange spørsmål om og kommentarer til kvalitet i journalistikken, er det naturlig å etterlyse redskaper som kan brukes for måling av journalistisk kvalitet

Samtidig er jeg frustrert over at han trolig har rett i at interessen ikke er så stor som den burde være.

For å motivere sine nølende medlemmer har Redaktørforeningen tilbudt dem hjelp og tips til slike regnskap, men knapt noen sjefredaktører skal ha meldt sin interesse.

Jeg tror den manglende interessen hos norske redaktører kan sammenlignes med en guttunge som står og ser på et rotete rom som skal ryddes. Det er så mye å ta tak i at han ikke skjønner hvor han skal starte, og han orker ikke å sette i gang.

Det hadde hjulpet hvis redaktørene ikke måtte starte med blanke ark når et slikt redaksjonelt regnskap skal lages, og det er en av premissene som ligger bak vårt arbeid med å lage automatiserte journalyser av redaksjonelt innhold ved hjelp av Gravemaskinen.

Vi tror ikke at automatiserte analyser kan erstatte jobben som må gjøres, men vi tror den kan forenkles og effektiviseres, samt at det blir lettere å motivere seg for resten av jobben når man har fått drahjelp i form av et datagrunnlag.

Som et raskt eksempel, skal jeg her lage et slags miniregnskap for Terje Angelshaugs artikler på BT.no i 2010. Det blir ikke helt riktig, ettersom Angelshaug ikke bedriver journalistikk i ordets rette forstand, men det ilustrerer forhåpentligvis verdien av å automatisere deler av jobben med Gravemaskinen.

Ettersom dette er en kjapp analyse jeg gjør mellom et par deadlines på andre skriveoppdrag og et telefonintervju jeg må gjøre i løpet av dagen, så er ikke informasjonen kvalitetssikret på samme måte som jeg pleier å gjøre når jeg lager en journalyserapport for forskjellige nettaviser. Det er litt dumt, men samtidig viser det jo også at det går an å raskt få et overblikk selv når man har dårlig tid.

Det første jeg ser på i min journalyse av Terje Angelshaugs artikler er at han er en morgenfugl. De fleste artiklene hans publiseres klokken 06:00 i følge Gravemaskinen.

En nærmere titt er ikke nødvendig for de som vet litt om publisering i nettaviser, men klokkeslettet viser tydelig at det er snakk om artikler som er skrevet dagen i forveien og som er satt på autopublisering.

Det gjelder imidlertid langt fra alle, så det er tydelig at Angelshaug også publiserer fortløpende i løpet av dagen når han er ferdig med å skrive sine artikler.

Ettersom vi ikke har en strukturert tilnærming til denne journalysen, hopper vi fra punkt til punkt basert på hva som faller oss inn.

Øverst i den bunken ligger en oversikt over mannlige og kvinnelige personer som Angelshaug har omtalt. Her viser rapporten 38 forskjellige herrenavn og 9 forskjellige damenavn. Vi skal ikke legge for mye i det, men det er en indikasjon på at også BT’s leserombud har en skjev kjønnsfordeling – på samme måte som BT.no har i sin helhet.

En kjapp titt på antall personer leserombudet pleier å omtale, viser at mer litt under halvparten inneholder ett personnavn, og litt færre enn det er tekster uten et eneste personnavn. I resten av artiklene omtales mellom 2 og 6 personnavn.

En kjapp analyse av artiklenes tekstlengde tyder på at BT’s leserombud har en fast tekstlengde satt av til sine tekster. På oversiktsrapporten er så og si alle artiklene definert som lange, noe som vil si en tekstlengde på mellom 2500 og 5000 tegn. Kun 3 artikler er definert som middels med 1000-2500 tegn. En oversikt over hver enkelt ville vist et mer nøyaktig tall, men det er ikke så viktig i denne sammenhengen.

Ettersom leserombudet var lesernes kontaktpunkt, er det ekstra viktig at Angelshaug ikke skrev for komplisert. En kjapp analyse av LIKS-verdier viser at han stort sett har et passe avansert språk. Med unntak av 2 artikler som klassifiseres som “barneboknivå” og 1 “tunglest” artikkel, ligger artiklene godt fordelt mellom “lettlest” og “lesbart”.

Som leserombud må Angelshoug svare for journalistikken i Bergens Tidende, men han omtaler også andre norske medier. Det inkluderer blant annet VG, Dagbladet, Aftenposten, Klassekampen, Adresseavisen, Dagens Næringsliv og Journalisten.

At BT’s leserombud for det meste omtaler Bergen by er neppe overaskende, men som alle andre bergensere er også Angelshaug ivrig i å omtale Oslo. Hvorvidt det er i negative eller positive vendinger skal vi ikke se på i denne omgang, men slikt er også mulig å automatisere.

Det er ikke så mange kommuner som får leserombudets blikk rettet mot seg, men noen er det. Foruten Bergen og Oslo, blir også Tromsø, Stokke, Samnaner, Granvin, Lærdal, Vik, Kvam, Eide, Ulvik og Førde omtalt.

Av land som Angelshaug har vist interesse for i sin omtale topper selvsagt Norge. Deretter følger Afghanistan, Tyskland, Sverige, Polen, Litauen, Danmark, Somalia, Pakistan, Irak, Nederland, Iran, Tsjekkia, India, Thailand, Haiti, Frankrike, Østerike, Island, USA og Israel. Vi kan derfor anta at Angelshaug er interessert i hva som skjer i det internasjonale samfunnet, samt at leserne av BT også er det ettersom det er tema i leserombudets spalte.

Når det gjelder ministre, så er ikke leserombudet så veldig opptatt av dem. Av dagens regjering, er det kun Audun Lysbakken som er omtalt i denne spalten. Det var i juli.

I sin meget gode analyse på Vox Publica er Angelshoug veldig flink til å legge inn lenker i teksten, men fullt så ivrig var han ikke i egen spalte. Der er det knapt lenker til andre enn BT.no, og det er ikke så mange lenker til interne artikler heller. Noe av det skyldes sikkert de autopubliserte artiklene på morgenkvisten, men en krysskobling for å sjekke det tar vi oss ikke tid til her og nå.

Dette var tross alt bare en introduksjon til Gravemaskinen hvor poenget mitt er å vise at det går an å automatisere ganske mye. Alle disse opplysningene er hentet direkte ut fra standardrapporter som er tilgjengelig nå, og det er mange flere som er relevante på tvers av alle norske medier.

Gravemaskinen er designet for rask spesialtilpasning, så ved lokale behov kan det raskt legges inn egne innsamlings- analyseregler for det som måtte dukke opp.

Og med det avslutter jeg her og nå, og gir nok en gang anbefalningen om å lese Terje Anglehougs meget gode analyse. Der står det om mye mer enn “bare” redaksjonelle regnskap.

 

PS! Hele denne journalysen tok ca 50 minutter. Det inkluderer både tiden det tok å hente ut informasjonen fra Gravemaskinen, og tiden det tok å skrive dette blogginnlegget. (Jeg er stolt av systemet, og tillater meg derfor å skryte litt av det….)