Tag Archives: journalyse

VG’s mest engasjerende artikler

Første halvår er straks over, og jeg bruker anledningen til å spørre Gravemaskinen om hvilke saker som var de mest engasjerende i VG hittil i år (2011):

  1. Dommedagsprofet: Jeg bommet med fem måneder
  2. Ungdom onanerte i medelevers brownies
  3. Amerikaner (19) i dameundertøy skal ha drept naboens pygmegeit
  4. Dommedagsprofet: Jorden går under lørdag
  5. – Lubne lever lengst
  6. Gutt (13) holdt fanget i hundebur, drept og begravd i sement
  7. Norge innfører datalagringsdirektivet
  8. Obama bin Laden skal være død
  9. Nadia gir bort alle konfirmasjonspengene
  10. Her får anda Veranda politieskorte over veien
  11. Vulkanutbrudd på Island
  12. Her slår læreren elevene sine
  13. Forskning: Mer miljøvennlig å ha SUV enn schæfer
  14. Nå kommer sommeren
  15. En liten historie om luft og kjærlighet
  16. VGTV direkte – i tilfelle jorden går under
  17. Ektepar fikk villsau i tv-kabelen
  18. Maria Amelie: – De bør si unnskyld
  19. – Hundeeier satte fyr på sin egen hund
  20. Har du sett et mer spektalulært straffespark?
  21. – Folk på vestkanten blir stadig penere enn på østkanten
  22. Krekar blir henrettet ved Irak-retur
  23. «Jackass»-stjerne døde
  24. Tykk og sunn bedre enn tynn og utrent
  25. Obama: Osama bin Laden ble drept på søndag

Listen genereres automatisk ut fra måleparametere hentet ut via sosiale medier, og et kladdeutkast av artikkelen ble publisert direkte fra et script jeg sitter og jobber med. Tanken er å la Gravemaskinen lage kladdeutkast med de mest interessante statistikkene, for så å fylle ut med kommentarer og tekst på tradisjonelt vis.

Det er ikke nødvendigvis samsvar mellom hvilke saker som er mest lest og hvilke som har skapt mest engasjement i sosiale medier, men det er en viss korrelasjon. Dette er en algoritme på et relativt tidlig stadie, men den er allerede ganske god til å plukke ut de mest engasjerende sakene på dagsbasis, og så vidt jeg kan se er det trolig en god korrelasjon med det jeg vil anta er mest lest.

Nå blir det litt arbeid med å finjustere algoritmen, samt legge på ytterligere variabler slik at det blir mulig å identifisere dagens “snakkiser” på tvers av nettaviser med forskjellig størrelse.

Dette er forøvrig ett av mange eksempler på det vi kaller “journalyse”. Journalyse er et ord satt sammen av analyse og journalistikk, og vi bruker det som et begrep for å beskrive analyser av journalistisk innhold. Det er noe jeg jobber en del med i forbindelse med Gravemaskinen.

Nyhetsdøgnet med Osama Bin Laden

Det ble mange artikler om Osama Bin Laden i norske nettaviser mandag 2. mai 2011, og for meg var det en passende anledning til å teste en ny funksjon i Gravemaskinen.

Sent i går kveld la vi inn en ny funksjon som gjør det mulig å lage en rekke rapporter sortert på timene i et døgn. Den kan brukes på alle variablene og måleparameterne vi bruker til å lage redaksjonelle samfunnsregnskap i våre journalyser.

Ved å søke på “Osama Bin Laden” i noen utvalgte norske nettaviser får jeg frem en slik graf:

Her ser vi at norsk presse raskt hev seg rundt tidlig på morgenen da nyheten ble kjent. De første artiklene kom i firetiden på morgenkvisten og da klokken passerte 07:00 var det fullt publiseringstrykk.

Med unntak av en liten lunsjpause rundt 12:00-13:00 holdt det seg jevnt til langt ut på kvelden. Da gikk nettavisene litt på tomgang i timen fra 21:00-22:00 før de igjen produserte for fullt frem til midnatt.

Tidligere har vi hatt muligheten til å aggregere denne informasjonen over en periode for så å spre den utover døgnets timer. Det nye nå er at vi kan isolere rapporteringen for hvert enkelt døgn slik at vi både kan gå tilbake til spesifikke dager og også se dagen i dag i tilnærmet sanntid.

Dette blir forhåpentligvis en nyttig og mye brukt funksjon i redaksjonene fremover. I dette eksempelet har vi valgt en relativt enkel og standard vinkling med fokus på antall artikler som inneholder et navn, men tilsvarende rapporter kan også genereres for å vise f.eks. kildevariasjon, tekstlengder og språkbruk.

Redaksjonelt regnskap for BT’s leserombud

Terje Angelshaug var tidligere leserombud i Bergens Tidende (BT). Han har lang presseerfaring, og er ikke redd for å si hva han mener.

Nå har han skrevet en omfattende analyse av pressen sett i forhold til mediestøtte, og den vil jeg anbefale på det sterkeste til alle med interesse for journalistikk.

For meg inneholder analysen hans også elementer som er direkte relatert til meg og Gravemaskinen. Angelshaug tar opp behovet for redaksjonelle regnskap, noe jeg jobber med i mine journalyser basert på data fra Gravemaskinen, samt i min masteroppgave på BI der jeg skriver om nettopp redaksjonelle samfunnsregnskap.

På den positive siden er jeg glad for at Angelshaug peker på hvor viktig det er med slike redaksjonelle regnskap.

Basert på BT-lesernes mange spørsmål om og kommentarer til kvalitet i journalistikken, er det naturlig å etterlyse redskaper som kan brukes for måling av journalistisk kvalitet

Samtidig er jeg frustrert over at han trolig har rett i at interessen ikke er så stor som den burde være.

For å motivere sine nølende medlemmer har Redaktørforeningen tilbudt dem hjelp og tips til slike regnskap, men knapt noen sjefredaktører skal ha meldt sin interesse.

Jeg tror den manglende interessen hos norske redaktører kan sammenlignes med en guttunge som står og ser på et rotete rom som skal ryddes. Det er så mye å ta tak i at han ikke skjønner hvor han skal starte, og han orker ikke å sette i gang.

Det hadde hjulpet hvis redaktørene ikke måtte starte med blanke ark når et slikt redaksjonelt regnskap skal lages, og det er en av premissene som ligger bak vårt arbeid med å lage automatiserte journalyser av redaksjonelt innhold ved hjelp av Gravemaskinen.

Vi tror ikke at automatiserte analyser kan erstatte jobben som må gjøres, men vi tror den kan forenkles og effektiviseres, samt at det blir lettere å motivere seg for resten av jobben når man har fått drahjelp i form av et datagrunnlag.

Som et raskt eksempel, skal jeg her lage et slags miniregnskap for Terje Angelshaugs artikler på BT.no i 2010. Det blir ikke helt riktig, ettersom Angelshaug ikke bedriver journalistikk i ordets rette forstand, men det ilustrerer forhåpentligvis verdien av å automatisere deler av jobben med Gravemaskinen.

Ettersom dette er en kjapp analyse jeg gjør mellom et par deadlines på andre skriveoppdrag og et telefonintervju jeg må gjøre i løpet av dagen, så er ikke informasjonen kvalitetssikret på samme måte som jeg pleier å gjøre når jeg lager en journalyserapport for forskjellige nettaviser. Det er litt dumt, men samtidig viser det jo også at det går an å raskt få et overblikk selv når man har dårlig tid.

Det første jeg ser på i min journalyse av Terje Angelshaugs artikler er at han er en morgenfugl. De fleste artiklene hans publiseres klokken 06:00 i følge Gravemaskinen.

En nærmere titt er ikke nødvendig for de som vet litt om publisering i nettaviser, men klokkeslettet viser tydelig at det er snakk om artikler som er skrevet dagen i forveien og som er satt på autopublisering.

Det gjelder imidlertid langt fra alle, så det er tydelig at Angelshaug også publiserer fortløpende i løpet av dagen når han er ferdig med å skrive sine artikler.

Ettersom vi ikke har en strukturert tilnærming til denne journalysen, hopper vi fra punkt til punkt basert på hva som faller oss inn.

Øverst i den bunken ligger en oversikt over mannlige og kvinnelige personer som Angelshaug har omtalt. Her viser rapporten 38 forskjellige herrenavn og 9 forskjellige damenavn. Vi skal ikke legge for mye i det, men det er en indikasjon på at også BT’s leserombud har en skjev kjønnsfordeling – på samme måte som BT.no har i sin helhet.

En kjapp titt på antall personer leserombudet pleier å omtale, viser at mer litt under halvparten inneholder ett personnavn, og litt færre enn det er tekster uten et eneste personnavn. I resten av artiklene omtales mellom 2 og 6 personnavn.

En kjapp analyse av artiklenes tekstlengde tyder på at BT’s leserombud har en fast tekstlengde satt av til sine tekster. På oversiktsrapporten er så og si alle artiklene definert som lange, noe som vil si en tekstlengde på mellom 2500 og 5000 tegn. Kun 3 artikler er definert som middels med 1000-2500 tegn. En oversikt over hver enkelt ville vist et mer nøyaktig tall, men det er ikke så viktig i denne sammenhengen.

Ettersom leserombudet var lesernes kontaktpunkt, er det ekstra viktig at Angelshaug ikke skrev for komplisert. En kjapp analyse av LIKS-verdier viser at han stort sett har et passe avansert språk. Med unntak av 2 artikler som klassifiseres som “barneboknivå” og 1 “tunglest” artikkel, ligger artiklene godt fordelt mellom “lettlest” og “lesbart”.

Som leserombud må Angelshoug svare for journalistikken i Bergens Tidende, men han omtaler også andre norske medier. Det inkluderer blant annet VG, Dagbladet, Aftenposten, Klassekampen, Adresseavisen, Dagens Næringsliv og Journalisten.

At BT’s leserombud for det meste omtaler Bergen by er neppe overaskende, men som alle andre bergensere er også Angelshaug ivrig i å omtale Oslo. Hvorvidt det er i negative eller positive vendinger skal vi ikke se på i denne omgang, men slikt er også mulig å automatisere.

Det er ikke så mange kommuner som får leserombudets blikk rettet mot seg, men noen er det. Foruten Bergen og Oslo, blir også Tromsø, Stokke, Samnaner, Granvin, Lærdal, Vik, Kvam, Eide, Ulvik og Førde omtalt.

Av land som Angelshaug har vist interesse for i sin omtale topper selvsagt Norge. Deretter følger Afghanistan, Tyskland, Sverige, Polen, Litauen, Danmark, Somalia, Pakistan, Irak, Nederland, Iran, Tsjekkia, India, Thailand, Haiti, Frankrike, Østerike, Island, USA og Israel. Vi kan derfor anta at Angelshaug er interessert i hva som skjer i det internasjonale samfunnet, samt at leserne av BT også er det ettersom det er tema i leserombudets spalte.

Når det gjelder ministre, så er ikke leserombudet så veldig opptatt av dem. Av dagens regjering, er det kun Audun Lysbakken som er omtalt i denne spalten. Det var i juli.

I sin meget gode analyse på Vox Publica er Angelshoug veldig flink til å legge inn lenker i teksten, men fullt så ivrig var han ikke i egen spalte. Der er det knapt lenker til andre enn BT.no, og det er ikke så mange lenker til interne artikler heller. Noe av det skyldes sikkert de autopubliserte artiklene på morgenkvisten, men en krysskobling for å sjekke det tar vi oss ikke tid til her og nå.

Dette var tross alt bare en introduksjon til Gravemaskinen hvor poenget mitt er å vise at det går an å automatisere ganske mye. Alle disse opplysningene er hentet direkte ut fra standardrapporter som er tilgjengelig nå, og det er mange flere som er relevante på tvers av alle norske medier.

Gravemaskinen er designet for rask spesialtilpasning, så ved lokale behov kan det raskt legges inn egne innsamlings- analyseregler for det som måtte dukke opp.

Og med det avslutter jeg her og nå, og gir nok en gang anbefalningen om å lese Terje Anglehougs meget gode analyse. Der står det om mye mer enn “bare” redaksjonelle regnskap.

 

PS! Hele denne journalysen tok ca 50 minutter. Det inkluderer både tiden det tok å hente ut informasjonen fra Gravemaskinen, og tiden det tok å skrive dette blogginnlegget. (Jeg er stolt av systemet, og tillater meg derfor å skryte litt av det….)

Drammens Tidende skriver mest om Drammen

Ikke akkurat noen stor overraskelse, men ettersom dette er en blogg tar jeg meg friheten til å vinkle på det helt opplagte.

I går blogget jeg om Aftenpostens favorittbyer, og i dagens journalyse skal jeg ta for meg omtalen av kommuner i Drammens Tidende. Dette henger sammen med ny funksjonalitet i Gravemaskinen som nå har blitt til journalyserapporter som kan hentes ut for alle nettavisene vi analyserer.

Drammens Tidende skriver mest om Drammen kommune, men de skriver også mye om hovedstaden. Dessuten er det mange artikler som omtaler nabokommuner, og som en følge av alt fra idrett til nasjonale saker, så er den geografiske spredningen ganske stor.

I denne grafen har jeg tatt med alle kommuner som er omtalt i minst 200 artikler i Drammens Tidende det siste året, og sortert resten under kategorien “andre kommuner”:

Her er oversikten over kommuneomtale sortert etter antall artikler i Drammens Tidende:

  1. drammen
  2. oslo
  3. lier
  4. modum
  5. nedre eiker
  6. bergen
  7. øvre eiker
  8. hurum
  9. asker
  10. sande
  11. tromsø
  12. røyken
  13. trondheim
  14. bærum
  15. stavanger
  16. kongsberg
  17. svelvik
  18. sigdal
  19. kristiansand
  20. molde
  21. sandefjord
  22. haugesund
  23. fjell
  24. skien
  25. bodø
  26. fredrikstad
  27. krødsherad
  28. lillehammer
  29. tønsberg
  30. åmot
  31. kongsvinger
  32. sarpsborg
  33. ringerike
  34. larvik
  35. hamar
  36. moss
  37. ålesund
  38. elverum
  39. sogndal
  40. arendal
  41. alta
  42. horten
  43. notodden
  44. ski
  45. holmestrand
  46. sandnes
  47. halden
  48. grimstad
  49. porsgrunn
  50. lund
  51. harstad
  52. førde
  53. nannestad
  54. mandal
  55. narvik
  56. stord
  57. gjøvik
  58. voss
  59. kristiansund
  60. rana
  61. hole
  62. os
  63. jevnaker
  64. strand
  65. røros
  66. eidsvoll
  67. ål
  68. sola
  69. hemsedal
  70. volda
  71. ås
  72. flesberg
  73. verdal
  74. lørenskog
  75. gol
  76. steinkjer
  77. stokke
  78. oppegård
  79. rygge
  80. oppdal
  81. søgne
  82. kragerø
  83. råde
  84. giske
  85. flå
  86. hol
  87. hammerfest
  88. trysil
  89. odda
  90. vefsn
  91. sørum
  92. lyngen
  93. levanger
  94. samnanger
  95. vestby
  96. risør
  97. karmøy
  98. lunner
  99. lillesand

 

Aftenpostens favorittbyer

At Oslo troner suverent på topp som mest omtalte norske by i Aftenposten kommer neppe som en overraskelse, men hvordan ligger det an på plassene bak?

Det er utgangspunktet for denne journalysen der jeg har hentet ut statistikk over hvilke norske byer som er mest omtalt det siste året:

  1. oslo
  2. bergen
  3. trondheim
  4. stavanger
  5. kristiansand
  6. tromsø
  7. lillehammer
  8. drammen
  9. tønsberg
  10. bodø
  11. ski
  12. larvik
  13. fredrikstad
  14. sandefjord
  15. haugesund
  16. skien
  17. grimstad
  18. arendal
  19. hamar
  20. elverum
  21. ålesund
  22. sandnes
  23. molde
  24. mandal
  25. sarpsborg
  26. kongsvinger
  27. halden
  28. lillestrøm
  29. sandvika
  30. hammerfest
  31. kongsberg
  32. førde
  33. horten
  34. alta
  35. moss
  36. gjøvik
  37. narvik
  38. florø
  39. harstad
  40. porsgrunn
  41. steinkjer
  42. kristiansund
  43. lillesand
  44. kirkenes
  45. notodden
  46. levanger
  47. egersund
  48. holmestrand
  49. verdal
  50. mosjøen
  51. stord
  52. flekkefjord
  53. odda
  54. hønefoss
  55. lyngdal
  56. askim
  57. kragerø
  58. drøbak
  59. stokmarknes
  60. brønnøysund
  61. risør
  62. namsos
  63. stjørdal
  64. svolvær
  65. sandnessjøen
  66. farsund
  67. langesund
  68. vadsø
  69. fauske
  70. rjukan
  71. tvedestrand
  72. brevik
  73. mysen
  74. vardø
  75. sortland
  76. sauda
  77. otta
  78. bryne
  79. brumunddal
  80. moelv
  81. leknes
  82. honningsvåg
  83. kopervik
  84. ulsteinvik
  85. fagernes
  86. åndalsnes
  87. hokksund
  88. jørpeland
  89. kolvereid
  90. svelvik
  91. finnsnes
  92. fosnavåg
  93. stathelle
  94. måløy
  95. brekstad

Slik ser fordelingen ut: