1. Startsiden
  2. Det store mediebildet
  3. Medieforskning

Resirkulering av nyheter i nettavisene 1999-2009

Forsker: Dag Elgesem

Tildelt støtte: 2010

Arbeids-/studiestedUiB, Institutt for informasjon og medievitenskap

Epost: dag.elgesem@infomedia.uib.no

Få tak i rapport: dag.elgesem@infomedia.uib.no

Sammendrag:

Utgangspunktet for prosjektet var det arkivet av nettaviser som er samlet ved Norsk aviskorpus siden 1998. For å etablere et test-korpus, valgte vi å starte med å se på saker på forsidene av 8 nasjonale og regionale nettaviser i siste del av perioden, og hentet de 10 øverste sakene på disse forsidene (klokken 20 hver dag, i perioden 7.-18. desember). Dette har gitt oss et test-datasett på 960 nyhetsartikler.

Vi laget skript for å rense teksten for reklame og annen irrelevant informasjon, slik at de var tilrettelagt for automatisert analyse. Vi utviklet programvare for automatisert identifikasjon av gjenbruk og resirkulering av nyheter. Og så har vi utviklet et program for å sammenlikne tekster, basert på en såkalt «suffix tree»-algoritme. Den henter ut tekster som overlapper og grupperer dem.
Arbeidet vil munne ut i artikler i medievitenskaplige journaler, med fokus på spørsmål knyttet til mediemangfold. Arbeidet supplerer og nyanserer bildet som er gjort i f.b.m- Nyhetsveka-prosjektet ved Høyskolen i Volda. Prosjektet vil også gi artikler i informasjonsvitenskaplige tidsskrift, om algoritmer for automatisert tekstanalyse.