Show simple item record

 
dc.contributor.author CLARINO Bergen senter
dc.contributor.author Lyse Samdal, Gunn Inger
dc.date.accessioned 2025-09-02T11:25:01Z
dc.date.available 2025-09-02T11:25:01Z
dc.date.issued 2025-04-11
dc.identifier.uri http://hdl.handle.net/11509/157
dc.description Frekvensordliste fra Norsk aviskorpus (bokmål). Frekvensordlisten er en liste av de 10.000 mest frekvente ordene i Norsk aviskorpus, sortert på frekvens fra høyest til lavest. Norsk aviskorpus inneholder tekst fra elleve store aviser med materiale fra 1998 til 2022. Frekvensordlisten kan f.eks. bruke for å luke ut «stoppord» (vanlige ord med antatt lav informasjonsverdi) i språkteknologisk prosessering av tekst, eller for å tallfeste hva som er «vanlige» ord og ordforråd. Listen inneholder både språklige ord og tegnsetting, og skiller mellom store og små bokstaver. På toppen av listen finner du bl.a.: ".", "som", "det", og "Det". Merk at de mest frekvente ordene fra avisspråk, som her, kan være annerledes enn de mest frekvente ord fra skjønnlitteratur, ungdomsspråk eller barnespråk. Blant de 100 mest frekvente ordene finner du bl.a. "VG" og "Foto" (fordi ordet "Foto" ofte går igjen i avistekster med bildekreditering). Frekvensordlisten er generert 25.08.2025, og du kan alltid hente en nyere liste direkte fra Norsk aviskorpus via clarino.uib.no/korpuskel. Du kan da også hente flere ord enn de 10.000 som er nedlastbare her.
dc.language.iso nob
dc.publisher University of Bergen, Department of Linguistic, Literary and Aesthetic Studies
dc.rights Creative Commons - Attribution 3.0 Unported (CC BY 3.0)
dc.rights.uri http://creativecommons.org/licenses/by/3.0/
dc.rights.label CC
dc.source.uri https://clarino.uib.no/korpuskel/
dc.subject frekvensordliste
dc.subject Lemma Frequencies
dc.subject word frequencies
dc.title Frekvensordliste (bokmål) fra ord i norsk avisspråk
dc.type lexicalConceptualResource
metashare.ResourceInfo#ContentInfo.detailedType wordList
metashare.ResourceInfo#ContentInfo.mediaType text
has.files yes
branding Clarino
contact.person Paul Meurer paul.meurer@uib.no University of Bergen
contact.person Gunn Inger Lyse Samdal gunn.lyse@uib.no University of Bergen, Department of Linguistic, Literary and Aesthetic Studies
size.info 10000 tokens
files.size 294629
files.count 3


 Files in this item  Download all files in item (287.72 KB)

This item is
Distributed under Creative Commons
and licensed under:
Creative Commons - Attribution 3.0 Unported (CC BY 3.0)
Attribution Required
Icon
Name
frekvensordliste-aviskorpus-nob.tsv
Size
138.07 KB
Format
Unknown
Description
tabulator-separerte kolonner
 Download file
Icon
Name
frekvensordliste-aviskorpus-nob.csv
Size
138.07 KB
Format
Unknown
Description
kolonner skilt med komma
 Download file
Icon
Name
cmdi-metadata-frekvensordliste-aviskorpus-nob.xml
Size
11.59 KB
Format
XML
Description
CMDI-metadata-freq-NCC-nob
 Download file

Show simple item record