Show simple item record

 
dc.contributor.author CLARINO Bergen senter
dc.contributor.author Lyse Samdal, Gunn Inger
dc.date.accessioned 2025-09-02T11:25:14Z
dc.date.available 2025-09-02T11:25:14Z
dc.date.issued 2025-08-25
dc.identifier.uri http://hdl.handle.net/11509/158
dc.description Frekvensordliste frå Norsk aviskorpus (nynorsk). Frekvensordlista er ei liste over dei 10 000 mest frekvente orda i Norsk aviskorpus, sortert på frekvens frå høgast til lågast. Norsk aviskorpus (nynorskdelen) inneheld ca. 21 millionar ord frå elleve store aviser, og har per i dag materiale frå 1998 til 2020. Frekvensordlista kan til dømes brukast til å luke ut «stoppord» (vanlege ord med låg informasjonsverdi) i språkteknologisk prosessering av tekst, eller for å talfeste kva som er «vanlege» ord i ordforrådet. Treng du frekvenslister frå andre typar språkmateriale, ta kontakt med clarino@uib.no. Denne lista inneheld både språklige ord og teiknsetjing, og skil mellom store og små bokstavar. På toppen av lista finn du mellom anna: ".", "ikkje", "det" og "Det". Merk at dei mest frekvente orda frå avisspråk, som her, kan vere annleis enn dei mest frekvente orda frå andre sjangerar som skjønnlitteratur, ungdomsspråk eller barnespråk. Blant dei 100 mest frekvente orda finn du mellom anna ordet "Foto" (fordi ordet "Foto" ofte går att i avistekstar med bildekreditering). Frekvensordlista er generert 25.08.2025, og du kan alltid hente ei nyare liste direkte frå Norsk aviskorpus via clarino.uib.no/korpuskel. Du kan då òg hente fleire ord enn dei 10 000 som er nedlastbare her, t.d. alle orda i heile korpuset.
dc.language.iso nno
dc.publisher University of Bergen, Department of Linguistic, Literary and Aesthetic Studies
dc.rights Creative Commons - Attribution 3.0 Unported (CC BY 3.0)
dc.rights.uri http://creativecommons.org/licenses/by/3.0/
dc.rights.label CC
dc.subject Lemma Frequencies
dc.subject Word List
dc.subject Word Frequencies
dc.title Frekvensordliste (nynorsk) frå ord i norsk avisspråk
dc.type lexicalConceptualResource
metashare.ResourceInfo#ContentInfo.mediaType text
has.files yes
branding Clarino
contact.person Gunn Inger Lyse Samdal gunn.lyse@uib.no University of Bergen, Department of Linguistic, Literary and Aesthetic Studies
size.info 10000 tokens
files.size 255907
files.count 3


 Files in this item  Download all files in item (249.91 KB)

This item is
Distributed under Creative Commons
and licensed under:
Creative Commons - Attribution 3.0 Unported (CC BY 3.0)
Attribution Required
Icon
Name
cmdi-metadata-frekvensordliste-aviskorpus-nno.xml
Size
12.19 KB
Format
XML
Description
cmdi metadatafil
 Download file
Icon
Name
frekvensordliste-aviskorpus-nno.tsv
Size
118.86 KB
Format
Unknown
Description
tabulatorseparerte kolonner
 Download file
Icon
Name
frekvensordliste-aviskorpus-nno.csv
Size
118.86 KB
Format
Unknown
Description
kommaseparerte kolonner
 Download file

Show simple item record