dc.contributor.author | CLARINO Bergen senter |
dc.contributor.author | Lyse Samdal, Gunn Inger |
dc.date.accessioned | 2025-09-02T11:25:14Z |
dc.date.available | 2025-09-02T11:25:14Z |
dc.date.issued | 2025-08-25 |
dc.identifier.uri | http://hdl.handle.net/11509/158 |
dc.description | Frekvensordliste frå Norsk aviskorpus (nynorsk). Frekvensordlista er ei liste over dei 10 000 mest frekvente orda i Norsk aviskorpus, sortert på frekvens frå høgast til lågast. Norsk aviskorpus (nynorskdelen) inneheld ca. 21 millionar ord frå elleve store aviser, og har per i dag materiale frå 1998 til 2020. Frekvensordlista kan til dømes brukast til å luke ut «stoppord» (vanlege ord med låg informasjonsverdi) i språkteknologisk prosessering av tekst, eller for å talfeste kva som er «vanlege» ord i ordforrådet. Treng du frekvenslister frå andre typar språkmateriale, ta kontakt med clarino@uib.no. Denne lista inneheld både språklige ord og teiknsetjing, og skil mellom store og små bokstavar. På toppen av lista finn du mellom anna: ".", "ikkje", "det" og "Det". Merk at dei mest frekvente orda frå avisspråk, som her, kan vere annleis enn dei mest frekvente orda frå andre sjangerar som skjønnlitteratur, ungdomsspråk eller barnespråk. Blant dei 100 mest frekvente orda finn du mellom anna ordet "Foto" (fordi ordet "Foto" ofte går att i avistekstar med bildekreditering). Frekvensordlista er generert 25.08.2025, og du kan alltid hente ei nyare liste direkte frå Norsk aviskorpus via clarino.uib.no/korpuskel. Du kan då òg hente fleire ord enn dei 10 000 som er nedlastbare her, t.d. alle orda i heile korpuset. |
dc.language.iso | nno |
dc.publisher | University of Bergen, Department of Linguistic, Literary and Aesthetic Studies |
dc.rights | Creative Commons - Attribution 3.0 Unported (CC BY 3.0) |
dc.rights.uri | http://creativecommons.org/licenses/by/3.0/ |
dc.rights.label | CC |
dc.subject | Lemma Frequencies |
dc.subject | Word List |
dc.subject | Word Frequencies |
dc.title | Frekvensordliste (nynorsk) frå ord i norsk avisspråk |
dc.type | lexicalConceptualResource |
metashare.ResourceInfo#ContentInfo.mediaType | text |
has.files | yes |
branding | Clarino |
contact.person | Gunn Inger Lyse Samdal gunn.lyse@uib.no University of Bergen, Department of Linguistic, Literary and Aesthetic Studies |
size.info | 10000 tokens |
files.size | 255907 |
files.count | 3 |
Files in this item Download all files in item (249.91 KB)
This item is
Creative Commons - Attribution 3.0 Unported (CC BY 3.0)
Distributed under Creative Commons
and licensed under:Creative Commons - Attribution 3.0 Unported (CC BY 3.0)


- Name
- cmdi-metadata-frekvensordliste-aviskorpus-nno.xml
- Size
- 12.19 KB
- Format
- XML
- Description
- cmdi metadatafil

- Name
- frekvensordliste-aviskorpus-nno.tsv
- Size
- 118.86 KB
- Format
- Unknown
- Description
- tabulatorseparerte kolonner

- Name
- frekvensordliste-aviskorpus-nno.csv
- Size
- 118.86 KB
- Format
- Unknown
- Description
- kommaseparerte kolonner