| dc.contributor.author | CLARINO Bergen senter |
| dc.contributor.author | Lyse Samdal, Gunn Inger |
| dc.date.accessioned | 2025-09-02T11:25:01Z |
| dc.date.available | 2025-09-02T11:25:01Z |
| dc.date.issued | 2025-04-11 |
| dc.identifier.uri | http://hdl.handle.net/11509/157 |
| dc.description | Frekvensordliste fra Norsk aviskorpus (bokmål). Frekvensordlisten er en liste av de 10.000 mest frekvente ordene i Norsk aviskorpus, sortert på frekvens fra høyest til lavest. Norsk aviskorpus inneholder tekst fra elleve store aviser med materiale fra 1998 til 2022. Frekvensordlisten kan f.eks. bruke for å luke ut «stoppord» (vanlige ord med antatt lav informasjonsverdi) i språkteknologisk prosessering av tekst, eller for å tallfeste hva som er «vanlige» ord og ordforråd. Listen inneholder både språklige ord og tegnsetting, og skiller mellom store og små bokstaver. På toppen av listen finner du bl.a.: ".", "som", "det", og "Det". Merk at de mest frekvente ordene fra avisspråk, som her, kan være annerledes enn de mest frekvente ord fra skjønnlitteratur, ungdomsspråk eller barnespråk. Blant de 100 mest frekvente ordene finner du bl.a. "VG" og "Foto" (fordi ordet "Foto" ofte går igjen i avistekster med bildekreditering). Frekvensordlisten er generert 25.08.2025, og du kan alltid hente en nyere liste direkte fra Norsk aviskorpus via clarino.uib.no/korpuskel. Du kan da også hente flere ord enn de 10.000 som er nedlastbare her. |
| dc.language.iso | nob |
| dc.publisher | University of Bergen, Department of Linguistic, Literary and Aesthetic Studies |
| dc.rights | Creative Commons - Attribution 3.0 Unported (CC BY 3.0) |
| dc.rights.uri | http://creativecommons.org/licenses/by/3.0/ |
| dc.rights.label | CC |
| dc.source.uri | https://clarino.uib.no/korpuskel/ |
| dc.subject | frekvensordliste |
| dc.subject | Lemma Frequencies |
| dc.subject | word frequencies |
| dc.title | Frekvensordliste (bokmål) fra ord i norsk avisspråk |
| dc.type | lexicalConceptualResource |
| metashare.ResourceInfo#ContentInfo.detailedType | wordList |
| metashare.ResourceInfo#ContentInfo.mediaType | text |
| has.files | yes |
| branding | Clarino |
| contact.person | Paul Meurer paul.meurer@uib.no University of Bergen |
| contact.person | Gunn Inger Lyse Samdal gunn.lyse@uib.no University of Bergen, Department of Linguistic, Literary and Aesthetic Studies |
| size.info | 10000 tokens |
| files.size | 294629 |
| files.count | 3 |
Files in this item Download all files in item (287.72 KB)
This item is
Creative Commons - Attribution 3.0 Unported (CC BY 3.0)
Distributed under Creative Commons
and licensed under:Creative Commons - Attribution 3.0 Unported (CC BY 3.0)
- Name
- frekvensordliste-aviskorpus-nob.tsv
- Size
- 138.07 KB
- Format
- Unknown
- Description
- tabulator-separerte kolonner
- Name
- frekvensordliste-aviskorpus-nob.csv
- Size
- 138.07 KB
- Format
- Unknown
- Description
- kolonner skilt med komma
- Name
- cmdi-metadata-frekvensordliste-aviskorpus-nob.xml
- Size
- 11.59 KB
- Format
- XML
- Description
- CMDI-metadata-freq-NCC-nob