Første 100 linjer av article.json
Første 100 linjer av article.json med versjon=1
col | desc |
---|---|
a | artikkel_id |
w | primært lemmaord |
v | versjon |
oppdatert | oppdatert dato |
sortert med sist oppdatert først
Alle artikler pakket inn i en json-fil.
Alle artikler - oppdateres hver uke, natt til mandag.
lemmaord og bøyde former med pipe som skilletegn: |
col | desc |
---|---|
w | lemmaord |
a | artikkel_id |
wc | ordklasse |
sub_wc | underordklasse |
pc | paradigmekode |
inf | bøyde former |
lemmaord
artikkel_id
ordklasse
underordklasse
Tabellen lemma i nneholder kobling mellom ord (lemmaord/oppslagsord/grunnform) og artikkel_id + underordklasse
Samme ord kan være knyttet til flere artikler, og en artikkel kan ha flere oppslagsord.
Se f.eks. ordet by
En unik kombinasjon av ord og artikkel_id er et lemma.
Unntaksvis har et lemma flere underordklasser, og tabellen lemma har en rad for hver underordklasse.
Så strengt tatt er tabellnavnet lemma bare nesten riktig.
lemmaord
artikkel_id
ordklasse
underordklasse
paradigmekoder, et paradigme representerer et bøyingsmønster
lister med bøyde former, en liste med bøyde ord for hvert bøyingsmønster
ordklasse
liste med gramatiske trekk som beskriver hver av de bøyde formene
Ordklasser:
- https://universaldependencies.org/u/pos/index.html
Underordklassekoder med beskrivelse: