CD: Word index (CD_Ordliste)

This page is not translated to English

If the information on this page seems important, please contact PolSys



-----------------------------------------

CD: Ordliste (CD_Ordliste)

Ord i partidokumentene er indeksert ved at feltet Ord inneholder alle partidokumentenes ord.

Ord i tekstform (Ord)

I dette feltet er hvert enkelt ord i partidokumentene lagret. Et ord i dette feltet består av karakterene A-Å, a-å og 0-9; alle andre karaktertegn er erstattet med blank (" ") før lagring.

F eks vil ordet/sekvensen "Nato-medlemskap" i et partidokument bli lagret i dette feltet som to poster: "Nato" og "medlemskap".

Dokumentnummer (Nummer)

Fortløpende ordteller innenfor dokument (Nummer) (Ordteller)

Karakterposisjon i tekstdokumentet - fra (Fra)

Karakterposisjon i orginalt tekstdokument (*.txt).

Karakterposisjon i tekstdokumentet - til (Til)

Karakterposisjon i orginalt tekstdokument (*.txt).

Frase (Frase)

Dette feltet inneholder feltet Ord pluss de fire forregående ord; altså en frase på fem ord.

Hensikten med feltet er forenkle uttak av fraser fra partidokumenter.

Setningsnummer (Setningsteller)

Refererer til setningsnummeret ordet tilhører.

Avsnittsnummer (Avsnittsteller)

Refererer til avsnittsnummeret ordet tilhører.