Hvordan fungerer vores søgeindeks?

Sådan fungerer søgeindekset

Vektorembeddings i søgning

Vektorembeddings er kernen i vores søgesystem. De gør det muligt for os at konvertere både dokumenter og søgeforespørgsler til numeriske repræsentationer, som kan sammenlignes effektivt. Dette resulterer i mere præcise og relevante søgeresultater. Læs mere om dette på Vektor udregninger.

Hurtige og præcise søgeresultater

Vores søgesystem bruger algoritmer til at finde de mest relevante dokumenter baseret på din forespørgsel. Dette sikrer, at du hurtigt får adgang til de mest relevante informationer, selv når dine søgeord ikke matcher nøjagtigt med ordene i dokumenterne.

1. Indeksering og opsummering af dokumenter: Alle dokumenter i vores database bliver indekseret og opsummeret. Dette involverer flere trin:

  • Opdeling af dokumenter i mindre dele (chunks).
  • Konvertering af chunks til numeriske repræsentationer (embeddings).
  • Placering af embeddings i en vektorDatabase for hurtig og effektiv søgning.
  • Generering af korte resuméer for hver sag fra kilder som Domsdatabasen, Landsskatteretten, EU-domstolen, osv. Dette giver en hurtig oversigt over sagens indhold.

Denne proces sikrer, at vi både kan søge effektivt og give brugerne hurtige indblik i sagernes indhold.

Sådan fungerer dokumentchat

2. Behandling af søgeforespørgsel: Når du indtaster en søgeforespørgsel, bliver den også konverteret til en embedding. Dette gør det muligt at sammenligne din forespørgsel med de indekserede dokumenter på en mere sofistikeret måde end traditionel tekstsøgning.

Sådan fungerer dokumentchat

3. Hentning af relevante dokumenter: Systemet finder de dokumenter eller chunks, hvis embeddings er tættest på din forespørgsels embedding. Dette sikrer, at de mest relevante resultater returneres, selv når de ikke indeholder nøjagtig de samme ord som din søgning.

Sådan fungerer dokumentchat

4. Præsentation af resultater: De fundne dokumenter eller chunks rangeres efter relevans og præsenteres for dig. Hvert resultat indeholder typisk et uddrag eller en opsummering af det relevante indhold, så du hurtigt kan vurdere, om det er det, du leder efter.

Sådan fungerer dokumentchat