Hvordan virker systemet?

Sådan fungerer RAG

Vektorembeddings

Vektorembeddings er en fundamental teknologi, der gennemsyrer moderne AI og maskinlæring. Disse matematiske repræsentationer af data er nøglen til at forstå og bearbejde kompleks information i alt fra søgemaskiner til avancerede AI-assistenter. Hvis du udforsker eller udvikler applikationer inden for disse områder, vil du uundgåeligt støde på vektorembeddings. I denne sektion vil vi give dig en intuitiv forståelse af, hvad vektorembeddings er, og hvordan de revolutionerer databehandling og AI-applikationer. For en dybdegående teknisk gennemgang, se vores artikel om Vektor udregninger.

Reducering af Hallucinationer

Kort fortalt kopierer og indsætter vi data, som vi ved er valide, som herefter bliver inkluderet i prompten til AI'en. På den måde kan AI'en bruge disse ekstra informationer og dermed øge sandsynligheden for at svare korrekt og reducere risikoen for hallucinationer.

1. Opdeling i mindre dele (chunks): Retsinformation, Domsdatabase, Skats vejledning og andre kilder opdeles i mindre dele (chunks). Hver chunk embeddes, hvilket betyder, at de konverteres til numeriske repræsentationer (embeddings) og placeres på enhedscirklen. Dette gør det muligt for systemet at analysere og bearbejde data mere effektivt.

Sådan fungerer RAG

2. Omformulering af spørgsmål: Når en bruger stiller et spørgsmål, omformulerer en sprogmodel (LLM) spørgsmålet i tre forskellige varianter for at trække relevante informationer ud fra vektor databasen. Dette sikrer, at alle mulige relevante svar bliver taget i betragtning. (Dette er ikke påkrævet, men kan forbedre kvaliteten af svaret).

Sådan fungerer RAG

3. Hentning af relevante data: De mest relevante chunks hentes fra vektor databasen og embeddes igen for at sikre, at de mest præcise og nyttige data bliver brugt til at besvare spørgsmålet.

Sådan fungerer RAG

4. Generering af svar: Sprogmodellen (LLM) kombinerer brugerens spørgsmål med de hentede informationer og genererer et svar, som sendes tilbage til brugeren. Dette svar er baseret på både den oprindelige forespørgsel og de relevante data, der er fundet i vektor databasen, hvilket øger nøjagtigheden og relevansen af svaret.

Sådan fungerer RAG