lokalIQ - Klar for et KI du kan stole på?

I en tid hvor store teknologiselskaper konkurrerer om å kontrollere AI-landskapet, er det viktigere enn noensinne å ha alternativer som gir deg full kontroll over dine data. lokalIQ representerer en ny tilnærming til Retrieval-Augmented Generation (RAG) som setter personvern, sikkerhet og kostnadseffektivitet i høysetet.

Hva er lokalIQ?

lokalIQ er et hybrid RAG (Retrieval-Augmented Generation) system som kombinerer vektorsøk med grafdatabaser for å gi intelligent dokumentanalyse og spørsmål-svar funksjonalitet. I motsetning til skybaserte AI-tjenester, kjører lokalIQ fullstendig på din egen infrastruktur og sikrer komplett datapersonvern og kontroll.


Hvorfor velge lokal RAG?

🔒 Sikkerhet og personvern

Terminalgrensesnitt vs. nettleser: I motsetning til de fleste AI-tjenester som utelukkende kjører i nettleseren, hvor både nettleserleverandør (google, microsoft) og nettleserutvidelser kan og vil samle sensitiv informasjon, kan lokalIQ benytte terminalgrensesnitt. Dine data forblir i et kontrollert miljø som reduserer risikoen for tilsiktede og utilsiktede data-lekasjer og mot at informasjonen din blir videresolgt til tredjepart.

Fullstendig kontroll: Alle dokumenter, samtaler og AI-interaksjoner forblir lokalt på din maskin. Ingen data sendes til eksterne servere, og du beholder full kontroll over hvem som har tilgang til informasjonen.

Ingen eksterne avhengigheter: Du kan være trygg på at dine data ikke blir brukt til å trene språkmotorene fra Meta, OpenAI, Microsft, Google, Grok, Apple og Amazon med flere. I den grad systemet krever mer datakraft enn lokal server kan tilby kan systemet konfigureres til å benytte Franske Mistral som er underderlagt GDPR lovgivning i Norge og EU.

💰 Kostnadseffektivitet

Lokale LLM: Ved å bruke lokale språkmotorer kan du kjøre kraftige språkmodeller som Llama 3.2 på din egen maskinvare [2]. Du betaler ingen lisenser og du har ingen "per-token" kostnader - bare en engangsutgift for oppsett og konfigurering [3].

Valgfri sky-lagring: All prosessering og lagring av data kan skje lokalt, du slipper kostnadene knyttet til å sende store mengder data frem og tilbake til sky-tjenester [4].

Skalerbar, og etter ditt budsjett: Start med det du har og oppgrader maskinvaren etter behov. Ingen tvungne enterprise-pakker eller uforutsigbare kostnader basert på bruk.

🏢 Enterprise-fordeler

Compliance og regulering: For organisasjoner som må overholde GDPR, Schrems II, eller andre databeskyttelsesreguleringer, eliminerer lokal prosessering mange compliance-utfordringer. Data forlater aldri din jurisdiksjon.

Luftgap-sikkerhet: Systemet kan kjøres helt frakoblet fra internett, noe som gjør det ideelt for høysikkerhetsmiljøer som forsvarsindustri, finans eller kritisk infrastruktur.

Tilpassing uten begrensninger: Du kan tilpasse systemet helt etter dine behov uten å være avhengig av eksterne leverandørers API-endringer eller servicebegrensninger.

🚀 Tekniske fordeler

Høy ytelse: Med GPU-akselerasjon og optimalisert chunking kan lokale systemer overgå sky-baserte løsninger for spesifikke bruksområder [5].

Offline-tilgang: Systemet fungerer uten internettforbindelse, noe som gjør det perfekt for felt-arbeid, reise eller ustabile nettverksmiljøer.

Flerspråklig støtte: Bygget med norsk og andre språk i tankene, med mulighet for å finjustere modeller på dine spesifikke behov.

Framtiden er lokal! Ta kontroll over dine data.

Kjerneteknologi

🧠 AI og Maskinlæring

  • LLM-integrasjon: Støtter flere leverandører (Ollama, OpenAI, Mistral, Anthropic, Google Gemini)
  • Lokale modeller: Kjører Llama, Mistral og andre modeller lokalt via Ollama
  • Embeddings: HuggingFace flerspråklige modeller for semantisk forståelse
  • Entitetsutvinning: Skjemabasert utvinning med svartelistefiltrering for rene kunnskapsgrafer
  • Spørreklassifisering: Dedikert LLM velger automatisk optimal gjenfinningsstrategi per spørsmål

🗄️ Hybrid Database-arkitektur

Vektor-lager

  • ChromaDB: Filbasert vektordatabase for semantisk likhetssøk (standard)
  • pgvector: PostgreSQL vektorsøk for større dokumentmengder

Graf-lager

  • Neo4j: Anbefalt grafdatabase med fler-instans arkitektur (én instans per prosjekt)
  • Apache AGE: PostgreSQL graf-utvidelse for multi-tenant med automatisert oppsett
  • FalkorDB: Legacy Redis-basert grafdatabase (avviklet)

Integrasjon

  • PropertyGraphStore: LlamaIndex integrasjonslag som kombinerer vektor- og graftilnærminger
  • Dobbeltlagring: Dokumenter lagres som både vektorer og kunnskapsgrafer

📖 Avansert dokumentbehandling

Docling-integrasjon (lisensbaserte funksjoner)

  • Gratis Nivå: PDF, DOCX, Excel, HTML-parsing med grunnleggende tabellutvinning (70% nøyaktighet)
  • Premium Nivå: TableFormer for høy-nøyaktige tabeller (95-98%) - kritisk for finansrapporter
  • Bedrift Nivå: OCR, lydtranskripsjon, vision-language modeller for bildeforståelse

Behandlingsprosess

  • Flerfomatstøtte: PDF, DOCX, CSV, Excel, Markdown, HTML, ODT, JSON, ren tekst
  • Semantisk oppdeling: Kontekstbevisst dokumentoppdeling (bevarer entitetskoherens)
  • Deduplikasjon: Intelligent innholdsdeduplikasjon på tvers av dokumenter
  • Parallell prosessering: Samtidig embedding-generering og entitetsutvinning
  • Forbehandlingskommando: iq preprocess konverterer komplekse dokumenter til ren Markdown

🔍 Intelligent gjenfinning

Tre-stegs strategi for hybridsøk

  • Vektorlikhet: Semantisk embedding-basert gjenfinning
  • Kunnskapsgraf: Entitet-relasjonstraversering
  • BM25 Fulltekst: Tradisjonelt nøkkelord-søk

Avanserte funksjoner

  • Spørreklassifisering: LLM-basert ruter velger optimal strategi (BM25_FAVOR, KG_FAVOR, VECTOR_FAVOR, HYBRID_DEFAULT)
  • Query Fusion: Flere søkestrategier fusjonert med reciprocal rank fusion
  • Dokumenttype-Forsterkning: Automatisk spørrebasert dokumenttype-deteksjon og score-forsterkning
  • Reranking: Cross-encoder modeller for endelig relevansscoring
  • Adaptive parametere: Spørrespesifikk optimalisering

💬 Samtalehukommelse

  • Fler-Omgangs Samtaler: Naturlige oppfølgingsspørsmål (“Hva mer?”, “Kan du utdype?”)
  • Kontekstuell Forståelse: Håndterer pronomen og referanser til tidligere spørsmål
  • Flere Formatstiler: Dialog, sammendrag eller strukturert samtalehistorikk
  • Konfigurerbart: Omgangstelling, token-budsjett, relevansfiltrering, auto-utløp

⚙️ Konfigurasjonssystem

  • Pydantic-modeller: Typesikker konfigurasjon med kjøretidsvalidering
  • YAML-komposisjon: Menneskelesbar med arvstøtte
  • Lisenshåndtering: Funksjonsporter for premiumfunksjoner
  • Flerprosjektstøtte: Spør på tvers av flere kunnskapsbaser med vektet fusjon

Brukergrensesnitt

🖥️ Kommandolinje (CLI)

  • Moderne Kommandoer: ingest, query, preprocess, postgres setup, status, diagnose
  • Automatiseringsklart: Perfekt for skript, CI/CD-pipelines, planlagte oppgaver
  • PostgreSQL Oppsett: Automatisert database/bruker-oppretting for Apache AGE (iq postgres setup)

📺 Terminal brukergrensesnitt (TUI)

  • Rikt Interaktivt Grensesnitt: Ved bruk av Textual-rammeverket
  • Sanntids Chat: Live svar med syntaksutheving
  • Flerpanel: Chat, konfigurasjon, debugging, entitetsvisning
  • Slash-Kommandoer: /help, /clear, /write, /url
  • Eksport: Markdown, ren tekst, Word, PDF formater

🌐 Webgrensesnitt

Chatopplevelse

  • WebSocket Streaming: Sanntids responsstreaming
  • Kommandohistorikk: Naviger tidligere spørsmål med piltaster
  • Sesjonsbehandling: Vedvarende samtaler på tvers av sideoppdateringer
  • Slash-Kommandoer: /help, /clear, /write, /url, /config

Prosjekthåndtering

  • Dyp Mappenavigering: Bla gjennom hierarkiske prosjektstrukturer med breadcrumbs
  • Visuell Differensiering: Mapper (rav) vs. konfigurasjonsfiler (indigo)
  • Konfigurasjonsforhåndsvisning: Se prosjektinnstillinger før valg

Avanserte visualiseringer

  • Mermaid-Diagrammer: Automatisk syntaksfiksing og gjengivelse
    • Eksporter til SVG (vektor), PNG (høyoppløselig), eller skriv ut/PDF
    • Håndterer norske tegn og komplekse etiketter
  • Tabeller: Forbedret gjengivelse fra Docling-forbehandling med TableFormer-nøyaktighet
  • Diagrammer: Plotly.js integrasjon for søylediagrammer, linjediagrammer, kakediagrammer
    • Interaktiv sveip, zoom, pan
    • Norske etiketter og formatering

Eksportfunksjoner

  • Samtaleeksport: Markdown, ren tekst, HTML, PDF (via utskrift), Word
  • Mermaid-Diagrammer: Individuell diagrameksport (SVG/PNG/PDF)
  • Utskriftsoptimalisert CSS: Ren, profesjonell PDF-utdata fra nettleserutskrift

Nøkkeldifferensiatorer

🔒 Komplett personvern

  • Ingen Skyavhengighet: Alt kjører på dine servere
  • GDPR-kompatibel: Ingen data forlater din infrastruktur
  • Offline-kapabel: Fungerer uten internettforbindelse
  • Multi-tenant-Isolasjon: Database-per-kunde eller fler-instans arkitektur

💰 Kostnadseffektiv

  • Faste Kostnader: Engangs maskinvareinvestering vs. løpende API-avgifter
  • Dual-LLM Arkitektur: Lokale modeller for bakgrunnsbehandling, valgfri sky for spørsmål
  • Skalerbar: Legg til kapasitet uten per-spørsmål kostnader
  • Kostnadsoptimalisering: Separate LLM-er for spørsmål vs. entitetsutvinning

🇳🇴 Optimalisert for norsk språk

  • Språkstøtte: Norske embeddings, prompts og finansterminologi
  • Entitetstyper: Norsk-spesifikke entiteter (kommuner, fylker, budsjettpost, etc.)
  • Tegnhåndtering: Automatisk Æ/Ø/Å konvertering for databasekompatibilitet
  • Domenefokus: Spesialisert for norsk offentlig sektor, helsevesen og finans

🔧 Svært konfigurerbart

  • Alt er konfigurerbart: Chunk-størrelser, gjenfinningsparametere, modellvalg, forsterknigsfaktorer
  • Leverandøragnostisk: Bytt mellom LLM-leverandører enkelt
  • Ytelsesjustering: Individuell gjenfinningskontroll (vector_top_k, graph_top_k)
  • Spørrestrategier: Flere klassifiseringskategorier med tilpassede prompts

🚀 Produksjonsklare funksjoner

  • Entitetssvartelistefiltrering: Blokkerer søppeltyper mens LLM-oppdagelse tillates
  • Timeout-Håndtering: Hierarkisk validering forhindrer utvinnigsfeil
  • Minnehåndtering: GPU cache-rydding, token-budsjetthåndtering
  • Diagnostiske Verktøy: Entitetsanalyse, relasjonsinspeksjon, grafstatistikk
  • Automatisert Oppsett: iq postgres setup for Apache AGE-initialisering

Teknisk arkitektur

LokalIQ architecture diagram

Ytelseskarakteristikker

  • Ingesting: Behandler tusenvis av dokumenter med deduplikasjon og entitetsutvinning
  • Spørrehastighet: 200ms-2s avhengig av kompleksitet, maskinvare og gjenfinningsstrategi
  • Skalerbarhet: Håndterer bedriftsdokumentsamlinger (testet med 800+ siders pdf dokumenter)
  • Minneeffektiv: Smart chunking, batch-behandling, GPU-minnehåndtering
  • Klassifisering: <100ms spørreklassifisering med lokal LLM

Brukstilfeller

🏥 Helsevesen

  • Pasientjournalanalyse (GDPR-kompatibel)
  • Medisinsk beslutningsstøtte
  • Forskningsdokumentbehandling
  • Helseplattformen-dokumentasjonsanalyse

🏛️ Offentlig sektor

  • Kommunal dokumentanalyse (årsregnskaper, budsjett)
  • Kommunestyremøtereferatanalyse
  • Politisk forskning og compliance-sjekking
  • Innbyggertjenesteautomatisering

🏢 Bedrift

  • Interne kunnskapsbaser
  • Kontrakt- og juridisk dokumentanalyse
  • Finansrapportanalyse med komplekse tabeller
  • Kundesupportautomatisering

📊 Finansielle tjenester

  • Årsregnskapsanalyse med TableFormer-nøyaktighet
  • Budsjettdokumentbehandling
  • Investeringsdokumentasjon
  • Økonomisk indikatorsporing

Sammendrag

lokalIQ representerer en ny generasjon AI-drevne dokumentanalysesystemer som prioriterer personvern, kostnadseffektivitet og ytelse. Ved å kombinere de nyeste fremskrittene innen vektorsøk, kunnskapsgrafer og spørreklassifisering med lokale AI-modeller, gir det bedriftsklare funksjoner uten personvernbekymringene og løpende kostnadene ved skybaserte løsninger.

lokalIQ = Vektorsøk + Graf-Intelligens + Spørreklassifisering + Dokumentforsterkning + Samtalehukommelse + Lokal AI + Komplett Personvern

noter


[1]lokalt som i at systemet ikke har noen eksterne avhengigheter.
[2]Maskinvare iht til spesifikasjon kan leies eller eies av kunde
[3]Vi tilbyr valgfri årlig vedlikehold- og utviklingsavtale.
[4]De fleste sky-tjenester støttes for data-lagring, også vektor og kunnskapsgrafer.
[5]avhengig av datamengde.