CIO CISO CFOStyreDatabricksOpenTelemetryUnity CatalogMLflowAI AgentsAgent GovernanceObservabilityAI GovernanceFinOpsEnterprise AIData Platform

Databricks gjør AI-agentenes spor til styringsdata

Joachim Høgby

22. mai 202622. mai 20265 min lesingKilde: Databricks

Del

LinkedIn X Facebook E-post WhatsApp Telegram

Databricks flytter observability for AI-agenter fra loggverktøy til styrt bedriftsdata.

Selskapet skrev 22. mai at Databricks nå støtter direkte innskriving av OpenTelemetry-spor til Unity Catalog. Det høres teknisk ut. Poenget er mer praktisk: sporene etter agentenes arbeid kan lagres som Delta-tabeller, styres med samme tilgangskontroller som andre data, analyseres med SQL og brukes i evaluering og overvåking.

For norske CIO-er og CISO-er er dette en viktigere nyhet enn en ny chatbot-knapp. Når agenter får tilgang til systemer, dokumenter og verktøy, blir sporene etter hva de faktisk gjorde en del av kontrollmiljøet. Hvem spurte om hva? Hvilke verktøy ble kalt? Hvilke data ble lest? Hvor lang tid tok det? Hva kostet modellen? Hvor feilet den? Hvilke svar bør brukes som evalueringsdata, og hvilke må maskeres eller slettes?

Databricks prøver å gjøre disse spørsmålene til vanlige dataplattform-spørsmål, ikke et sidespor i et separat observability-produkt.

Agentlogger blir styringsdata

Databricks beskriver problemet slik: AI-agenter lager store mengder sporingsdata. Sporene kan inneholde prompts, verktøykall, svar, latency og hele kjørebanen gjennom en oppgave. Tradisjonelle observability-plattformer er gode på driftssignaler, men Databricks mener de blir dyre og tungvinte når sporene skal lagres lenge, gjenbrukes i analyse og styres som sensitive data.

Den nye løsningen lar team skrive OpenTelemetry-data direkte til Unity Catalog via en administrert, serverless ingestion-løype. Dataene havner i Delta-tabeller. Derfra kan de brukes i SQL, dashboards, ETL, MLflow-evaluering, MLflow-monitorering og Databricks Genie.

Det gir én enkel lederkonsekvens: Agentenes produksjonsatferd kan bli like revisjonsbar som andre forretningsdata. Det er ikke bare nyttig for utviklere som feilsøker. Det er nyttig for sikkerhet, compliance, økonomistyring og leverandørkontroll.

Hvorfor dette betyr noe i drift

Agentprosjekter stopper ofte i overgangen fra demo til produksjon. Ikke fordi modellen ikke kan svare, men fordi virksomheten ikke ser nok av hva agenten gjør. Loggingen blir fragmentert. Kostbildet er uklart. Evalueringsdata blir liggende i ett verktøy, sikkerhetslogger i et annet og forretningsresultater i et tredje.

Databricks angriper akkurat dette skillet. Selskapet peker på tre praktiske fordeler:

Spor kan skrives inn i sanntid og beholdes lenge uten samme kostpress som i rene SaaS-observability-modeller.
Spor kan styres med Unity Catalog, inkludert rettigheter, kolonne-maskering og radfiltrering.
Spor kan kobles mot forretningsdata, modellkostnader og evalueringsresultater.

Det siste er ofte undervurdert. En agent er ikke god bare fordi den svarer raskt. Den må løse riktig oppgave, bruke riktige verktøy, holde seg innenfor policy og gi en målbar effekt. Hvis sporene kan kobles til konvertering, saksbehandlingstid, kundetilfredshet, risiko eller avvik, kan ledelsen diskutere kvalitet med data i stedet for anekdoter.

OpenTelemetry som felles språk

Databricks bruker OpenTelemetry som format. Det er viktig fordi det skiller instrumentering fra lagring. Virksomheter kan instrumentere agenter og apper med et standardformat, men velge hvor sporene lander.

I Databricks-modellen går spor, logger og metrikker inn i Unity Catalog-tabeller. Ingestion-laget er ifølge selskapet drevet av Zerobus Ingest, som støtter OpenTelemetry-protokoller via gRPC og REST. Databricks sier dette fjerner behovet for en egen kjede med Kafka, mellomlagring og hjemmelaget datarør før sporene kan analyseres.

Bloggen viser også et eksempel med en LangGraph-agent som kjører utenfor Databricks, bruker en Databricks-hosted Claude Sonnet 4.6-modell og kaller Genie via MCP for å gjøre SQL-analyse. Poenget er ikke akkurat den demoen. Poenget er at sporene kan samles selv om agentene kjører flere steder.

Det treffer et reelt problem i store virksomheter. AI-agentene kommer ikke til å leve i ett pent system. De vil ligge i kundeservice, utviklingsverktøy, økonomi, HR, analyse og fagsystemer. Da blir felles sporformat, eierskap til data og tydelige rettigheter avgjørende.

FinOps møter sikkerhet

Databricks peker også på koststyring. Når spor lagres som tabeller, kan virksomheten analysere tokenbruk, latency, feilrater og modellvalg. Bloggen viser et eksempel der team kan bygge egne kostdashboards som bruker kontraktspriser, ikke bare listepriser.

Det er en CFO-vinkel her: AI-kost blir fort usynlig når den ligger inne i agentkjeder. Ett verktøykall kan trigge søk, flere modellkall og nye verktøykall. Uten spor på riktig nivå blir det vanskelig å vite hva en oppgave faktisk koster.

Det er også en CISO-vinkel: Spor kan inneholde rå prompts, svar og sensitive data. Hvis disse sendes ukritisk til tredjeparts observability-plattformer, oppstår nye databehandler- og tilgangsproblemer. Hvis sporene styres i samme dataplattform som øvrig sensitiv informasjon, blir det enklere å håndheve policy. Ikke automatisk trygt, men mer håndterbart.

Hva ledere bør gjøre nå

Dette er ikke en grunn til å kjøpe enda en plattform i blinde. Det er en påminnelse om hva som må være på plass før agenter får reell fullmakt.

CIO bør kreve en arkitektur for agent-spor før neste store agentutrulling. Hvilke hendelser logges? Hvor lenge lagres de? Kan spor kobles til forretningsresultater? Kan de brukes til regresjonstesting når modell, prompt eller verktøy endres?

CISO bør stille mer ubehagelige spørsmål. Hvilke prompts og svar kan inneholde persondata, forretningshemmeligheter eller kundedata? Hvem får lese sporene? Maskeres data før analyse? Kan sporene brukes i hendelseshåndtering? Finnes det revisjon på hvem som søker i dem?

CFO bør få kost per prosess, ikke bare total modellregning. Hvis en agent skal erstatte manuelt arbeid, må virksomheten kunne måle både kvalitet og kost på oppgavenivå.

Og styret bør be om én ting: Agentenes handlinger må være etterprøvbare. Ikke bare modellens svar.

Databricks-saken viser hvor enterprise-AI er på vei. Verdien ligger ikke bare i modellen. Den ligger i driftssystemet rundt modellen: spor, tilgang, evaluering, kostkontroll, rollback og kontinuerlig forbedring. Det er kjedelig infrastruktur. Nettopp derfor er det viktig.

Kilder og medier

Primærkilde: Databricks, «Observability for any agent, anywhere: Production-ready tracing with OpenTelemetry & Unity Catalog on Databricks», publisert 22. mai 2026: https://www.databricks.com/blog/observability-any-agent-anywhere-production-ready-tracing-opentelemetry-unity-catalog
Kildekreditering: Databricks.
Thumbnail: OpenAI Image 2 / hogby.ai.

📬 Likte du denne?

AI-nyheter for ledere. Kuratert av en CIO som bygger det selv. Daglig i innboksen.

Relaterte saker

Anthropic gjør Claude Opus 5 til ny toppmodell for agentarbeid

Breaking

AI-modellerAnthropicClaude

Anthropic gjør Claude Opus 5 til ny toppmodell for agentarbeid

Claude Opus 5 flytter Anthropic-kampen fra ren intelligens til styrbar kost, fart og sikkerhet i agentarbeid. Det er en tydelig CIO-sak, ikke bare en modellnyhet.

24. juli 20265 min lesing

Anthropic

Åpne saken

CIOCISOCTO

GitHub ruller Claude Opus 5 inn i Copilot for agentisk koding

Claude Opus 5 er tilgjengelig i GitHub Copilot for Pro+, Max, Business og Enterprise. GitHub fremhever agentiske kodeflyter, egenverifisering og strengere cyber-sperrer. For IT-ledere blir modellvalg i Copilot et spørsmål om styring, kostnad og sikkerhet – ikke bare autocomplete.

24. juli 20265 min lesing

GitHub

Åpne saken

AI-modellerGoogle AIGemini

Google gjør Gemini Flash raskere for agentarbeid

Google lanserer Gemini 3.6 Flash og 3.5 Flash-Lite med tydeligere fokus på hastighet, token-effektivitet og produksjonsklare AI-agenter.

24. juli 20264 min lesing

Google AI

Åpne saken