CIO CISOCTOStyreGitHubGitHub CopilotCopilot CLIAI AgentsKodeagenterSubagenterAgent OrchestrationDeveloper ToolsDevSecOpsAI GovernanceAI SecurityObservabilitySoftware EngineeringEnterprise AIRisikostyringProduktivitet

GitHub kutter feil ved å la Copilot delegere mindre

Joachim Høgby

13. juni 202613. juni 20265 min lesingKilde: GitHub Blog

Del

LinkedIn X Facebook E-post WhatsApp Telegram

GitHub har gjort en interessant endring i Copilot CLI: Agenten skal delegere mindre. Ikke fordi subagenter er uviktige, men fordi for mange handoffs gjør agentarbeid tregere, mer skjørt og vanskeligere å styre.

I et blogginnlegg 12. juni skriver GitHub at selskapet har rullet ut smartere subagent-delegering til 100 prosent av produksjonstrafikken i Copilot CLI. Endringen ligger bak brukerflaten. Utvikleren får ikke et nytt panel med valg. Copilot skal selv bli bedre til å velge når hovedagenten skal løse oppgaven direkte, når en subagent faktisk skaper verdi, og når arbeid bør kjøres parallelt.

Tallene er mer interessante enn selve funksjonen. I en produksjonsbasert A/B-test reduserte GitHub verktøyfeil per økt med 23 prosent. Søkeverktøyfeil falt med 27 prosent, og redigeringsfeil falt med 18 prosent. Total ventetid ble redusert med 5 prosent ved P95 og 3 prosent ved P75. GitHub oppgir ingen kvalitetsregresjon.

Dette er et lite produktgrep med stor styringsverdi. Det viser at neste fase for kodeagenter ikke bare handler om større modeller eller flere verktøy. Den handler om orkestrering. Når en agent jobber i et repo, kan den lese filer, søke, redigere, kjøre kommandoer og be andre agenter undersøke deler av problemet. Hver overlevering har kostnad. Den bruker tokens, tid og verktøykall. Den kan også introdusere feil hvis filstier er utdaterte, arbeidskatalogen er feil, eller subagenten mangler kontekst.

GitHub beskriver problemet nøkternt: En enkel endring kan bli treg hvis hovedagenten sender oppgaven videre til en hjelper som søker gjennom repoet på nytt, venter, og returnerer informasjon hovedagenten allerede hadde. Det som burde vært ett steg, blir tre. Subagenten var ment som hjelp. I praksis ble den friksjon.

For norske CIO-er og utviklingsledere er læringen klar. Agentproduktivitet må måles som et system, ikke som en modelltest. Det holder ikke å spørre hvilken modell som scorer best på kodebenchmark. Man må måle ventetid, feilrate, unødvendige verktøykall, repeterte søk, mislykkede editeringer og hvor ofte agenten stopper opp fordi den venter på en subagent.

GitHub gjorde også noe som bør kopieres i enterprise-miljøer: De brukte agentbaner som datagrunnlag. LLM-er analyserte fulle agentforløp og identifiserte hvor delegering hjalp og hvor den bare la på overhead. Deretter ble orkestreringspolicyen strammet inn. Enkle finn-les-rediger-verifiser-oppgaver skal holdes hos hovedagenten. Bred utforskning, uavhengig analyse og naturlig parallelt arbeid kan sendes til subagenter.

Det er en god modell for intern bruk av AI-agenter. Mange virksomheter er på vei inn i en fase der de får flere agenter enn de har styring på: kodeagent, testagent, sikkerhetsagent, supportagent, innkjøpsagent og analyseagent. Fristelsen er å la alt samarbeide med alt. Det blir fort dyrt og uklart. Den bedre regelen er smalere: Deleger når det finnes et tydelig selvstendig mandat. Ikke deleger fordi agenten kan.

Sikkerhetsdimensjonen er også viktig. Færre unødvendige handoffs betyr færre steder hvor kontekst kan mistolkes, lekkes eller manipuleres. En subagent som leter bredt i et repo kan se mer enn den trenger. En subagent som får for vag instruks kan følge feil spor. En subagent som redigerer feil fil kan skape en ny sårbarhet. Bedre orkestrering er derfor ikke bare produktivitet. Det er internkontroll.

GitHubs neste steg er å gjøre Copilot CLI mer adaptiv på tvers av modeller, agenter, skills og verktøy. Det er retningen hele markedet peker mot. Brukeren skal ikke velge modell, hjelpeagent og verktøy for hver oppgave. Systemet skal velge basert på oppgaven, repo-kontekst, policy og forventet resultat.

Det betyr at innkjøp av kodeagenter bør endres. Spør ikke bare leverandøren om modellstøtte og pris per token. Spør hvordan agenten bestemmer seg for å delegere. Spør hvilke metrikker dere får på feil, ventetid og verktøybruk. Spør om dere kan se hovedagent- og subagentløp i etterkant. Spør hvordan policy kan hindre at en agent går bredere enn oppgaven krever.

For utviklingsteam er den praktiske konsekvensen enkel: Oppdater Copilot CLI til versjon 1.0.42 eller nyere hvis dere bruker verktøyet. Men den strategiske konsekvensen er større. Den beste agenten er ikke den som gjør mest på én gang. Det er den som vet når den skal gjøre mindre.

Kilder og medier

Primærkilde: GitHub Blog, "How we made GitHub Copilot CLI more selective about delegation", publisert 12. juni 2026. Source URL: https://github.blog/ai-and-ml/github-copilot/how-we-made-github-copilot-cli-more-selective-about-delegation/

Kildekreditering: GitHub Blog. Thumbnail: OpenAI Image 2 / hogby.ai.

📬 Likte du denne?

AI-nyheter for ledere. Kuratert av en CIO som bygger det selv. Daglig i innboksen.

Relaterte saker

StyreCIOAI-infrastruktur

Nvidia gir Sutskevers SSI mer regnekraft i AI-kappløpet

Safe Superintelligence får tilgang til Nvidias Vera Rubin-plattform og skal skalere forskningen kraftig. For styrer er saken et nytt tegn på at AI-ledelse styres av compute, kapital og tilgang.

28. juli 20264 min lesing

TechCrunch

Åpne saken

CISOCIOCybersikkerhet

Vercel viser prislappen på AI-drevet sårbarhetsjakt

Vercels DeepsecBench måler hvor godt ulike modeller finner sikkerhetsfeil i kode. Tallene viser at AI-skanning blir billigere, men at funnrate og styring fortsatt er harde krav.

28. juli 20264 min lesing

Vercel

Åpne saken

CIOStyreArbeidsliv

OpenAI måler hvordan AI flytter arbeid mellom roller

OpenAIs nye arbeidsrapport viser at ChatGPT-brukere i økende grad tar oppgaver fra andre fagområder. For ledere betyr det mindre stillingslogikk og mer styring av faktisk arbeid.

28. juli 20264 min lesing

OpenAI

Åpne saken