
Usikker kunnskap er bedre enn ingen
Selv om tallene på effekten av kunstig inntelligens er usikre, mener forfatterne av Menon-rapporten som kritiseres av UiO-forskere at mer kunnskap som regel er bedre enn ingen kunnskap. Men det forutsetter at man er åpen om usikkerhetene metodene og grunnlaget fører med seg.
Av Kristoffer Midttømme, partner; Jonas Erraia, partner; Trygve Leithe Svalheim, data scientist, alle i Menon Economics
De tre UiO-forskerne Ståle Grut, Alexander Moltubakk Kempton og Hilde Reinertsen ved forskergruppen HumAIn har gjort et godt stykke arbeid og forteller en spennende og viktig historie om tallet som vokste opp og flyttet hjemmefra. Det legges ned omfattende arbeid for å øke KI-bruken i offentlig sektor, og det er prisverdig at Stat&Styring bidrar til å opplyse hvorvidt disse ressursene anvendes best mulig.
Selv om metoden vi benyttet er hyppig benyttet i fagfellevurdert forskning på feltet, er vi enige i at metoden ikke er perfekt og at det kreves enda mer kunnskap før man kan ta store beslutninger. Likefullt mener vi at det er verdt å frembringe kunnskap selv om den er usikker, så lenge det formidles på en forsvarlig måte – noe vi her har gjort. Grut og kolleger kritiserer oss for å miste nyanser på veien fra resultatkapittel til sammendrag, men antyder selv i sin egen overskrift at vi har omtalt 155 000 årsverk i offentlig sektor som «overflødige» – noe vi aldri har gjort og ikke mener. Under utdyper vi våre merknader til poengene Grut og kolleger reiser.
Vi vet fortsatt lite om effektene av generativ KI, men lærer stadig mer
Ettersom generativ KI er en ny teknologi, ligger det i sakens natur at ingen vet så mye om hvordan den påvirker arbeidsmarkedet, før man har fått testet den. Da vi utgav vårt notat i november 2023, viste vi til tidlige empiriske funn fra anvendelse av generativ KI (Brynjolfsson m.fl. 2025[1], Dell'Acqua m.fl. 2023, Noy og Zhang 2023). Nå har det tilkommet mer forskning om effektene av generativ KI-bruk. Det er gjennomført nye randomiserte kontrollerte eksperimenter som måler effektiviseringen av enkeltoppgaver og innen visse yrkesgrupper. Resultatene fra studiene er dels sprikende, men peker i hovedsak i retning av at generativ KI vil ha stor påvirkning på oppgaveløsning i arbeidslivet. At studiene spriker, er som man må forvente når man studerer en pågående teknologiutvikling og anvendelser innen ulike yrkes- og fagområder. I tillegg er det gjennomført større studier som indikerer at introduksjon og bruk av KI har negative effekter på sysselsetting innen de mest KI-eksponerte yrkene, særlig for nyutdannede arbeidstakere (se blant annet Brynjolfsson m.fl. 2025, Ozkan og Sullivan 2025 og Lichtinger m.fl. 2025).
Dette er interessante funn og viktig nybrottsarbeid, som løfter frem nye problemstillinger om effekter av generativ KI. Økonomifaget er beryktet for å ha en svært treg publiseringsprosess.[2] Selv om flere av disse studiene derfor ikke har rukket å bli fagfellevurdert, er sannsynligheten for at generativ KI vil påvirke arbeidsmarkedet såpass stor, at vi vurderer det er verdt å ta forskningen på alvor. Nettopp fordi usikkerheten er så høy, og konsekvensene kan bli så store, ønsker vi å bidra til at nye funn og ideer løftes frem i offentligheten.
Tall begynner noen ganger å leve sitt eget liv
Grut og kolleger peker på faren for at slike tall får et eget liv i ordskiftet, løsrevet fra forbehold om beregningsusikkerhet og metodiske svakheter. Denne faren er høyst reell. Menon publiserer over 200 rapporter hvert år, og vi har dessverre ikke full kontroll over hvordan alle våre vurderinger og beregninger blir benyttet videre.
Ja, beregningene vi gjorde, er usikre. Ja, vi mener likevel at vi tilførte ny kunnskap da vi skrev dette notatet. Og ja, vi mener at mer kunnskap som regel er bedre enn ingen kunnskap, så lenge man er åpen om usikkerhetene metodene og grunnlaget fører med seg. Vi mener at det er riktig og viktig å forsøke å tallfeste økonomiske størrelser, fordi alternativet til usikre tallgrunnlag, ofte er uklare kvalitative vurderinger som er vanskelige å tolke, vanskelige å bruke og vanskelige å ettergå. Dette er bakgrunnen for blant annet vårt arbeid med samfunnsøkonomiske virkninger som ofte ikke kan prissettes, så som goder som miljø, natur, kultur, helse og sikkerhet.
I notatet benyttet vi en forskningsbasert metode (senere publisert i en ikke-fagfellevurdert artikkel i Science, Eloundou m.fl. 2024) og overførte metoden til norske data basert på anerkjente koblingsnøkler og overganger. I ettertid har også Statistisk sentralbyrå (Vigtel, 2025), under mottoet «Tall som forteller», gjort en tilsvarende studie som vår, der de benytter eksakt samme metode som vi gjorde.[3] SSB-studien er finansiert av Direktoratet for høyere utdanning og kompetanse (HK-dir), noe som vel indikerer at forvaltningen faktisk ser et behov for denne typen tallgrunnlag. KI-eksponeringen på yrkesnivå som ligger til grunn for notatet vårt, er også blant annet benyttet av Federal reserve bank of St. Louis (Ozkan og Sullivan, 2025), og av den anerkjente arbeidsmarkedsøkonomen David Autor og innovasjonsforskeren Neil Thompson (2025) i et viktig nybrottsarbeid publisert i sommer. I denne studien forsøker Autor og Thompson å måle forskjellen på utviklingen i lønnsnivå og sysselsetting når enkle rutineoppgaver kontra mer ekspertisekrevende oppgaver blir automatisert vekk fra et yrke. Hvordan måler de ekspertisegraden til en arbeidsoppgave? Ved hjelp av nevrale nettverk og store språkmodeller – de samme teknikkene vi benyttet i vårt notat.
Gitt at dette er den beste tilgjengelige metoden for å undersøke disse spørsmålene i så stor skala, blir en viktig jobb for oss å forsøke å være åpne og ærlige om metodene som er benyttet, og usikkerheten i kildedata, forutsetninger og metode. Det har vi vært her, og det anerkjenner Grut og kolleger. Det hviler da et betydelig ansvar på den som plukker våre funn ut av kontekst og bruker dem videre. Enkelte nyanser vil alltid forsvinne på veien fra resultatkapittelet til sammendraget, det er jo poenget med et sammendrag. Her kaster Grut og kolleger stein i glasshus når de kritiserer oss. Menon har aldri påstått at det finnes «155.000 overflødige årsverk i norsk offentlig sektor», slik deres overskrift antyder. For å kunne trekke en slik konklusjon om overflødighet, må det gjøres helt andre utredninger enn det vi har hatt som mål, og gitt uttrykk for, å gjøre. Vi er derfor helt enige med Grut og kolleger i at den norske stat ikke burde ta store og viktige beslutninger basert på akkurat dette tallgrunnlaget.
Offentlig sektor bør ikke og skal ikke fatte viktige beslutninger på sviktende kunnskapsgrunnlag
Og som hovedregel gjør de heller ikke det. Mange offentlige beslutninger blir godt utredet, og det er gjerne etatene som er de flinkeste. Krav om at 80% av offentlig sektor skal ta i bruk KI i 2025, fører til oppslag hos offentlige virksomheter om at de ansatte må «Huske å laste ned Copilot til din PC :)». Det er ikke særlig kunnskapsbasert, trolig heller ikke særlig nyttig, men utover lisenskostnadene antakeligvis heller ikke så skadelig.
Den riktige måten å gjøre dette på, er å følge utredningsinstruksen, som har vært mye debattert i spaltene i Stat&Styring. Forbedring eller automatisering av arbeidsprosesser og tjenesteproduksjon med kunstig intelligens bør da være et av flere tiltak som vurderes, hvor man veier nytte og kostnader mot hverandre før man tar endelige retningsvalg. Og der effektene er usikre, bør man teste. Overordnede beregninger av et generelt effektiviseringspotensial, gir ikke svaret på om det faktisk er gunstig å investere i en konkret KI-løsning som er ment å effektivisere arbeidet. Vi opplever faktisk at svært mange offentlige virksomheter utreder dette riktig! Her kan vi for eksempel vise til Kommunal- og distriktsdepartementets utredning av erfaringer og mulighetsrom for bruk av KI i arealplanleggingen, eller en av de mange utredningene Kommunesektorens organisasjons (KS) har gjennomført – her om muligheter og barrierer for ansvarlig bruk av kunstig intelligens (KI) i kommuner og fylkeskommuner.
Vi står fast ved at tallgrunnlaget har verdi, men kan ikke kontrollere hvordan alle våre kunnskapsgrunnlag benyttes videre
Grut, Kempton og Reinertsen er alle tilknyttet forskningshuben HumAIn, som er opptatt av å undersøke og analysere forestillinger om KI i fremtiden. I Menon etterstreber vi alltid å levere gode beslutningsgrunnlag for aktuelle problemstillinger. Empiriske studier, som er forskningsbaserte og åpne for kritikk, er en måte å nettopp bidra til offentlig diskurs om KI i fremtiden. Vi setter derfor pris på at forskerne i HumAIn deler sine perspektiver i offentligheten. Det de peker på i sin artikkel er viktig og har relevans langt utover KI-diskusjonen. Spørsmål som hvordan man bør frembringe og formidle kunnskap når faktagrunnlaget er mangelfullt og usikkerheten er stor er noe vi står ovenfor daglig. Hvordan man sikrer at resultater og innsikt blir brukt i tråd med intensjonen er noe alle kunnskapsarbeidere og journalister bør reflektere over jevnlig. Ikke minst er det viktig at beslutningstagere og byråkrater fortsetter å ta ansvar for at avgjørelser tas på et tilstrekkelig godt grunnlag.
Men vi holder fast ved at tallene er viktige nok, metodene gode nok, og presentasjonen nøktern nok, til at det norske offentlige ordskiftet rundt KI er bedre når vi har gjort våre beregninger, enn de ville vært dersom vi ikke hadde gjort dem!
Referanser
David Autor, Neil Thompson, Expertise, Journal of the European Economic Association, Volume 23, Issue 4, August 2025, Pages 1203–1271
Brynjolfsson, E., Li, D., & Raymond, L. (2025). Generative AI at work. The Quarterly Journal of Economics, 140(2), 889-942.
Brynjolfsson, E., Chandar, B., & Chen, R. (2025). Canaries in the coal mine? six facts about the recent employment effects of artificial intelligence. Stanford Digital Economy Lab. Published August.
Dell'Acqua, F., McFowland III, E., Mollick, E. R., Lifshitz-Assaf, H., Kellogg, K., Rajendran, S., & Lakhani, K. R. (2023). Navigating the jagged technological frontier: Field experimental evidence of the effects of AI on knowledge worker productivity and quality. Harvard Business School Technology & Operations Mgt. Unit Working Paper, (24-013).
Eloundou, T., Manning, S., Mishkin, P., & Rock, D. (2024). GPTs are GPTs: Labor market impact potential of LLMs. Science, 384(6702), 1306-1308.
Hadavand, A., Hamermesh, D. S., & Wilson, W. W. (2024). Publishing economics: How slow? Why slow? Is slow productive? How to fix slow?. Journal of Economic Literature, 62(1), 269-293.
Lichtinger, G., & Hosseini Maasoum, S. M. (2025). Generative AI as Seniority-Biased Technological Change: Evidence from US Résumé and Job Posting Data. Tilgjengelig hos SSRN.
Noy, S., & Zhang, W. (2023). Experimental evidence on the productivity effects of generative artificial intelligence. Science, 381(6654), 187-192.
Ozkan, S. & Sullivan N. Is AI Contributing to Rising Unemployment? Evidence from Occupational Variation. Federal reserve bank of St. Louis, august 2025.
Vigtel, T. C. (2025). Potensielle effekter på sysselsetting av økt bruk av generativ kunstig intelligens. SSB-notat 2025/15.
[1] Vi viste til arbeidsnotatet som ble offentliggjort i 2023, men som nå er fagfellevurdert og publisert.
[2] Se for eksempel Hadavand m.fl. 2024 for en sammenligning mot andre fag og et forsøk på å forklare årsakene.
[3] I motsetning til vår studie, velger SSB derimot ikke den mest konservative vurderingen fra GPT-4 når de anslår effektiviseringspotensialet på oppgavenivå.