ForumOA
Forum for offentlige anskaffelser
Kurs · innsikt · rådgivning

Når evalueringen blir for tynn

Kjernen i saken
Når kriteriene er skjønnsmessige, og særlig når poengforskjellene er små, er det ikke nok å vise at evalueringen fremstår rimelig på overflaten. Oppdragsgiver må kunne vise hvilke konkrete forhold som faktisk gjorde det ene tilbudet bedre enn det andre. Generelle karakteristikker som «velbegrunnet» eller «overbevisende» holder ikke – og feil om faktum, selv på detaljnivå, kan velte hele evalueringen.
Når evalueringen blir for tynn
Kurs om dette Innsyn, klager og omgjøring · 19. mai

Det er lett å overse den subsidiære siden av Oslo tingretts kjennelse TOSL-2025-198508 av 6. februar 2026 – badstusaken ved Langkaia. Hovedspørsmålet om vesentlig endring fikk all oppmerksomheten. Men i pkt. 4 drøfter retten et annet spørsmål, som i mange konkurranser er mer aktuelt enn regler om vesentlig endring: hva skal til for at en skjønnsmessig evaluering holder som rettslig grunnlag for tildeling?

Kjennelsen er en midlertidig forføyning, avsagt av dommerfullmektig. Den binder ingen. Men resonnementet er verdt å se nærmere på, fordi det viser hvor lett en skjønnsmessig evaluering kan bli for tynn.

Sakens rammer

Bymiljøetaten hadde valgt et tildelingskriterium for oppdragsforståelse som utgjorde 60 prosent av den totale vekten. Kriteriet var skjønnsmessig og åpent – det ga evalueringspanelet et bredt handlingsrom. De tre tilbyderne fikk henholdsvis 10,0, 9,8 og 9,6 poeng. Forskjellen mellom vinnerne og klageren var 0,4 poeng.

Når skjønnet er så vidt, og poengforskjellen så liten, stiller det tilsvarende høye krav til evalueringsdokumentasjonen. Det er dette som er kjernen i den subsidiære anførselen.

Hva retten faktisk sa

Retten går igjennom evalueringsprotokollen punkt for punkt og konstaterer at panelet i stor grad har brukt generelle karakteristikker som «velbegrunnet», «gjennomtenkt» og «overbevisende beskrivelse». Det er få konkrete forskjeller mellom tilbudene som kommer frem. Retten skriver:

«Retten kan ikke ut fra protokollen se hvilke konkrete forhold som faktisk skiller tilbudene fra hverandre. Begrepsbruken er i stor grad evaluerende, ikke beskrivende.»

Dette er en sentral formulering. Retten skiller mellom evaluerende språk – som beskriver panelets vurdering – og beskrivende språk – som forteller hva tilbudene faktisk inneholdt. Uten beskrivelse av tilbudets innhold, blir evalueringen selvrefererende.

Feil om faktum

Retten påpekte også et konkret faktum-problem. Panelet hadde lagt til grunn at vinnerens bookingsystem var mer avansert enn klagerens, og brukt dette som en av begrunnelsene for poengforskjellen. Men klageren kunne dokumentere at hans bookingsystem faktisk hadde tilsvarende funksjonalitet – noe som fremgikk av tilbudsdokumentene selv.

Retten skriver om dette:

«Når evalueringen bygger på en uriktig oppfatning av faktum, og feilen knytter seg til et forhold som er brukt aktivt i begrunnelsen, svekker det evalueringens etterprøvbarhet.»

Selv om panelet ellers hadde utøvd et forsvarlig skjønn, kunne retten ikke se bort fra at denne feilen kunne ha påvirket utfallet. Og det er nok til at begrunnelsesplikten ikke er oppfylt.

Hvorfor poengforskjellen har betydning

Det er en naturlig sammenheng mellom størrelsen på poengforskjellen og kravet til presisjon i begrunnelsen. Dette er ikke formulert som en regel, men følger av alminnelig forvaltningsrett og av KOFA-praksis. Når forskjellen er stor, tåler evalueringen mer slurv. Når forskjellen er liten, må hver lille observasjon kunne forsvares.

I denne saken var forskjellen 0,4 poeng. Det betyr at én feilaktig observasjon om bookingsystemet kan ha stått for hele utslaget. Retten kunne ikke med sikkerhet si at feilen ikke hadde påvirket utfallet. Dermed kunne den heller ikke se bort fra at klageren ville vunnet uten feilen.

Fem lærdommer for oppdragsgivere

1. Skjønnsmessige kriterier krever mer presisjon i evalueringen, ikke mindre

Det er en utbredt misforståelse at brede tildelingskriterier gir oppdragsgiver et bredere handlingsrom også i evalueringen. Det er motsatt: jo bredere kriteriet er formulert, desto viktigere er det at evalueringen selv viser hva som faktisk ble vektlagt. Ellers blir tildelingen reelt sett uetterprøvbar.

2. Generelle karakteristikker er ikke nok

Ord som «velbegrunnet», «gjennomtenkt», «solid» og «overbevisende» sier noe om panelets vurdering – men ingenting om tilbudet. De må følges opp med beskrivelser av hva i tilbudet som begrunner karakteristikken. Uten denne koblingen blir evalueringen en parafrase av seg selv.

3. Feil faktum undergraver evalueringen

Selv små feil om hva tilbudene faktisk inneholder, kan velte en evaluering. Dette gjelder særlig når feilen brukes aktivt i begrunnelsen. Det hjelper ikke at evalueringen ellers fremstår ryddig – kravet til etterprøvbarhet innebærer at de faktiske premissene må være riktige.

4. Små poengforskjeller tåler mindre slurv

Jo mindre forskjell mellom tilbudene, desto mer kritisk blir enhver uklarhet i begrunnelsen. Oppdragsgiver bør spørre seg om evalueringen tåler en nøye gjennomgang når forskjellen er på noen tideler av et poeng. Hvis ikke, bør enten kriteriet strammes inn, eller evalueringen skrives grundigere.

5. Brede kriterier bør følges av stram intern metode

Når konkurransegrunnlaget åpner for et bredt skjønn, må den interne evalueringsmetoden kompensere. Det kan bety forhåndsdefinerte underkategorier, felles forståelse av hva som kreves for å nå de ulike poengnivåene, og en disiplinert begrunnelsesmal som tvinger panelet til å beskrive før de evaluerer.

Sjekkliste før evalueringsprotokollen sluttføres

  1. Har vi beskrevet konkret hva tilbudene inneholder, før vi sier noe om hvor gode de er?
  2. Kan vi peke på spesifikke forskjeller mellom tilbudene som begrunner poengforskjellen?
  3. Er alle faktiske premisser i evalueringen korrekte og dokumenterbare fra tilbudet?
  4. Vil evalueringen tåle en gjennomgang der hver poengforskjell må forsvares?
  5. Har vi unngått rene evaluerende ord uten beskrivende underlag?
  6. Er det samsvar mellom de underkriteriene vi har brukt internt og det som fremgår av konkurransegrunnlaget?
  7. Kan en utenforstående lese protokollen og forstå hvorfor vinneren vant?

Min vurdering

Det er fristende å se denne delen av kjennelsen som en teknisk detalj, overskygget av det mer spektakulære spørsmålet om vesentlig endring. Men jeg tror dette er den delen av avgjørelsen som vil ha mest praktisk betydning i det daglige.

Vesentlige endringer er relativt sjeldne. Skjønnsmessige tildelingskriterier med lav poengforskjell er regelen, ikke unntaket. Og svært mange evalueringsprotokoller vil ikke bestå den testen retten her anvender: at man skal kunne peke på hvilke konkrete forhold som faktisk skiller tilbudene.

Det som er interessant, er at retten ikke stiller noe høyere krav enn det som allerede følger av anskaffelsesloven § 4 og alminnelig begrunnelsesplikt. Kjennelsen formulerer bare kravet litt skarpere enn vi vanligvis ser det. Og det treffer en praksis som mange oppdragsgivere nok ikke har tenkt så nøye på.

For min del er hovedpoenget dette: evalueringen må beskrive før den vurderer. Det er et enkelt prinsipp. Men svært mange protokoller bommer på det.

Avslutning

Den subsidiære delen av TOSL-2025-198508 binder ingen, og den innfører ingen ny rettsregel. Men den er en påminnelse om at begrunnelsesplikten ikke er en formalitet. Den skal sikre at skjønnet faktisk er utøvd, og at det kan etterprøves. Når evalueringen blir for tynn – fordi den bruker evaluerende språk uten beskrivende underlag, eller fordi den bygger på feil faktum – svikter den på sitt mest grunnleggende nivå.

Hva retten egentlig sier, er ikke at skjønnet må innsnevres. Den sier at skjønnet må bæres av noe konkret. Det er en øvelse i å se tilbudene som de faktisk er – ikke bare slik panelet intuitivt opplever dem.

Kilder

Oslo tingretts kjennelse TOSL-2025-198508 av 6. februar 2026, særlig pkt. 4 om den subsidiære anførselen. Anskaffelsesloven § 4 om krav til likebehandling, forutberegnelighet og etterprøvbarhet. KOFA-2025/1373, KOFA-2024/400 og KOFA-2019/106 om begrunnelsesplikt ved skjønnsmessige tildelingskriterier. HR-2025-1098-A og HR-2022-1964-A (Flage Maskin) om prinsippene for evaluering og domstolskontroll i anskaffelsessaker.

← Tilbake til Innsikt