Det viktigste vi kan gjøre som land, er å slutte å anta at noen andre ordner dette for oss.
Vi står i et nytt ChatGPT-øyeblikk, og denne gangen er det IT-systemenes tur. Claude Mythos er det kraftigste KI-systemet vi kjenner til. Det er i stand til å finne ukjente sårbarheter i programvare, for eksempel operativsystemene som brukes av verdens banker, regjeringer og flyplasser. Mythos er utviklet av selskapet Anthropic, som unnlater å offentliggjøre KI-systemet for å beskytte verden mot potensielt enorme skader.
Da Anthropic 7. april varslet verden om Mythos, var KI-systemet allerede blitt testet i flere uker. I løpet av denne tiden fant det tusenvis av alvorlige, ukjente sårbarheter i alle de store operativsystemene og nettleserne. Noen av disse sårbarhetene har ligget der i over 20 år uten å ha blitt oppdaget. Slike uoppdagede sårbarheter kalles nulldagssårbarheter. Den som eier IT-systemet, har nemlig «null dager» på å forberede seg om sårbarheten utnyttes i et angrep.
I tillegg til å finne et mylder av sårbarheter skrev Mythos også angrepskode som utnytter dem – uten menneskelig hjelp.
Flere eksempler
Selv om Anthropic ikke gjorde Mythos tilgjengelig for allmennheten, er det flere som har sett modellen i aksjon: Et utvalg store teknologiselskaper, inkludert Amazon, Apple og Microsoft, har fått tilgang til Mythos gjennom prosjektet Glasswing. Hensikten er å gi forsvarerne et forsprang, altså muligheten til å fjerne sårbarhetene før fiendtlige aktører får tilgang til samme type verktøy.
Blant de store KI-selskapene har Anthropic lenge hatt rollen som et av de mest ansvarlige, for eksempel da de nylig nektet å la Pentagon bruke KI-systemene deres til å masseovervåke amerikanere. Den aktuelle beslutningen om å tilbakeholde Mythos er et ansvarlig grep, men det er på ingen måte en sikkerhetsmekanisme.
For det første finnes det eksempler på at KI-selskaper annonserer at et system er for farlig for å offentliggjøres, før de lanserer det kort tid etterpå – som da OpenAI sa det samme om GPT-2, før modellen ble tilgjengeliggjort for hele verden.
Naivt
Vår digitale sfære er full av skadelige KI-systemer, og private aktører er i en skarp konkurransesituasjon der vi ikke kan forvente at de har råd til å stå imot det kommersielle presset så lenge som de kanskje bør. Hva skal Anthropic gjøre hvis en konkurrent tilbyr samme funksjonalitet som Mythos, mot betaling?
Det vil være naivt å tro at ikke lignende produkter enten allerede finnes eller er like rundt hjørnet
Dette bringer oss til det andre poenget: Mythos’ kapabiliteter er på ingen måte overraskende eller unike. Mythos er basert på en stor språkmodell og har dermed evnen til å tolke enorme mengder tekst. Den er ikke på langt nær det eneste systemet av sin sort. Det vil være naivt å tro at ikke lignende produkter enten allerede finnes eller er like rundt hjørnet.
Dessuten tyder våre egne forskningsresultater på at man ikke trenger et system på Mythos’ nivå for å utgjøre en trussel av samme art.
Vi har testet
Vi har bygget et rammeverk som imiterer Mythos’ funksjonalitet, for risiko- og kapabilitetstesting. Det bruker en sverm bestående av åpent tilgjengelige språkmodeller som er så små at de kan kjøre på en vanlig laptop. Modellene samarbeider ved å dele informasjonen de finner, prøve ulike strategier og forbedre seg selv, uten menneskelig innblanding.
Vi testet svermen mot GPT-4o, OpenAIs flaggskipsmodell. Svermen klarte å omgå sikkerhetsmekanismene i 66 prosent av angrepene og produserte detaljerte instruksjoner for blant annet sabotasje og cyberangrep i nesten halvparten av forsøkene. Kostnaden for angriperen er tilnærmet 0 kroner, og den nødvendige ekspertisen er ingenting.
Men den viktigste testen gjensto: Vi satte svermen til å lete etter sikkerhetshull i programvare, altså samme type oppgave som Mythos utfører.
Mot en testapplikasjon med ni plantede sårbarheter fordelt på åtte ulike sårbarhetskategorier fant svermen alle ni, på under to minutter. Flere av feilene krevde resonnering på tvers av filer, detaljforståelse av programkode og evnen til å skille mellom kode som ser sårbar ut, men er trygg, og kode som ser trygg ut, men er sårbar.
Kontroll over kritisk infrastruktur kan ikke overlates til selskaper som selv ikke bestemmer hvordan produktene deres brukes
Det hører med til historien at dette ikke er nøyaktig det samme som det Mythos gjør, da denne søker gjennom millioner av kodelinjer i programvare som er i bruk og sikkerhetstestet. Men konseptuelt er det akkurat det samme, og det viser at den underliggende resonneringsevnen – å forstå hvordan en feil i én fil fører til en sårbarhet i en annen – allerede finnes i språkmodeller hvem som helst kan laste ned gratis. Hva betyr dette?
Det betyr at å tilbakeholde Mythos ikke holder som sikkerhetsmekanisme. Å begrense tilgangen til Mythos er fornuftig, men det kjøper oss i beste fall tid, ikke sikkerhet. De samme kapabilitetene som gjør Mythos farlig – parallell utforskning, delt minne, automatisk forbedring – kan allerede reproduseres med åpne modeller på vanlig maskinvare. Enhver motivert aktør med grunnleggende programmeringskunnskaper kan gjøre dette.
Det betyr også at Norge ikke kan basere sin digitale sikkerhet på tiltro til at amerikanske teknologiselskaper opptrer ansvarlig.
Ble brukt i Iran-angrep
Som vi skrev i forrige måned, da Anthropic gjorde motstand mot Pentagon, fortjener Anthropic anerkjennelse for å sette grenser. Men Anthropic er fortsatt i forhandlinger med Pentagon, og deres flaggskipsmodell Claude ble brukt i angrepet mot Iran, tross selskapets egne innvendinger. Kontroll over kritisk infrastruktur kan ikke overlates til selskaper som selv ikke bestemmer hvordan produktene deres brukes.
Vi trenger egne verktøy. Ikke fordi vi skal konkurrere med Mythos, men fordi uavhengig testing av KI-systemer ikke kan være avhengig av de samme selskapene som lager dem. Rammeverket vi har bygget, kjører på lokal maskinvare, bruker åpne modeller, deler ikke data og koster ingenting å drifte. Det kan brukes til å teste KI-modeller og programmer før de innføres i helsevesenet, finanssektoren eller offentlig forvaltning. Og det kan gjøres uten å spørre et amerikansk selskap om lov.
Følg med, vær bevisst
Norge er et lite land, men vi har sterke forskningsmiljøer, høy digital kompetanse og godt samarbeid mellom akademia, næringsliv og myndigheter. Vi kan bidra til den internasjonale forsvarsinfrastrukturen gjennom åpen kildekode, uavhengig testing og ved å bygge verktøy alle kan bruke. Men det krever koordinering og sannsynligvis at vi samarbeider raskere enn Forskningsrådets utlysningsrytme tillater.
Det enkleste enkeltpersoner og foretak kan gjøre, er det samme som sist: Følg med, velg bevisst, vær villig til å bytte produkter, og vær i stand til å bytte leverandør. Det viktigste vi kan gjøre som land, er å slutte å anta at noen andre ordner dette for oss.
Disclaimer : This story is auto aggregated by a computer programme and has not been created or edited by DOWNTHENEWS. Publisher: aftenposten.no



