Supersterke AlphaZero sjokkerer sjakkverden

I 2017 skjedde det et gjennombrudd i utvikling av programvare som er supersterk i både sjakk og andre spill enn det tidligere er kjent. Denne programvaren kan slå både mennesker og andre sjakkcomputere.

Les også: Slik blir du bedre sjakkspiller

Selskapet DeepMind ble etablet i 2010 og ble kjøpt opp av Google i 2014. Etter dette har flere store selskaper stått i kø for å investere i DeepMind.

Kunstig intelligens etterligner biologisk nervevev

DeepMind driver med utvikling av såkalt nevralt nettverk som brukes til å etterligne biologisk nervevev fra hjernen eller det sensoriske system.

Det utvikles metoder og algoritmer som forsøker å etterligne egenskapene, men bruker kun inspirasjon fra biologisk nervevev uten å være eksakt kopi.

Lærer seg å bli best i alt

DeepMind utvikler et nevralt nettverk som lærer seg å spille videospill på lignende måte som et menneske gjør det.

Selskapet har tidligere skapt overskrifter da selskapets program AlphaGo klarte å slå en profesjonell Go-spiller og programmet har også klart å slå verdensmesteren i spillet Go flere ganger. Go er et brettspill som anses å være mer komplisert (flere mulige trekk) enn sjakk.

Slår verdens beste sjakkcomputer

Nå har DeepMind klart å utvikle AlphaZero som har slått verdens beste sjakkcomputer, Stockfish. AlphaZero blir bedre og bedre ved å lære seg selv å spille bedre etter hvert sjakkparti. Resultatet er både fascinerende og skremmende.

Les også: Dette er Stockfish

Skremmende effektiv maskin

Det som gjør AlphaZero ekstremt imponerende, men også skremmende, er at programmet kan lære seg et hvilket som helst spill og slå mennesker uansett. Programmet lærer seg spillereglene først og blir deretter bedre og bedre jo mer programmet spiller. AlphaZero baserer sitt spill ikke på hvordan mennesker og maskiner har spillt sjakk tidligere, men kan lære å bli bedre på egen hånd. Man kan nesten si at AlphaZero «tenker» som et menneske og det er det som er revolusjonen med AlphaZero.

Ikke nok med det, det tok AlphaZero under 24 timer å lære seg å spille tre forskjellige spill på et svært høyt nivå, altså slik at programmet er blitt bedre enn et menneske.

Slik fungerer AlphaZero

Teknologien bak AlphaZero kalles for «Deep Reinforcement Learning» eller forsterkende læring på norsk. Det er en type maskinlæring og dermed også en type kunstig intelligens.

Forsterkende læring går ut på at maskiner eller programvare, agenter, prøver å finne løsningen til et problem ved å definere den ideelle løsningen innenfor en bestemt kontekst, og så gir belønninger eller straff for hvorvidt oppførselen fører agenten nærmere eller lengre fra løsningen. Les mer på Wikipedia.

Agentene får sin kunnskap direkte fra kilden uten forhåndsinformasjon som for eksempel måten stormestere i sjakk har spillt tidligere. Agenten får altså kunnskapen på egen hånd ved læring. Dette er gjort mulig ved såkalt «Deep Learning» (en type maskinlæring) av nevrale nettverk. Det agentene gjør er å etterligne måten mennesket løser oppgaver.

MuZero

DeepMind lanserte i 2019 en ny maskin med navnet MuZero som skal være enda mer avansert og bedre enn AlphaZerto. MuZero trenger ikke å vite noe om reglene for sjakk eller andre spill før den starter. På samme måten som AlphaZero lærer MuZero sjakk eller andre spill underveis mens den spiller. Les mer på deepmind.google.

Slutten på en æra?

Er dette slutten på en æra hvor sjakkcomputere er laget med tradisjonell programmering? Nå er det kunstig intelligens og nevrale nettverk som gjelder.

Syv år etter at AlphaZero vant suverent mot Stockfish kan man trygt si at kunstig intelligens er på full fart inn i verdenssamfunnet på flere områder, ikke bare sjakk. Men, det er flere som lurer på om dette er en boble som snart sprekker.

En av faktorene som signaliserer at dagens voldsomme interesse i kunstig intelligens er at flere og flere selskaper forlanger betaling for tjenester som bruker kunstig intelligens. Det er mange som mener en slik utvikling ikke kan fortsette i lengden – boblen kan sprekke.

Stockfish – AlphaZero

AlphaZero spilte 100 sjakkpartier mot Stockfish i 2017. AlphaZero vant 28 partier, 72 partier ble remis, AlphaZero tapte ingen. Du finner et av partiene på chess.com.

Hva er AlphaGo?

Go er et kinesisk brettspill som faktisk er mer komplisert enn sjakk og det ble laget for over 2500 år siden. AlphaGo er programmet som kan spille Go. Les mer i vår artikkel.

Video: AlphaGo

Videopresentasjon av AlphaGo:

Video: AlphaGo

Videopresentasjon av AlphaGo – det er maskinen som slo verdensmesteren i brettspillet Go:

Kilder: theverge.com, wikipedia.org (1), wikipedia.org (2)

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *