Sjakkcomputeren som sjokkerer

by Arsæll Benediktsson · 04/06/2023

I 2017 skjedde det et gjennombrudd i utvikling av programvare som er supersterk i både sjakk og andre spill enn det tidligere er kjent. Denne programvaren kan slå både mennesker og andre sjakkcomputere.

Les også: Her kan du last ned Stockfish

Selskapet DeepMind ble etablet i 2010 og ble kjøpt opp av Google i 2014. Etter dette har flere store selskaper stått i kø for å investere i DeepMind.

Les også: Bli medlem av Sjakkporten!

Kunstig intelligens etterligner biologisk nervevev

DeepMind driver med utvikling av såkalt nevralt nettverk som brukes til å etterligne biologisk nervevev fra hjernen eller det sensoriske system. Det utvikles metoder og algoritmer som forsøker å etterligne egenskapene, men bruker kun inspirasjon fra biologisk nervevev uten å være eksakt kopi.

Lærer seg å bli best i alt

DeepMind utvikler et nevralt nettverk som lærer seg å spille videospill på lignende måte som et menneske gjør det. Selskapet har tidligere skapt overskrifter da selskapets program AlphaGo klarte å slå en profesjonell Go-spiller og programmet har også klart å slå verdensmesteren i spillet Go flere ganger. Go er et brettspill som anses å være mer komplisert (flere mulige trekk) enn sjakk.

AlphaGo på YouTube

Dokumentaren AlphaGo handler om spillet Go, som på mange måter er mer komplisert enn sjakk. Den handler også om utviklingen av dette dataprogrammet og den er nå tilgjengelig på YouTube. Les mer i vår artikkel.

Slår verdens beste sjakkcomputer

Nå har DeepMind klart å utvikle AlphaZero som har slått verdens beste sjakkcomputer, Stockfish. AlphaZero blir bedre og bedre ved å lære seg selv å spille bedre etter hvert sjakkparti. Resultatet er både fascinerende og skremmende.

Les også: Dette er Stockfish

Skremmende effektiv maskin

Det som gjør AlphaZero ekstremt imponerende, men også skremmende, er at programmet kan lære seg et hvilket som helst spill og slå mennesker uansett. Programmet lærer seg spillereglene først og blir deretter bedre og bedre jo mer programmet spiller. AlphaZero baserer sitt spill ikke på hvordan mennesker og maskiner har spillt sjakk tidligere, men kan lære å bli bedre på egen hånd. Man kan nesten si at AlphaZero «tenker» som et menneske og det er det som er revolusjonen med AlphaZero.

Ikke nok med det, det tok AlphaZero under 24 timer å lære seg å spille tre forskjellige spill på et svært høyt nivå, altså slik at programmet er blitt bedre enn et menneske.

Slik fungerer AlphaZero

Teknologien bak AlphaZero kalles for «Deep Reinforcement Learning» eller forsterkende læring på norsk. Det er en type maskinlæring og dermed også en type kunstig intelligens.

Forsterkende læring går ut på at maskiner eller programvare, agenter, prøver å finne løsningen til et problem ved å definere den ideelle løsningen innenfor en bestemt kontekst, og så gir belønninger eller straff for hvorvidt oppførselen fører agenten nærmere eller lengre fra løsningen. Les mer på Wikipedia.

Agentene får sin kunnskap direkte fra kilden uten forhåndsinformasjon som for eksempel måten stormestere i sjakk har spillt tidligere. Agenten får altså kunnskapen på egen hånd ved læring. Dette er gjort mulig ved såkalt «Deep Learning» (en type maskinlæring) av nevrale nettverk. Det agentene gjør er å etterligne måten mennesket løser oppgaver.

Egen spillestil

Det spesielle med AlphaZero er at den lærer sjakk på egen måte – den har med andre ord sin egen spillestil som AlphaZero finner på etter hvert som den lærer spillet. Dette har dagens sjakkspillere faktisk utnyttet og lært av. Dermed er AlphaZero i ferd med å endre måten mennesker spiller sjakk. Det som tidligere var ansett som best i en bestemt sjakk-stilling ikke lenger er det etter at supercomputeren AlphaZero har endre oppfatningen.

Slutten på en æra?

Er dette slutten på en æra hvor sjakkcomputere er laget med tradisjonell programmering? Nå er det kunstig intelligens og nevrale nettverk som gjelder.

Dette er en Twitter-melding fra 2017 fra nettstedet Chess24.com som markerer at AlphaZero har slått Stockfish:

Now the era of computer chess engine programming also seems to be over: AlphaZero, developed by @DeepMindAI & @demishassabis, took just 4 hours playing against itself to learn to play better than Stockfish (it won 64:36)! Replay 10 example games: https://t.co/cBEuoEFMTN #c24live pic.twitter.com/U2bn1KyJbL

— chess24.com (@chess24com) December 6, 2017

Brukes til å analysere flere varianter

Den nye sjakkcomputeren AlphaZero er nylig blitt brukt til å analysere flere sjakkvarianter. AlphaZero har den fordelen at den kan gå grundigere til verks i sjakkteoriene enn tidligere er blitt kjent. Les mer på chess.com.

Leela Chess Zero

Leela Chess Zero er en nedlastbar app som bruker de samme algoritmene som AlphaZero. Les mer i artikkel.

Stockfish – AlphaZero

Dette er sjakkpartiet hvor AlphaZero slår Stockfish. Du kan spille gjennom partiet:

Du finner flere sjakkpartier på chess24.com.

Video: AlphaZero

Videopresentasjon av AlphaZero:

Video: AlphaGo

Videopresentasjon av AlphaGo – det er maskinen som slo verdensmesteren i brettspillet Go:

Kilde: theverge.com, Wikipedia