Supersterke AlphaZero sjokkerer sjakkverden

I denne uken skjedde det et gjennombrudd i utvikling av programvare som er supersterk i både sjakk og andre spill enn det tidligere er kjent. Denne programvaren kan slå både mennesker og andre sjakkcomputere.

Les også: De beste sjakklenkene

Selskapet DeepMind ble etablet i 2010 og ble kjøpt opp av Google i 2014. Etter dette har flere store selskaper stått i kø for å investere i DeepMind.

Kunstig intelligens etterligner biologisk nervevev




DeepMind driver med utvikling av såkalt nevralt nettverk som brukes til å etterligne biologisk nervevev fra hjernen eller det sensoriske system.

Det utvikles metoder og algoritmer som forsøker å etterligne egenskapene, men bruker kun inspirasjon fra biologisk nervevev uten å være eksakt kopi.

Lærer seg å bli best i alt

DeepMind utvikler et nevralt nettverk som lærer seg å spille videospill på lignende måte som et menneske gjør det.

Selskapet har tidligere skapt overskrifter da selskapets program AlphaGo klarte å slå en profesjonell Go-spiller og programmet har også klart å slå verdensmesteren i spillet Go flere ganger. Go er et brettspill som anses å være mer komplisert (flere mulige trekk) enn sjakk.

Slår verdens beste sjakkcomputer

Nå har DeepMind klart å utvikle AlphaZero som har slått verdens beste sjakkcomputer, Stockfish. AlphaZero blir bedre og bedre ved å lære seg selv å spille bedre etter hvert sjakkparti. Resultatet er både fascinerende og skremmende.

Les også: Dette er Stockfish Chess

Skremmende effektiv maskin

Det som gjør AlphaZero ekstremt imponerende, men også skremmende, er at programmet kan lære seg et hvilket som helst spill og slå mennesker uansett. Programmet lærer seg spillereglene først og blir deretter bedre og bedre jo mer programmet spiller. AlphaZero baserer sitt spill ikke på hvordan mennesker og maskiner har spillt sjakk tidligere, men kan lære å bli bedre på egen hånd. Man kan nesten si at AlphaZero «tenker» som et menneske og det er det som er revolusjonen med AlphaZero.

Ikke nok med det, det tok AlphaZero under 24 timer å lære seg å spille tre forskjellige spill på et svært høyt nivå, altså slik at programmet er blitt bedre enn et menneske.

Slik fungerer AlphaZero

Teknologien bak AlphaZero kalles for «Deep Reinforcement Learning» eller forsterkende læring på norsk. Det er en type maskinlæring og dermed også en type kunstig intelligens.

Forsterkende læring går ut på at maskiner eller programvare, agenter, prøver å finne løsningen til et problem ved å definere den ideelle løsningen innenfor en bestemt kontekst, og så gir belønninger eller straff for hvorvidt oppførselen fører agenten nærmere eller lengre fra løsningen. Les mer på Wikipedia.

Agentene får sin kunnskap direkte fra kilden uten forhåndsinformasjon som for eksempel måten stormestere i sjakk har spillt tidligere. Agenten får altså kunnskapen på egen hånd ved læring. Dette er gjort mulig ved såkalt «Deep Learning» (en type maskinlæring) av nevrale nettverk. Det agentene gjør er å etterligne måten mennesket løser oppgaver.

Slutten på en æra?

Er dette slutten på en æra hvor sjakkcomputere er laget med tradisjonell programmering? Nå er det kunstig intelligens og nevrale nettverk som gjelder.

Dette er en Twitter-melding fra nettstedet Chess24.com som markerer at AlphaZero har slått Stockfish:

 

Stockfish – AlphaZero

Dette er sjakkpartiet hvor AlphaZero slår Stockfish. Du kan spille gjennom partiet:

Du finner flere sjakkpartier på chess24.com.

Video: AlphaZero

Videopresentasjon av AlphaZero:

Video: AlphaGo

Videopresentasjon av AlphaGo – det er maskinen som slo verdensmesteren i brettspillet Go:

Kilde: theverge.com, Wikipedia

You may also like...

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert.