Zet 37 — het moment dat we wisten dat AI iets had dat wij niet hadden

In maart 2016 speelde DeepMind's AlphaGo een match van vijf partijen tegen Lee Sedol, op dat moment een van de sterkste Go-spelers ter wereld. Go is een aloud Oost-Aziatisch bordspel dat veel complexer is dan schaken. Tot dat moment werd algemeen aangenomen dat AI nog zeker tien tot twintig jaar nodig had om professioneel Go-niveau te bereiken. Dat was de wetenschappelijke consensus, opgeschreven in papers, uitgesproken in conferenties.

AlphaGo won 4-1. Dat was al verbazingwekkend. Maar de specifieke zet die iedereen later over zou spreken, was zet 37 in partij 2.

De zet

Op de 37e beurt van partij 2 plaatste AlphaGo een zwarte steen op een onconventionele plek — de vijfde lijn vanaf de rand. In traditionele Go-theorie is een dergelijke zet meestal slecht in het stadium van het spel waarin AlphaGo het deed. De vijfde lijn is te ver van het bord, wordt niet goed verdedigd, kan makkelijk worden omsingeld. Mensen spelen deze zet bijna nooit op dat moment.

Michael Redmond, de Amerikaanse 9-dan professional die de partij commentarieerde, zei live op televisie: "Dat is een heel, heel vreemde zet." Fan Hui, de Europese kampioen die AlphaGo eerder had verslagen, dacht aanvankelijk dat het een fout was. Op sociale media vermoedden fans dat het algoritme een bug had.

Lee Sedol keek er verbijsterd naar. Hij dacht vijftien minuten na — voor Go-spelers een lange tijd — voor hij reageerde. Later gaf hij aan dat hij het geen fout vond, maar er ook geen logica in kon ontdekken.

De partij ging door. Met elke verdere zet bleek dat zet 37 de hele middenpartij had voorbereid. Wat aanvankelijk als willekeurig-ver leek, werd het hart van een configuratie die zich over het hele bord uitstrekte. Zet 37 bleek de sleutel. Lee Sedol verloor partij 2, en later de match.

Wat die zet was

Achteraf hebben Go-experts lang over zet 37 gesproken. De algemeen aanvaarde interpretatie: het was een creatieve zet die de beperkingen van menselijke Go-theorie blootlegde. Mensen hadden eeuwenlang Go gespeeld en eigen heuristieken ontwikkeld over wanneer de vijfde lijn goed of slecht is. Die heuristieken bleken onvolledig. AlphaGo, dat geleerd had via miljoenen self-play partijen, had een stijl ontwikkeld die buiten die heuristieken lag.

Fan Hui, die in het DeepMind-team werkte na zijn eigen verlies tegen AlphaGo, zei in een interview: "Het is niet dat de zet slecht was of goed — het is dat hij creatief was op een manier die we niet hadden voorzien."

Voor Go-kenners was dit een schok. Go heeft eeuwen opening-theorie, middelspel-patronen, eindspel-tactieken. Grootmeesters trainen decennia om deze wijsheid te internaliseren. En hier kwam een machine die, in zes maanden self-play, patronen had ontwikkeld die deze hele traditie overstegen. Het was niet dat AlphaGo beter was in wat mensen deden; het had iets gevonden wat mensen niet hadden gevonden.

Waarom het anders voelde dan 1997

Deep Blue had Kasparov verslagen met rekenkracht. 200 miljoen stellingen per seconde, handgecodeerde evaluatie. Brute force plus menselijke schaakwijsheid. Mensen konden zichzelf geruststellen: een machine versloeg ons niet door slimmer te zijn, maar door sneller te rekenen.

AlphaGo werkte anders. Zelf een eigen intuïtie getraind via self-play. Zetten maakten die niemand had voorzien. Het leek — voelde — niet als brute kracht maar als een soort inzicht. Iets dat we met menselijke intelligentie associeerden.

Dat besef raakte veel mensen harder dan Deep Blue ooit had gedaan. Kasparov had een wedstrijd verloren. Lee Sedol zag iets wat op creativiteit leek in een computer. Die twee gevoelens zijn kwalitatief anders.

Lee Sedol zei later in een interview: "Tot zet 37 dacht ik dat AI sterk was in Go door veel berekenen. Na zet 37 realiseerde ik me dat AI creatief kon zijn. Dat was een ander gevoel dan ik vooraf had verwacht."

AlphaZero — de volgende stap

AlphaGo was getraind op menselijke partijen — miljoenen Go-partijen tussen mensen waren de uitgangsdata. Pas in 2017 publiceerde DeepMind AlphaZero, dat hetzelfde soort resultaat bereikte zonder enige menselijke partijen. Alleen self-play vanaf willekeurig spel. Binnen 24 uur training was AlphaZero sterker dan alle bestaande Go-programma's. Daarna werd hetzelfde idee op schaak en shogi toegepast, met vergelijkbare resultaten.

Dat was nog een schok. Het betekende dat zelfs de stijl van AlphaGo — hoe creatief hij ook was — nog steeds deels geworteld was in menselijke Go-traditie. AlphaZero had die wortels niet. Het speelde volkomen nieuwe stijlen die Go-meesters pas moesten begrijpen.

De Go-wereld nam dit op een bijzondere manier. Men begon AlphaZero's partijen te bestuderen zoals men klassieke meesterlijke partijen zou bestuderen. Moderne Go-training gebruikt AI-systemen als leraar. De stijl van top-Go-spelers in 2026 is direct beïnvloed door wat AI ze heeft laten zien.

Dat is anders dan wat er met schaak gebeurde. Na Deep Blue bleef menselijk schaak grotendeels "oud schaak". Na AlphaGo en AlphaZero veranderde Go op fundamenteel niveau. Niet alleen werd het sterker — het werd anders. AI had zetten gevonden die mensen niet hadden, en die zetten zijn nu deel van het menselijke spel.

Wat zet 37 ons leerde

Er zijn meerdere lessen.

Ten eerste: AI kan creatief zijn in een functionele zin. Dit is geen vage bewering. Het kan zetten vinden die mensen niet hebben bedacht, ondanks duizenden jaren van collectieve menselijke inspanning. Of dat "echte" creativiteit is in een filosofische zin, is een aparte vraag. Maar creatief in de zin dat het nieuwe, waardevolle uitkomsten produceert — ja.

Ten tweede: schaal plus iteratie plus self-play kan tot uitkomsten leiden die buiten de huidige menselijke kennis liggen. Dat is een machtige combinatie. Als ze in Go werkt, werkt ze potentieel ook in wetenschappelijk onderzoek, ingenieursproblemen, wiskundige bewijzen. Sommige van die toepassingen zijn nu al zichtbaar (AlphaFold voor eiwitten, FunSearch voor wiskunde).

Ten derde, en misschien het belangrijkste: mensen leren bij wanneer AI iets kan wat wij niet. We leren van AlphaGo's stijl in Go. We leren van AlphaFold's voorspellingen in biologie. We kunnen leren van toekomstige AI-systemen in nog meer domeinen. Het is geen nul-som-spel waarbij de machine wint en de mens verliest. Soms wint iedereen.

Het gevoel

Zet 37 had geen onmiddellijke economische impact. Het veranderde geen industrie. Het was een zet in een Go-partij, door een AI tegen een mens, gezien door miljoenen kijkers.

Maar het veranderde iets in hoe mensen over AI denken. Voor zet 37 was de retoriek: AI is krachtig maar niet creatief. Na zet 37 werd die stelling kwetsbaarder. Er was een weerlegging in één zet. Een zet die een mens niet had bedacht, door een machine die meerdere mensen hadden gebouwd.

Voor Lee Sedol persoonlijk was het pijnlijk. Hij verklaarde in 2019, drie jaar na de match, dat hij met pensioen ging omdat "zelfs als ik nummer één word, kan ik nooit de top zijn. Er is een entiteit die niet kan worden verslagen." Hij had duidelijk een punt; vanaf 2020 is geen mens meer de AlphaGo-generatie AI-systemen geklopt in Go op hoog niveau.

Maar Go leeft voort. Spelers blijven trainen, toernooien blijven bestaan, miljoenen mensen spelen het spel. Niet omdat ze de sterkste zijn — omdat het spel zelf de waarde is, niet de hoogste kampioen.

Dat is misschien wel het belangrijkste inzicht dat zet 37 ons achterliet. AI kan de bovengrens van vaardigheid verleggen. Maar wat de activiteit de moeite waard maakt, ligt niet altijd bij de bovengrens. Het ligt in het doen zelf, in de samenwerking, in het leren, in de diepte die een mens er zelf in vindt.

Die les werd in maart 2016 ook ingeleerd. Geleidelijk, terwijl de partijen verder gingen, terwijl mensen de betekenis ervan begonnen te bevatten. Zet 37 was de aankondiging. De rest is een herinterpretatie die nog steeds aan de gang is.

Veelgestelde vragen

Waarom was Go zo moeilijk voor AI?+

Go heeft veel meer mogelijke stellingen dan schaak (10^170 versus 10^120), en er is geen simpele evaluatie van wie 'voorstaat'. Brute-force zoekstrategieën zoals Deep Blue gebruikte, werken niet. Menselijke Go-meesters bouwen intuïtie op over jaren van training, iets wat moeilijk te formaliseren bleek.

Wat was zet 37 precies?+

Een zet op de vijfde lijn vanaf de rand — in de traditionele Go-theorie een 'verliezer' op dat moment, omdat het zich te ver uitzet over het bord. Experts keken er verbijsterd naar. Pas drie uur later, naarmate de partij zich ontvouwde, werd duidelijk dat de zet de hele middenpartij domineerde.

Wat deed AlphaGo anders dan Deep Blue?+

AlphaGo leerde via self-play en reinforcement learning, met neurale netwerken die 'intuïtie' konden ontwikkelen. Deep Blue had handgecodeerde regels. AlphaGo had grotendeels zichzelf geleerd. Dat maakt zijn zetten moeilijker te verklaren — ook voor de makers.

Wat is AlphaZero?+

Een opvolger uit 2017 die alles wat AlphaGo deed overtrof, én geen menselijke Go-partijen gebruikte in zijn training. Alleen self-play vanaf willekeurig spel. Binnen uren werd het sterker dan elke menselijke speler, en later werd dezelfde architectuur toegepast op schaak en shogi.

Zet 37 — het moment dat we wisten dat AI iets had dat wij niet hadden

De zet

Wat die zet was

Waarom het anders voelde dan 1997

AlphaZero — de volgende stap

Wat zet 37 ons leerde

Het gevoel

Veelgestelde vragen

Verwante artikelen

Vragen die je eigen project betreffen?

De zet

Wat die zet was

Waarom het anders voelde dan 1997

AlphaZero — de volgende stap

Wat zet 37 ons leerde

Het gevoel

Veelgestelde vragen

Verwante artikelen

Wat is een LLM eigenlijk? AI-basisbegrippen in gewone taal

10 AI-tools die ik dagelijks gebruik (en waarvoor)

AI-agents uitgelegd: meer dan slimme chatbots

Vragen die je eigen project betreffen?