Laisky's Notes

https://youtu.be/WXuK6gekU1Y?si=KnJ-WTTVCpgvEgT3

前阵子和人讨论 GPT 时聊到了 AlphaGo，我意识到我对 AlphaGo 不太了解，所以最近打算学习一下。而要了解 AlphaGo，首先都推荐观看这部纪录片。

2014 年深度学习（AlexNet）的论文发表，DeepMind 开始利用深度神经网络处理视频游戏，并很快转向了对围棋的研究。2015 年，DeepMind 邀请欧洲围棋冠军 Fan Hui 来到英国与 AlphaGo 对弈并全胜，这是围棋程序第一次战胜专业人类选手，Fan Hui 也以顾问的身份加入 AlphaGo。2016 年 DeepMind 前往韩国挑战世界冠军 Lee Sedol，并取得了四胜一负的成绩。这一系列的胜利引起了全球的关注，也让人们开始认识到了深度学习的威力。

值得注意的是，围棋的特色在于其近乎无穷的可能性，这也对应着近乎无穷的计算量，这使得围棋其实是一个直觉游戏（intuitive game），而不是一个需要深思熟虑的策略游戏（logic based game），毕竟任何所谓的深思熟虑在这无穷的可能性面前都是无谓的。专业棋手其实是通过记忆数以万计的棋谱来训练自己的直觉，然后使用直觉来对弈，这一训练方式和神经网络的工作原理非常相似，这也是深度神经网络最终能够击败人类的原因。

更多关于神经网络信息可以参考此前发过的介绍 GPT 的文: https://t.me/laiskynotes/144

我还在学习 AlphaGo 的论文，更多笔记日后再更新。

YouTube

AlphaGo - The Movie | Full award-winning documentary

With more board configurations than there are atoms in the universe, the ancient Chinese game of Go has long been considered a grand challenge for artificial intelligence.

On March 9, 2016, the worlds of Go and artificial intelligence collided in South…