应用介绍
强化学习大大提高了AI的能力,因为它的思路是“奖励过程,而非只奖励结果”。比如AI下棋,可以从每一步中学习好棋和坏棋,而不是等到漫长的棋局结束后才知道这一盘该不该学。强化学习还提升了AI的格局,因为有时候,哪怕没有明显的收获,只是探索了一个新地方,这种新奇感也是奖励。
强化学习大大提高了AI的能力,因为它的思路是“奖励过程,而非只奖励结果”。比如AI下棋,可以从每一步中学习好棋和坏棋,而不是等到漫长的棋局结束后才知道这一盘该不该学。强化学习还提升了AI的格局,因为有时候,哪怕没有明显的收获,只是探索了一个新地方,这种新奇感也是奖励。