AlphaZero是一种以MCTS为基础的使用模仿学习的强化学习方法,适用于奖励函数难以建模的情形。国际象棋动作空间建模很复杂。复现策略拟合还算成功,但是局势判断拟合失败。
基因和语言从信息角度看没有区别,图片、语言跨模态技术已经有了,基因编辑还会远吗?
使用ChatGPT对社交网络注入垃圾信息,打击异己,潜移默化的改造认知,阻止其他AI获得好的训练样本。