在国际象棋上复现AlphaZero的设计和失败的心得

柏舟 新冠4年 12-19 阅读次数 714

AlphaZero是一种以MCTS为基础的使用模仿学习的强化学习方法,适用于奖励函数难以建模的情形。国际象棋动作空间建模很复杂。复现策略拟合还算成功,但是局势判断拟合失败。

chatGPT等AI大模型或开启基因研究新时代

柏舟 新冠4年 03-30 阅读次数 509

基因和语言从信息角度看没有区别,图片、语言跨模态技术已经有了,基因编辑还会远吗?

ChatGPT在舆论战科技战中应用

柏舟 新冠4年 02-17 阅读次数 550

使用ChatGPT对社交网络注入垃圾信息,打击异己,潜移默化的改造认知,阻止其他AI获得好的训练样本。