人工智能第2页｜柏舟的博客

柏舟新冠4年 12-19 阅读次数 714

AlphaZero是一种以MCTS为基础的使用模仿学习的强化学习方法，适用于奖励函数难以建模的情形。国际象棋动作空间建模很复杂。复现策略拟合还算成功，但是局势判断拟合失败。

柏舟新冠4年 03-30 阅读次数 509

基因和语言从信息角度看没有区别，图片、语言跨模态技术已经有了，基因编辑还会远吗？

柏舟新冠4年 02-17 阅读次数 550

使用ChatGPT对社交网络注入垃圾信息，打击异己，潜移默化的改造认知，阻止其他AI获得好的训练样本。