大语言模型的能力边界和提示词的技巧为什么有效

柏舟   03-30

目前的大模型只是根据输入反应式回答。根据该特点需要对提示词针对性设计。

变分:一个通往力学、控制、深度学习的桥梁

柏舟   新冠5年 12-19

是否存在一种方法,将任意的计算问题转化为试验,通过做试验让自然给出计算结果?

推荐《安克创新访谈》,谈大模型的未来和应用

柏舟   新冠5年 07-02

大模型的出现与GPU的发展密切相关,未来将有超越基于冯诺依曼架构的系统出现,使大模型存算训一体,真正实现通用人工智能。本文介绍了访谈梗概,讨论了分治法、计算的本质和存算训大模型的意义。

从天气预报谈深度学习,不同的预报对象、结构和心得体会

柏舟   新冠5年 06-28

天气预报的主要对象有中期天气预报,风力发电的风速预报以及短时强降雨预报。在Nature上发表了很多文章,主要的方法包括Transformer,图神经网络,AI for Science的一些方法,以及传统的UNet,PredCNN等。

内积空间下为什么神经网络可以拟合任何函数

柏舟   新冠5年 02-20

最小二次逼近和使用损失函数导出内积。

在国际象棋上复现AlphaZero的设计和失败的心得

柏舟   新冠4年 12-19

AlphaZero是一种以MCTS为基础的使用模仿学习的强化学习方法,适用于奖励函数难以建模的情形。国际象棋动作空间建模很复杂。复现策略拟合还算成功,但是局势判断拟合失败。

chatGPT等AI大模型或开启基因研究新时代

柏舟   新冠4年 03-30

基因和语言从信息角度看没有区别,图片、语言跨模态技术已经有了,基因编辑还会远吗?

ChatGPT在舆论战科技战中应用

柏舟   新冠4年 02-17

使用ChatGPT对社交网络注入垃圾信息,打击异己,潜移默化的改造认知,阻止其他AI获得好的训练样本。