文章第5页｜柏舟的博客

柏舟新冠5年 01-05 阅读次数 625

从泛函的向量空间理解LQR，以及对张量的协变、逆变的理解。

柏舟新冠4年 12-26 阅读次数 496

#心绪

柏舟新冠4年 12-19 阅读次数 714

AlphaZero是一种以MCTS为基础的使用模仿学习的强化学习方法，适用于奖励函数难以建模的情形。国际象棋动作空间建模很复杂。复现策略拟合还算成功，但是局势判断拟合失败。

柏舟新冠4年 12-03 阅读次数 588

我的哲学体系解决两个时代问题：人工智能意味着什么？现代文明是什么？

柏舟新冠4年 11-30 阅读次数 601

把线性代数、常微分方程、自动控制原理连续起来，简单举了一个物理一个赛博的例子。

柏舟新冠4年 11-27 阅读次数 468

不可变类型（值类型）和可变类型（引用）的赋值行为有很大差异，具体表现在副作用的影响、装箱上。

柏舟新冠4年 11-05 阅读次数 489

#心绪

柏舟新冠4年 10-30 阅读次数 723

我没有特别喜欢编程，却成了现在这个样子：高中的时候明知道996还去，上大学就自学了；上大学时我想算法这么卷傻逼才去，然后现在搞强化学习。真香！