新冠纪元 前端 编程感悟 心绪 软件系统设计 读书与历史 数学与控制 人工智能

强烈推荐《讲过大家的中国历史》,谈中国文化基因

柏舟   新冠5年 02-10

周人的忧患观:战战兢兢,如履深渊,如履薄冰。

以Rust和Go为例编程语言的错误处理

柏舟   新冠5年 01-23

Go和Rust这类错误处理方式需要显式处理错误。优点是错误类型都是显式定义的,缺点是会污染所有后续的函数,并且影响调用栈,很难调试。

函数、老虎机、强化学习优化问题的辨识与区别

柏舟   新冠5年 01-11

区别:是否存在先验的模型,奖励函数是否可观测。有无足够的信息决定了最终是否需要平衡搜索、当前收益和未来。

线性泛函分析中向量空间和LQR、对偶空间的物理含义

柏舟   新冠5年 01-05

从泛函的向量空间理解LQR,以及对张量的协变、逆变的理解。

在国际象棋上复现AlphaZero的设计和失败的心得

柏舟   新冠4年 12-19

AlphaZero是一种以MCTS为基础的使用模仿学习的强化学习方法,适用于奖励函数难以建模的情形。国际象棋动作空间建模很复杂。复现策略拟合还算成功,但是局势判断拟合失败。

新冠纪元的源起和我的哲学体系

柏舟   新冠4年 12-03

我的哲学体系解决两个时代问题:人工智能意味着什么?现代文明是什么?

线性代数、数列和微分方程特征值的含义,连续与离散的关系,零空间与稳定性

柏舟   新冠4年 11-30

把线性代数、常微分方程、自动控制原理连续起来,简单举了一个物理一个赛博的例子。