chatGPT等AI大模型或开启基因研究新时代

柏舟   新冠4年 03-30

很多人担心AI会取代人的工作,人类会被AI控制,我觉得这是很久以后的事情。因为,AI很可能会在基因领域取得更大的突破,协助人们更好的理解基因的含义,从而编辑基因。属于益生菌的时代不远了。

2018年,DeepMind就已经搞出了AlphaFold,它能够根据一个蛋白质的氨基酸序列来预测它的3D结构。传统的蛋白质研究是基于X射线晶体学和冷冻电镜等试验方法,成本高,耗时长。然而,AlphaFold能够计算可能的蛋白质3D结构,并且准确性较高,这在医疗制药领域会带来相当大的效率提升,改变了传统的研究方式。所以,从历史上看,将已经成熟应用的蛋白质预测扩展到同样基于Transformer的ChatGPT并不是不可能的事情。

我作为外行胡乱猜测AI模型和生物的原理。基因和语言从信息角度看具有很高的相似度,本质上都是一种编码——对语义的编码,对蛋白质的编码。我们既然可以对语言向量化,那么同样可以对基因语义向量化。只是说语言底层的逻辑和基因自组织规则不同,需要对约束条件进行设计。目前的AI已经能够通过输入图片,文字,语言获得用户想要的结果,所以我觉得基因和语言的跨模态技术,从理论上不会存在问题。无非是在GPT-4上面加一个基因的模态罢了,跟图片模态不会有本质区别。

首先,利用这个技术可以很快了解基因的含义和用途。下一步根据基因的作用进行基因编辑,使用语言输入目标,让AI生成文字描述和基因序列。我觉得AI首先会在这些方面得到应用:

我甚至连小说题目都想好了:

一场生化危机过后,地球上所有男人都死了,只有女人活了下来。之后出现了一个新的物种替代了原来男人的位置。但所有人都不知道的是,Shuttle·Zen活了下来,开启了他的复仇之路。

我们都是罗辑。