首页

校友招聘

校友专访

校友通讯

校友卡申请

​AI为伴,共谱未来——访 2012 级硕士校友谢臣哲

发布时间:2023-08-10浏览量:


谢臣哲,2012 级硕士校友,嘉实基金管理有限公司固定收益研究部AI预警组组长


问:对于AI在金融领域的应用,您认为目前发展到什么程度了?

谢臣哲:AI发展至今已经有几十年的时间了,它在各个领域的应用通常都是从门槛较低、最常见、有最广泛需求的场景开始。比如常见的智能客服、智能推荐等等,这些并不需要极其专业的智能、技术或行业知识。AI在金融领域的发展也一样,最先从门槛低的场景展开,处于初级阶段。银行、基金、券商和保险等大型公司在金融科技方面的应用主要是为自身业务赋能,用于自动化、结构化和数字化的工作,并没有大规模真正用于智能投研。

这个初级阶段的特点是,一方面,AI已经出现并产生了新的生产力。例如,ChatGPT的出现刺激了人们使用这种新的工具进行股票交易,尽管在现实中暂时不太可能广泛使用,这种现象本身已经激发了人们使用新的生产力工具进行投资的兴趣。另一方面,在金融领域还没有出现以这种新工具为核心的新组织形态,一些领跑机构有尝试有布局,但仍然是向传统业务场景赋能的构建思路。因此,我认为当前是一个生产力快速发展和迭代的时代。但金融领域的生产关系还没有适应这种生产力的发展。


问:国外现在发展到什么程度?

谢臣哲:在AI的应用层面,国内与国外基本上是同步发展的,我国也不需要过多担心数据量和数据质量的问题。但在模型的开发和研究层面,例如ChatGPT这样的大型预训练模型的开发,尽管我们也取得了一些成就,比如百度的文心一言,但从实际效果来看,我们仍然落后半年左右,跟GPT-4相比还有一些差距。

另一个需要密切关注的问题是我们的基础设施。大家知道,深度神经网络的训练、学习、推理需要显卡。就是说一个国家的算力是多少,那它所能够拥有的AI的最大潜力就是多少。我们在基础设施、AI生态上还落后一些,但并不需要太担忧,最终我们在这一轮科技浪潮中必然能够构建AI基础、算力、应用的完整体系。


问:未来你觉得应该是国家统一去训练一个模型,或者说是一些头部公司训练一些模型,国家去监管,还是每一个公司有自己的模型?

谢臣哲:这个模型分很多层面。现在我们用的GPT-4表面上是一个模型,其实是4个训练阶段。最初始的训练阶段叫预训练阶段,这个预训练阶段其实就把海量的文本直接丢给机器,不做标记,是一种无监督学习。训练完成后,机器可以根据前文预测后面的内容,一个字、一个字的生成,这也就是生成式AI的意思。这个阶段,我觉得不需要特别多的模型。原因在于它的训练成本非常高,目前一次就要1000多万美元,这个成本可能未来也无法下降,只有超大规模的公司能承担,这对于基金公司来说,没有实力也没有必要去做。这样的模型不需要很多,有几个就可以了,但不能只有一个。因为如果全人类可以使用的大模型只有一个,那我们从AI获得的答案就会非常同质化,这意味着人类世界就没有波动了,这是不应该发生的事情。

GPT预训练模型的底层叫Transformer。它在2017年由谷歌的工程师首次提出,它的本质是一种数学结构,跟我们说的其他模型,比如上个世纪发明的SVM(支持向量机)、随机森林,其实是并行的。过去五年人类所有的预训练大模型,全部是基于Transformer结构的。Transformer结构相比上个世纪发明的随机森林等模型,有很大的进步。我觉得最大的进步是,它学习了我们人类大脑的注意力机制。所谓注意力机制,就是比如在这个会议室里有很多东西,但我只注意到你,你的注意力也只在我身上。人类的注意力机制,会让我们的大脑屏蔽一些不重要的信息,让它们对我们的神经刺激小一些,以使得最重要的元素可以对我们的神经刺激大一些。Transformer就是通过数学的模型搭建,让机器也学会了这个注意力的运行方式。

但它也只学会了人类大脑(经过上亿年演化)的其中一个机制,我们还有其他的机制是它还不知道的。它必须通过以T、P为单位的海量数据训练,才能产生这么一点点的智慧。但我们人类,只需要学一本金融学,可能国际金融也能无师自通了。所以,在基础的模型层面还很有发展的潜力,通过大量研发的投入,我们可以得到更有效的模型。但另一个维度上,目前模型的参数已经达到基础智慧的阈值了,足够我们来应用它。总结下来,基础层面万亿参数的大模型,不需要太多但不能只有一个;对于大部分公司来说,不需要参与自研。

GPT在完成基础的预训练结束之后,还有三个阶段,需要对它做微调、做对抗,以及做提示性的训练,让它表现的更像一个正在跟我们对话的人。在金融领域也是一样,我们拿到一个不论是来自OpenAI,还是华为、阿里的基础大模型,需要用我们的金融数据对它进行训练。


问: AI技术的发展对金融行业会有哪些深远的影响?其发展最终是否会取代传统的投资方式?

谢臣哲:我认为AI对金融行业未来的影响可以分为几个层次。

第一个层次,也是最宏伟的目标,就是AI技术的发展能带来一种类似“互联网+金融”的范式。应用这种新的AI投资范式可以做到成本特别低、收益特别好、效率特别高,它将吸引所有金融资产管理公司加入其中。当前行业背景费率下降,也可能倒逼这种模式快速出现。

第二个层次,AI可能成为某一些投资领域的新兴范式,但在那些需要发挥人类创造力的领域无法取代人类。这样的力量如果能占到10%或20%,也将给市场带来巨大的新波动。举例来说,在股票市场上,我们过去一直使用技术面分析;随后一部分人转向基本面分析;基本面分析也在逐渐演化,不再只看当前的盈利情况,也关注未来的盈利预测。然而,尽管这些方法逐渐演变,市场仍然存在基于技术面分析的投资者。

第三个层次,AI将在某些细分领域有所突破,对过去西方金融理论统治世界长达一百年的格局带来新的变革。举个例子,过去,我们的投资组合理论是“收益/风险”,风险在这里是指波动性,即上涨和下跌都被视为风险。然而,我们更希望获得高收益的同时承担较低风险,但是传统的西方投资理论无法实现这一点。而AI具有很强的非线性拟合能力,更接近人脑思考逻辑,在这一点上可以超越传统投资组合理论。。


问:AI在金融领域的应用会有一些潜在的挑战和风险吗?您认为该如何应对?

谢臣哲:风险一定是存在的,而且是方方面面普遍存在的。GPT通过巨量的数据将人类的知识压缩(coding)到其超过1,000亿的参数中,然后通过解码(decoding)的方式提取所需信息。这个过程类似于人类的大脑,我们回忆过去的事情时,也是通过刺激大脑进行解码。

在压缩过程中它只是学习,我们无法控制它。所以当你问它问题时,它肯定能给一个答案。比如,在早期版本的GPT中,当你询问它如何制作炸弹等涉及人身安全的问题时,它可能会给出回答。再比如,如果你要求它赞美美国总统拜登,它可以写一首诗,但如果你要求它赞美特朗普,它就写不出来,并回答说:“我不讨论政治性问题”。这表明在训练过程中,输入给它的数据是有偏见的。因此,我们现在的方法是在解码阶段进行监督和安全控制,采取各种方法控制风险。例如,我们不能让AI单独自主地运行,而是通过程序控制它按照我们的要求来运营。GPT能够给出激进、温和或中庸的回答,这实际上就是通过选择不同的控制方法,以给出符合你想要的答案。

使用开源模型也存在一定的风险。除了之前提到的政治敏感问题的传播风险外,当我们使用这些模型时,就是再次向其提供数据进行训练,也就可能泄漏我们的数据,这种风险是相当大的。

此外,这种大型模型的竞争其实也是一种文明的竞争。通过GPT,可以构建自己的生态系统和下游应用,有人用它进行图像处理,有人用它作为私人助理。但是,它有一个前提条件,如果你希望对话的效果更好、效率更高,就必须使用英语与它对话。久而久之,这将导致世界上的语言趋向英语,这是一个非常麻烦的问题。如果这个生态系统建立起来,大家都用英文,那么它获得的数据将越来越多,版本迭代速度越来越快,变得越来越好。


问:用AI做风控和投资时,如何保证数据的准确性和安全性?

谢臣哲:第一,我们可以做模型的解释性研究,有多种方法。一种方法是彻底把黑箱打开,另一种是通过观察,看它在什么情况下会做A决策,在什么情况下会做B决策,看这两个情况有什么区别。我们通过对比分析,来解释是哪个核心变量影响它的决策从A跳到了B。

第二,我们只让它在一个很局限的空间范围内做决策。有一些决策尽管它做了,我也不采纳。

第三,在模型给出结果到我们投资决策的环节,我们可以采用工程设计。拿无人驾驶来说,无人驾驶分好多等级,在高速上,我们可以完全使用它,但到了环线或者城市道路,复杂度上升,工程上就能识别出不适合完全托管给无人驾驶,要求人类要介入。


问:您认为该如何平衡AI技术的发展和人类工作的需求?如何确保AI技术不会代替人类工作,而是与人类工作相辅相成?

谢臣哲:AI技术一定会影响人类,但会代替人类工作还是与人类工作相辅相成?需要从不同的角度来看。

陆奇在最近的公开演讲里提到未来的人类可能分成两个大类:第一类是参与操作的人,之所以不是 AI 去操作,是因为AI在训练阶段只能接触到信息,它的产出也只能是信息。这意味着它需要人类的帮助把现实世界的事情处理成信息。所以一定会持续有人类“参与操作”,帮助 AI 处理信息。第二类是负责生产创造idea的人,他们来让AI演进、迭代。

所以,讨论AI会不会替代人类工作,要分好多层面来看。AI作为一个处理信息的工具,在信息处理这个层面,一定会取代一部分人的工作。但是,这些人被替代后不是就没有工作做了,他们可以到后台去支持AI的工作,也就是成为“参与操作的人”。旧的岗位会消失,新的岗位会生产出来,其实是供需变化。

举例娱乐,比如主播。主播作为内容生产者,生产的内容其实都是同质化的,这意味着主播这个市场必然是尖峰式的金字塔:最顶尖的人吃掉了大部分的市场,这又进一步导致那些顶尖的主播无法服务每一个粉丝。但是AI进入主播行业可能会带来巨大的改变。英伟达最近发布了一个游戏视频,里面的 NPC跟每个进入游戏玩家的对话是不一样的。在过去,玩家只能跟NPC进行基于预设规则的互动,而未来的NPC可以跟每个人产生不同的互动,并且基于大量的对话数据进行迭代和进化。

娱乐类主播同样,一个可以跟不同的粉丝产生不同对话的AI主播显然比只能响应极少数有钱人的真人主播更有优势。又或者美食主播,你跟真人主播对话问TA能不能教自己做菜,TA大概率不会理你,但是ChatGPT就随时响应你。

所以从这个层面看,未来那些在“顶尖”的人,一定是使用AI生产内容的人。如果你不使用AI做内容,可能连基准的AI都打不过。这对人类的影响是巨大的。

提到用AI做内容,有一个新出现的职业prompter,就是提示词工程师。他们能够让AI生产的内容更好。我有一个实习生同学,他每个月花300块钱去订阅一个博主,据他了解有1000多人同时订阅这个博主。这个博主专门教粉丝如何更好地让AI生成更好看的图。这就是 AI 催生出来的新职业。所以,新的工具诞生之后,一定会产生新的工作、新的人与人的关系、新的人与机器的关系,这是人类发展必然会出现的。

大部分人在面对AI时,会局限在机器赋能人,局限在效率提升的层面。但回顾历史会发现,人制造了工具看起来是人类选择工具,其实工具也在选择使用工具的人。就像看起来是人类驯化了小麦,但实际上是小麦选择了那些擅长处理人与小麦关系的人类。事实上,几年前在生物学上曾有过讨论,现在已经证明人类部分基因是经过大自然驯化和选择的,让我们更能适应新事物新工具,这一点其实达尔文也观察到了,所有被人驯化的动物都存在相似的表型特征。

这就是AI与人类的关系。表面上看是我们创造了AI,但实际上有可能是AI在选择人类,发展出一条适合AI成长的道路。


问:您认为未来AI的发展趋势是怎样的?它会在人类社会中扮演什么样的角色?

谢臣哲:关于AI的发展趋势,我们可以先梳理一下历史。AI的发展趋势经历了四、五波的波峰波谷阶段。

第一个阶段是符号学。第二个阶段人类通过数学工具的创新,发明了支持向量机(SVM)。它可以帮我们解决分类问题,尤其在工厂中应用很广泛,被用来判断生产的产品合格与否。第三个阶段在上世纪大概八九十年代,经过大量模型应用,进入到决策树体系构建。相比于过去两个阶段,这一阶段的AI在做决策的时候,逻辑思考方式跟人类是很相似的。举个例子,我们让10个专家在100个蘑菇里选出哪些是有毒的。每个专家的选择方式是不一样的,有的看颜色、有的闻味道。最终每个专家选出了50个,我们取他们的交集,得到的就是有毒的蘑菇。在随机森林里可能是上千、上万个专家,根据大家的决策逻辑求和,来做预测和判断。这一套方法其实是对人类在处理具体现实世界的事情,尤其是在分类方面,很重要的总结、提升。接下来的第四个阶段,进入神经网络时代。上世纪80年代被提出的BP神经网络,是一种基于反向传播神经网络的数学范式。第五个阶段,人类开始围绕“神经元”搭建神经网络,比如循环神经网络、卷积神经网络,到今天的Transformer结构。通过上万亿参数的模型系统对现实世界实现精准响应,于是诞生了现在的AI工具。

梳理下来我们会发现,工具的迭代是随着我们基础发明的产生而逐渐迭代的。基础的创造过程还没有结束,意味着AI的趋势还在延续。因为现在AI还没达到人类大脑的水平:能耗低,会举一反三,效率又高、又快,以及记忆能力等等,都还远远没有达到。

所以,AI还有很大的发展。它现在所处的阶段,如前面所说的,它是信息处理非常高效的人类智慧的集合体,它学到了人类的历史、文本和图像。它扮演的角色,还只是个提高信息处理效率的工具,还不是像内燃机、电这样的革命性的发明。但是对信息的处理效率能不能算生产力提升呢?放到更大的时间尺度去看,答案是肯定的。

回顾过去我们互联网发展的历史,从门户时代到搜索时代到推荐时代,都是间隔了5到 10年。商品领域的超市商场到淘宝到拼多多也是5到10年。人类发展供给跟需求这两根曲线,从相交到分开,再到相交,就是5到10年。一个供给的变化,大概是需要5年时间。新的需求从产生到庞大,逐渐扩展起来,到适应这个供给,又产生新的东西,就是5年。

所以,AI在扮演什么角色呢?它是未来5年推动产生能满足人类新需求的模式的助推器。


问:对于那些希望了解并应用AI技术的校友和同学,您对他们有什么建议?

谢臣哲:我认为要敞开胸怀去拥抱AI。AI现在还处于发展的初级阶段,在大部分工作中是无法替代人类的,我们要在强化自己工作技能的同时,学会使用它提升自己的工作效率;在那些可以被AI替代的领域,要去接受它、适应它。

对于那些对AI有一些理解、会写代码的同学,我建议大家先去学习谷歌2017年发布的关于Transformer的论文。只有理解这个机制,才能明白今天这一轮AI新范式的产生跟过去每一次有什么区别,大概对人类有多大的影响。

还不懂 AI、不会写代码的同学,可以先关注一些相关的公众号,去学习和使用ChatGPT,在实践中感受AI对自己日常工作和生活的影响。

总之,AI势必影响人类,二者相互适应向前发展。我们既要学习,跟进时代,尤其是解放思想,顺AI大势而为,同时又要在‘ChatGPT’时代重视设计自我,构建自我,成为既能使用又能创造的自己。