陈孝良,2019级金融EMBA校友,声智科技董事长兼CEO。
道口小院,紫荆花下,
我在五道口看见知识的海洋,
光阴犹如金色沙滩上的脚印,
记录着我们青春的追求与坚持。
道口小院,讲坛之间,
我在五道口听见创新的声音,
智慧的火花,在五道口燃烧,
赋予我们前行的勇气和力量。
道口小院,思想之上,
我在五道口梦见绚丽的色彩,
AI的琴弦,被我们轻轻拨动,
余音绕梁,让我们携手共赴星辰大海。
--------赠《五道口校友通讯》
在生成式人工智能这个热点领域,全球正处于一个非常特殊的时刻,人工智能的迅猛发展已经对全球社会的每个角落产生了影响。人工智能,尤其是生成式AI和大模型,正在开创一种新的可能性,不仅在艺术和娱乐方面有所体现,而且在金融、医疗、教育、工业、传媒、交通等行业领域也将展现巨大价值。在这个跃变过程中,AI不仅会是生产力的提升者,还可能成为创新的催化剂。
非常感谢《五道口校友通讯》的邀请,期待能与道口校友们一起,深入理解AI的发展和问题,对AI可能带来的变化有更清晰的判断,一起探索如何利用AI来更有效的推动经济和社会的发展,以及探讨AI和人类之间的关系。
唯有热爱,方能不忘初心
我是从中国科学院辞职创业,于2016年5月创建了声智科技(SoundAI.com),期间因为某些原因需要在中科院停留两年,恰好经历了2015年的股灾,当时市场就对科学家创业提出了各种质疑。创业伊始就经历了一波资本市场的洗礼,这并非什么糟糕的事情,反而奠定了声智团队务实肯干、不惧困难的硬汉风格,也打造了我们在科技冬奥和科技抗疫期间持续贡献的创新品格。科技创新可能不在于机制和规模,但是必须要不畏险阻勇于突破,必须要心无旁骛专注创新,即便如此可能也未必成功。但是若能通过创业为国家和社会做出更多的贡献,哪怕一点点的技术进步,哪怕微不足道的经济贡献和社会责任,这也是我们团队的骄傲和价值的实现。
陈孝良在中科院的科研瞬间
声智团队在中美博弈和新冠疫情的这几年时间,心无旁骛聚焦于核心技术研发,就要依靠我们自身的业务闭环来维持增长,所以我们经历了创业过程之中更多的坎坷和磨难,也在科技冬奥期间深刻体会到了国之大者的内涵。我觉得创业就是一种修炼,创业公司天生就要面对极度不确定的未来,就要处理极度高风险的任务,就要承担前所未有的压力。科技创业就是一种心灵的洗礼和信念的坚持,是对人工智能的未来憧憬和对科技引领生产力的信念。
当然,对于AI科技创业者来说,仅仅有信念和责任是不够的,必须要有一种对于AI技术深深的热爱。我是在2006年开始研究GPU并行计算技术,当时是要解决超大规模声学计算速度的问题,属于国内最早一波使用英伟达Cuda计算架构的研究人员。我一直非常感激中科院声学所的培养,若没有国家重大项目的支持,我也很难学习DSP、FPGA和GPU等各种最新架构的计算平台,在中科院的13年时间,各位老师的指导和重大项目的历练奠定了我创业的技术基础和价值信念。所以创业以后,我们把“远见好学”定位为公司核心价值观之一。我仍然会拿出一半时间学习AI相关的技术和理论,尝试着用AI技术去解决各种实际问题。我们团队热爱这种在挑战中寻找解决方案的过程,也享受在实现一个个想法的过程中不断突破自我、不断超越的过程。
我相信,唯有热爱,才是驱动我们不断前行的强大力量。恰恰就是这种热爱,才可以让我们团队无限投入,才能发现深度学习与声学计算之间的创新之处。我们基于深度学习的非线性处理能力,弥补了声学非线性计算的不足,在2016年就推出了远场语音交互技术,成功应用在国内的智能音箱领域,当前已经迭代了第三代技术,不仅取消了唤醒词,还可以应用在智能电梯等更严苛的环境。随后在这“一招鲜”的基础之上,我们迅速研发了Azero人工智能开发框架。经过7年时间的积淀,目前已经具有了壹元大模型(AzeroGPT)、壹元物联系统(AzeroIoT)和壹元非结构化数据软件(AzeroDatrix)的产品能力,拥有了特色的算法、海量的数据和可信的交互等能力。
唯有专注,才能拼来速度
虽然人工智能是新兴技术领域,但是日新月异迭代迅速,且在全球竞争极其激烈,稍有迟疑一些可能就会被淘汰。特别是技术路线之间的竞争,如果早期阶段技术战略失误,有可能导致研发投入直接归零,所以科技创业绝对是高风险的事情,但不见得是高回报,我相信很多校友会有此体会。
科技企业要想生存发展,首先要有差异化竞争优势,要开创自己的独特道路。我们探索将研发的技术优势转化为市场落地的速度优势,以深度理解客户需求和敏锐观察市场动态的产品和服务能力,赢得业界的普遍认可。比如我们在计算机听觉、深度学习和自然语言模型等领域有着深厚的技术积累。即便如此,我们在科技冬奥和科技抗疫期间,还必须达到1周1款新产品,甚至1天上线1款新应用的速度,只有这种扎实的技术积累和组织管理能力,才能在社会紧急状态下为用户持续提供高质量、高性能的AI产品和服务。
其次,我们坚持合作共赢的原则。我们深知在这个充满竞争的市场环境中,只有合作才能共赢。比如在大模型领域,我相信有不少校友企业都在焦虑,其实完全不必担心大模型的技术变革。我们应该看到数据和技术底层的突破,实际上带来了更多的市场机会。因技术变革而能重构市场,这就是我们所看到的璀璨未来。所以我们建议要把更多精力和资源放在学习大模型和商业化思考方面,没有必要谋求自研,自研的效率肯定很低,何况大模型的投入巨大,数据和算力都是硬门槛,模型人才更是挑战巨大。当然,必须考虑到数据安全和隐私方面的问题,于是我们发布了可私有部署的大模型全栈服务,从数据处理、模型训练、模型部署、模型应用到GPU部署和运营,我们始终坚持以开放共赢的原则与企事业单位、研究机构、教育机构等合作伙伴进行深度合作,共享资源,共创未来。
大模型,突破内卷的机遇
人工智能技术曲曲折折90多年的历史,现在终于能在推动生产力方面做出一些令人瞩目的进步。生产力的进步,才能创造更多的增量财富,才是突破全球内卷的历史机遇。大模型通常指的是参数量巨大、计算量极大的深度学习模型。这些模型通常具有数亿、甚至数千亿的参数量,需要通过大量的训练数据和计算资源进行训练和优化。大模型具有较强的表达能力和泛化能力,能够在各种复杂场景下实现高效的分析和预测。
大模型的出现得益于深度学习技术的快速发展和计算能力的提升。深度学习技术通过多层次的神经网络结构实现对数据的无监督学习和抽象表示,极大地提高了数据处理和分析的效率和准确度。而计算能力的提升,则为大模型的训练和应用提供了足够的支持和保障,促进了大模型技术的发展和应用。
2023年3月全球大模型参数量统计(LifeArchitect.ai)
尽管大模型具有强大的分析能力、预测能力、泛化能力和无监督学习特性,但也面临着计算资源消耗大、模型解释性差、过度拟合问题、灾难性遗忘问题、易产生歧视和偏见等诸多方面的挑战和限制。这不仅给研究人员带来了巨大挑战,而且在实际应用中,更是需要根据具体的场景和需求,选择合适的模型规模和结构,平衡模型的性能和资源消耗之间的关系。举个例子来说,灾难性遗忘问题是训练过程中经常出现的问题,也是实际应用中的障碍,这非常容易导致真正的知识无法蒸馏出来,反而基于错误的知识进行了合成,经常产生“一本正经胡说八道”的问题。
行业垂直大模型是指针对特定领域或任务而构建的大规模机器学习模型,它们通常具有更深层次的网络结构和更多的参数数量,以提高对特定任务的精度和效率。与通用的大规模机器学习模型相比,行业垂直大模型在特定领域或任务上具有更高的性能和精度,因为它们通常需要对特定的领域知识进行深入挖掘和分析,从而获得更好的特征提取和模型训练效果。
美国大模型的训练数据来源参考(LifeArchitect.ai)
行业垂直大模型的应用范围非常广泛,从美国大模型的应用落地来看,大模型技术既能拉动消费市场,让OpenAI在1个月内用户过亿,也能在营销、客服、广告、法律等行业市场拉动新的经济需求,而这些领域就需要微调来得到行业垂直大模型以提升精度和速度。但是,我们也要注意到,国内对于大模型的概念关注较多,反而还没出现类似美国OpenAI、Midjouney这类商业落地的成熟应用。
根据相关研究,行业垂直大模型技术的发展对我国GDP的贡献将非常可观。以医疗领域为例,预计到2030年,基于医疗行业垂直大模型技术的数字医疗市场规模将达到10万亿元人民币,相当于目前我国医疗市场的2倍以上。同时,行业垂直大模型技术的应用还可以推动金融、教育、交通、文旅等领域的数字化转型和创新,进一步提高经济效益和社会效益。
总之,未来的人工智能将会在技术上越来越复杂、应用上越来越广泛。随着人工智能技术的不断发展和完善,我们将能够创造出更智能、更友好、更有价值的AI产品和服务,从而推动社会的发展,从而改变人们的生活。我们也将始终保持初心,不畏困难,勇于创新,不断突破,以最为前沿的技术和卓越的服务,为社会的发展做出我们的贡献。
人机交互,AI安全和伦理
我非常感兴趣的一个研究领域就是探讨人类和AI之间的关系,比如人类喜欢AI还是厌恶AI多一点,那反过来呢?我们最近会公布一些论文和研究结果,有些就是基于大模型进行的实验研究,这是很有意思的研究,也在AI安全和伦理方面具有一定的社会价值。我们深知,随着AI技术的快速发展和广泛应用,安全和伦理问题已经成为了不能忽视的重要议题。我们认为,安全和伦理问题不仅影响到AI技术的健康发展,更关乎到我们的社会和谐,我们的生活质量,甚至我们的生命安全。
例如,如何防止大模型被用于制造假新闻和诈骗成为了一个重要问题。再如,AI技术的使用可能会对人们的隐私权产生影响。还如,随着AI技术的发展,一些工作可能会被机器取代,这将对社会的就业结构,甚至社会的稳定性产生影响。在这些挑战面前,我们建议积极开展AI伦理讨论,共同探寻解决方案。我们认为,应当在尊重人类权利和尊严的前提下,以经济发展为目标来合理利用AI技术,以实现科技与人文的和谐共生。所以我们也提供一个解决思路,就是为合作伙伴提供可私有部署的行业垂直大模型,这对我们的产品、研发、供应链和运维等全链条提出了一系列的高标准全栈要求,我们希望与多方合作和共同努力,一起促进经济发展,一起构建可信的AI未来。
道口小院,从这里眺望世界
2019年,我走进了道口小院,这是一处静谧的避世之地,隐藏在繁华喧嚣的热闹之中。在这个小院里,我们可以远离喧嚣和纷扰,寻找内心的宁静和平衡。站在道口小院,小桥流水,我们可以看到各种各样的可能性和人生的抉择。这像极了大模型的一种提示训练方法,我们要在纷繁复杂的世界中保持警觉,审慎地做出每个选择,走出一条自己真正想要走的路。
从道口小院聆听全球经济学者的声音,眺望全球经济的纷纷扰扰,不仅是一种对外界的观察和感知,更是一种内心的洞察和领悟。当我们在小院中静静地坐下,聆听大自然的声音,细细回味世界的美好与苦涩,我们会发现在小院对创业有了更深刻的认识。我们在小院里思考人生的意义和目标,思索自己与世界的关系。我们道口校友的眼界和心境更加开阔,对世界的看法也会更加宽广。
道口小院景色
紫荆花开,携手筑梦未来
紫荆花开之际,大模型的爆发给我们道口校友带来了历史机遇,我们所看到的是校友之间的友谊,是携手成长的机会,也是道口的未来。我们应当看到大模型对美国所产生的深刻影响,我们也应该看到OpenAI和Midjourney这种小团队在研发和应用以及商业化方面所做出的创新成就。这就是我们道口校友当下创新谋求破局的机遇,我们应当积极拥抱和投入到对大模型的研究中去,通过大模型的知识积累,我们能够窥见更远的地方,感受更广阔的世界。
感谢《五道口校友通讯》的窗口作用,通过加强校友之间的友谊和合作,促进技术和知识的共享和交流,提高道口校友群体在人工智能领域的影响力和竞争力,为校友的成长提供更广泛的交流和合作机会,增强校友与大模型在技术和市场的有效对接和大模型的实际落地能力。我觉得可以在道口校友之间建立数字经济的共享平台,开展研究和产业之间的数据互享,增强大模型数据利用的效率和质量,也能摸索出一套国内发展Web3的经验。我们也将全力支持道口校友,共同推动大模型与数字消费市场深度融合,打造个性化、精准化的数字金融和消费体验,携手筑梦,一起努力发展壮大,为国家和社会做出道口校友特有的贡献。