随着科技的飞速发展,人工智能技术已经站在了一个历史性的拐点。AI技术范式正在转变为“基础模型-应用反馈学习”,从过去的“预训练模型-特定任务精调”逐渐演进。这种转变势必引领出更多应用潜力,推动各行各业探索AI新范式,其中包括通用大模型演进以及利用创新模型解决医疗、工业、办公等场景中的问题。得益于新产品的快速融入,各个领域正不断塑造全新的业态和场景,为整个社会带来巨大的商业价值。那么打造大模型上如何判断各种模型的好坏呢?大量数据的企业会有很强的竞争优势吗?宣布打造大模型的云知声有什么竞争优势?对于这灵魂三问,云知声也做出了回答。
灵魂提问1:如果转变为Maas的模式,如何判断各种模型的好坏呢?
无论哪种模型,最终都要从结果来评判的,ChatGPT比较好的一点就在于它其实在隐藏了中间的理解问题,用户不需要关心模型中间的“意图理解”环节,也不需要显式做句法分析、语义理解等动作,只要看看ChatGPT最终给用户的反馈质量如何就可以。就像图灵测试一样,只要人类无法判断是真人还是机器在回应,就是足够智能。如果单独处理“语义理解”任务,过去像BERT这种模型,要比GPT模型做得更好,因为它使用了双向注意力机制,但BERT架构没法直接形成直观的高质量回复,所以让非技术用户感知到。
灵魂提问2:如果以数据为中心的话,掌握大量数据的企业会有很强的竞争优势吗?
云知声:不论是过去的传统算法,还是现在的机器学习算法,数据都已经变得非常重要,很多公司本质上也已经变成了数据公司。只要有很多的数据沉淀下来,模型就可以变得足够聪明,只不过此前使用传统的统计学习方法去挖掘这种能力,而现在使用深度学习和大模型的方法去挖掘,精度和能力也就越来越强。
灵魂提问3:云知声以语音识别技术起家的,相关技术积累对于行业大模型有何帮助?
云知声不仅仅停留在声音领域,声音只是它的一个切入点,云知声更希望有一个云端大脑,有强大的认知能力,能够通过声音的交互去解决问题。
早在2012年时,云知声开始布局“三驾马车”,到2016年AlphaGo开始兴起的时候,就已经开始布局底层的大规模计算能力,也就是Atlas超算平台。在此之上,云知声还拓展了知识图谱和认知技术体系,从而形成一个全栈的技术体系。现在拓展到的大模型对我们来说只是一个算法框架的升级。类似过去用BERT主要是解决判别式问题的,那现在就把它切换成GPT的生成式框架,而BERT实际上是Transformer的编码器部分,GPT则是Transformer的解码器部分,算法改变对云知声没有本质的挑战,它已经具备训练大模型的基础架构。除了算法和算力支撑,在行业问题认知和数据积累方面,也让云知声充满信心。包括物联网和医疗领域,云知声理解这些行业业务的核心问题,也有相关的数据积累,非常有信心能把大模型做好。
作为国内顶尖的语音人工智能独角兽企业,云知声在过去十年里成功构建了一套以语音、语言和知识图谱为核心,覆盖感知、认知与生成的全栈AI技术体系。目前,云知声正积极向多模态人工智能方向迈进。站在这个新起点上,云知声已将ChatGPT技术升级视为公司实现AGI能力构建的关键环节,并把优先解决智慧物联和智慧医疗领域应用问题作为其核心任务。在未来的道路上,云知声将继续深耕AI技术创新,为各行各业带来前所未有的价值,推动人工智能产业进一步发展。