和鲸科技联合创始人,执行总裁兼首席产品官 殷自强分享:构建企业级AI中台,实现业务场景价值闭环
导读
从数据资产到模型资产,大模型的发展,正在加速企业构建AI中台,旨在让更多 AI 的能力能够被构建出来、能够被管理起来、能够面向业务开放起来,打通从数据到模型到最后决策的全链路。
本文将从为什么建AI中台、如何建AI中台、企业AI中台建设案例三个方面进行展开分享。
01 为什么要去建 AI 中台?
数据变成企业资产是大家的共识,但现在我们发现模型已经成为影响企业竞争力的一个重要资产。
越来越多的企业需要面临很多的复杂决策,这些决策不是拍脑袋做的,需要依赖一些决策模型,所以这些模型会越发重要,成为企业当中的一个重要资产。以前的模型相对较简单,可能通过一些回归或者简单的方法,就能够做出来。但现在随着 AI 的发展,模型的复杂度在逐渐递增,且更新的速度也很快,所以如何针对业务,更好地管理模型,将会是企业的核心竞争力。
除此之外,如果单独有模型,不能构成最终的价值闭环,最终都要服务于业务。在与一些企业交流时,发现 AI 模型在实际业务当中,其实是“神秘的黑盒”。许多算法团队,经常是“拿着锤子找钉子”,并不知道模型在业务当中会有什么用。
站在业务的视角,大家会经历心理学上的一个名词,“从愚昧山峰”到“绝望之谷”。因为大家对于 AI 是充满幻想的,认为有了 AI 就可以解决任何问题,对于 AI 有很高的预期。但直接跟算法团队交流的时候,可能会遇到很多的问题,比如业务问题对应了哪些历史业务数据,哪些业务数据是清洗标注过代表增长的,这时会感觉, AI 好像花瓶一样,需要人工才有对应的智能,听到这样的评价,就会陷入到绝望之谷。不论在算法团队,还是在业务团队,如果很难形成协同上的认知,就不能形成相应的共识,也没有办法在真正意义上,将 AI 落地到一些比较重要的业务场景当中。
从另外一个视角,有一些企业 AI 的模型跑起来了,但这样的模型更多是由算法驱动或者技术驱动做的,经常会遇到一个问题:业务定个新的 KPI,模型可能就会失效。比如一开始是针对现在的业务受众做的,但在新的季度,某个业务需要换一些受众画像与方向,就会发现之前的预测模型完全失效了。大家的目标没有在前期拉齐,这个面向未来的模型,就没有办法给大家带来对应的泛化性结果。如果没有建立起一个能连接各个团队的 AI 中台,就会带来这样的问题。
在大模型的发展过程中,如何看待大模型和 AI 中台的关系?许多企业不应该去考虑如何训练大模型,而是如何去利用大模型。随着大模型的发展,尤其像AI agent 相关技术的提出,用好大模型需要考虑企业有多少的 know how未来可以更好的模型化、工具化被大模型调用,这些才是企业真正的经验与知识。所以说现在用 AI 中台可以更好地整合内部已有的模型,把一些好的决策,好的方法模型化、工具化之后,随着AI大面积发展,整个企业可以更好地智能化运行。
什么是AI中台?初期AI中台主要专注模型的全生命周期管理,受众更多是面向算法团队。上图是基于 ModelOps 的一条流程,它所定义的是从模型开发到部署的全生命周期管理。现在 AI 算法从 1.0 - 2.0 方向发展,AI 中台本身也一样,不是单纯管理一个开发流程,能够发挥多少 AI 中台的能力,决定于有多少业务团队能够使用AI。所以建立整个 AI 中台的目标,在于有多少 AI 的能力能够被构建出来、能够被管理起来、能够面向业务开放起来,打通从数据到模型到最后决策的全链路。
02 如何构建 AI 中台
当前在讨论 AI 中台的时候,更多的是关注业务如何去使用的视角,那如何去建?会遇到哪些问题?因为企业内部决策链路复杂,算法团队、数据团队、IT团队、业务团队的视角不同,要去平衡的是企业内部最核心的各个团队当中的声音。我们需要让 AI 发挥作用,就要去思考还有哪些模型需要去被管理起来?它的受众有哪一些?企业未来有多少人能够去用它?如何评估平台的ROI?
首先建 AI 中台其实是一把手工程,作为企业一号位的人员,需要与高管团队讨论,如何建立围绕数据跟模型的企业竞争力。当只有这样的事情在企业内部去确认的时候,这家公司的 AI 中台才有可能建立得起来,因为AI 中台会变成公司的战略、公司的文化、公司竞争力去构建,各个团队才有可能去思考 AI 跟业务的关系。
这是我们发现很重要的一个前提,需要把它当做一把手工程去建立。
在建 AI 中台的时候,作为一家企业,哪些模型资产需要被考虑?我们将其中模型分成三大类,第一大类认为它可能不是 AI 模型,而是公司非常重要的、数据驱动的核心业务模型,因为这些模型是能够拉动所有业务的毛细血管。这样的模型盘点一般是由业务团队牵头,考虑模型如何被管理跟调用起来。
第二类传统意义上的 AI 模型,更多是一些预测类模型或者分类模型,这种模型逐步变得复杂,业务人员没有办法去构建,需要算法团队专人负责,所以从算法团队的视角,需要考虑管理哪些传统AI预测类模型。
对企业的模型进行相关盘点之后,才能知道 AI 中台该去管理哪些模型。接着应该梳理工作流,首先把人群分画像,对于业务人员平时会怎么去用数据?算法团队怎么去构建模型?构建出来之后跟基础设施、业务团队要怎么去交互?过程中哪些用户、工作环节需要被利用到?还要考虑有对应的能力提升平台,帮助能力不足的员工不断成长。这些都是需要在内部做核心路径的梳理。
在平台推广过程当中的决定性因素是人,有多少人愿意去接受新事物。
有个很好的概念——“公民数据科学家”,定义为能够使用高级方法去解决实际业务的人。最后我们会发现 AI 中台能够创造多少的价值,取决于企业当中有多少“公民数据科学家”,有多少在业务中懂得 AI具体用处,能够参与到模型流程当中的人。所以应该把平台的建设跟人才的培养相结合,才是整个平台最终能够达到多元的重要因素。
基于挑战任务的实践是企业 AI 应用人才培养的有效途径,将企业中遇到的某些重要的问题,判断它通过 AI 可能会解决,将问题抛出来,希望企业中的人能够一起参与进来,比如用 Python 或者简单模型去建立,这时大家会有更好的驱动力去学习。把这些问题解决时,大家的参与感是非常强的,因为是基于真实问题、真实场景,能够感受到在掌握某个知识的之后,是可以起到真实价值的。
企业在推进这件事情的过程中,很自然就将 AI 中台推广出去了,因为大家处理相关任务时,就会利用在 AI 中台上所集成的某些数据、某部分模型的能力作为脚手架接着往下走。所以我们发现这是在内部做人才培养非常好的方式方法。
03 案例介绍
与某三甲医院的合作,是一个非常典型的例子。
第一点,医院相关分析人员需要在了解医学的基础上,还能够了解 AI 模型的相关方法,对应人才的内部培养周期很长,所以当一个人掌握了相关信息之后,另外一个人想要参与进来进行相关课题的合作的时候,又得重新开始做数据采集、环境搭建,重复从 0 到 1 的去做很多的事情,所以效率很低。
右图就是在实际的研究当中,利用之前梳理出来的模块,在新的研究中就可以非常快速的开展,只需要调整里面某些特定参数或简单增加几个步骤,就可以完成一次新的分析,这就是通过引擎化设计所带来的效果。
这时内部要去设计相关事情,我们一起把整个 AI 中台的推广分成“起承转合”四个环节,MVP只是一开始的工作,叫做“起”,是让工作上平台,打通人跟数据、环境的问题。
除此之外,他们希望能够在内部培养更多可以使用 AI 中台的人。
0