ChatGPT的战火,已经燃烧到第二阶段。去年年底,ChatGPT爆火出圈让大众意识到了语言模型的智能与魅力,随后国内外科技巨头与AI企业接连响应,推出自家AI聊天机器人。但To C只是第一战场,如今科技巨头们正将鏖战焦点转向更大的战场——To B的企业AI大模型服务。随着多家云计算大厂公布AI大模型服务,一个关键难题摆在想要将大模型能力与自身业务做结合的企业面前:怎么选?换句话说,怎么衡量大模型的优劣?有哪些可以参考维度?可能不少人的第一反应是看算力,毕竟ChatGPT从底座大模型训练到上线后的每日运行都非常烧钱。的确,没有算力优势是万万不行的,但这并不代表着“得算力者得天下”,除了算力之外,进入大模型落地期后,企业更需关注的是大模型全生命周期的综合体验这就好比买手机时,大家会首先关心跑分,因为跑分越高意味着性能越好。但跑分并不等同于使用体验,在跑分相差不多时,手机的实际体验跟系统、UI设计、应用程序、隐私安全、续航能力、售后服务等很多因素挂钩。企业选用大模型也是类似的,不仅要看算力,还要看综合体验和实效,包括大模型本身能力、大模型企业服务能力、全栈技术积累程度等。当前企业在云平台上选用大模型服务,主要需求可分成三类:一是使用大模型的能力,实现自家产品和服务的升级;二是基于既有大模型微调出面向特定场景的专属大模型;三是租赁算力。在这种情况下,要衡量大模型服务,具体可以参考哪些维度?下面我们将拆解来看。01.大模型落地,企业怎么选?六大关键参考维度

 

大模型服务好不好,可以看一些硬指标。一是高效性。影响大模型训练和推理效率的主要因素涉及整个IT技术栈,需要由算力、框架、模型(包括丰富的大模型体系)、应用构筑的四层架构相互配合提供支撑,形成很强的协同作用和高效的反馈闭环,帮助大模型调优迭代、降本增效。反映到实际数据上,可以重点关注千卡加速比、异构资源利率、模型开发迭代效率等参数。以在这四层IT架构的每一层都做了重资产投入的百度为例,据百度集团副总裁侯震宇昨日在文心大模型技术交流会上分享,百度是全球唯一在这四层架构的各个层面都拥有领先自研产品的公司。百度AI大底座的千卡并行线性加速比达到90%以上,训练资源利用率超过70%,模型开发迭代效率提升100%二是易用性。即上手门槛有多高,这是影响客户体验的核心因素,包括有没有与实际业务需求匹配的服务模式、能否提供从开箱即用到深度定制的服务和工具,交付和部署方式是否灵活等。三是全面性,包括是否覆盖大模型全生命周期(从训练大模型到用好大模型)的开发、管理、应用集成服务。四是安全性。这也是越来越多企业关心的问题,最近三星为了防止企业机密泄露还下达了“AI聊天机器人封杀令”。因此大模型服务必须有完备的安全机制,来确保模型输入输出稳定,保障数据安全。此外是否完全自主可控也影响安全性。五是开放性。有的大模型服务支持的大模型类型有限,有的则不仅支持自研大模型,还支持多种开源大模型及其他第三方大模型。六是扩展性。如果大模型服务支持集成更多插件,并能够对插件做更多编排,则能通过外挂应用的方式,更好地拓展大模型能力边界。02.全能型的大模型厨房:既能直接用,又能自生产

 

目前,企业应用大模型面临诸多难点:模型体积大,训练难度高;算力规模大,性能要求高;数据规模大,数据质量参差不齐……对此,云计算企业需将模型开发、训练、调优、运营等复杂过程封装起来,通过低门槛、高效率的企业级服务平台深入产业,来为千行百业提供服务。自3月16日文心一言邀请内测以来,百度在“AI大模型+云服务”上的排兵布阵一直备受关注。昨日,百度智能云终于公开交卷,宣布其正在内测的“文心千帆大模型平台”将提供两种服务:一是以文心一言为核心,提供大模型服务,帮助客户改造产品和生产流程;二是支持企业基于任何开源或闭源的大模型,开发自己的专属大模型

百度集团副总裁侯震宇说,文心千帆大模型平台是全球首个一站式的企业级大模型平台。所谓“一站式”是指不仅提供大模型服务,还提供大模型开发和应用的整套工具链,并支持各类第三方大模型,未来将成为大模型生产和分发的集散地。文心千帆就相当于是一个“大模型厨房”,你可以直接端走做好的大模型菜肴成品(比如文心一言大模型),再稍微加点调料就能端给客户享用;你也可以自带食材、厨师,使用文心千帆提供的完整灶台和丰富的工具自己做菜。从易用性来看,文心千帆提供的服务已经能够覆盖绝大多数企业诉求。目前该平台提供公有云服务、私有化部署两大交付模式,私有化部署能满足对数据监管有严格要求的企业需求。

其公有云服务将提供:推理(直接调用大模型的推理能力)、微调(通过高质量精标业务数据,高效训练出特定行业的大模型)、托管(将模型发布在百度智能云,以实现更加稳定高效的运行)三种服务,大降企业部署大模型的门槛。为了直观展示微调大模型的操作,百度智能云AI与大数据平台总经理忻舟在现场演示了微调行业专属大模型的全过程。使用文心千帆的可视化开发工具链,企业用少量数据即可发起模型微调,最快几分钟就能训出专属大模型
0个人收藏 收藏

评论交流