独家对话腾讯混元刘煜宏:做大模型可以有「深圳速度」,但不能跳步

zz06f0e

时间 2024年7月3日 预览 4

转载:https://news.zol.com.cn/881/8815617.html

2024-07-03 18:19:02·[??中关村在线 原创??]·作者:科技快讯


「越有决心情绪越稳,已悄然接入腾讯 700 个产品」。

作者 | 张鹏

整理 | 今夜科技谈

加速,狂奔,硝烟四起,是过去一年大模型创业浪潮展现出的一番景象。有资源、有能力的腾讯,却显得「过于冷静」了。

2024 年 5 月 30 日,腾讯推出基于混元大模型的 App——元宝,它的产品设计很简洁,打开的第一屏,是一个搜索框,核心是先瞄准生产力场景,重塑信息的组织、交付。

这样的产品理念从何而来?一个做底层技术出身的团队,做大模型是首先是为了改造内部业务的工作流和产品。所以对于做什么,不做什么,腾讯混元大模型团队有清晰的认知。生产率工具容错率低,更考验技术能力,进一步迭代模型能力。

对外鲜有高调发声,「水下」内部却将大模型摆在战略位置。推出元宝 App 之前,腾讯混元大模型作为技术底座的角色,已经支持了腾讯内部接近 700 个「客户」,并沉淀出一套平台工具和合作模式。这让腾讯对后来将模型算法、数据、工程能力等技术能力「外化」有了信心,一切也顺其自然。

腾讯元宝发布之后,腾讯混元大模型负责人刘煜宏收到一些反馈,让他感到惊喜,「一些好的公众号内容已经被『遗忘』,但元宝挖掘出来,重新做了信息组织」。「没有上帝视角」,用户需求越滚越大是产品最好的验证。

「一年后国内的模型能力将拉齐」的预判在今天被验证,再次证明了图快走捷径做大模型没有意义。对于 OpenAI 的示范效应,刘煜宏说,即便后来者看到一条确定性高的路径,也得走一遍。试过,才能跑得越来越快,缩短每一次追赶的时间。被问到之后的计划,刘煜宏说,多模态甚至全模态的理解和生成都是「必答题」,当下也会让模型在「多一些思考」、增强推理能力上下功夫。

大模型注定是一场长跑,「AGI 目前更像信仰」,但将腾讯混元大模型能力在内部 700 个业务上用得好,是刘煜宏认为对于 AGI 的务实追求。有远见但务实,也是混元团队在大模型上的世界观对齐。

在近两个小时的直播里,关于腾讯的大模型思考,混元的做与不做,元宝将与腾讯生态如何产生联动等话题,刘煜宏为我们做了坦诚的梳理和解答。


以下是这次直播对话的实录,经极客公园整理后发布:

01做大模型可以有「深圳速度」,但不能跳步

张鹏:去年 9 月腾讯混元大模型正式对外亮相,前段时间也发布了元宝这样一个比较AI?Native 的产品。但外界总体感觉,腾讯比较沉稳,没有疯狂抢先手、也没有一下放出很多产品,情绪一直比较稳定?

沉稳的背后,腾讯在大模型上是怎样的策略?

刘煜宏:其实是「外松内紧」。外界看到不着急,感知混元推出来比较晚,但坦白来讲,这是一个非常卷的赛道,我们内部的节奏是非常紧张的。

腾讯从战略上一直将大模型和生成式人工智能,视为百年不遇的、类似工业革命一样的机遇。

对外产品上,去年 9 月推出了「腾讯混元助手」小程序,今年 5 月 30 日推出了元宝 App,(也推出智能体开发平台——元器),但这些背后的底层能力其实我们做了很久,像广告大模型在 21 年就开始做了。元宝 App 发布一个月不到的时间里,更新了五六版,每一个小的迭代都解决了一部分问题。

去年我们没怎么对外发布产品,其实是内部率先用起来(大模型),比如腾讯会议、文档,微信读书的 AI 助手,包括它们在内很多内部产品已经在用了,除了 API 的方式接入,还有一些业务会做精调。到目前为止,腾讯内部有接近 700 个业务接入混元,基本上腾讯所有的业务都用。


腾讯内部近 700 个业务接入混元大模型|图片来源:腾讯

张鹏:OpenAI一声炮响让大家看到这个新的趋势,去年腾讯内部对于大模型是如何判定的?当时做决策的真实情况是什么样的?

刘煜宏:GPT-3.5 出来前后开始做混元这个项目。一些底层相关技术做得更早,刚才提到广告大模型在 21 年就开始做了,搜索相关的「推广搜」场景也做了很久,运行大模型的底座从一几年开始就在建设。

对外的产品节奏看起来体感很慢,因为一开始便深知这是一个长期的项目。原来还说百年一遇,现在发现是几百年一遇的项目。不是短期一窝蜂就能搞定,像做原子弹,只有一步一步积累,把底子打牢。

举个例子,做底层涉及到网络问题,没有网络、算力,怎么训练?钱能跟上吗?预算怎么投怎么收?等等,都得考虑。我们比较清醒,对底层困难预估得足。

Copyright2023小老板科技