独家对话腾讯混元刘煜宏：做大模型可以有「深圳速度」，但不能跳步|小老板

转载：https://news.zol.com.cn/881/8815617.html

2024-07-03 18:19:02·[??中关村在线原创??]·作者：科技快讯

「越有决心情绪越稳，已悄然接入腾讯 700 个产品」。

作者 | 张鹏

整理 | 今夜科技谈

加速，狂奔，硝烟四起，是过去一年大模型创业浪潮展现出的一番景象。有资源、有能力的腾讯，却显得「过于冷静」了。

2024 年 5 月 30 日，腾讯推出基于混元大模型的 App——元宝，它的产品设计很简洁，打开的第一屏，是一个搜索框，核心是先瞄准生产力场景，重塑信息的组织、交付。

这样的产品理念从何而来？一个做底层技术出身的团队，做大模型是首先是为了改造内部业务的工作流和产品。所以对于做什么，不做什么，腾讯混元大模型团队有清晰的认知。生产率工具容错率低，更考验技术能力，进一步迭代模型能力。

对外鲜有高调发声，「水下」内部却将大模型摆在战略位置。推出元宝 App 之前，腾讯混元大模型作为技术底座的角色，已经支持了腾讯内部接近 700 个「客户」，并沉淀出一套平台工具和合作模式。这让腾讯对后来将模型算法、数据、工程能力等技术能力「外化」有了信心，一切也顺其自然。

腾讯元宝发布之后，腾讯混元大模型负责人刘煜宏收到一些反馈，让他感到惊喜，「一些好的公众号内容已经被『遗忘』，但元宝挖掘出来，重新做了信息组织」。「没有上帝视角」，用户需求越滚越大是产品最好的验证。

「一年后国内的模型能力将拉齐」的预判在今天被验证，再次证明了图快走捷径做大模型没有意义。对于 OpenAI 的示范效应，刘煜宏说，即便后来者看到一条确定性高的路径，也得走一遍。试过，才能跑得越来越快，缩短每一次追赶的时间。被问到之后的计划，刘煜宏说，多模态甚至全模态的理解和生成都是「必答题」，当下也会让模型在「多一些思考」、增强推理能力上下功夫。

大模型注定是一场长跑，「AGI 目前更像信仰」，但将腾讯混元大模型能力在内部 700 个业务上用得好，是刘煜宏认为对于 AGI 的务实追求。有远见但务实，也是混元团队在大模型上的世界观对齐。

在近两个小时的直播里，关于腾讯的大模型思考，混元的做与不做，元宝将与腾讯生态如何产生联动等话题，刘煜宏为我们做了坦诚的梳理和解答。

以下是这次直播对话的实录，经极客公园整理后发布：

01做大模型可以有「深圳速度」，但不能跳步

张鹏：去年 9 月腾讯混元大模型正式对外亮相，前段时间也发布了元宝这样一个比较AI?Native 的产品。但外界总体感觉，腾讯比较沉稳，没有疯狂抢先手、也没有一下放出很多产品，情绪一直比较稳定？

沉稳的背后，腾讯在大模型上是怎样的策略？

刘煜宏：其实是「外松内紧」。外界看到不着急，感知混元推出来比较晚，但坦白来讲，这是一个非常卷的赛道，我们内部的节奏是非常紧张的。

腾讯从战略上一直将大模型和生成式人工智能，视为百年不遇的、类似工业革命一样的机遇。

对外产品上，去年 9 月推出了「腾讯混元助手」小程序，今年 5 月 30 日推出了元宝 App，（也推出智能体开发平台——元器），但这些背后的底层能力其实我们做了很久，像广告大模型在 21 年就开始做了。元宝 App 发布一个月不到的时间里，更新了五六版，每一个小的迭代都解决了一部分问题。

去年我们没怎么对外发布产品，其实是内部率先用起来（大模型），比如腾讯会议、文档，微信读书的 AI 助手，包括它们在内很多内部产品已经在用了，除了 API 的方式接入，还有一些业务会做精调。到目前为止，腾讯内部有接近 700 个业务接入混元，基本上腾讯所有的业务都用。

腾讯内部近 700 个业务接入混元大模型｜图片来源：腾讯

张鹏：OpenAI一声炮响让大家看到这个新的趋势，去年腾讯内部对于大模型是如何判定的？当时做决策的真实情况是什么样的？

刘煜宏：GPT-3.5 出来前后开始做混元这个项目。一些底层相关技术做得更早，刚才提到广告大模型在 21 年就开始做了，搜索相关的「推广搜」场景也做了很久，运行大模型的底座从一几年开始就在建设。

对外的产品节奏看起来体感很慢，因为一开始便深知这是一个长期的项目。原来还说百年一遇，现在发现是几百年一遇的项目。不是短期一窝蜂就能搞定，像做原子弹，只有一步一步积累，把底子打牢。

举个例子，做底层涉及到网络问题，没有网络、算力，怎么训练？钱能跟上吗？预算怎么投怎么收？等等，都得考虑。我们比较清醒，对底层困难预估得足。