记者观察:大模型逐鹿下半场,超级应用仍未敲门
中新经纬7月6日电(常涛)以按下应用加速键为标志,大模型竞争进入下半场。
在移动互联网时代,App成为超级应用。在大模型时代,会不会出现新的超级应用?超级应用又可能是什么?这一问题,或许可以从2024世界人工智能大会(下称大会)上找到答案。
2024世界人工智能大会7月4日-6日在上海举行。中新经纬摄
中新经纬记者在大会展览馆走访后发现,相比于去年观众们普遍关注“大模型能干什么”,今年观众们对于大模型的关注也渐入“深水区”。“这个图生视频结果真不真?”“虚拟口语教练以前也有,基于大模型做的有什么不一样?”他们在关心,大模型未来将以怎样的形式影响他们的生活。
类比于用户通过App享受移动互联网带来的便利,各大模型厂商也在积极探索大模型时代“App”。
去年,以ChatGPT、文心一言为代表,大模型“内卷”的主战场是图文问答,今年以来,大模型文、图生成视频受到关注。

大会期间,快手视频生成大模型“可灵”展示了其图生视频的能力。上传蒙娜丽莎图片后,记者输入“蒙娜丽莎用手戴上眼镜”文字后,不久后就可生成5秒钟蒙娜丽莎戴眼镜的视频,让名画中的人物活了起来。
7月6日,可灵AI网页端上线,记者观察:大模型逐鹿下半场,超级应用仍未敲门可灵AI基础模型也迎来升级,推出更加清晰的高画质版,以及首尾帧控制、镜头控制等全新编辑能力,同时,创作者单次生成的文生视频时长增加至10秒。
与人进行实时、准确交互,也是目前大模型在应用侧瞄准的场景。
7月5日,商汤科技发布了所见即所得模型“日日新5o”,带来一种全新的AI交互模式,即实时的流式多模态交互。
比如对着它随手画一只小兔子,“日日新5o”能很快识别“这是一只可爱的兔子”,工作人员又画了一个微笑表情,它从这个平静的表情中捕捉到了笑意,工作人员又改了一笔把嘴巴画大增添了舌头,“日日新5o”看到后立马说道“这表情开心多了”。
据商汤科技介绍,它就如同真人聊天一样在交流对话,这种交互模式特别适用于实时对话和语音识别等应用。
在大会展览馆,随处可见的还有基于大模型的各种数字人,这也有可能是大模型时代的超级应用。
腾讯展示了基于优图实验室自研算法打造的有智能、有形象、可交互的“数智分身”,其中在医疗行业数智人展台,腾讯把AI技术充分融入就诊全流程,在诊前为患者提供智能导诊、预问诊;在诊中模拟医生形象,提供实时交互,实现在线问诊;在诊后为患者提供合理的用药提醒和智能随访。
今年“618”期间,京东发起了一场特殊的“总裁数字人直播”活动,多位企业创始人或CEO通过京东云言犀化身数字人下场直播。
京东云言犀相关负责人在大会期间接受中新经纬采访时说,大模型的颠覆性应用,不可能从通用大模型的优化中产生,必然是技术进步与产业积累的结合,数字人可能成为AI时代的颠覆性产品。团队在京东“618”的数字人直播中,发现观众接受程度很高:不仅已经跨过了“恐怖谷”效应,而且人均观看时长接近2分钟。这意味着大部分观众已普遍接受了数字人主播。
“618期间数字人直播时长超40万小时,观看人次超1亿、交互超500万次,这给了我们很大的信心。”上述负责人说。
不过,在讨论大模型时代的超级应用是什么时,也不要忽视硬件,硬件本身就是最直接的应用。
大会期间,有些厂商也展示了一批装配了大模型的硬件产品。例如,联想AIPC中的“天禧”个人大模型,是基于阿里通义千问等通用大模型打造;有道词典笔X7内置了子曰教育大模型的两大原生应用——虚拟人口语私教HiEcho和AI全科家庭教师小P老师;小米旗下的人工智能助手“小爱同学”与阿里云通义大模型展开合作,强化其在图片生成、图片理解等方面的多模态AI生成能力,并在小米汽车、手机等多类设备落地。
在各厂商积极探索大模型时代的超级应用可能是什么时,与会企业负责人也给出了一些前沿的思考。
对于未来的AI应用长啥样,百度创始人李彦宏最看好的方向是智能体,因为“开发最简单”。
李彦宏表示,随着基础模型的日益强大,开发应用也越来越简单,其中,最简单的就是智能体,只要用“人话”把工作流说清楚,再配以专有知识库,即可做出一个很有价值的智能体,“比互联网时代制作一个网页还简单”。
李彦宏认为,医疗、教育、金融、制造、交通、农业等各领域,未来都会依据自己的场景和特有经验、规则、数据等,做出各种智能体,将会出现数百万量级的智能体,形成庞大生态。
蚂蚁集团董事长兼CEO井贤栋持相似观点。他认为,为了破解通用大模型落地严谨产业面临的三个“能力短板”,即领域知识相对缺乏、复杂决策难以胜任、对话交互不等于有效协同,蚂蚁选择了构建专业智能体生态的路径,“从我们的实践来看,专业智能体是大模型落地严谨产业的有效路径。”
井贤栋还指出,未来智能化的用户体验,一定不是只靠一个大模型,而是需要全行业深度协作,需要很多的专业智能体共同参与、各司其职。
对于智能体,腾讯云副总裁、腾讯云智能负责人、腾讯优图实验室负责人吴运声表示,智能体的本质回归了大语言模型的初衷——人类输入不精确的自然语言,大模型能够用统一的方式去应对,而智能体提供的正是端对端的解决方法。吴运声说:“这是一种可以解决广泛问题的技术路线,所以业界对智能体的研究非常多。”
猎户星空董事长傅盛表示,人工智能的应用是核心,应用就是真正帮助人们解决各种实际问题、以各种AI技术为底层的App、硬件、软件。“只靠用户和大模型去聊天,并不能解决我们的大多数问题,这就是为什么所有人都在谈应用。”
在7月5日举办的腾讯论坛上,腾讯集团副总裁蒋杰在发言时表示,应用场景是未来大模型决战的必然战场。但当前大模型的落地主要集中在生产工具和提效方面,距离真正的业务创新还有一定距离,缺少杀手级的应用。
(文中观点仅供参考,不构成投资建议,投资有风险,入市需谨慎。)
中新经纬版权所有,未经书面授权,任何单位及个人不得转载、摘编或以其他方式使用。
责任编辑:薛宇飞罗琨
相关文章
-
深入了解DDoS攻击,保护网络安全的关键知识详细阅读
亲爱的读者,今天我们要探讨一个在网络安全领域中不可忽视的话题——DDoS攻击,这是一种网络攻击手段,它对互联网安全构成了严重威胁,在这篇文章中,我们将...
2025-09-13 5
-
探索色彩的魔法,字体颜色代码的奥秘与魅力详细阅读
亲爱的读者朋友们,你们是否曾经在编辑文档、设计网页或者制作演示文稿时,为了选择一个合适的字体颜色而苦恼?颜色不仅仅是视觉的装饰,它还能传达情感、影响阅...
2025-09-13 4
-
探索Ubuntu 9.10,下载指南与使用体验详细阅读
亲爱的技术爱好者们,你们是否准备好迎接一个全新的操作系统体验?我们要一起探索的是Ubuntu 9.10,一个曾经备受欢迎的Linux发行版,虽然它已经...
2025-09-13 6
-
网络压力测试工具,如何确保你的网络能承受风暴详细阅读
在数字化时代,网络稳定性和性能对我们的日常生活和业务运营至关重要,想象一下,你正在家中观看一场激动人心的足球比赛,突然网络崩溃,画面卡顿,这无疑是一场...
2025-09-13 6
-
揭秘局域网流量监控,如何查看并优化你的网络性能详细阅读
在当今这个信息爆炸的时代,网络已经成为我们生活和工作中不可或缺的一部分,无论是在家中、办公室还是公共场所,我们都需要依赖局域网(Local Area...
2025-09-13 6
-
解密密码编码学,保护信息的艺术与科学详细阅读
亲爱的读者,你是否曾经好奇过,当我们在互联网上发送信息时,是如何确保这些信息不被他人窥探的呢?这就是密码编码学——一门古老而又现代的学科,它涉及到信息...
2025-09-13 6
-
深入解析,robots.txt文件的神秘面纱及其对SEO的影响详细阅读
在互联网的世界里,搜索引擎优化(SEO)是一个永恒的话题,对于网站所有者和SEO专家来说,确保他们的网站能够被搜索引擎正确地索引和排名是至关重要的,在...
2025-09-13 6
-
聊天无界限,探索网页聊天软件的魔力详细阅读
亲爱的读者,你是否曾想象过,无论身处何地,只需轻点鼠标,就能与世界各地的朋友畅谈无阻?这不再是科幻小说中的场景,而是我们日常生活中的一部分——网页聊天...
2025-09-13 8