世界人工智能大会|首个面向端用户的可控人物视频生成大模型入选镇馆之宝
图说:Vimi入选大会展览展示最高荣誉“镇馆之宝”商汤科技供图(下同)
7月4日,2024世界人工智能大会在上海开幕。由商汤科技打造的首个面向C端用户的可控人物视频生成大模型——Vimi入选大会展览展示最高荣誉“镇馆之宝”。
据介绍,Vimi依托商汤日日新大模型,仅通过一张任意风格的照片就能生成和目标动作一致的人物类视频,并支持多种驱动方式,可通过已有人物视频、动画、声音、文字等多种元素进行驱动。
随着大模型和生成式AI技术的快速发展,让照片中的人物动起来已经不是新鲜事,但目前市面上的相关产品在实际应用中存在诸多痛点,有的人物动作、表情无法精准控制,世界人工智能大会|首个面向端用户的可控人物视频生成大模型入选镇馆之宝有的效果稳定性不高,有的时长有限只有三四秒钟,无法满足广大视频创作者的使用需求。为了解决这些应用中的实际问题,商汤可控人物视频生成大模型Vimi应运而生。

与图片表情控制类技术只能控制头部表情动作不同,Vimi不但可以实现精准的人物表情控制,还可实现在半身区域内控制照片中人物的自然肢体变化,并自动生成与人物相符的头发、服饰及背景变化。同时,光影变化也能做到合理生成,让人物动作和视觉效果流畅自然。Vimi可稳定生成长达1分钟的单镜头人物类视频,画面效果不会随着时间的变化而劣化或失真,可满足娱乐互动等需要长时间稳定视频生成的需求。
据悉,Vimi将面向C端用户开放使用。用户只需上传不同角度的高清人物图片,即可自动生成数字分身和不同风格的写真视频。由Vimi生成的视频人物不再只是呆板的五官运动,而是搭配手势、肢体、头发等,形成更完整、统一的人物动作,让创作者可基于生成的视频素材进行剪辑和再创作。
针对喜爱自拍的用户,Vimi可支持聊天、唱歌、舞动等多种娱乐互动场景;而对于热衷表情包的用户来说,Vimi通过单张图片即可驱动生成各种趣味的人物表情包,玩法多样,实现创作自由。此外,Vimi还提供唯美写真风、奇幻风等多种生成风格,让用户仿佛穿越不同次元,享受大片质感的沉浸式视觉效果。
目前,Vimi已在商汤科技官网开放预约体验。在明天(5日)商汤科技举办的“大爱无疆·向新力”人工智能论坛上,还将揭开Vimi的更多细节。
新民晚报记者郜阳
标签: 世界人工智能大会|首个面向端用户的可控人物视频生成大模型入选镇馆之宝
相关文章
-
轻松掌握,如何一键开启相机权限,让手机摄影更自由详细阅读
亲爱的朋友们,你是否曾遇到过这样的尴尬:当你兴奋地想要记录下生活中的某个精彩瞬间,却发现手机相机无法使用?这通常是因为相机权限没有正确设置,别担心,我...
2025-10-01 91
-
探索最佳拍照软件,捕捉生活瞬间的艺术详细阅读
在数字时代,拍照已经成为我们记录生活、分享情感的重要方式,无论是专业的摄影师还是普通的手机用户,拥有一款功能强大、操作便捷的拍照软件是必不可少的,本文...
2025-09-30 83
-
AI绘图生成器,未来艺术与设计的魔法画笔详细阅读
想象一下,你是一位热爱绘画的艺术家,但今天你不想拿起画笔,只想轻松地创作出一幅美丽的画作,或者,你是一位忙碌的设计师,需要快速制作出一张吸引人的海报,...
2025-09-28 91
-
探索无限可能,免费下载相机变变变,让摄影变得如此简单!详细阅读
亲爱的摄影爱好者们,你是否曾经梦想拥有一台能够随时变换功能的神奇相机?这个梦想不再遥不可及!“相机变变变”是一款革命性的免费应用,它将彻底改变你拍摄照...
2025-09-28 242
-
家庭安全新选择,家用监控系统的成本与价值分析详细阅读
随着科技的发展,家庭安全变得越来越重要,家用监控系统成为了众多家庭的首选,本文将为您详细解析家用监控系统的成本,以及如何根据您的需求选择合适的监控设备...
2025-09-28 82
-
探索高端摄像机,价格、性能与价值的完美平衡详细阅读
亲爱的读者们,你是否曾经在摄影器材店前驻足,被那些高端摄像机的精致外观和卓越性能所吸引?或者在社交媒体上看到那些令人惊叹的照片和视频,好奇它们是如何被...
2025-09-28 75
-
魔法变变变,让你的照片焕发新生的神奇软件详细阅读
亲爱的朋友们,你是否曾经梦想拥有一根魔法棒,轻轻一挥,就能让普通的照片变得生动有趣?或者,你是否曾希望有一款软件,能够让你的照片瞬间变换风格,从复古到...
2025-09-28 80
-
解锁创意之门,免费高清图片素材软件的魔法详细阅读
你是否曾经在制作演示文稿、设计网站或者编辑社交媒体帖子时,因为找不到合适的图片素材而感到头疼?或者,你是否曾经因为版权问题而不敢使用某些图片?别担心,...
2025-09-27 84
