美媒:中国新型文生视频人工智能模型令人兴奋
美国《麻省理工科技评论》6月19日文章,原题:我测试了一个令人兴奋的中国新型“文生视频”人工智能模型人们可能还不熟悉“快手”,但这家中国企业刚达到一个重要里程碑:它发布首款可供公众免费测试的“文生视频”生成式人工智能(AI)模型。6月6日,这个拥有6亿多活跃用户的短视频平台宣布推出这款自主研发的新工具。它的名字叫“可灵”。
但与公众在OpenAI试用4个月后仍无法访问的Sora不同,可灵很快就开始让人们亲自试用该模型。笔者就是其中之一。还记得Sora发布的令人印象深刻的演示视频和形象,包括东京街头景象、猫迅速穿过花园以及宇航员骑马等场景吗?我让可灵也生成有关视频。
生成的结果有几个值得称赞之处。这些视频都没偏离提示文字,且无论是摄像机的平移、树叶的颤动,还是马和宇航员的转动方式,相关视频画面的物理特性似乎都是正确的。其中每段视频大约需要3分钟生成。这不是最快的,但完全可以接受。

这些视频也有明显缺点。它们看起来模糊,有时会忽略提示中的请求,且目前生成的视频长度上限为5秒,这导致视频画面的动态或复杂性大幅降低。不过,将这些结果与Sora的演示视频进行对比并不公平,后者是OpenAI精心挑选后才向公众发布的,可能代表着超过其平均水平的文生视频。相比之下,这些可灵视频来自我首次尝试给出的提示,我也很少键入像“照片级真实感”这样的关键词来微调结果。
可灵的工作方式与Sora类似。但与Sora相比,美媒:中国新型文生视频人工智能模型令人兴奋可灵具有一个关键优势:快手是抖音在中国的最主要短视频竞争对手,拥有庞大的视频平台和数亿用户,这些用户共同上传可以用来训练可灵的海量视频数据。可灵最大的局限性可能是它(目前)只能生成5秒的视频。AI专家说,视频越长,就越有可能产生‘幻觉’或不一致的结果。
AI或将颠覆短视频的内容创作场景,将在短期内使创作者受益。从长远来看,快手、抖音等平台有可能接管视频制作,直接生成为用户定制的内容,从而减少平台对明星创作者的依赖。相关技术可能还需要相当长时间才能发展到这个水平,但如今文生视频工具领域越来越引人注目。据报道,快手的竞争对手字节跳动也在准备发布生成式视频工具。行业观察人士说,到今年年底,将会有很多选择。(作者ZeyiYang,丁玎译)
相关文章
-
解读色戒中的梁朝伟,演技巅峰与人性复杂性的完美融合详细阅读
引言:一部电影,一段传奇提到华语电影的经典之作,《色戒》无疑是绕不开的名字,这部由李安执导、改编自张爱玲同名小说的电影,不仅以其深刻的情感刻画和细腻的...
2026-04-09 5
-
评分90以上的谍战剧,一场智慧与情感的较量详细阅读
谍战剧作为影视作品中的一个重要类型,以其扣人心弦的情节、复杂的人物关系和高智商的博弈吸引了无数观众,近年来,随着制作水平的提升和剧本创作的精益求精,一...
2026-04-09 5
-
探索66鬼片网,经典恐怖电影的线上宝库详细阅读
引入:为什么我们爱看恐怖片?你是否曾在深夜关掉灯光,蜷缩在沙发上,打开一部让人毛骨悚然的恐怖片?心跳加速、肾上腺素飙升的感觉是不是让你欲罢不能?恐怖片...
2026-04-09 5
-
科技与隐私的边界,明星美女曝光背后的社会现象解析详细阅读
在这个信息爆炸的时代,社交媒体和智能设备让我们的生活变得更加便捷,这种便利也伴随着隐私泄露的风险,尤其是对于公众人物——明星、网红以及各种领域的“美女...
2026-04-09 5
-
巴西与哥斯达黎加,足球场上的激情碰撞与文化交融详细阅读
从绿茵场到生活的桥梁如果你是一位热爱足球的人,巴西”和“哥斯达黎加”这两个名字一定不会陌生,它们不仅代表了两个国家,更象征着一种独特的文化和精神,在国...
2026-04-09 5
-
侯宝林大儿子,相声艺术的传承与创新详细阅读
在中国相声界,侯宝林大师的名字可谓如雷贯耳,他不仅是中国相声史上的一座丰碑,更是无数相声演员心中的偶像和楷模,作为一代宗师,侯宝林的艺术成就早已超越了...
2026-04-09 5
-
景泰蓝的故乡与文化魅力,探索中国传统工艺的瑰宝详细阅读
景泰蓝是什么地方的?提到“景泰蓝”,很多人可能会联想到一种色彩斑斓、精美绝伦的传统工艺品,当有人问“景泰蓝是什么地方的”时,这个问题其实暗含了对这一独...
2026-04-09 6
-
中华5000年科技文明的传承与未来创新之路详细阅读
从历史深处走来的中华科技文明中华文明,作为世界上唯一延续至今且未曾中断的古老文明,其历史可以追溯到5000年前,在这漫长的岁月中,中华民族创造了无数辉...
2026-04-09 6
