仅只有未实名的,新媒易不收取任何费用,公益非盈利机构
24小时服务热线: 4000-163-302
请扫码咨询

新闻动态

NEWS CENTER

利用多模态AI的技能,人们可以处理和关联多种信息模态

2023-10-12

详细来说,在制造视频时,用户可以从Pictory 供给的多种模板中挑选一种,来设置视频的样式。

之后,Pictory 会依据用户输入的文本和挑选的模板和份额,主动地生成一个故事板。故事板是一个由多个场景组成的视频序列,每个场景包含了文字、图片、AI语音和一段音乐。


最后,用户可以在故事板上预览视频的效果,并进行一些修改和调整。

如此一来,团队不需要贵重的摄影师、剪辑师,也能制造出专业的、高质量的视频。

同样地,用3D CGI人物替换真人艺人的Wonder Studio,也是旨在进步视频制造效率的AI使用之一。


Wonder Studio 是一个基于网页的视频渠道,它可以让用户轻松地将任意的计算机生成的人物(CGI character)添加到任何场景中,运用AI技能来完成无缝的交融。

用户只需要拍摄自己想要的场景,并上传到网站上,Wonder Studio 的AI引擎就会主动剖析场景中的艺人的扮演,包含他们的动作和面部表情,并将这些信息转换成运动数据,然后用这些数据来驱动用户挑选的CGI人物。


这样,用户就可以完美地用3D CGI人物替换真人艺人,无需运用杂乱的3D软件或许贵重的制造设备,例如动作捕捉服。

三、趋势及国内现状

从以上视频AI的技能特点中,咱们至少可以总结出现在视频AI技能的两大趋势:

1. 制造流程极大简化

利用生成式AI技能,人们可以以主动化、智能化的方法,将文本、图画、音频、视频等多模态数据重新组合,来发明全新和从未有过的内容,在降低成本的一起,也打破了各个模态(或专业)之间的“技能壁垒”。

而这一壁垒的打破,正是生成式AI走向通用化、普及化的要害。


2. 内容的多样性和定制性

利用多模态AI的技能,人们可以处理和关联多种信息模态,然后在内容创造过程中,更好地表达自己的特性和风格,并适应不同的场合和意图。

这是以往受限于已有资料的单一模态技能难以完成的。


在上述两大趋势中,现在国内的视频AI使用,只勉强做到了“简化”这一步。

虽然国内现在也有一些与HeyGen相似的AI视频使用,例如腾讯智影、一帧秒创、万彩微影等。这些使用也利用了AI技能来简化视频创造过程,并供给了文本配音、文章转视频、数字人播报等功能。

然而,在详细的生成效果方面,国内使用的视频清晰度、资料丰厚度,以及定制化功能方面,仍与HeyGen等使用有着较大差距。


腾讯智影的数字人视频,可选资料比较有限

从总体上来说,这类使用依旧只能在渠道供给的资料库内,挑选有限的元素进行创造,并且在某些类别(如数字人视频)上,国产使用生成的视频,也未到达HeyGen视频那样流畅、逼真的标准。

如果说,在本轮AI革射中,国内视频AI技能只是停步于“降本”这一环节,从长远来看,是远远不足以降服智能化年代的观众的。

从当下观众的态度来看,AI制造的视频仍处于一种“不受待见”的状况,许多观众依然觉得,在视频中运用AI技能,是一种偷懒、不负责,且廉价的制造方法。


究其原因,是因为当下国内的部分AI技能,仍未打破一种感官上的阈值,依然让人明显觉察到“这不是人做的”。

于是就给人造成了一种“没有爱情”、“粗制滥造”的形象。

更有甚者,乃至将那些运用了AI技能的视频,打上了“营销号”的标签。

相关推荐