当前位置：首页 >新闻动态 >快手账号交易

利用多模态AI的技能，人们可以处理和关联多种信息模态

2023-10-12

详细来说，在制造视频时，用户可以从Pictory 供给的多种模板中挑选一种，来设置视频的样式。

之后，Pictory 会依据用户输入的文本和挑选的模板和份额，主动地生成一个故事板。故事板是一个由多个场景组成的视频序列，每个场景包含了文字、图片、AI语音和一段音乐。

最后，用户可以在故事板上预览视频的效果，并进行一些修改和调整。

如此一来，团队不需要贵重的摄影师、剪辑师，也能制造出专业的、高质量的视频。

同样地，用3D CGI人物替换真人艺人的Wonder Studio，也是旨在进步视频制造效率的AI使用之一。

Wonder Studio 是一个基于网页的视频渠道，它可以让用户轻松地将任意的计算机生成的人物（CGI character）添加到任何场景中，运用AI技能来完成无缝的交融。

用户只需要拍摄自己想要的场景，并上传到网站上，Wonder Studio 的AI引擎就会主动剖析场景中的艺人的扮演，包含他们的动作和面部表情，并将这些信息转换成运动数据，然后用这些数据来驱动用户挑选的CGI人物。

这样，用户就可以完美地用3D CGI人物替换真人艺人，无需运用杂乱的3D软件或许贵重的制造设备，例如动作捕捉服。

三、趋势及国内现状

从以上视频AI的技能特点中，咱们至少可以总结出现在视频AI技能的两大趋势：

利用生成式AI技能，人们可以以主动化、智能化的方法，将文本、图画、音频、视频等多模态数据重新组合，来发明全新和从未有过的内容，在降低成本的一起，也打破了各个模态（或专业）之间的“技能壁垒”。

而这一壁垒的打破，正是生成式AI走向通用化、普及化的要害。

利用多模态AI的技能，人们可以处理和关联多种信息模态，然后在内容创造过程中，更好地表达自己的特性和风格，并适应不同的场合和意图。

这是以往受限于已有资料的单一模态技能难以完成的。

在上述两大趋势中，现在国内的视频AI使用，只勉强做到了“简化”这一步。

虽然国内现在也有一些与HeyGen相似的AI视频使用，例如腾讯智影、一帧秒创、万彩微影等。这些使用也利用了AI技能来简化视频创造过程，并供给了文本配音、文章转视频、数字人播报等功能。

然而，在详细的生成效果方面，国内使用的视频清晰度、资料丰厚度，以及定制化功能方面，仍与HeyGen等使用有着较大差距。

腾讯智影的数字人视频，可选资料比较有限

从总体上来说，这类使用依旧只能在渠道供给的资料库内，挑选有限的元素进行创造，并且在某些类别（如数字人视频）上，国产使用生成的视频，也未到达HeyGen视频那样流畅、逼真的标准。

如果说，在本轮AI革射中，国内视频AI技能只是停步于“降本”这一环节，从长远来看，是远远不足以降服智能化年代的观众的。

从当下观众的态度来看，AI制造的视频仍处于一种“不受待见”的状况，许多观众依然觉得，在视频中运用AI技能，是一种偷懒、不负责，且廉价的制造方法。

究其原因，是因为当下国内的部分AI技能，仍未打破一种感官上的阈值，依然让人明显觉察到“这不是人做的”。

于是就给人造成了一种“没有爱情”、“粗制滥造”的形象。

更有甚者，乃至将那些运用了AI技能的视频，打上了“营销号”的标签。