新闻动态
NEWS CENTER
NEWS CENTER
2024-08-11
智能涌现的浪涛,还在翻涌。以本年5月为节点,全球科技巨子在AI范畴的成功与部署以更为密集的状态呈现。
其间一条步履鲜明的主线,是普遍在寻求AI落地。硬件端,苹果在全球开发者大会上发布苹果智能,宣布将ChatGPT融入Siri,三星宣布Galaxy AI融入手机、平板、穿戴式设备;软件端,谷歌在Chrome浏览器集成Gemini AI帮手……
一个公认的现况,AI运用便是国内AI产业当下的缺点环节,又是国内可以追赶乃至逾越的时机所在。
有趣的是,抛开尚处于初级阶段的“百模大战”,仅从AI运用场景动身,抖音与快手这两大先天占据优势的短视频内容渠道,各自负热的AI运用,又供给了两种天壤之别的落地途径。
AIGC相关的App中,豆包绕不过。据Questmobile数据显示,截至2024年6月,在国内AIGC App中,豆包、天工、Kimi智能帮手、猫箱增加亮眼——其间豆包流量排名第一。
豆包并不严格“归属”于抖音,更确切来说归归于字节跳动。坊间流传的消息是,这个名字很接地气的AI产品,最开端的定位是抖音内的AI东西包,或者是抖音内的一切AI运用都包了,所以叫豆包。
豆包自身的产品定位和才能也在不断迭代,直至跳脱出抖音自身的框架,独自成为一个App。与ChatGPT和文心一言等ChatBot产品形状相似但不同的是,虽然交互形状相似,但豆包的定位更倾向于一个综合性的AI Agent(AI智能体)渠道。
通用场景下,用户可以和“豆包”默许智能体聊天对话,也可以寻觅其他笔直运用的智能体对话处理笔直场景的问题,其间包含官方与第三方创立的智能体运用。
在不断迭代之下,其功用也愈发繁复。现在的豆包,不仅有App更有PC端,运用内的场景也扩展到了虚拟社交聊天、AI搜索、文档对话、文生图、内容创造等多种运用场景。而且AI才能的运用也开端扩展到了字节旗下的不同产品。
以抖音为例,一边是抖音运用内上线AI搜索功用,一边是用户在和豆包进行吃喝玩乐等特定类目内容交互时,豆包除了生成文字回复,还会推流一个抖音短视频来添补AI回复的准确性和及时性。
在本年上半年相对抢手的AI运用中,字节根本都有入局,虚拟社交范畴的猫箱,智能台开发渠道范畴的扣子,为主文生视频的即梦等等。但是,豆包之于字节的定位重要性毋庸置疑,先是继续在增加方面的投入并公布商业化途径,后是爽性将本来的大模型称号从云雀大模型改成豆包大模型等一系列动作,都足够验证。
集成、聚合、综合……豆包代表的产品途径,依旧保持着“超级App”或者说“超级进口”的思路,在市场相对空白阶段阶段,先经过运用端占领用户市场,而且在小步快跑中不断迭代,终究聚合成一个超级运用,来获取AI运用年代的优先船票。
与此同时,不同场景和不同产品的贯穿,又让字节生态内的用户数据进一步被累积,成为自身AI才能增加的数据养料。
对AI范畴有重视的人们,或许还会记得2月Sora推出时引起的震动。这是堪比ChatGPT式的信标。丝滑的文生视频体会,代表着人机交互、内容构思之间的某个隔膜被消磨殆尽,转向通途。
很多人会认为,我国版“Sora”,会诞生在BAT和所谓“大模型五虎”上。作出这种判断并不令人意外,技术基底延伸产品运用的链路总是更短。但出乎意料的是,真实在用户层引起爆发式普及的文生视频产品,却是快手推出的可灵。
与还处于内测阶段的Sora相比,在6月公布的可灵直接对外开放。比较吸引人的点在于,可灵支撑生成长达 2 分钟的 30 帧视频,分辨率最高1080p,而且可以自由定制宽高比。这样的产出才能,乃至远超还Sora和其余竞品(包含在可灵公布前一个月字节上线测试的文生视频运用“即梦”)。
在发布后不久,其又上线了图片生成视频功用。视频生成的效果,也契合其声称的大幅度合理运动、物理国际特性模拟、具有概念组合才能和想象力等优势。这一度成为许多“内容创造者”们吸睛的利器,让老照片、手绘图片变成视频的“独家秘笈”乃至被许多人做成课程出售。
快手的AI产品途径,也值得思考。在可灵之前,快手先后发布了通用大言语模型“爽快”、文生图大模型产品“可图”,均未有太大火花,反而是更契合自身内容生态的可灵敏捷火爆。
而在可灵爆火后,在移动端仅有能运用的渠道依旧只有快手创造东西快影 App。但快手专门打造了Web端,并发布公告称此前的可图渠道将在8月关闭,产品功用融入“可灵AI”中。从Web端进口可以看到,快手对可灵的官方定位是新一代AI构思生产力渠道,突破了文生视频局限,会集在AI内容/构思生成方面,而且还有AI视频剪辑等功用方面的想象力留白。
这似乎又是一个方向:围绕自身核心业务场景,供给AI助力来完成扬长避短。而快手自身的内容生态,AI才能的喂养、AI产品的落地、用户的反应,形成了一个完整闭环,用第三方渠道、东西的形式,从创造到体会到生态提升了整体主站App的体会。
不难发现,虽然现在交互的形状还归于一问一答、一入一出的阶段,但豆包和可灵之间的差异,已经有了被迫与主动的差别。
豆包测验的AI Agent作为通往AGI(通用人工)的必经之路,开展方向无疑是可以独立思考、调用东西去逐渐完成给定目标的独立帮手。终极的开展目标,是用户只需要给出一个需求,就能依据需求拆解过程并供给解法。用户被迫享受着AI的主动响应。