快手与字节在AI视频生成领域再次交锋:Seaweed-7B以70亿参数超越140亿模型

   日期:2025-04-25     来源:网络整理    作者:佚名    浏览:174    
核心提示:字节快手,AI视频“狭路又相逢”,字节,算法,mvl,知名企业,狭路又相逢,快手(软体),视频生成模型

文|周鑫雨‍‍

编辑|苏建勋

2025 年 4 月中旬,快手与字节这两个一直是对手的公司,在 AI 视频生成这个领域,又一次碰到了一起。

4 月 14 日,字节跳动的视频生成基础模型 Seaweed 低调地上线了官网,并且释出了技术报告。

_相逢是首歌广场舞教学视频_歌曲相逢是首歌视频

Seaweed生成的视频。图源:Seaweed官网

字节在视频领域想要达到“四两拨千斤”的效果。首发的模型 Seaweed-7B 以 70 亿的参数,实现了超越 140 亿参数同类模型的效果。并且它的训练效率相当高,同类模型训练通常需百万 GPU 小时,而 Seaweed-7B 只用了 66.5 万 H100 GPU 小时。

_相逢是首歌广场舞教学视频_歌曲相逢是首歌视频

Seaweed-7B训练效率。

字节比较低调,而快手在视频生成领域想要营造的声势,比字节的要大很多。快手在视频生成领域想营造的声势,与字节低调形成对比,显得浩大得多。快手在视频生成领域要营造的声势,相较于字节的低调,是浩大得多的。

4 月 15 日,在发布会上。快手的高级副总裁、主站业务与社区科学线负责人盖坤,面对到场的几百人。他用极高的评价为快手在视频生成领域的成绩定下了基调。

“‘可灵’吹响了整个视频生成赛道的挑战号角。”“在我们之后,各个厂商纷纷开始发布视频生成模型。”

创造了上线三个月服务超过 260 万用户的记录。

字节和快手在视频领域首次有了交手。“可灵”发布后,一度让字节处于追赶者的地位。到 2024 年 11 月 8 日,字节才重回视频领域第一梯队,Seaweed 和 PixelDance 上线了视频生成平台即梦 AI。

不少业内人士给出评价,2024 年在视频性能方面,奋力追赶的字节,最终与快手大致处于持平状态。

一年后的这次同台较量,快手显然也不肯让出技术第一的位置。

相逢是首歌广场舞教学视频__歌曲相逢是首歌视频

全球处于大幅领先的状态。持续保持领先。请让我再次重复这两句话。

交出新答卷时,盖坤的几句话再度让场子热闹起来。他宣布了快手在多模态领域的如下探索成果:有图像生成的基座模型“可图 2.0”;还有视频生成的基座模型“可灵 2.0”;以及多模态编辑功能 MVL。

歌曲相逢是首歌视频_相逢是首歌广场舞教学视频_

“可灵2.0”生成的视频。图源:快手

“可灵 2.0”在视频生成能力方面,其文生视频能力以及图生视频能力,都要比谷歌的视频模型 Veo2 更强。在与老对手 Sora 的竞争里,“可灵 2.0”文生视频模型的胜负比例竟然达到了 367%。

相逢是首歌广场舞教学视频_歌曲相逢是首歌视频_

“可灵2.0”能力。

DeepSeek 掀桌这一行为,已经让行业有所察觉,即模型对 AI 产品的上限有着决定性作用。在 2025 年,很多厂商的举动是回归模型。

字节和快手,当下在 AI 视频生成产品方面的野望存在差异。据悉,字节对于“即梦”的期望是打造 AI 时代的抖音,这是一个未来更面向消费者(ToC)的产品。而快手则把商业化的希望主要押注在 B 端。

2025 年,尽管情况如此,两家厂商仍有共识。他们的共识是打磨视频基座模型,并且要抢滩进入第一梯队。

《晚点》有报道称,字节的图像视频创作平台“即梦”的负责人是张楠。张楠 2025 年的 OKR 里,有一条是着重打磨模型效果。2025 年“可灵”团队的目标,在盖坤说出的 4 个字中得以浓缩,这 4 个字就是“持续领先”。

字节和快手方面,至少从技术层面来看,视频生成领域的战火会一直燃烧且越来越旺。

拼性能,更拼落地

4 月的这次“交手”,对于字节快手而言,不只是一次视频模型性能的较量。

视频模型落地存在困难,这是一个已经被多次提及的困境。模型效果没有达到预期只是其中一个方面,价格昂贵是视频模型普遍存在的问题。例如,OpenAI Sora 为了覆盖高昂的推理成本,推出的订阅费高达 200 美元。

可见,与“炫技”的 2024 年相比,2025 年的视频模型竞技场更注重实用,也更体现实惠。

相逢是首歌广场舞教学视频_歌曲相逢是首歌视频_

比如,字节的 Seaweed-7B 在性能方面相较于快手的上一代模型“可灵 1.6”稍显逊色,不过其优势在于部署成本相当低。仅需 40GB 显存的单 GPU,就能够达成高分辨率(1280x720)视频的生成。

这意味着,中小团队和个人创作者,也能负担得起AI视频创作。

字节和快手在实用性方面的共识是:仅拥有一个视频生成模型,当下是不能够满足用户创作需求的。

在“可灵 2.0”的发布会上,快手发布了图像生成模型“可图 2.0”。这个模型增强了指令遵循能力和审美能力,在竞技场上超越了 Midjourney v7、Rave 和 FLUX1.1 pro 这三个主流模型。

_相逢是首歌广场舞教学视频_歌曲相逢是首歌视频

“可图 2.0”生成的图片,其 prompt 描述的是一个摆满白色桌子的宴会厅,宴会厅周围坐着的人正在享用一顿美餐。图源为快手。

快手技术副总裁以及可灵 AI 负责人张迪认为,图像能力在视频模型落地的过程中是不可或缺的。

他给出了一组数据:在“可灵”生成的视频里,图生视频所占比例为 85%。这表明,在视频创作的实际情形中,更多的用户更倾向于通过图片来确定风格以及添加关键帧,从而获得更稳定的视频生成效果。

“多模态编辑 MVL 功能”是“可灵”这次发布的。工作人员介绍说,这也是为了满足创作者的实时视频编辑需求。

相逢是首歌广场舞教学视频__歌曲相逢是首歌视频

多模态编辑MVL功能。

多模态编辑 MVL 功能支持的不只是文字 prompt 。它还支持图像和视频模态的动作描述文件。例如,用户能够通过上传一段新视频,把新视频里的人物添加到原有的视频上。

快手注重图像,而字节发挥了文本处理方面的优势。Seaweed-7B 把字节的“长上下文调优技术”与长叙述视频生成技术“VideoAuteur”相结合,使得生成的视频能够依据用户的全局文本描述以及分镜描述,从而保持一致性。

“全村的希望”和“一个都不能落下”

字节有在视频领域登顶的野望,快手也有在视频领域登顶的野望,它们的野望是相同的。然而,从它们折射出的业务处境来看,却是不同的。

大众熟知的“精兵作战”的故事之外,“可灵”从诞生开始到成为热门,在快手的业务发展历程中,具有一定的偶然性。

相逢是首歌广场舞教学视频__歌曲相逢是首歌视频

《智能涌现》有相关了解,到 2024 年初的时候,文生视频的一项重要技术,被可灵团队给攻破了。在 2024 年 3 月,盖坤首次见到了“可灵”的演示版本。

公司对于 AI 的商业化预期,原本就不是很高。《智能涌现》了解到,快手的商业化业务负责人王剑伟(Thomas)在 2024 年第四季度的 OKR 里,“AI 商业化”不是“O(目标)”,只是“增长”之下的一个“kr(关键成果)”。

快手已有很长时间未出现新的故事了。快手是一家靠短视频业务发展起来的互联网公司,与不断拓展疆域的字节相比,它的业务版图并不宽广。到 2023 年,快手营收的核心依然是围绕短视频平台的线上营销、直播以及电商。

但“可灵”的出现,让快手看到了短视频之外的新增长曲线。

快手财报表明,从 2024 年 9 月起开放 API 服务,到 2025 年 2 月这段时间,可灵 AI 的累计营收达到了 1 亿元以上。在用户方面,盖坤在此次发布会上透露,当下“可灵”拥有 2223 万用户,其月活用户增长了 25 倍,全球的企业和开发者客户数量也已超过 15 万。

“可灵”不仅能够自身创造收益,还在对快手的其他业务起到撬动作用。快手商业化营销服务平台“磁力引擎”的一名员工曾向《智能涌现》透露,“可灵”为快手的广告业务带来了显著的增长态势。

大客户每月花费十几万进行投流,其广告物料能够通过 AI 生成。一个剪辑师一天最多能剪辑 10 条广告物料,然而可灵却可以生成几千条。我们在一天之内,就能够将这几千条广告物料利用算法分发到用户的推荐流中。

“可灵2.0”的发布,对快手来说,是“全村希望”的延续。

字节在视频生成赛道上,相较于单点奇袭的快手,有着更重的好学生包袱。

两年来,在人、算力以及金钱方面,字节在 AI 领域投入了大量兵力,这是有目共睹的。然而,在文本模型领域有 DeepSeek,在视频模型领域有可灵,语音模型和 MiniMax 的海螺 AI 打得十分激烈——字节虽然在各个方面都有所涉足,但似乎并没有牢牢抓住。

2025 年开春之后,字节内部开始进行一场改革。2025 年 3 月,原 Google Fellow 吴永辉成为 AI 部门“Seed”的新领导。在部门全员会上,他提到要强化组织文化,营造开放、包容且自信的团队研究氛围,还要提升技术的开放程度。

Seaweed-7B的发布,是字节AI改革后的一个注脚。

3 月豆包首次公开文生图技术报告之后,Seaweed 成为了字节在视频领域首个公开技术报告的模型。需要注意的是,之前被字节视为机密的研究团队,包括蒋路、冯佳时、杨振恒、杨建超,这次以技术报告署名的方式,首次一起走到了台前。

重振旗鼓后,双方的较量,才刚刚开始。

欢迎交流!

 
打赏
 
更多>同类资讯

推荐热播视讯

推荐视频

    Copyright © 2017-2021  二手钢结构网  版权所有  
    Powered By DESTOON 鄂ICP备2025106939号-1