Loading

Seedance 2.0 Mini AI 视频生成器

自带原生音频的快速、实惠 AI 视频 —— 三种创作方式

Seedance 2.0 Mini 是 ByteDance 更快、更低成本的视频模型。它能将一段文本提示词、一张图像,或一组参考图像与片段,转化为带同步音频(音效、环境声与口型同步语音)的精致视频,且这些音频无需额外付费即可生成。你可以选择 480p 以求速度,或选择 720p 以求平衡,将时长设置为 4 到 15 秒,并从包括自适应在内的七种宽高比中选择。

作为 Seedance 2.0 在速度与成本上经过优化的版本,Mini 保留了那些真正重要的特性——电影级运动、原生音频和灵活的输入方式——同时运行更快、更省钱。图像生视频可让起始帧动起来,并能向可选的结束帧插值,以实现可控的过渡。参考生视频最多可接受 9 张参考图像(在提示词中以 @Image1、@Image2 引用)、最多 3 段参考视频和最多 3 段参考音频轨道,让你能够在多次生成之间延续角色、风格、运动与声音。无需订阅——你只需为所生成的内容付费。

如何使用 Seedance 2.0 Mini

01

第 1 步:选择你的模式

选择「文本」以根据提示词生成,选择「图像」以让照片动起来(可选结束帧),或选择「参考」以用最多 9 张图像加参考视频和音频来引导视频。

02

第 2 步:撰写提示词与设置

描述运动和场景,然后设置分辨率(480p/720p)、时长(4–15s 或自动)、宽高比,以及是否生成同步音频。

03

第 3 步:生成并下载

点击生成,让 Seedance 2.0 Mini 渲染出带原生音频的视频。在浏览器中预览,准备就绪后下载 MP4。

Seedance 2.0 Mini 技术规格

提供方ByteDance
发布日期June 2026
分辨率480p, 720p
视频时长4–15 seconds(或自动)
宽高比21:9, 16:9, 4:3, 1:1, 3:4, 9:16, 自动
音频生成原生同步音频(默认开启)
输入模式文本生视频、图像生视频(首/尾帧)、参考生视频
参考输入最多 9 images、3 videos、3 audio(≤12 total)

为什么选择 Seedance 2.0 Mini

更快更实惠

Mini 针对速度和成本进行了调校,以更低的单条视频价格提供 Seedance 2.0 级别的运动和音频——非常适合快速迭代和批量生产。

原生同步音频

每条视频都自带 AI 生成的音频——音效、环境声和口型同步语音——与画面完美对齐,且无需额外付费。

三种灵活的输入模式

可从文本生成、用首/尾帧控制让图像动起来,或用最多九张参考图像加参考视频和音频来引导结果。

Seedance 2.0 Mini 与其他 AI 视频生成器对比

FeatureSeedance 2.0 MiniSeedance 2.0Happy Horse 1.0Veo 3.1
提供方ByteDanceByteDanceHappy Horse AIGoogle DeepMind
最高分辨率720p720p1080p1080p
最长时长15s15s15s8s
原生音频支持支持支持支持
输入模式文本、图像、参考文本、图像文本、图像、参考文本、图像
最适合速度与成本质量与网络搜索电影级运动照片级真实感

用 Seedance 2.0 Mini 你能创作什么

01

社交媒体内容

快速制作带电影级运动和内置音频的 TikTok、Reels 和 Shorts——快速又省钱,适合每日发布。

02

产品与广告片段

用首/尾帧控制和同步声音,将产品照片转化为简短的宣传片。

03

角色一致性

使用参考图像并配合 @Image 引用,在多个片段间保持角色或风格一致。

04

故事板与预演

在投入完整制作之前,根据文本提示词快速可视化场景和镜头。

05

声音驱动的片段

在图像或视频之外提供参考音频,以引导情绪、节奏和环境氛围。

06

批量内容生成

借助 480p 速度模式和按需付费定价,经济高效地制作大量短视频。

探索相关 AI 视频生成器

Seedance 2.0 Mini 常见问题

什么是 Seedance 2.0 Mini?

Seedance 2.0 Mini 是 ByteDance 推出的 Seedance 2.0 更快、更低成本的版本。它可以根据文本、单张图像或参考媒体生成视频,提供 480p 或 720p 的原生同步音频,时长为 4 到 15 秒。

Mini 与 Seedance 2.0 有何不同?

Mini 针对速度和成本进行了优化。它在三种输入模式下保留了电影级运动和原生音频,但运行更快、更省钱——非常适合快速迭代和大批量内容创作。

它支持哪些输入模式?

三种:文本生视频(根据提示词生成)、图像生视频(让起始帧动起来,并可选结束帧)、参考生视频(用最多 9 张参考图像,外加最多 3 段参考视频和 3 段参考音频轨道来引导结果)。

它会生成音频吗?

会。同步音频——包括音效、环境声和口型同步语音——默认生成,无需额外付费。如果你只需要视频,也可以将其关闭。

有哪些可用的分辨率、时长和宽高比?

分辨率为 480p(最快)和 720p。时长为 4 到 15 秒,或自动。宽高比包括 21:9、16:9、4:3、1:1、3:4、9:16 和自动。

计费方式是怎样的?

无需订阅——你按生成次数使用积分付费。费用随分辨率和时长变化,因此较短的 480p 片段比较长的 720p 视频更便宜。