"AI 全自动短视频引擎"。
这行字写在 Pixelle-Video 的 README 顶部,后面跟着火箭 emoji。阿里 AIDC 出的项目,一周涨了 5K star,总量 15.1K。
自动短视频这个赛道一直不冷不热。冷的是概念——2023 年就已经有人炒过了。热的是需求——做抖音、TikTok、YouTube Shorts 的人永远在找省力的方法。
所以我花了一晚上测了这个项目。结论比 README 诚实。
它能做什么
Pixelle-Video 的全流程大概是这样的:
- 输入主题:给它一个话题,比如"2026 年最值得关注的 5 个 AI 工具"
- 生成文案:自动写脚本/旁白
- 生成画面:用 AI 生成或匹配视频素材
- 配音:TTS 生成旁白
- 剪辑合成:自动拼接画面和音频,加字幕
- 输出:生成可以直接发布的短视频
整个流程从输入到输出,理论上不需要人手碰一下。
实测结果
能跑通的部分:
- 文案生成质量不错,中文支持良好(毕竟阿里出品)
- 配音自然度可以接受,不是那种一听就是机器的声音
- 字幕自动生成,格式可以直接用
拉胯的部分:
- 画面质量参差不齐。有些场景生成的视频看着还行,有些画面明显是 AI 乱拼的
- 节奏感差。自动剪辑不太懂"什么时候该慢、什么时候该快",这是目前所有 AI 剪辑工具的通病
- 长视频(超过 60 秒)的连贯性问题比较明显
成本账单
这是我跑一个 30 秒短视频的大致成本:
- API 调用(文案 + 配音):约 $0.5-1
- 视频生成:取决于你用的模型,本地跑不花钱但需要 GPU
- 时间:第一次配置约 30 分钟,后续每个视频 5-10 分钟
如果全部本地跑(GPU 足够),边际成本接近零。但 3090 跑视频生成还是挺吃力的,4090 以上会舒服很多。
适合谁
- 做批量内容的团队:每天需要产出大量短视频,对单条质量要求不是极致的
- 个人创作者试水:想看看 AI 短视频能做到什么程度
- 有 GPU 资源的开发者:本地跑成本最低
不适合谁?
- 追求精品内容的创作者(AI 还达不到这个水平)
- 没有 GPU、全靠 API 的人(成本会很快吃掉收益)
跟竞品比
这个赛道已经有不少玩家了。Pixelle-Video 的优势在于:
- 阿里系的中文理解能力比较强
- 全流程开源,可以自己改
- 跟阿里生态(通义万相等)集成可能更好
劣势是开源社区的维护力度不如一些纯社区项目,issue 响应速度一般。
GitHub: github.com/AIDC-AI/Pixelle-Video | Python | 15.1K star | 阿里 AIDC 出品 本文基于实际测试体验撰写