Pixelle-Video(github.com/AIDC-AI/Pixelle-Video)是一个开源的 AI 全自动短视频引擎,定位为从文本脚本到视频成片的一站式自动化解决方案。该项目已获得 7600 星标和 1200+ Fork,332 次提交,最近两周内仍在活跃更新。
它能做什么
Pixelle-Video 的核心工作流覆盖了短视频制作的完整链路:
- 脚本生成:输入主题,自动生成短视频脚本和分镜
- 数字人播报:支持 AI 数字人生成,自动匹配口型和表情
- 图生视频:将静态图片转化为动态视频片段
- 动作迁移:将参考视频中的动作迁移到数字人或角色上
- BGM 与字幕:自动配乐、生成并嵌入字幕
- 模板系统:提供多套预设模板,降低使用门槛
项目包含 Web 界面(web/ 目录),支持浏览器操作。同时提供 API 接口(api/ 目录)和工作流引擎(workflows/ 目录),支持与其他系统集成。
技术栈
项目使用 Playwright 方案进行页面渲染(最近的提交 替换html2image为playwright方案),相比传统的 html2image 方案能更好地处理动态内容和交互效果。支持 GitHub Actions 自动化部署,并提供 Windows 打包方案(packaging/windows/)。
与同类方案对比
| 方案 | 类型 | 部署方式 | 自动化程度 | 成本 |
|---|---|---|---|---|
| Pixelle-Video | 开源项目 | 本地/自托管 | 全流程自动化 | 算力成本 |
| HeyGen | 商业 SaaS | 云端 | 部分自动化 | 订阅制 |
| Runway Gen-3 | 商业 SaaS | 云端 | 生成单片段 | 按量计费 |
| 剪映/CapCut | 商业工具 | 桌面/移动端 | 半自动化 | 免费/付费功能 |
Pixelle-Video 的独特价值在于全流程开源可部署。对于需要批量生产短视频的团队(如 MCN、自媒体矩阵),本地部署可以显著降低长期成本。但对于偶尔制作视频的个人用户,商业 SaaS 工具可能更便捷。
快速上手
# 克隆项目
git clone https://github.com/AIDC-AI/Pixelle-Video.git
cd Pixelle-Video
# 安装依赖
pip install -r requirements.txt
# 启动 Web 界面
python -m pixelle_video.web
# 或通过 API 调用
python -m pixelle_video.api
项目需要配置相关的 AI 模型服务(如数字人生成所需的 TTS 和唇形同步模型),具体依赖请参考 docs/ 目录下的文档。
适用场景
- 自媒体矩阵的批量视频生产
- 教育培训内容的自动化制作
- 产品介绍的快速生成
- 多语言版本的视频本地化(同一脚本配不同语言播报)