Pixelle-Video:开源 AI 全自动短视频引擎,从脚本到成片一站式生成

Pixelle-Video:开源 AI 全自动短视频引擎,从脚本到成片一站式生成

Pixelle-Video(github.com/AIDC-AI/Pixelle-Video)是一个开源的 AI 全自动短视频引擎,定位为从文本脚本到视频成片的一站式自动化解决方案。该项目已获得 7600 星标和 1200+ Fork,332 次提交,最近两周内仍在活跃更新。

它能做什么

Pixelle-Video 的核心工作流覆盖了短视频制作的完整链路:

  • 脚本生成:输入主题,自动生成短视频脚本和分镜
  • 数字人播报:支持 AI 数字人生成,自动匹配口型和表情
  • 图生视频:将静态图片转化为动态视频片段
  • 动作迁移:将参考视频中的动作迁移到数字人或角色上
  • BGM 与字幕:自动配乐、生成并嵌入字幕
  • 模板系统:提供多套预设模板,降低使用门槛

项目包含 Web 界面(web/ 目录),支持浏览器操作。同时提供 API 接口(api/ 目录)和工作流引擎(workflows/ 目录),支持与其他系统集成。

技术栈

项目使用 Playwright 方案进行页面渲染(最近的提交 替换html2image为playwright方案),相比传统的 html2image 方案能更好地处理动态内容和交互效果。支持 GitHub Actions 自动化部署,并提供 Windows 打包方案(packaging/windows/)。

与同类方案对比

方案类型部署方式自动化程度成本
Pixelle-Video开源项目本地/自托管全流程自动化算力成本
HeyGen商业 SaaS云端部分自动化订阅制
Runway Gen-3商业 SaaS云端生成单片段按量计费
剪映/CapCut商业工具桌面/移动端半自动化免费/付费功能

Pixelle-Video 的独特价值在于全流程开源可部署。对于需要批量生产短视频的团队(如 MCN、自媒体矩阵),本地部署可以显著降低长期成本。但对于偶尔制作视频的个人用户,商业 SaaS 工具可能更便捷。

快速上手

# 克隆项目
git clone https://github.com/AIDC-AI/Pixelle-Video.git
cd Pixelle-Video

# 安装依赖
pip install -r requirements.txt

# 启动 Web 界面
python -m pixelle_video.web

# 或通过 API 调用
python -m pixelle_video.api

项目需要配置相关的 AI 模型服务(如数字人生成所需的 TTS 和唇形同步模型),具体依赖请参考 docs/ 目录下的文档。

适用场景

  • 自媒体矩阵的批量视频生产
  • 教育培训内容的自动化制作
  • 产品介绍的快速生成
  • 多语言版本的视频本地化(同一脚本配不同语言播报)

主要来源