C
ChaoBro

Redis 创始人 antirez 用 C 手写了 DeepSeek 4 Flash 的 Metal 推理引擎

Redis 创始人 antirez 用 C 手写了 DeepSeek 4 Flash 的 Metal 推理引擎

Salvatore Sanfilippo(网名 antirez)又开始写东西了。

这次不是 Redis,是一个叫 ds4 的项目——用 C 语言写的 DeepSeek 4 Flash 本地推理引擎,针对 Apple Silicon 的 Metal GPU 加速。13 小时前刚推到 GitHub,目前 846 星,已经上了 Hacker News。

antirez 这个名字在开发者圈子里不需要太多介绍。Redis 的原作者,C 语言老炮,后来离开 Redis Labs 去做了一些有趣的小项目(比如 LoRa 相关的)。他写代码的特点就两个:极简、极快。

ds4 写了什么

从仓库结构来看,ds4 非常精简:

  • ds4.c / ds4.h:核心推理引擎
  • ds4_cli.c:命令行交互
  • metal/:Metal GPU 加速的 kernel 代码
  • tests/:测试
  • download_model.sh:模型下载脚本
  • AGENT.md:给 AI 编码 agent 用的指令文件

总共只有 7 个 commit,但质量不低。有一个 PR 已经修了 README 的拼写错误,antirez 自己也做了一个 MTP(Multi-Token Prediction)验证器的 F32 兼容性修复。

仓库还带了 AGENT.md——给 Claude Code、Cursor 这类 AI 编码助手的指令文件。这意味着 antirez 已经在用 AI agent 辅助开发了。

为什么值得关注

第一,antirez 写的东西通常质量很高。 他不是那种"写个 demo 放 GitHub 就不管了"的人。Redis 之所以能成为行业标准,很大程度上归功于他对代码质量和性能的极致追求。ds4 虽然刚发布,但已经有了测试、CI、issue 响应——这是一个认真维护的项目的起点。

第二,Apple Silicon 本地推理这个赛道还在早期。 虽然已经有 llama.cpp、MLX、Rapid MLX 等工具,但专门为 DeepSeek 4 Flash 优化的 Metal 原生推理引擎不多。ds4 如果能做到比通用框架更快,对 Mac 用户来说是个好消息。

第三,7 commits 13 小时——这是个刚冒头的项目。 现在关注,能看到它从零长大的过程。如果 antirez 持续投入,ds4 有可能会成为 Apple Silicon 上跑 DeepSeek 4 Flash 的优选方案。

怎么上手

# 下载项目
git clone https://github.com/antirez/ds4.git
cd ds4

# 下载模型(运行脚本)
./download_model.sh

# 编译
make

# 运行
./ds4_cli

前提是你有一台 Apple Silicon 的 Mac。项目依赖 Metal 框架,不支持 Linux 或 Windows。

风险和观察点

现在评价 ds4 还为时过早。7 个 commit 的项目,离"生产就绪"还有距离。几个值得关注的问题:

  • 性能数据:目前还没有公开的 benchmark。和 llama.cpp、MLX 相比,速度怎么样?
  • 模型支持:目前只支持 DeepSeek 4 Flash 一个模型。未来会不会扩展?
  • 维护频率:antirez 之前有过"写完 Redis 就去做其他事了"的历史。ds4 能维护多久?

我会持续跟这个项目。如果 antirez 保持更新节奏,ds4 值得放进 Mac 本地推理工具箱。

相关阅读:


主要来源: