GitHub Trending #1:DeepSeek-TUI 日增 2400 星,终端里的 AI 编程Agent 杀疯了
DeepSeek-TUI 以单日 2434 星登顶 GitHub Trending,这款基于 Rust 的终端编码 Agent 支持 DeepSeek V4 全模型、1M token 上下文和 MCP 协议,为 Cursor 和 Claude Code 提供了一个零依赖的开源替代方案。
发现GitHub上值得关注的AI开源项目与趋势
DeepSeek-TUI 以单日 2434 星登顶 GitHub Trending,这款基于 Rust 的终端编码 Agent 支持 DeepSeek V4 全模型、1M token 上下文和 MCP 协议,为 Cursor 和 Claude Code 提供了一个零依赖的开源替代方案。
InsForge 登上 GitHub Trending 日榜,这个项目提供基于 Postgres 的后端服务,包含认证、存储、计算、托管和 AI Gateway,专为 Coding Agent 设计。目前 8,200+ Star,日增 213 Star。
OpenClaw 2026.5.5 版本发布,修复飞书、LINE、Telegram、Discord 消息平台问题,优化控制 UI/TUI 响应性,插件更新时保持 SDK 链接稳定,并增强 Gateway 状态监控与重启诊断。
Agent Zero v1.13 正式发布,核心更新包括 LibreOffice 深度集成(ODT/ODS/ODP 作为主格式)和浏览器技能增强。这是一个完全开源的 Agent + 办公技术栈,主打开放格式和自主办公能力。
Cocoindex 是一个增量式引擎,专为长程 AI Agent 设计。通过增量状态管理和断点续跑机制,解决 Agent 在长时间运行中的状态丢失和重复计算问题。GitHub 上每日新增 438 stars,社区活跃度持续攀升。
HuggingFace 社区开发者 Jackrong 发布 Qwen3.6 35B A3B 蒸馏模型,使用 Claude Opus 推理数据进行知识蒸馏。模型权重 71.9GB,GGUF 版本即将推出。这展示了社区如何利用闭源模型的推理能力来增强开源模型。
WLFI 生态推出 WorldRouter,将 Claude、GPT、Gemini、Qwen 等 300+ 模型整合到统一账户,API 价格统一比官方低 30%。支持智能路由和 fallback,开发者一个 Key 调用所有模型。
Sulphur-2 在 Hugging Face 开源发布,支持文本到视频(t2v)和图像到视频(i2v)生成,无内容审查限制。作为首个真正可用的开源视频生成模型,它在创意自由度上直接对标 SeedDance、Kling、Veo 等商业闭源方案。
IndexTTS 社区版 V26 更新:支持 8 人同时对话配音、音色库永久保存、情感可控、推理速度提升 10 倍。基于 GPT 架构的工业级零样本 TTS 系统(20.3k stars)正在成为开源语音合成的事实标准。
Google Research 在 ICLR 2026 发表 TurboQuant,通过向量旋转+极化量化将 KV Cache 内存压缩 4-6 倍,H100 上注意力加速 8 倍。Qdrant 和 llama.cpp 已率先集成,本地大模型推理进入新阶段。
CyberSentry 开源项目引发关注,基于 Llama 3.1 70B (NVIDIA NIM) + ReAct 模式,集成 Nmap、目录模糊测试、SSL 检查器等 8 种真实安全工具,具备目标分析、工具选择、结果解释、策略调整的完整自主渗透测试能力。
研究团队发布 PageIndex,一种完全颠覆传统 RAG 的检索方法——不需要向量数据库、不做 embedding、不切块、不做相似度搜索,而是通过树状索引让 LLM 像人类一样阅读文档。FinanceBench 得分 98.7%。
Ruflo 以每日 2432 星的速度增长,总星数突破 43,986。这个面向 Claude 的多 Agent 编排平台提供企业级架构、自学习 Swarm 智能、RAG 集成和 Claude Code/Codex 原生支持。
Unsloth 发布完整指南,用 GGUF 量化后的 Gemma 4 和 Qwen3.6 在 24GB 内存机器上实现完整 agentic coding,支持自愈式工具调用。低成本本地 AI 编程的门槛被进一步拉低。
Anthropic 发布 33 页 Claude Skills 构建指南,开源社区已有 35+ Agent 框架支持。Prompt 升级为 Skill,系统提示词演变为 SKILL.md,AI 开发范式正在发生根本性转变。
DeepSeek-TUI 登顶 GitHub Trending,Rust 编写的终端编程 Agent 单日涨星 2389。支持 DeepSeek/Claude/Qwen 等多模型,为开发者提供轻量高效的命令行 AI 编码体验。
自适应网页爬虫框架 Scrapling 本周在 GitHub 获得 5650 星增长,总星数突破 44K。它的核心卖点是自动处理反爬机制、动态页面和结构变化。本文分析 Scrapling 的技术优势、竞品对比及适用场景。
Google 工程师 addyosmani 开源的 agent-skills 仓库突破 2.9 万 Star,日增 629 Star,汇集生产级 AI 编码 Agent 技能文件,支持 Claude Code、Cursor、Windsurf 等多平台,正成为 Agent 技能的事实标准。
Google Gemma 4 系列正式支持 MTP(Multi-Token Prediction)多令牌预测技术,通过投机解码(speculative decoding)将推理速度提升 2-3 倍,且零质量损失。SGLang 已实现 Day 0 支持,覆盖 Gemma 4 全部 4 个尺寸。这对本地 AI 部署是重大利好。
virattt/dexter 以 23.5K stars 成为 GitHub trending 上的金融 AI 爆款。这个开源自主 Agent 能像人类分析师一样完成深度金融研究:抓取 SEC 文件、分析财报、生成估值报告,支持 OpenAI/Claude/Gemini/Grok/Ollama。
local-deep-research 登上 GitHub Trending 榜单,这是一个完全本地化运行的深度研究 Agent,无需云端 API 即可完成多轮搜索、分析和报告生成。在隐私敏感行业(法律、医疗、金融)引发关注。
英伟达发布 Nemotron 3 Nano Omni 开源全模态模型,深度优化 Hopper 和 Blackwell 架构 FP8 推理,同时兼容 RTX 5090 等消费级显卡和 Jetson Thor 机器人平台,直指 AI Agent 应用开发。
GitHub 上新出现的 awesome-hermes-agent 项目,系统整理了 Hermes Agent 生态的全部技能、教程、社区项目和最佳实践。对于刚入门或想深入 Hermes 的开发者,这是目前最完整的生态导航资源。
DeepSeek-TUI 以单日 2389 星的增长速度登顶 GitHub Trending,这款 Rust 编写的终端编程 Agent 支持 DeepSeek 模型、Claude、Qwen 等多模型,让开发者在命令行中体验完整的 AI 编码工作流。
Dify 作为开源 LLM 应用开发平台,GitHub Stars 突破 50K,但在 Agent 编排和生态深度上仍落后于 LangChain、CrewAI。本文分析 Dify 的技术定位、竞争优势及 2026 年的关键挑战。
Hermes Agent v0.12 引入 Kanban 任务板,支持多智能体并行协作:Agent 从看板自主领取任务、并行执行、阻塞时自动交接。一个视图替代多个终端,这是 Hermes 从单智能体工具向多智能体操作系统演进的关键一步。
NousResearch/hermes-agent 在 2026 年 5 月第一周以 108.1K 新增 stars 登顶 GitHub 月度增长榜,总 stars 突破 127K。这款"自我进化"的 Agent 框架正在重新定义 AI 代理的开发范式。
HermesOS 宣布免费层正式开放,用户无需信用卡即可在云端部署持久化 AI Agent 实例,支持持久记忆、浏览器自动化、终端访问和定时任务,BYO API Key 无加价。
阿里通义团队开源 Qwen-Scope,提供完整的稀疏自编码器套件,实现模型内部特征可视化、输出控制和长尾数据合成,大模型可解释性从研究走向工程。
OpenClaw 生态在 2026 年 5 月迎来爆发:医疗领域 Skills 已达 869 个,官方发布免费 18 步从零构建教程,插件系统上线支持按需安装。AI Agent 的竞争正从框架本身转向垂直领域生态。
社区开发者发布 QwenSeek-2B,基于 Qwen3.5-2B 底座,利用 DeepSeek-V4 的 <think> 思维链进行蒸馏,Apache 2.0 许可证开源,可在消费级 GPU 上运行。
开源 AI 编码工具 OpenClaude 发布 v0.9.1,正式将 OpenAI Codex 设为默认提供方、GPT-5.5 设为默认模型。这一转变源于 Sam Altman 的公开回应——如果 OpenAI 官方支持,就把 Codex 设为 OpenClaude 的默认选项。
Hermes Agent 的记忆系统通过三层架构(工作记忆/语义记忆/情景记忆)彻底重构了 AI Agent 的记忆机制,修正了 OpenClaw 在记忆压缩中的信息丢失问题。Ollama 0.21 的本地支持让这一能力可直接在消费级硬件上运行。
TypeScript 教育博主 mattpocock 发布的 Claude Skills 仓库一周内暴涨 31,091 颗星至近 60K,登顶 GitHub Trending,内容来自其个人 .claude 目录的实战技能集合。
Flower AI Summit 2026 上,Flower Labs 发布 Flower Agents 和 Project Kaya,提出好 Agent 的三要素框架:上下文理解任务、访问权获取数据、控制力执行操作。
Hermes Agent v0.12.0 发布,1096 次提交、550 个 PR、213 位贡献者。引入 Curator 自主管理技能库、自我改进审查循环升级、ComfyUI/Tou 默认集成,开源 Agent 框架竞争进入"自进化"新阶段。
GitHub Trending榜首项目TradingAgents(67,992星)是一个多智能体LLM金融交易框架。通过研究员、分析师、风控官等专用Agent协作,实现从信息收集到交易决策的全自动化流程。
Google Cloud 宣布发布 50+ 个 MCP(Model Context Protocol)服务器,覆盖 BigQuery、AlloyDB、Vertex AI 等核心服务,原生内置治理与可观测性,企业 Agent 工作流集成进入标准化阶段。
mattpocock 的 skills 仓库一周内暴涨 31,091 星,总星数达 59,309。这个从 .claude 目录中提取的实用技能集合,正在成为 AI 辅助编码的事实标准。本文解析其内容结构、为什么火、以及你可以怎么用。
Ruflo 作为面向 Claude 的多 Agent 编排平台,本周新增 4321 Star 总数突破 4.1 万。其核心卖点是自学习集群智能、RAG 集成和原生 Claude Code/Codex 对接,正在成为复杂 AI 工作流的编排层选择。
cocoindex-io/cocoindex 登上 GitHub Trending Python 榜,这是一个面向长周期 Agent 任务的增量计算引擎。与传统的 Agent 框架不同,cocoindex 通过增量状态管理让 Agent 可以在数小时甚至数天的时间跨度内持续工作而不丢失上下文。
Hmbown/DeepSeek-TUI 在 GitHub Trending 冲上第 4 名,日增 1277 stars。为 DeepSeek 模型打造的终端编程代理,让开发者无需 IDE 即可在命令行中完成编码任务,填补终端 AI 编程工具生态空白。
TypeScript 专家 mattpocock 发布的 skills 仓库在 GitHub 一周内获得 31,000+ 新 stars,总量突破 59,000。该项目提供来自实战工程师的 .claude 技能文件,涵盖 TypeScript 最佳实践、代码审查、架构设计等场景,为 Claude Skills 生态树立了质量标杆。
Open Design 正式开源看板模式,支持在同一界面同时编排 Hermes Agent、Cursor、DevinAI 等多个 AI 开发工具,实时预览运行状态并并行设计多个原型。这是 AI 开发体验从单工具调用向多 Agent 协作的标志性升级。
OpenAI 在 GitHub 上线官方 Codex Skills Catalog 仓库,为 Codex CLI 和 API 提供标准化的技能目录。开发者可以直接引用预置技能,也可以贡献自定义技能,标志着 Agent 能力从"个人配置"走向"社区共享"。
browserbase 开源 Claude Agent SDK with web browsing tool,2070 stars 且日增 320。解决 Agent 网页交互标准化难题,提供开箱即用的浏览器控制能力,降低 Web Agent 开发门槛。
OpenCode 是一个全新的开源 AI 编码 Agent,完全免费、无锁定,支持在终端、IDE 或桌面环境运行,兼容 Claude、GPT、Gemini 甚至本地模型。它像真正的开发者一样读取整个代码库上下文、自主执行编辑操作,成为 Cursor/Claude Code 之外的第三条路线。
通义千问发布 Qwen3.6-35B-A3B,35B 总参数 MoE 架构推理仅激活 3B,256 个专家中路由激活 8+1 个,支持 262K 原生上下文、可扩至 100 万 token,Apache 2.0 许可开源。
给 Codex 装上游戏美术技能包,用自然语言描述角色动画和场景地图,自动输出带透明通道的 PNG 精灵图序列和引擎可用地图,支持 Godot 和 Unity 直接导入。
DeepSeek-TUI 今日 GitHub Trending 第四,单日狂揽 1277 星。这款 Rust 编写的终端编码 Agent 原生支持 DeepSeek V4 的 1M 上下文,内置 Plan/Agent/YOLO 三种模式、RLM 并行推理、LSP 诊断,零依赖单二进制部署。
Hermes Agent 推出桌面客户端,支持多 Agent 并行管理、跨平台会话同步、多模型供应商切换,并内置 Telegram 和 Discord 集成。零终端操作,浏览器级界面让 AI Agent 管理门槛骤降。
GitHub 开源项目 DeepClaude 可将 Claude Code 的模型后端切换为 DeepSeek V4 Pro,保留完整的 agent loop、文件读写、bash、git 等能力,将百万 token 成本从 $15 降至 $0.87,实际用户 31M token 仅花费 $0.55。
Google 宣布 Gemma 4 即将支持在 React Native 应用中完全端侧运行,无需云端 API。这意味着数百万移动开发者可以直接在 iOS/Android 应用中嵌入轻量级 AI 能力,隐私、延迟、成本三赢。
OX Security 发现 20 万个 MCP 服务器存在命令执行漏洞,STDIO 传输层缺乏输入清洗。LangChain-ChatChat 和 Windsurf 均受影响,CVE-2026-30617 评分高达 8.6。
社区开发者将 Claude Opus 4.6 和 4.7 的 8706 条思维链数据开源,让小模型训练"先思考再回答"的能力成为可能。过去需要数千美元 API 费用才能攒够训练数据,现在直接可用。
GitHub 新开源项目 DeepClaude 允许将 Claude Code 的 AI 后端无缝切换为 DeepSeek V4 Pro,百万 token 成本从 15 美元降至 0.87 美元,降幅达 17 倍。只需配置三个环境变量即可使用。
DigitalOcean 发布 Knowledge Bases 全托管 RAG 服务,集成数据摄取、分块、嵌入、检索、重排序全流程,内置 RAG Playground、高级重排序算法、两个开源新模型及 MCP 集成,开发者可数分钟构建生产级 RAG 应用。
三星电子重启碳化硅(SiC)代工业务,目标 2028 年量产。SiC 被视为下一代功率半导体核心材料,广泛应用于电动汽车、充电基础设施和工业电源领域。
Show HN 新项目 Agent-desktop 以 88 分登顶今日榜单——这是一个让 AI Agent 直接操控本机桌面环境的 CLI 工具,标志着 Agent 从"代码世界"走向"图形世界"。
三星工程师(前OpenAI)与团队开发的Flipbook项目引发关注——输入搜索词,实时用像素生成动态插画,文字也是像素组成,画面任何区域可点击生成下一层。这种"无限视觉浏览器"可能代表AI交互的新范式。
Pipecat 是当前 GitHub 上最受关注的实时语音 AI Agent 框架,主打亚 200ms 延迟的生产级语音交互。社区整理的 AI Agent 生态目录中将其列为"大多数你实际用过的生产级语音 Agent 都基于此构建"的底层框架。本文解析其架构、竞品对比和快速上手指南。
June AI 发布 Models 2026 终极阵容:开源侧包括 GLM 5.1、DeepSeek V4 Pro/Flash、Kimi K2.6、Qwen3.5 397B、Gemma 4 31B;闭源侧包括 GPT 5.5、Grok 4.1 Fast、Claude Opus 4.7、Gemini 3.1 Pro。开源模型首次在数量和综合能力上与闭源阵营形成正面对抗。
Inclusion AI 开源 LLaDA2.0-Uni,一个基于扩散 LLM 的统一多模态模型,整合视觉理解与图像生成于单一架构。MoE 骨干配合 SigLIP-VQ tokenizer,仅需 8 步即可生成图像,支持原生交错推理。为多模态 Agent 提供了全新的推理范式。
TradingAgents 以 65k Stars、日增 3300+ 冲上 GitHub Trending 第二。作为多 Agent LLM 金融交易框架,涵盖股票、加密货币的情绪分析和量化交易,提供完整的开源量化研究方案。
Hermes Agent 最新引入 Kanban 多 Agent 协作模式——Agent 自动从看板领取任务、并行工作、阻塞时自动交接。一个界面即可监控所有 Agent 进度,告别终端切换的繁琐。
Anthropic 4 月 17 日发布 Claude Design 全网震惊后仅 15 天,开源版 open-design 已上线。支持 11 个 CLI 自动识别、内置 31 个 Skill × 72 套品牌级 Design System,让 Qwen、Kimi、GLM 等模型也能获得 Claude Design 级别的设计能力。
Mercury Agent 正式发布,官方定位是"OpenClaw + Hermes 的完美合体"。该项目融合 OpenClaw 的 Idea 启发与 Hermes 的能量驱动,主打"真正的控制力"。开源 Agent 框架迎来新的整合者。
100%开源、Apache 2.0许可的AI Perception Protocol正式发布,定位为AI Agent的"感知层"基础协议。如果2025年是Agent框架爆发年,2026年将是Agent感知能力的基建年——这个协议可能成为下一个LangChain级别的基础设施。
OpenSlide(open-slide)将幻灯片生成的粒度从 Markdown 提升到 React 组件级别。内置 Agent 技能支持一句话生成完整 Deck,固定 1920×1080 画布确保输出一致性,正在成为 AI 时代替代 PowerPoint 的开源方案。
Meta 发布 Tuna-2,一个无编码器的多模态模型,直接使用像素嵌入而非传统视觉编码器。在细粒度感知基准上超越编码器模型,统一理解与生成。MoE 架构,开源权重,为多模态 AI 提供了一条全新的技术路线。
OpenClaw 2026.5.2 于5月3日发布,核心更新包括 xAI Grok 4.3 模型集成、插件安装稳定性提升、网关与代理热路径优化、四大通信平台(Discord/Slack/Telegram/WhatsApp)修复,以及 TTS 实时语音通话功能打磨。这是 OpenClaw 连续第三周发布重要更新。
阿里通义团队正式开源 Qwen-Scope 稀疏自编码器(SAE)完整套件,支持特征提取、数据分类、输出控制三大场景。这意味着开发者可以直接操纵模型内部特征来控制输出,无需 prompt engineering。本文解析 Qwen-Scope 的三大核心能力、适用场景以及上手指南。
阿里通义团队开源 Qwen-Scope 工具,基于稀疏自编码器(SAE)覆盖 Qwen3/3.5 共 7 个模型,可在推理阶段定向控制输出行为,用少量种子数据完成分类与长尾样本合成。
AMD 推出搭载 Ryzen AI Max+ 395 处理器的 128GB 内存 Mini PC,售价 $2K-$3K,完整支持 ROCm。可在本地运行 200B 参数级别大模型,直接对标 NVIDIA DGX Spark。本地 AI 推理的性价比门槛被大幅降低。
n8n-mcp 项目在 GitHub 上获得 19,257 星,日增 264 星。该项目通过 MCP 协议将 Claude Desktop、Claude Code、Windsurf、Cursor 等 IDE 与 n8n 自动化平台打通,用户可以用自然语言直接构建和编辑 n8n 工作流,无需手动拖拽节点。
Claude Opus 4.7 在消费级硬件上从零实现了 AlphaZero 风格的自博弈管线,仅用 3 小时完成,并在 Connect Four 游戏中以先手 7/8 的成绩击败了 Pascal Pons 专业 solver。其他前沿 Coding Agent 均未超过 2/8。这是 Agent 自主推理能力的重要信号。
GitHub 爆火的 agency-agents 项目达 9.2k Star,提供 211 位即插即用的 AI 专家角色。可将专业工作流注入 Hermes Agent、OpenClaw 等本地框架,实现自动化效率质变。
中美大模型 + Hermes Agent/OpenClaw 等开源 Agent 框架的组合,正在将"捉虫"和"救火"的效率提升一个数量级。Harness Engineering(驾驭工程)成为 2026 年 AI 开发者的核心技能。
Tracer-Cloud/opensre 本周新增 1,199 星,总星 4.3K。这是一个开源 AI SRE Agent 框架,支持 60+ 运维工具集成,用合成事故场景训练 Agent 的根因分析能力,官方部署基于 LangGraph Platform。
OpenAI 在 HuggingFace 开源了 Privacy Filter 模型——一个 1.5B 参数的双向 Token 分类模型,专用于 PII(个人身份信息)检测和脱敏。仅 50M 活跃参数,可在浏览器中运行,支持 128K 长上下文。
OpenClaw 发布 2026.5.2 版本更新,新增 xAI Grok 4.3 模型支持,插件安装和更新流程更加稳定,Gateway 和 Agent 核心路径性能优化,修复了 Discord、Slack、Telegram、WhatsApp 等多平台消息通道的问题,并改进了 TTS、实时语音和网页搜索功能。
penMonoAgent 是一个基于 .NET 10 和 llama.cpp 构建的本地编码 Agent,推理完全在本地运行,无需 Token 费用,代码也不出本机。自带 20 个工具和 5 个专项子 Agent,支持 Docker 一键部署。
一个 GitHub 目录项目在 24 小时内获得 233 个 Star、274 次 Bookmark,它编译了整个 AI Agent 生态——框架、工具、真实用例,持续更新。在 Agent 碎片化严重的 2026 年,这种"全景地图"的价值正在被重新认识。
谷歌启动Gemma 4 Good挑战赛,$20万奖金池,围绕健康、教育、全球韧性、数字公平和AI安全五条赛道。Gemma 4家族提供4种尺寸的开源模型,为开发者提供技术底座。
Poolside 发布 Laguna XS.2,33B 总参数/3B 激活参数的 MoE 编程模型,SWE-bench Verified 达到 68.2%。36GB Mac 即可运行,Apache 2.0 许可,支持 Ollama 一键部署。
Google发布的Gemma 4 26B A4B采用26B总参数、4B激活的MoE架构,支持256K上下文窗口。总参数不大但激活参数极小,推理速度快、资源消耗低,让消费级硬件运行高质量本地AI成为现实。
阿里国际数字商业集团旗下 AIDC-AI 开源 Pixelle-Video,一个支持数字人播报、图生视频、动作迁移的 AI 全自动短视频引擎,GitHub 9.2K stars 提供从脚本到成片的端到端自动化管线。
新一代 Agent Harness 框架宣称实现 20 倍内存效率提升,支持大规模并行 AI 会话而不让机器崩溃。从 JCode 到 Pi 终端 agent,Harness 正在成为运行 AI 代理集群的基础设施层。
字节跳动开源 DeerFlow 2.0,GitHub 狂揽 50.7k Stars。框架将 LangGraph 状态机、沙盒安全、记忆管理、IM 接入等基础设施全部打包,开箱即用,适合个人开发者、创业团队和企业内部自动化场景直接落地复杂 AI 工作流。
Maigret是一个开源OSINT工具,仅凭一个用户名就能在3000+网站上搜索目标人物的数字足迹。今日GitHub Trending排名第二,日增1065星,总星数突破22K。对于安全研究人员和反欺诈从业者,这是必备的侦察工具。
OpenADE 作为开源 AI 编码协作工具完成重大更新,新增 GPT-5.5 与 Codex 集成、更快的 diff 引擎,同时保持对 Claude 的兼容。它为团队提供了一条绕过商业编辑器的开源协作路径。
GitNexus 本周 GitHub 周榜飙升 5376 星至 34.6K,只需拖入 GitHub 仓库或 ZIP 文件即可在浏览器端生成交互式知识图谱,内置 Graph RAG Agent 实现零服务器部署的代码探索方案。
Ruflo 在 GitHub Trending 飙升至第 2 名,单日增长 1,258 stars。它为 Claude Code 提供了 Agent 群集编排、自学习记忆、联邦通信和企业级安全能力,将单点 AI 助手升级为多 Agent 协作系统。
2026年 AI 到 3D 的完整管线已经成型:GPT Image 2 生成概念图 → Hunyuan3D/Tripo 转 3D 网格 → MeshyAI/Blender 清理绑骨 → Mixamo 自动动画。一个下午即可产出游戏级角色,成本约 600 美元。
lambda 社区发布 hermes-agent-reasoning-traces 数据集,首次大规模公开 Agent 的推理轨迹数据,包含解析、分析、可视化和微调的完整工具链。这标志着 AI Agent 从"黑盒运行"走向"可观测、可调试、可优化"的新阶段。
Warp 终端宣布开源并转型为 Agentic 开发环境,GitHub 日增 3400 星,总星数突破 5.1 万。内置 AI Agent 可自主执行终端任务,标志着命令行工具从"手动输入"向"意图驱动"的进化。
browserbase/skills 登上 GitHub Trending,为 Claude Code 提供一套完整的网页自动化技能插件,涵盖浏览器操控、站点调试、Cookie 同步和对抗性 UI 测试,将 Agent 的 web 交互能力从"能看"提升到"能操作"。
obra/superpowers 项目突破 17.5 万 GitHub 星标,日增超千星。这个"Agentic Skills 框架"将 Claude Agent 的能力模块化,标志着从对话式 AI 向可组合 Agent 工作流的范式转移。
NVIDIA 发布 Dynamo 项目,专门为 Agentic AI 重构推理基础设施。传统推理栈假设每次请求是独立的,但 Agent 编码会话会产生数百次 API 调用和大量重复的上下文计算。Dynamo 通过 KV 感知路由和上下文复用,在同等硅片上实现 2.7 倍性能提升。
OpenClaw 和 Hermes Agent 两大开源 Agent 框架正在加速融合国产模型生态。最新版本同时支持 Kimi、GLM、DeepSeek、MiniMax 等国内模型,并通过模型路由和自动降级机制实现任务优化。Agent 框架正在从"工具"进化为"操作系统"。
TauricResearch 的 TradingAgents 项目以 59K+ stars 登顶 GitHub Trending,这是一个用多 Agent LLM 框架做金融交易的开源方案,日增 2100+ 星。
Archon 从 Python Agent 构建器转型为 TypeScript AI 编码工作流引擎,用 YAML 定义开发流程,17 个预设工作流覆盖 issue 修复到 PR 创建全链路,支持 Slack/Telegram 远程触发。
五款开源工具组合——DeepSeek V4 Flash 做推理引擎、Ollama 做模型管理、OpenClaw 做 24/7 守护进程、Hermes 做智能路由、Claude Code 做编码辅助——构建完全免费的本地 AI 工作栈。
GitHub 开源项目 llm_wiki 以 4.6k Stars 蹿红——它实现了 Karpathy 构想的知识库形态:不再每次提问都去原始文档里现找,而是先让 LLM 预处理生成知识索引。个人知识管理正式迈入原生 Agent 时代。
RTK 用 Rust 写了一个 CLI 代理层,拦截并压缩 AI 编程工具的命令输出,30 分钟 Claude Code 会话从 11.8 万 token 降到 2.4 万,支持 12 种 AI 工具。
Hermes Agent GitHub 星标突破 127K,上月新增超 10 万。社区涌现出 Agent 连续运行 100+ 天、处理 108 亿 tokens 的实战案例,标志着 AI Agent 从实验品走向生产级基础设施。
社区开发者演示将 Hermes Agent 与 Open Web UI 集成,通过 Docker 一键部署,实现免费且功能完整的 ChatGPT 风格 Agent 交互界面,适合个人和小团队自部署需求。
NVIDIA 发布 Nemotron 3 Nano Omni,30B 混合 MoE 架构,将图像、音频、视频、文本统一到一个推理循环中。Canonical 合作推出 Ubuntu inference snap,一条命令即可部署,无需复杂集成。
CJackHwang/ds2api 是一个 Go 语言编写的 DeepSeek 兼容中间件,专注高并发协议适配,将多样 Web 协议转换为标准化 DeepSeek API 格式。本周 GitHub 新增 1,726 星至 3,066 星,为需要对接多模型源的企业提供统一 API 网关方案。
Hermes Agent 5 月 1 日更新原生集成 LM Studio,自动发现本地模型、按需加载、智能路由推理策略。无需手动配置,消费级硬件即可运行完整的 Agentic 工作流。
NVIDIA 在 GTC 2026 推出 NemoClaw 和 OpenShell,为 OpenClaw 生态注入企业级安全能力。OpenShell 提供可控的沙箱环境,精确管理 Agent 的访问权限、数据共享和输出审查,一条命令即可部署。
阿里 Qwen 团队发布 Qwen-Scope 开源可解释性工具包,为 Qwen3.5-27B 提供 81k SAE 特征覆盖 64 层,支持推理 steer 和机理分析,大幅降低模型黑箱化程度。
DeepSeek 发布 V4 技术报告,揭示两大核心创新:用混合压缩注意力系统替代标准 Attention,引入 Muon 优化器加速训练并提升稳定性。同时改进层间连接方式,增强复杂推理能力。
TradingAgents 登顶 GitHub Trending,v0.2.4 版本新增对通义千问、DeepSeek、智谱 GLM 的原生支持。这个模拟真实交易公司架构的多 Agent 框架,正在降低 AI 量化交易的门槛。
Hermes Agent v0.12.0 推出 Dashboard Profiles 管理页面,用户可在 Web 界面直接配置多 Agent 架构。同时新增 ACP Server 适配器实现标准协议交互,以及 Curator 技能维护系统自动优化 skills。
Meta FAIR发表论文提出在预训练阶段直接植入LLM的安全性、事实性和推理能力,而非在后期微调阶段修补。这种先天设计思路可能改变模型训练范式,从根源上提升模型质量而非依赖对齐后处理。
GitHub 新项目 The Agency 在两周内突破 50K Stars,包含 147 个专业化 AI Agent,覆盖工程、设计、营销、产品、QA、支持等 12 个部门。这不是提示词模板合集,而是一套完整的 AI 组织架构。项目正在重新定义"AI 自动化"的边界。
MuleRun发布浏览器扩展,Agent可从Web应用直接访问用户本地浏览器标签页,实时提取网页内容。配合新上线的电商和创作者数据源,MuleRun正在构建"数据获取→分析→输出"的完整Agent工作流。
Sim(simstudioai/sim)是一个开源的 AI Agent 编排平台,目前获得 28K stars。它定位为"AI 劳动力的中央智能层",支持构建、部署和编排多 Agent 协作工作流。在 Sam Altman 说"嫉妒 2026 年创业者"的背景下,Sim 代表了"一人公司"的基础设施。
AgentKit 发布新版本,为 AI Agent 提供链上交易、身份注册和信誉系统能力,原生兼容 OpenClaw、Hermes、ClawUp 等主流 Agent 运行时。AI Agent 从"执行工具"正式升级为"经济主体"——它们可以自己赚钱、交易、建立链上信誉。
dirac 是一个新开源的 AI 编码 Agent,核心设计理念是"只做小改动"——避免传统 AI Agent 一次性修改大量文件导致的混乱。通过限制每次编辑范围、生成更易审查的 diff,显著降低 AI 编程的失败率和回滚成本。
HuggingFace 开源 ml-intern 项目,一个能阅读论文、训练模型、自动部署 ML 模型的 AI 工程师。一周内获得 7,774 stars 和 5,665 stars 增长,由 HuggingFace 核心开发者维护。
trycua/cua 项目一周内获得 15,450 stars,提供跨平台 Computer Use Agent 基础设施。支持 macOS、Linux、Windows 的桌面控制沙箱、SDK 和评测基准,是构建桌面自动化 Agent 的开源标准。
Nous Research 开发的 Hermes Agent 在 GitHub Stars 上超越 Anthropic 的 Claude Code 仓库,同时发布 Creative Suite 集成 TouchDesigner 和 ComfyUI,标志开源 Agent 正式进入创意生产领域。
Warp 正式将核心代码库开源(MIT + AGPL v3),3 天内 GitHub Star 突破 49,000,登顶 Trending 榜首。项目内置 AI 编码 Agent,同时支持 Claude Code、Codex、Gemini CLI 等外部 Agent 接入,OpenAI 作为创始赞助商参与。
Hugging Face 开源 ml-intern,一个能阅读论文、训练模型并部署 ML 模型的开源 AI 工程师 Agent,本周 GitHub 增长 6,388 星至 7,651 星。
TauricResearch/TradingAgents 在 GitHub 持续热门,累计 58,369 星,今日新增 2,023 星。该项目构建了多 Agent LLM 金融交易框架,将分析、决策、风控拆分为独立 Agent 协同工作。在 Agent Arena S3 实盘竞赛同期,该项目为自主交易 Agent 的构建提供了开源参考实现。
TauricResearch/TradingAgents 本周新增 2,023 星,总星数突破 57,943,持续霸榜 GitHub Trending。这个多 Agent LLM 金融交易框架从学术研究走向实战,v0.24 版本在架构和策略层面的更新值得关注。
小米开源 MiMo-V2.5-ASR,原生支持普通话、英语及吴语、粤语、闽南语、四川话等中文方言,可处理歌曲、噪声、多说话人场景。这是首个在方言识别上达到实用水平的开源 ASR 模型。
Future AGI 将其完整的 Agent 工程与优化平台开源(Apache 2.0),涵盖追踪、50+ 评估指标、仿真引擎、18 种内置 Guardrails、6 种 Prompt 优化算法,支持 50+ 框架和 100+ LLM 供应商。
Hermes Agent v0.12.0 "The Curator Release" 已获 930+ 点赞、234+ 收藏。但多数用户只使用了不到 8% 的功能。本文深挖 134 个斜杠命令中最实用的隐藏能力,从命名 Persona 到跨会话记忆管理。
trycua/cua 是一个本周新增 1,842 星的开源项目,提供 Computer-Use Agent 的完整基础设施:跨平台沙箱(macOS/Linux/Windows)、SDK 和评测基准。与 OpenAI Codex Computer Use 不同,cua 是纯开源方案,支持自主训练和评估。
Mception 是一个开源 MCP Server 审计工具,内置 46 条安全规则,可检测工具投毒、Rug Pull、远程代码执行和供应链攻击。输出 SARIF 格式报告,无需 API Key。在 MCP 生态爆发式增长的背景下,这是 Agent 安全领域的基础设施级项目。
Beads 登上 GitHub Trending,为 AI 编程助手提供基于依赖关系图的结构化任务追踪系统。用 DAG 管理多 Agent 任务,解决上下文丢失和任务混乱问题,像是给 AI Agent 装了个项目经理。
Google 发布 Gemini Embedding 2,业界首个基于 Gemini 架构的完全多模态 embedding 模型,支持 100+ 语言的文本、图像、音频统一编码到同一向量空间。已通过 Gemini API 和 Vertex AI 提供预览。这意味着自然语言搜图、以图搜图的语义精度迎来代际提升,RAG 知识库的多模态融合成为可能。
月之暗面开源 FlashKDA,基于 CUTLASS 实现 Kimi Delta Attention 高性能核,在 H20 上实现 1.72-2.22 倍前向加速,支持变长批处理,可作为 flash-linear-attention 的直接替换后端。
OpenClaw 和 Hermes Agent 已全面支持接入 GLM-5.1、Kimi K2.6、DeepSeek V4 Pro 等国产模型。本文详解各模型的接入配置、价格对比、最佳实践,帮助开发者以最低成本搭建国产 AI Agent 工作流。
OpenClaw 发布 v2026.4.29 版本,带来 Active-Run Steering 群聊原生 Agent 体验、记忆系统底层重构、更多模型提供商支持。这是 OpenClaw 从个人助手向企业级 AI 网关演化的关键一步。
OpenRouter 上线全新匿名模型 Owl Alpha,提供 105 万 token 上下文、262K 最大输出、原生工具调用支持,目前免费使用。模型专为 Agent 工作负载设计,兼容 Claude Code、OpenClaw 等主流工具,但所有 prompt 和输出会被提供商记录用于模型改进。
Hermes Agent 推出 Labyrinth 可视化工具,将 Agent 运行时的提示词、工具调用、失败记录、模型切换、记忆和子 Agent 全部映射为可追溯图谱。6.3 万浏览、203 收藏,社区对 Agent 可观测性的需求远超预期。
北京大学DCAI团队联合快手可灵等机构开源OpenWorldLib,一个统一、可扩展的世界模型推理框架,通过标准化接口打通交互式视频生成、3D场景重建、VLA具身控制与多模态推理,终结此前各任务接口割裂、重复开发的工程困境。
GitHub 开源 Spec-Kit 工具链,推行"先写规格,再写代码"的开发范式。通过 Specify → Plan → Tasks → Implement 四步流程,把模糊需求转化为结构化文档,让 Claude Code、Cursor、Copilot 等 AI 编程工具产出质量显著提升。
开源项目 CutClaw 实现了端到端的 AI Agent 视频剪辑:输入原始素材和音乐,Agent 会像编剧一样规划每一个剪辑点,自动完成素材筛选、节奏匹配和剪辑输出。
Qwen Code 是阿里通义团队开源的终端 AI 编程 Agent,24.1k 星、5649 次提交,支持多协议 API、SubAgent 并行、技能插件系统,提供类 Claude Code 体验且完全可自部署。
Skill Retrieval Augmentation(SRA)框架正式开源,附带包含 26,262 个技能、636 个黄金技能的 SRA-Bench 基准测试。它为 AI Agent 提供了一种高效的技能检索增强方法,让 Agent 在面对新任务时能快速找到最合适的已有技能。
ComposioHQ 维护的 awesome-codex-skills 仓库今日登顶 GitHub Trending,单日新增 1177 星。该仓库系统整理了 Codex CLI 和 API 的实用技能集合,反映出 Agent 技能生态正在成为开发者基础设施的新热点。
Andrej Karpathy 的 LLM 编码陷阱观察被封装成一个 CLAUDE.md 技能文件,GitHub 一周涨到 102K 星。本文解析它解决了什么问题、包含哪些核心规则,以及如何应用到你的工作流中。
AgentField 项目提出"AI Agent 的 Kubernetes"概念,提供完整的 Agent 控制平面。不是又一个 Agent 框架,而是解决规模化部署的核心基础设施。
微软亚洲研究院开源 Agent Lightning 框架,首次实现零侵入式强化学习优化——无需修改 Agent 内部代码,即可为任意 AI 智能体插上训练优化的翅膀。
4月29日英伟达发布 Nemotron 3 Nano Omni 开源全模态模型,深度优化 FP8 推理,兼容 RTX 5090 消费级显卡和 Jetson Thor 机器人平台,将 AI Agent 的部署门槛大幅降低。
Anthropic 将 Claude Code 从 $20 Pro 计划中移除后,社区迅速推出了开源替代品 OpenClaude——支持任意模型、无订阅限制、可在本地运行,正在成为开发者的新选择。
GitHub 热门项目 TradingAgents 发布 v0.2.4,新增结构化 Agent、检查点恢复、记忆日志等功能。该项目以多 Agent 协作方式实现金融交易决策,目前获 5.6 万 Star,日增 386 Star。
GitHub 新出现的 Mercury Agent 项目被社区视为 Hermes 和 OpenClaw 的终极结合升级版,针对本地 Agent 后台运行做出重大改进。四大核心机制解决权限失控、费用超支等痛点。
OpenClaw 发布 v2026.4.27 版本,核心亮点是集成 OpenAI Codex Computer Use 功能,让 AI Agent 可以直接控制用户桌面。同时升级了桌面控制体验、新增更多通讯渠道、整体启动速度优化。
阿里千问团队开源 Qwen-Scope,通过稀疏自编码器(SAE)为 Qwen3/3.5 系列模型提供内部"X 光"视角,将模型内部数字拆解为可读语义开关,推动大模型从黑盒走向透明。
Qwen 团队开源 FlashQLA,基于 TileLang 构建的高性能线性注意力核,实现 2-3 倍前向推理加速和 2 倍反向加速,专为个人设备上的 Agent AI 场景优化。
OpenAI 开源 Symphony,一个将 GitHub Issue 等任务追踪系统接入 Codex Agent 的编排框架,让每个 Issue 都能自动分配 Agent 处理,人类只需负责审查和方向把控。
free-claude-code 本周 GitHub Trending 第一,16,154 新增 Star,总 Star 达 18,791。该项目让开发者在终端、VS Code 甚至 Discord 中免费使用 Claude Code 能力,并支持语音交互。
Hermes Agent 推出 Curator(策展人)功能,每周自动合并重叠技能、清理过期条目、将细碎技能降级为模板,解决 Agent 技能库膨胀的核心痛点。
ComposioHQ 维护的 awesome-codex-skills 项目汇集了实用的 Codex 技能列表,覆盖跨 Codex CLI 和 API 的自动化工作流,日增 1,177 stars。
Craft.do 团队开源了 Craft Agents,将 Claude Agent SDK 与 Pi SDK 整合为统一的桌面 Agent 工作台,支持多会话收件箱、MCP 连接、多 LLM 提供商和远程服务器模式,Apache 2.0 许可。
ZhuLinsen/daily_stock_analysis 以 LLM 为核心引擎,聚合多源行情数据、新闻与舆情,每日自动生成 A/H/美股决策仪表盘并推送到企业微信、飞书、Telegram 等渠道,零服务器成本运行。
GitNexus 是一款完全在浏览器端运行的代码知识图谱生成器,拖入 GitHub 仓库即可生成交互式图谱并内置 Graph RAG Agent,33.4k stars。
TypeScript 开发者 mattpocock 将其 .claude 目录中的实用技能整理为开源项目,日增 7,280 stars,总量达 44.8k,为 Claude Code 用户提供真实工程场景的技能模板。
微软在 GitHub 开源 VibeVoice,集成语音识别、语音合成和语音克隆能力,提供 vLLM 推理插件和 Apple Silicon 支持,45.7k stars。
英伟达发布 Nemotron 3 Nano Omni 开源全模态模型,深度优化 Hopper/Blackwell 架构 FP8 推理,兼容 RTX 5090 消费级显卡,效率提升 9 倍,标志着 AI Agent 竞争转向效率维度。
OpenClaw 4.24 版本正式发布,将 DeepSeek V4 Flash 设为新用户默认模型,实时语音通话全面打通并可调用完整 Agent 能力,浏览器自动化新增像素级点击。这一更新同时降低了使用成本并扩展了交互方式。
Rust 编写的 Warp 终端作为 Agentic 开发环境在 GitHub Trending 榜首爆发,日增 12,822 stars,总量达 44.2k,标志着终端从命令执行器向 AI 协作平台的转变。
ComposioHQ/awesome-codex-skills 以 4700 星标和日增 1180 星的热度,整理了 Codex CLI 和 API 的实战技能集合,覆盖 DevOps、测试、代码审查、安全等场景,是 AI 编程自动化的实用参考库。
PurpleAILAB/Decepticon 是一个开源的多 Agent 自主红队测试平台,模拟 AI 黑客执行从侦察到权限提升的完整 Kill Chain,在 Kali 沙箱中自动化渗透测试,为 AI 系统安全评估提供新工具。
The Agency 项目在两周内突破 50K GitHub 星标,提供 147 个专业 AI Agent 覆盖 12 个部门,从工程到营销、从 QA 到空间计算,将 AI Agent 从单点工具升级为完整的组织架构。
jcode 是一个用 Rust 编写的 Coding Agent Harness,以 2811 次提交和活跃的社区快速迭代,定位为 Claude Code 和 Codex 之间的统一调度层,支持技能插件和自开发能力。
obra/superpowers 以 173K 星标成为 GitHub 最热的 AI 编程项目,提供跨 Claude Code、Codex、Cursor、Copilot 的统一 Skills 框架和方法论,正在定义 AI 编程工具的能力扩展标准。
Anything Analyzer 是一个 TypeScript 协议分析工具,集成浏览器抓包、MITM 代理、指纹伪装和 AI 分析能力,并通过 MCP Server 直接对接 AI Agent/IDE,4 月中旬上线后已获 2,055 颗 Star。
FalkorDB 发布 GraphRAG SDK 1.0,在自研 GraphRAG-Bench 评测中对 8 个系统排名第一。相比向量检索,图结构 RAG 在多跳推理和成本可控性上展现出明显优势。
Higgsfield 发布 MCP 服务器,将 Seedance 2.0、GPT Image 2.0 等顶级多模态模型接入 AI Agent 工作流,支持 OpenClaw、Hermes Agent 等框架,实现内容生成的端到端自动化。
月之暗面(Moonshot AI)开源 Kimi K2.6,1T 参数 MoE 架构,256K 上下文窗口,在 LiveBench 和 Terminal-Bench 上接近 GPT-5.4 与 Opus 4.7 水平,成本仅为后者的约六分之一。
Graphify 上线一周获得 37,989 颗 GitHub Star,支持将代码、文档、论文等任意文件夹转换为可查询的知识图谱,并作为技能直接接入 Claude Code、Cursor、Codex 等 AI 编码助手。
KellerJordan 发起的 Modded-NanoGPT 是一个社区协作的 LLM 训练速度挑战项目,通过集成旋转嵌入、Muon 优化器、FP8 矩阵乘法等数十项技术,将 GPT-2 级模型的训练时间从 45 分钟压缩到 90 秒。
Upstash 开源的 Context7 为 LLM 和 AI 代码编辑器提供实时更新的代码文档,解决训练数据过期导致的幻觉 API 和过时示例问题。5.4 万星标,MIT 许可,可通过 MCP 一键接入。
微软开源 Playwright MCP 服务器,将 Playwright 浏览器自动化能力通过 Model Context Protocol 暴露给 AI Agent。基于可访问性树而非截图,无需视觉模型即可操作网页。3.2 万星标,Apache-2.0 许可。
Fission AI 开源的 OpenSpec 为 AI 编程助手引入轻量级规范层,通过 proposal/specs/design/tasks 四层工件让开发者和 AI 在写代码前先对齐目标。4.4 万星标,支持 25+ 编码平台。
OpenClaw 发布 2026.4.26 版本,引入 Google Live Talk 实时语音交互、Ollama 本地模型集成全面重构、一键从 Claude Code 迁移配置、Matrix 端到端加密等功能。获得社区 1837 点赞、34 万次浏览。
AIDC-AI/Pixelle-Video 是一个开源 AI 全自动短视频引擎,支持从文本脚本到成片的一站式生成,涵盖数字人、图生视频和动作迁移。7600 星标,1200+ Fork,为短视频创作者提供了可本地部署的自动化方案。
mksglu/context-mode 开源了一个上下文窗口优化插件,通过沙盒化工具输出将 AI 编程 Agent 的上下文消耗降低 98%。11k 星标,支持 14 个编码平台,正在成为 Agent 开发者的标配工具。
trycua/cua 开源了 Computer-Use Agent 的完整基础设施,包含沙箱环境、SDK 和多平台基准测试,支持 macOS/Linux/Windows 桌面控制。15.1k 星标,3200+ 次提交,是构建桌面级 AI Agent 的基础设施层。
Zilliz 开源 claude-context,一个代码搜索 MCP 服务器,通过向量检索让整个代码库成为 Claude Code 等编程 Agent 的上下文。10.2k 星标,本周增长 3700+,为大型项目的 Agent 辅助编程提供了可扩展方案。
HuggingFace 发布 ml-intern,一个能自主阅读论文、设计实验、训练并发布 ML 模型的开源 AI 工程师。本周新增 6400+ 星标,标志着自动化机器学习进入 Agent 驱动新阶段。
本周 GitHub Trending 上多个 AI 项目值得关注:Matt Pocock 开源 3.9 万星技能库、Voice-Pro 整合语音克隆全栈、pentest-ai-agents 提供 28 个 Claude 渗透测试子 Agent。开发者工具生态持续升温。
Voice-Pro 将 ElevenLabs 和 Descript 的核心功能整合为一个开源工具,支持零样本语音克隆、Whisper 转录、100+ 语言配音,通过 Gradio WebUI 本地运行。X 上获 1,550 收藏,5.5 万浏览。
Euphony 是一个开源工具,可将 Codex 会话日志和聊天数据转换为可视化界面,支持翻译、筛选和编辑。X 上 4,336 赞、2,842 收藏,浏览量超 38 万,社区热度极高。
TypeScript 工具链作者 Matt Pocock 公开了他的 .claude 技能目录,包含大量面向真实工程场景的 AI 配置和指令集。发布当日狂揽 7,321 星,总星数突破 3.8 万,成为 GitHub Trending 榜首。
davila7/claude-code-templates 提供了一套 CLI 工具,用于快速配置、管理和监控 Claude Code 的运行环境。今日新增 346 星,总星数超 2.6 万,成为 Claude Code 生态中最受欢迎的第三方增强工具之一。
ds2api 是一个高性能全栈中间件,将 DeepSeek 客户端协议转换为通用 API 格式。支持多账号自动轮询、编译二进制、Vercel Serverless 和 Docker 部署,兼容 Google/Claude/OpenAI 等多种 API 格式。
ace-step-ui 为开源音乐生成模型 ACE-Step 1.5 提供了专业的 Web 界面。支持本地运行、无限生成、零费用,直接对标 Suno 等付费音乐 AI 服务。今日新增 162 星,社区热度持续攀升。
GitNexus 是一个完全在浏览器端运行的代码知识图谱生成器。拖入 GitHub 仓库或 ZIP 文件,自动生成交互式知识图谱并内置 Graph RAG Agent。无需服务器部署,今日新增 1,607 星,总星数超 3.2 万。
本月GitHub上涌现出多个优秀的AI开源项目,涵盖大模型微调、Agent开发、多模态应用等方向。
流行的AI应用开发框架LangChain发布v1.0版本,带来更稳定的API和全新的Agent系统。
微软开源 VibeVoice 语音 AI 模型家族,支持 60 分钟音频一次性转录(无需切片),内置说话人分离,覆盖 50+ 语言。GitHub 已达 44.7k 星,本地运行零成本。