百度文心5.1 Preview悄然上线Arena,全球排名第13,法律领域登顶
4月30日,百度文心5.1 Preview版本悄然上线LMSYS Chatbot Arena,以1476分的Elo成绩位列全球第13、国产大模型第一。法律与政府领域排名第1,商业管理第4。核心技术亮点:参数量压缩至5.0的1/3,训练成本仅同级模型6%。
每日筛选关键变化,保留值得继续看的内容。
4月30日,百度文心5.1 Preview版本悄然上线LMSYS Chatbot Arena,以1476分的Elo成绩位列全球第13、国产大模型第一。法律与政府领域排名第1,商业管理第4。核心技术亮点:参数量压缩至5.0的1/3,训练成本仅同级模型6%。
DeepSeek V4 原生兼容昇腾 950 处理器,叠加寒武纪 Q1 营收增长超 150%,美国出口管制正在从"阻碍"变成中国 AI 芯片厂商的"强制垄断加速器"。国产算力替代已跨过测试期进入全面部署阶段。
微软亚洲研究院开源 Agent Lightning 框架,首次实现零侵入式强化学习优化——无需修改 Agent 内部代码,即可为任意 AI 智能体插上训练优化的翅膀。
4月30日,百度文心5.1 Preview版本悄然上线LMSYS Chatbot Arena,以1476分的Elo成绩位列全球第13、国产大模型第一。法律与政府领域排名第1,商业管理第4。核心技术亮点:参数量压缩至5.0的1/3,训练成本仅同级模型6%。
DeepSeek V4 原生兼容昇腾 950 处理器,叠加寒武纪 Q1 营收增长超 150%,美国出口管制正在从"阻碍"变成中国 AI 芯片厂商的"强制垄断加速器"。国产算力替代已跨过测试期进入全面部署阶段。
AgentField 项目提出"AI Agent 的 Kubernetes"概念,提供完整的 Agent 控制平面。不是又一个 Agent 框架,而是解决规模化部署的核心基础设施。
微软亚洲研究院开源 Agent Lightning 框架,首次实现零侵入式强化学习优化——无需修改 Agent 内部代码,即可为任意 AI 智能体插上训练优化的翅膀。
DeepSeek最新估值超400亿美元,智谱GLM估值达500亿,MiniMax 300亿,月之暗面Kimi约200亿正筹备港股上市。中国AI大模型公司的资本版图正在重塑,估值体系全面对标硅谷。
4月29日英伟达发布 Nemotron 3 Nano Omni 开源全模态模型,深度优化 FP8 推理,兼容 RTX 5090 消费级显卡和 Jetson Thor 机器人平台,将 AI Agent 的部署门槛大幅降低。