C
ChaoBro

AI研究

跟进论文、基准、数据集与实验方法中的关键进展

研究

TideGS:单卡 24GB 显存训练超 10 亿 3D Gaussian,ICML 2026 Spotlight

TideGS 通过 SSD-CPU-GPU 层级存储管理,在单张 24GB GPU 上实现了超过 10 亿高斯原语的 3DGS 训练,是此前 out-of-core 基线(约 1 亿)的 10 倍、内存内训练(约 1100 万)的约 100 倍。论文被 ICML 2026 接收为 Spotlight。

#TideGS #3D Gaussian Splatting #Out-of-Core
研究

CogOmniControl:把"创意意图理解"做成视频生成的推理引擎

CogOmniControl 提出推理驱动的可控视频生成框架,将生成过程拆分为创意意图认知和生成两步。在专业动漫制作数据上训练的 CogVLM 能准确理解稀疏抽象条件,配合 CogOmniDiT 和 RL 对齐,在两个自建基准上超越现有开源模型。

#CogOmniControl #视频生成 #可控生成
研究

让LLM自己做流行病预测:哈佛团队用自主树搜索预测多病原体疾病

哈佛大学与麻省总医院团队合作,提出了一种基于自主LLM引导树搜索的多病原体疾病预测方法。LLM不再只是对话工具,而是化身为自主的搜索Agent,在复杂的假设空间中探索最优的预测模型。这项工作展示了LLM在科学建模中的新角色。

#AI for Science #疾病预测 #自主搜索
研究

Mental Health AI 安全评估的盲区:单轮评分为什么无法检测渐进式伤害

最新 arXiv 论文指出,当前心理健康 AI 的安全评估存在根本性缺陷——它们评估的是孤立回复或最终结果,而临床上最危险的伤害往往来自交互序列中的累积效应:逐渐升级的依赖、反复强化的负面模式、跨轮次的缓慢恶化。论文提出「时序安全不可识别性」理论框架和 SCOPE-MH 评估标准。

#AI 安全 #心理健康 #时序评估
研究

NVIDIA AnyFlow:视频扩散模型的一次「步数自由」实验,On-Policy 蒸馏能否终结推理步数焦虑

NVIDIA 最新发布的 AnyFlow 论文提出了一种「任意步数」视频扩散模型——同一个模型可以在 1 步到数十步之间自由切换,而不需要为每种步数单独训练。核心方法 On-Policy Flow Map Distillation 通过在训练中随机采样步数并自指导蒸馏,让模型学会在任何推理步数下都保持稳定的生成质量。

#视频生成 #扩散模型 #NVIDIA