如果你是个工程师,大概率每天都在和 CAD 软件打交道。
画一个零件,从草图到拉伸到倒角到打孔——每一步都需要精确的参数。一个成熟的工程师,可能花了十年才熟练掌握这套语言。
而现在,一个叫 GenCAD 的项目说:给我一张图,我还你一个可以编辑、可以制造的 CAD 模型。
这不是你印象中的 AI 画图
先搞清楚一件事:GenCAD 做的事情,和 Midjourney 或 DALL-E 生成图片完全不是一个维度。
那些 AI 生成的是一张像素图——你看得到,但你没法拿它去工厂加工。
GenCAD 生成的是参数化 CAD 命令序列。通俗点说,它不只是给你一个 3D 模型的"外观",它给了你这个模型从第一笔到最后一笔的完整设计历史。
这意味着什么?
意味着你可以在 SolidWorks、Fusion 360 这些专业 CAD 软件中打开它,修改每一个参数,调整每一个尺寸,然后直接送去 CNC 机床加工。
这才是真正的工程设计级别的 AI 生成。
技术拆解:四步走
GenCAD 的架构设计相当精巧,分四个关键步骤:
第一步,用一个自回归 Transformer 编码器学习 CAD 命令序列的潜在表示。简单说,就是让 AI 理解 CAD 命令的"语法"——拉伸、旋转、倒角这些操作在数学上意味着什么。
第二步,用对比学习模型把 CAD 命令序列和 CAD 图像的潜在空间对齐。这一步让 AI 建立起"图片"和"设计命令"之间的桥梁。
第三步,用一个潜在扩散模型,根据输入的 CAD 图片生成对应的 CAD 命令潜在表示。
第四步,解码器把这些潜在表示转换成实际的参数化 CAD 命令序列。
整个流程的核心难点,在于 CAD 数据结构(尤其是边界表示 B-rep)极其复杂。很多之前的研究退而求其次,用网格、体素或点云来替代——但这些表示方式牺牲了精度和可编辑性,无法用于真正的工程任务。
GenCAD 选择了一条更难的路,但也更正确的路。
为什么这件事值得上 HN 热榜
在 Hacker News 上,GenCAD 拿到了 320 分、79 条评论。对于一个学术论文项目来说,这是非常高的关注度。
评论区的讨论集中在几个方向:
- 对制造业的颠覆潜力。如果工程师只需要画一张草图,AI 就能生成完整的 CAD 模型,那产品设计的迭代速度可能会提高一个数量级。
- 对 3D 打印和 CNC 加工的影响。可编辑的 CAD 模型意味着可以直接进入制造流程,省去了从 3D 扫描到 CAD 建模的中间环节。
- 对 AI for Engineering 方向的示范效应。GenCAD 证明了 AI 不仅可以生成"看起来对"的东西,还可以生成"能用"的东西——这在工程领域是质的区别。
现实的局限
当然,GenCAD 离真正的产品化还有距离。
目前它主要处理的是相对简单的几何形状。对于高度复杂的装配件、包含多种材料和表面处理要求的产品,它的能力仍然有限。
但技术演进的速度往往超出预期。两年前的 AI 代码生成工具也只能写简单的函数,现在它们已经在参与复杂系统的开发了。
如果 GenCAD 沿着同样的轨迹发展,那 3 到 5 年后,CAD 设计师的工作方式可能会发生根本性的变化。
不是被取代,而是被赋能。设计师把精力放在创意和功能定义上,AI 负责把概念变成可执行的工程文件。
这大概就是 AI 最好的样子——不是替代人类,而是让人类专注于人类擅长的事情。