Если вы инженер, скорее всего, вы ежедневно работаете с программным обеспечением CAD.
Создание детали — от эскиза до выдавливания, фаски и сверления отверстий — требует точных параметров на каждом этапе. Опытный инженер, возможно, потратил десять лет, чтобы в совершенстве освоить этот «язык».
А теперь проект под названием GenCAD заявляет: «Пришлите нам одно изображение — и мы вернём вам полностью редактируемую и пригодную для производства CAD-модель».
Это не то ИИ-рисование, которое вы себе представляете
Сначала уточним одну важную вещь: задача GenCAD принципиально отличается от генерации изображений ИИ-системами вроде Midjourney или DALL-E.
Такие ИИ-системы создают пиксельные изображения — их можно увидеть, но нельзя отправить на производство.
GenCAD же генерирует последовательность параметрических CAD-команд. Проще говоря, он предоставляет не просто «внешний вид» 3D-модели, а её полную историю проектирования — от первого эскиза до последней операции.
Что это значит?
Это значит, что вы можете открыть такую модель в профессиональных CAD-программах — SolidWorks, Fusion 360 — изменить любой параметр, скорректировать любые размеры и сразу отправить файл на станок с ЧПУ для обработки.
Вот это и есть настоящая генерация на уровне инженерного проектирования.
Технический разбор: четыре этапа
Архитектура GenCAD продумана чрезвычайно тщательно и состоит из четырёх ключевых этапов:
Первый этап: автокодирующий трансформер с автогрессивной архитектурой обучается выявлять скрытые представления последовательностей CAD-команд. Проще говоря, ИИ учится понимать «грамматику» CAD-команд — что математически означают такие операции, как выдавливание, вращение или фаска.
Второй этап: модель контрастного обучения (contrastive learning) выравнивает скрытые пространства CAD-команд и CAD-изображений. Этот этап формирует мост между «изображением» и «последовательностью команд проектирования».
Третий этап: модель диффузии в скрытом пространстве (latent diffusion model) генерирует соответствующее скрытое представление CAD-команд на основе входного CAD-изображения.
Четвёртый этап: декодер преобразует эти скрытые представления в реальные параметрические CAD-команды.
Ключевая техническая сложность всего процесса заключается в исключительной сложности структур данных CAD — особенно в представлении границ (B-rep, boundary representation). Многие предыдущие исследования шли по пути упрощения: вместо B-rep использовались полигональные сетки, воксели или облака точек. Однако такие подходы жертвуют точностью и редактируемостью — а значит, неприменимы в реальных инженерных задачах.
GenCAD выбрал более трудный, но и более правильный путь.
Почему этот проект попал в топ Hacker News
На Hacker News GenCAD набрал 320 баллов и вызвал 79 комментариев. Для академического исследовательского проекта это чрезвычайно высокий уровень внимания.
Обсуждения в комментариях сосредоточились на нескольких ключевых направлениях:
- Потенциал радикальной трансформации промышленности. Если инженеру достаточно нарисовать один эскиз, а ИИ сам сгенерирует полноценную CAD-модель, скорость итераций при проектировании изделий может возрасти в десятки раз.
- Влияние на 3D-печать и обработку на станках с ЧПУ. Редактируемые CAD-модели позволяют напрямую переходить к производству, минуя промежуточный этап — преобразование данных 3D-сканирования в CAD-модель.
- Демонстрационный эффект для направления «ИИ в инженерии». GenCAD доказывает, что ИИ способен генерировать не просто «визуально корректные» объекты, а действительно «рабочие» решения — в инженерной сфере это принципиальное качественное различие.
Реальные ограничения
Разумеется, GenCAD пока ещё далек от коммерческого внедрения.
На сегодняшний день он в основном справляется с относительно простыми геометрическими формами. Его возможности остаются ограниченными при работе со сложными сборками, изделиями из нескольких материалов или с требованиями к поверхностной обработке.
Однако темпы технологического развития зачастую превосходят наши ожидания. Два года назад ИИ-инструменты генерации кода умели писать лишь простые функции; сегодня они уже участвуют в разработке сложных программных систем.
Если GenCAD будет развиваться по аналогичному сценарию, то через 3–5 лет методы работы конструкторов CAD могут претерпеть фундаментальные изменения.
Их не заменят — их усилят. Конструкторы будут сосредотачиваться на творческой составляющей и определении функциональных требований, а ИИ будет автоматически переводить концепции в исполнимые инженерные документы.
Вот каким, вероятно, должно быть лучшее применение ИИ: не замена человека, а расширение его возможностей — чтобы человек мог сосредоточиться именно на том, что у него получается лучше всего.