Што значи новиот Text-to-3D на Nvidia за инженерство и дизајн на производи

tl; dr: Генеративната вештачка интелигенција се развива со возбудливо темпо. Најновиот алгоритам на Nvidia го претвора текстот во 3D мрежа двапати побрзо од проектите објавени пред едвај 2 месеци. Ова значи дека техничките можности сега веќе ја надминуваат нашата способност да работиме со нив.

Минатата недела хартија од страна на научниците на Nvidia ја демонстрираа експоненцијалната брзина со која се развива генеративниот простор со вештачка интелигенција. Оваа експлозија на активност - особено видлива во последните 9 месеци - ќе има влијание на секој дел од животот, не само на дизајнот на производите, инженерството и производството. Промените ќе ја откачат индустријата од структурните ограничувања во начинот на кој се комуницираат идеите, ќе ги зајакнат побрзите циклуси на иновации и на крајот ќе и овозможат да ги исполни своите ветувања за одржливост.

Откако со години им беше кажано дека вештачката интелигенција суштински ќе го револуционизира начинот на кој работиме, малкумина очекуваа креативниот сектор да биде меѓу првите жртви. Појавата на генератор на текст сличен на човекот на GPT-3 во 2020 година ги донесе можностите во поостар фокус. Оттогаш беше диво возење: DALL-E (текст во слика), Whisper (препознавање говор) и неодамна Стабилна дифузија (текст во слика) не само што ги зголемија можностите на говорните и визуелните алатки за вештачка интелигенција, туку и ги намали ресурсите потребни за нивно користење (од 175 милијарди параметри за GPT-3 на 900 милиони за стабилна дифузија).

Големината на стабилна дифузија значи помалку од 5 GB простор на дискот – што може да се работи на кој било лаптоп. Не само тоа; за разлика од OpenAI (кој главно е финансиран од Мајкрософт и објавува GPT-3, DALL-E и Whisper), Стабилната дифузија е со отворен код, што значи дека другите можат многу полесно да ги надоградуваат неговите учења. Тоа значи дека го гледаме само почетокот на иновативниот циклус - претстои уште многу, како што сега покажува трудот на Nvidia.

Поддржувачите на Stable Diffusion (стабилност.ai) дополнително го турбополнат овој тренд со обезбедување технолошки и финансиски грантови за други тимови кои го водат истражувањето во нови насоки. Дополнително, мноштво проекти ги ставаат алатките достапни за сè поширок опсег на корисници. Меѓу нив се приклучоците за Blender, алатка за дизајн со отворен код и еквивалент на Adobe за Photoshop. Целосниот API пристап до алатките се финансира со големи долари за вложен капитал, што значи дека стотици милиони развивачи на софтвер, не само неколку стотици илјади инженери за податоци, сега ќе создаваат свои алатки на овие алгоритми.

Говорот, сликите и текстот се меѓу првите вертикали што се нарушени од овие технологии. Но, 3D не е далеку зад себе. Надвор од нишата генеративна уметност, цртаните филмови се очигледна прва точка на примена. Веќе постои генератор на Покемон базиран на Стабилна дифузија. Следни се Визуелните ефекти и филмовите. Но, многу други сектори веројатно ќе бидат нарушени - меѓу нив и дизајнот на ентериерот, а во цената го води Interiorai.com.

Во целата оваа возбуда, примената на иновациите во Дизајн и инженерство се чувствува како последователна мисла. Сепак, најверојатно тоа е областа на која на крајот ќе биде најзначајно погодено. Се разбира, има првични предизвици: Прво, Стабилна дифузија и неговите сонародници сè уште не се многу прецизни. Тоа не е проблем за цртаните филмови, но е голем предизвик за секој обид да се трансформира текстот во целосни 3Д геометрии што се користат во индустриски контексти. Тоа е област што имаше одреден зародиш интерес (проект наречен Bits101 беше лансиран во Израел во 2015 година). Можеби ова е светиот грал на индустријата, но има многу средни предизвици кои може многу полесно да се решат. Тие вклучуваат подобрено препознавање на објекти (алгоритмот Yolo веќе се користи со голем ефект), што ќе доведе до подобрени цитати и прибелешки - подобрување на квалитетот и намалување на грешките. Приклучоците, исто така, треба да го олеснат користењето Generative AI за развој на основни дизајни (Primitives), кои потоа може дополнително да се уредуваат во алатките за дизајн за да се подобри толеранцијата според барањето. Тоа е пристап кој веќе се користи во Inspire на Altair, кој користеше анализа на конечни елементи за да го стори истото. Овие примитиви можат да послужат и како синтетичка база на податоци за означени модели, од кои има недостаток во индустријата за 3D CAD. Извршен директор и основач на Physna го истакнува ова во една статија детализирање на нивните сопствени обиди да ги користат овие нови методи за креирање детални 3D дизајни, што исто така нагласува голем број замки во користењето синтетички податоци за да се поттикнат овие алгоритми Креирањето 3D дизајни од 2D цртежи е уште една потенцијална област на апликација, како и интелигентната CAM - хранење од библиотека на абење на алатот за да се одредат најдобрите стратегии за обработка.

Овие предизвици се важни и профитабилни за решавање сами и за себе. Сепак, нивното главно влијание ќе биде да помогнат во еволуцијата на патеката од идеја до дизајн со на крајот да се намали зависноста од 3D дизајни за да се пренесе намерата. Дизајните, без разлика дали се 2D или 3D, служеа како основно средство за преведување на потребите на клиентите на финални производи. Тоа ја ограничува индустријата бидејќи овие дизајни служат како црна кутија во која се складирани сите оние вредни увиди на клиентите, производствените ограничувања и целите на компанијата, кои не можат да се раздвојат, а сепак сами да се идентификуваат. Ова значи дека кога нешто се менува, речиси е невозможно едноставно да се прилагоди дизајнот. Ова е причината зошто на иновациите во производството, како што е 3D печатењето, им треба толку долго време за да се усвојат и постојано да ги разочаруваат краткорочните инвеститори. Компонентите што го сочинуваат авионот се „поставени“ од моментот кога се дизајнирани, и покрај 20-годишниот продуктивен животен век. Речиси нема опсег на иновации - тие мора да го чекаат лансирањето на следната генерација.

Способноста да промените едно ограничување и да дозволите алгоритам како што е Стабилна дифузија да ги реконституира параметрите за дизајн и производство значително ќе го забрза усвојувањето на новите иновации и ќе ни овозможи побрзо да создаваме полесни производи со подобри перформанси. Како што прават во Формула 1 или Дизајн на системи, идните инженери ќе дејствуваат како менаџери со ограничувања кои ќе можат да изразат со зборови и повикувајќи се на извори на податоци кои се целта и ограничувањата на производот.

Без да го забрзаме инженерскиот процес за нови и постоечки производи на овој начин, немаме речиси никакви средства за постигнување на амбициозните цели за одржливост што мора да ги поставиме самите себе. За да го направите ова, прво мора да се договориме за јазик што можеме да го користиме за да комуницираме надвор од дизајните. Овој нов семантички модел е очигледната празнина во иновациите наведени погоре. Голем број компании веќе почнаа да експериментираат со него, како на пр nТопологија со нејзините концепти на Полиња. А сепак, темпото на промена е бавно, за разлика од алгоритмите што ќе ги потхранува семантичкиот модел. Новиот алгоритам на Nvidia наводно е двојно побрз од DreamFusion, објавен пред помалку од 2 месеци. Компаниите за производи и инженеринг сега треба да работат на доловување на нивните идеи на нови начини доказ за иднината, со цел да ги искористат максимално можностите што ги носи оваа експлозија на генеративна вештачка интелигенција. Брзината на промена во алгоритмите покажа, уште еднаш, дека Морзеовиот закон се применува насекаде кога алатките се дигитализираат. Предизвикот останува нашата човечка неспособност да ја прифатиме оваа промена и да употребиме нови комуникациски методи способни да го отклучат нивниот потенцијал, и покрај итноста на задачата.

Извор: https://www.forbes.com/sites/andrewegner/2022/11/24/what-nvidias-new-text-to-3d-means-for-engineering–product-design/