Системот за вештачка интелигенција од следната генерација ветува невидена приспособливост

Напојувајќи го едношалтерското деловно решение како AI21 додека ги надминува сите познати светски модели во однос на продуктивноста, Jambo станува првиот модел достапен на метод базиран на Mamba од производна класа. Со интеграцијата на Mamba SSM технологијата и елементите на старата архитектура на Transformer, Jamba се залага за нова визија во дизајнирањето на поголемиот јазичен модел (LLM).

Револуционизирање на LLM

Изгледот на Џамба укажува на промена на ерата во случајот со LLM, кои ефикасно се справуваат со ограничувањата на редовните SSM и типовите на архитектури Transformers. Вклучувајќи се во контекст на големината на прозорецот до 256K, Jamba се смета дека има голема предност во однос на другите модели во слични региони на различни одредници, со што ја поставува новата лента како мерка за најдобра ефикасност и перформанси.

Архитектурата на Џамба има многу аспекти кои ја поставуваат како хибриден систем од трансформатори, Мамбас и мешавина од експерти (МО) кои дејствуваат заедно во синергија. Оваа интеграција имплементира оптимизација за искористување на меморијата заедно со пропусната моќ, што е главниот фокус на јазичната задача од големи размери и ја поместува границата на перформансите што може да се достигнат.

Да се ​​биде скалабилен е ДНК на Jamba, што значи дека може да се справи со преку 140K контексти користејќи само еден графички процесор. Оваа приспособливост може да ги задржи операциите и вклучувањето на рака, помагајќи да се научи и истражува, да се генерира ново знаење и да се поттикнуваат иновациите во заедницата за вештачка интелигенција.

Пресвртнички достигнувања

Воведувањето на Jamba означува не само феномен што ја менува играта, туку и пионерски чекор напред во областа на истражувањето за LLM. Прво, успешно ги спојува архитектурата Mamba и Transformer на таков начин што тие двајцата работат заедно како симбиоти, чија комбинација се покажува навистина помоќна од поединечните половини. Згора на тоа, текстот воведува хибридна верзија SSM-Transformer која ги комбинира моќта и брзината на другите постоечки SSM-трансформатори со способноста за подобро работење во нови контексти.

Меѓутоа, Даган, потпретседател на производот на AI21, изрази неверојатно и ја задржа мешаната архитектура на Џамба во преден план. Тој објасни како агилноста на Џамба овозможува брза испорака на случаи за употреба со огромни количини и ја поддржува брзината во реално време, дури и го забрзува лансирањето на случаи за критична употреба.

Соработка со отворен код

Објавувањето на отворени тежини на Jamba со лиценца Apache 2.0 имплицира дека AI21 може да спроведе ваков вид на провизија во заедницата со отворен код. AI21 е посветен на обезбедување на средина каде што може да се поттикнат нови достигнувања преку охрабрување на понатамошни придонеси и идеи.

Капсулирањето на гасоводот NVIDIA GPU како микросервис за заклучоци на NIM ја поедноставува пристапноста на Jamba што ги напојува претпријатијата апликации. Хуманизација: интеграцијата без триење овозможува брзо и без проблеми распоредување додека се надградуваат апликациите на Jampa во практично сите дневни сценарија.

Објавувањето на Jamba од AI21 означи важна пресвртница во полето на корпоративната вештачка интелигенција. Џамба е подготвен да ја трансформира индустријата за јазични модели нудејќи иновативна хибридна архитектура, неспоредлива приспособливост и исклучителни карактеристики за интеграција на модели. Затоа, ги опремува клиентите да ги извршуваат своите предизвикувачки јазични задачи лесно и побрзо отколку што беше можно претходно.

AI21, исто така, ја покажа својата поддршка за соработка со отворен код и деловни партнерства со водечки компании за вештачка интелигенција како NVIDIA, што дополнително ја демонстрира својата посветеност да го движи темпото на технолошкиот напредок и да го зголеми усвојувањето на високоефикасни решенија за вештачка интелигенција во различни области.

Сепак, Џамба се грижи за своето место во поширокиот пејзаж на вештачката интелигенција, бидејќи се однесува на обработката на јазикот; на тој начин, влијанието ќе се почувствува многу надвор од опсегот на традиционалните платформи за обработка на јазици за да се воведе нов ред на деловни решенија напојувани со вештачка интелигенција.

Извор: https://www.cryptopolitan.com/next-generation-ai-system-promises/