ChatGPT V4 ја надминува лентата, SAT и може да идентификува експлоатирања во договорите за ETH

GPT-4, најновата верзија на четботот за вештачка интелигенција (AI), ChatGPT, може да ги положи средношколските тестови и испитите на правниот факултет со бодови рангирани во 90-тиот перцентил и има нови способности за обработка кои не беа можни со претходната верзија.

Бројките од резултатите од тестовите на GPT-4 беа споделени на 14 март од неговиот креатор OpenAI, откривајќи дека исто така може да конвертира слики, аудио и видео влезови во текст, како и покреативно и посигурно да ракува со „многу понијансирани инструкции“.

„Положува симулиран правосуден испит со резултат околу првите 10% од оние кои полагаат тестови“, додаде OpenAI. „Спротивно на тоа, резултатот на GPT-3.5 беше околу долниот 10%.

Бројките покажуваат дека GPT-4 постигнал оценка од 163 во 88-от перцентил на испитот LSAT - тест студентите треба да го положат во Соединетите Држави за да бидат примени на правниот факултет.

Резултати од испитите на GPT-4 и GPT-3.5 на низа неодамнешни испити во САД. Извор: OpenAI

Резултатот на GPT4 би го ставил во добра позиција да биде примен во најдобрите 20 правни факултети и е само неколку оценки помалку од пријавените оценки потребни за прифаќање во престижни училишта како што се Харвард, Стенфорд, Принстон или Јеил.

Претходната верзија на ChatGPT постигна само 149 поени на LSAT, ставајќи го на дното 40%.

GPT-4, исто така, освои 298 од 400 на униформниот правосуден испит - тест што го направија неодамна дипломирани студенти по право што им дозволува да практикуваат адвокат во која било јурисдикција на САД.

Резултатите од UBE треба да бидат примени за да се практикуваат право во секоја јурисдикција на САД. Извор: Национална конференција на правници

Старата верзија на ChatGPT се мачеше на овој тест, завршувајќи на дното 10% со резултат 213 од 400.

Што се однесува до испитите за читање и пишување врз основа на докази SAT и SAT математика што ги полагаат средношколците во САД за да ја измерат нивната подготвеност за факултет, GPT-4 постигна резултати во 93-от и 89-от перцентил соодветно.

GPT-4 се истакна и во „тешките“ науки, објавувајќи многу над просечните перцентилни резултати во АП биологија (85-100%), хемија (71-88%) и физика 2 (66-84%).

Резултати од испитите на GPT-4 и GPT-3.5 на низа неодамнешни испити во САД. Извор: OpenAI.

Сепак, неговиот резултат од AP Calculus беше прилично просечен, рангирајќи се од 43 до 59 перцентил.

Друга област каде што недостасуваше GPT-4 беше испитите по англиска литература, објавувајќи резултати од 8-ми до 44-от перцентил на два одделни теста.

OpenAI рече дека GPT-4 и GPT-3.5 ги полагале овие тестови од практичните испити 2022-2023 година и дека „нема специфична обука“ од алатките за обработка на јазици:

„Не направивме посебна обука за овие испити. Малцинство од проблемите на испитите беа видени од моделот за време на обуката, но веруваме дека резултатите се репрезентативни.

Резултатите предизвикаа страв и во заедницата на Твитер.

Поврзани со: Како ChatGPT ќе влијае на просторот Web3? Одговори индустријата

Ник Алмонд, основачот на FactoryDAO изјави неговите 14,300 следбеници на Твитер на 14 март дека GPT4 ќе ги „плаши луѓето“ и дека ќе го „урне“ глобалниот образовен систем.

Поранешниот директор на Coinbase, Конор Гроган, рече дека вметнал жив паметен договор за Ethereum во GPT-4 и веднаш укажал на неколку „безбедносни пропусти“ и навел како може да се експлоатира кодот:

Претходните контроли на паметните договори на ChatGPT открија дека неговата прва верзија исто така може да ги открие грешките во кодот до разумен степен.

Роуан Чеунг, основачот на билтенот за вештачка интелигенција „The Rundown“ сподели видео од GPT како рачно нацртана лажна веб-страница на парче хартија во код.