OpenAI tvrdi da njihov GPT-4o model može komunicirati kao stvarna osoba

OpenAI tvrdi da njihov GPT-4o model može komunicirati kao stvarna osoba

OpenAI je u ponedjeljak najavio GPT-4o, potpuno novi model umjetne inteligencije koji tvrtka tvrdi da je korak bliže "mnogo prirodnijoj interakciji čovjeka i računala." Novi model prihvaća bilo koju kombinaciju teksta, zvuka i slika kao ulaz i može generirati izlaz u sva tri formata. Također je sposoban prepoznati emocije, dopušta vam da ga prekinete usred govora i gotovo odmah reagira tijekom razgovora, poput ljudskog bića.

"Posebna stvar kod GPT-4o je što donosi inteligenciju razine GPT-4 svima, uključujući naše besplatne korisnike," rekla je Mira Murati, glavna tehnološka direktorica OpenAI-a, tijekom prezentacije uživo. "Ovo je prvi put da napredujemo velikim korakom kada je u pitanju jednostavnost korištenja."

Tijekom prezentacije, OpenAI je demonstrirao GPT-4o uživo prevodeći između engleskog i talijanskog jezika, pomažući istraživaču u rješavanju linearnih jednadžbi u stvarnom vremenu na papiru te pružajući upute o dubokom disanju drugom izvršnom direktoru OpenAI-a samo slušajući njegovo disanje.

Slovo 'o' u GPT-4o označava 'omni', što je referenca na multimodalne sposobnosti modela. OpenAI je rekao da je GPT-4o treniran na području teksta, vizualnog sadržaja i zvuka, što znači da su svi ulazi i izlazi obrađeni istom neuronskom mrežom. Ovo je drugačije od prethodnih modela tvrtke, GPT-3.5 i GPT-4, koji su korisnicima omogućavali postavljanje pitanja jednostavnim govorom, ali su zatim taj govor prenosili u tekst. To je uklanjalo ton i emocije te usporavalo interakcije.

OpenAI novi model čini dostupnim svima, uključujući besplatne korisnike ChatGPT-a, tijekom sljedećih nekoliko tjedana te također objavljuje desktop verziju ChatGPT-a, prvo za Mac, koju će plaćeni korisnici imati pristup od danas.

Najava OpenAI-a dolazi dan prije Google I/O, godišnje konferencije za razvojne programere tvrtke. Nedugo nakon što je OpenAI otkrio GPT-4o, Google je najavio verziju svog AI chatbota Gemini s sličnim mogućnostima.

Vezani sadržaj:

  • VIDI AI kuharica - Pregled AI alata

    Pregled AI alata

    Popis AI alata po kategorijama namjene.

  • VIDI AI kuharica - Uvoz i pristup podacima u LLM sustavima

    Prikupljanje, priprema i korištenje podataka

    Što ako imate svoju vlastitu kolekciju podataka koju biste htjeli učiniti dostupnom drugim osobama korištenjem LLM (Large Language Model) sustava? Na primjer, veliku količinu podataka o vlastitom znanstvenom istraživanju, ili novootkrivenoj arheološkoj lokaciji.

  • VIDI AI kuharica - Savjeti za učinkovitiji prompt

    Prompt Engineering - ključna nova vještina

    Umjetna inteligencija mijenja način na koji pojedinci i poslovne organizacije funkcioniraju, a s tim promjenama nastaju i potpuno nove profesionalne vještine. Jedna od najbrže rastućih i najtraženijih vještina u 2025. godini postala je prompt engineering – disciplina koja spaja tehničko razumijevanje AI modela s kreativnim pristupom oblikovanju instrukcija. Kako biste maksimalno iskoristili AI potencijal, poželjno je naučiti pismeno se izražavati, ali s doista konkretnim i detaljnim uputama.

  • VIDI AI kuharica - LLM: Vlastito znanje dostupno svima

    LLM - Najveći knjiški moljac

    Pročitao je stotine milijardi „knjiga“ i nesebično prenosi znanje.

  • VIDI AI kuharica

    Postoje li recepti za AI kuhinju?

    Početna prašina oko generativnog AI se donekle slegla i još nas većinom nije zamijenila umjetna inteligencija. No, i dalje je i sve više oko nas, a ti se alati s predznakom AI-a s malo znanja mogu iskoristiti kao nadogradnja vaših poslovnih ili privatnih alata. Zaronili smo u vrlo napućen svijet AI alata i izronili s našom kuharicom u kojoj možete naći gotove recepte ili samo sastojke s kojima uz malo truda vi možete stvoriti svoj recept.

Newsletter prijava


Kako izgleda naš posljednji newsletter pogledajte na ovom linku.

Copyright © by: VIDI-TO d.o.o. Sva prava pridržana.