Drugim riječima, pokušat ćemo vam približiti odgovor na pitanje - kako razgovarati s umjetnom inteligencijom? Pa, kao s pametnim kolegom koji zna odraditi posao – pisati članke, raditi izvještaje, tablice, pa čak i kodirati! Ne! Upravo suprotno, kao s kolegom koji zna sve nabrojano, ali ne može vam čitati misli i razumjeti što očekujete od njega. Sve mu treba „tri puta nacrtati“, kao da ste dobili šegrta koji tek treba izučiti zanat. Prednost nas ljudi u odnosu na AI je upravo ta mogućnost da već unaprijed znamo što se od nas očekuje kada nam nadređeni zada novi zadatak. Iako nam to nitko izričito nije rekao, vidjeli smo od ostatka kolega kako oni odrade neki specifičan zadatak, te instinktivno pokušamo ponoviti istu stvar.
Adaptivni promptovi
Razvijaju se AI modeli koji mogu prilagoditi svoje odgovore na osnovu korisničkog stila unosa i preferencija. Ova tehnologija omogućit će personalizirane AI interakcije bez potrebe za eksplicitnim instrukcijama.
No-code platforme
Jedan od nastajućih trendova jest usvajanje no-code platformi koje omogućavaju ne-tehničkim korisnicima stvaranje sofisticiranih promptova pomoću drag-and-drop sučelja. Ove platforme približavaju pristup naprednim AI mogućnostima korisnicima koji su manje tehnički orijentirani te su vrlo popularni među školarcima ili drugim korisnicima koji žele naučiti programirati, a uvijek ih je toga bilo strah čim su vidjeli silne znakove koje nisu razumjeli na prvi pogled.
Multimodalni AI modeli
Budućnost prompt engineeringa uključuje rad s multimodalnim AI modelima koji mogu procesirati tekst, slike, audio i video istovremeno. To otvara nova područja za kreativne i praktične primjene. Primjer ovoga isprobajte tako da pokušate savladati korištenje neke aplikacije koju do sada niste nikada koristili. Recimo, instalirajte i pokrenite Blender za 3D modeliranje. Zatim pokrenite Googleov AI Studio s linka: https://aistudio.google.com/live. Kliknite na ikonicu Stream. Dobit ćete gumb „Share Screen“ kojim svoj trenutni ekran računala dijelite s multimodalnim LLM modelom Gemini.
Sada ga možete upitati kako kreirati 3D objekt – za početak, možda da krenete od jednostavnijih oblika, pa nastavite s kompliciranijima. Svakako istu stvar možete isprobati s aplikacijom Excel ili nekom trećom. Sesija je ograničena na 10 minuta, a nakon toga možete krenuti s novom sesijom.
Google AI studio Share Screen opcija, među ostalim, može pomoći pri upoznavanju rada s vama novim aplikacijama
Ključni elementi efikasnog prompt engineeringa
Stvaranje učinkovitih promptova zahtijeva razumijevanje temeljnih načela koja omogućavaju AI modelima da daju točne i relevantne odgovore. Stručnjaci su identificirali šest ključnih elemenata koji čine osnovu uspješnog prompt engineeringa.
Što zapravo znači „dobar prompt“?
Najčešća greška koju korisnici čine je postavljanje previše općenitih pitanja. Umjesto općenitog „Napiši mi članak o prednostima rada od kuće“, efikasniji pristup zahtijeva preciznu specifikaciju: „Napiši članak od 800 riječi o prednostima rada od kuće za IT profesionalce. Uključi tri konkretna primjera (veću produktivnost, bolju ravnotežu privatnog i poslovnog života, uštedu troškova) i završi pozivom na akciju za menadžere.“
Dakle, sve ovisi o tome koliko dobro znaš objasniti što ti zapravo treba. Tako funkcionira prompt. To nije samo pitanje. To je komunikacijski kanal, specifična vrsta upute u kojoj u dozvoljeni broj ulaznih tokena stavite sve: što želite, kako to treba izgledati i čemu to služi. Ako kažete „napiši mi funkciju u Pythonu za temperaturu“, dobit ćeš neku osnovnu varijantu. Ali ako kažete „napiši Python funkciju koja iz CSV-a učitava podatke o temperaturi, filtrira ih tako da uzima samo one iz ljetnih razdoblja i vraća prosječnu vrijednost“, tada već ulazimo u ozbiljniju suradnju.
Kontekst kao ključ razumijevanja
AI modeli funkcioniraju značajno bolje kada razumiju situaciju u kojoj ih se koristi. Efikasni promptovi uključuju informacije o:
Ciljanoj publici - kome je namijenjen sadržaj („Napiši mi kao za školarca od 10 godina“)
Svrsi sadržaja - što se želi postići („Učenik mora shvatiti da su definicije bitne za naučiti ih napamet“)
Tonu i stilu - formalno, neformalno, tehnički, laički pristup („Izbjegavaj korištenje stručnih izraza, a kada ih koristiš, obavezno ih objasni, napiši njihovo značenje“)
Ograničenjima - duljina, format, specifični zahtjevi („Nemoj koristiti bulletse. Koristi jednostavne rečenice, a izbjegavaj složene rečenice“)
Proces stvaranja kvalitetnih promptova
Razvoj efikasnih promptova prati strukturiran pristup koji se sastoji od pet ključnih faza. Ovaj proces omogućava sustavno poboljšavanje kvalitete AI odgovora kroz iterativno usavršavanje.
Faza 1: Definiranje problema
Prvi korak uključuje jasno identificiranje cilja i zahtjeva. Definirajte što točno želite postići, odredite ciljanu publiku i identificirajte ključne zahtjeve koji moraju biti ispunjeni.
Faza 2: Postavljanje konteksta
U ovoj fazi bitno je objasniti situaciju ili domenu, navesti relevantne podatke te postaviti ton i stil komunikacije. Kontekst omogućava AI modelu da bolje shvati okvir u kojem treba generirati odgovor.
Faza 3: Dizajn prompta
Stvaranje strukturiranog prompta zahtijeva korištenje jasnih instrukcija, dodavanje konkretnih primjera i definiranje formata odgovora. Ova faza direktno utječe na kvalitetu konačnog rezultata.
Faza 4: Testiranje i iteracija
Testiranje prompta s različitim unosima omogućava analizu kvalitete odgovora i identificiranje područja za poboljšanje. Ovaj korak je ključan za optimizaciju performansi.
Faza 5: Optimizacija
Finalna faza uključuje prilagođavanje prompta na osnovu dobivenih rezultata, standardizaciju uspješnih tehnika i dokumentiranje najboljih praksi za buduće korištenje.
ChatGPT optimizacija
ChatGPT najbolje reagira na jasno strukturirane promptove koji koriste:
- Jasne oznake za različite dijelove prompta
- Specificirane formate odgovora (bullet points, tablice, eseji)
- „Djeluj kao...“ konstrukcije za role-playing scenarije
Kako biste se poigrali s promptanjem, kreirali smo prompt „za bolje generiranje promptova“ za ChatGPT koji možete iskoristiti za daljnje generiranje bogatijih promptova putem linka: https://chatgpt.com/share/687106e3-88ec-800e-960a-6cafe4d38dc7 i iz njega ujedno vidjeti kako se može „isprogramirati“ petlja u jezičnom modelu. Naravno, isti prompt možete iskoristiti i u drugim jezičnim modelima.
Mi smo navedeni prompt iskoristili za kreiranje vodiča kroz promptove za alat Midjourney. Pogledajte ga na linku https://chatgpt.com/share/687105c2-71d4-800e-b14d-c6fe0d4cb018 i svakako imajte na umu da je ovo prvi rezultat prompta.
A da bi on bio 100% validan i otporan, trebao bi ga verificirati stručnjak za Midjourney, no za nas koji „nismo stručnjaci“ ostaje pokušati iskoristiti taj prompt i u kreirani prompt ubaciti je li rezultat Midjourneyja dobar ili loš. Ponavljanjem tog postupka gradi se prompt koji je sve bolji i bolji.
Nema idealnog prompta iz prvog pokušaja, i to je ono što čini stvar zanimljivom. Zapravo, prava moć leži u tome koliko fino podešavate svoje upite. Pisanju prompta možete pristupiti isto onako kako pisac pristupa kreiranju književnog djela. Dakle, opisuje vam situaciju i onda vas uvede u priču. U biti, kao korisnik LLM alata morate prvenstveno biti voljni usavršavati vlastite vještine pisanja. Iako, sada već imamo mobilne aplikacije koje dozvoljavaju unos prompta glasom, slikom ili videom.
Primjer cjelovitog prompta za kreiranje stripa pogledajte na linku: https://chatgpt.com/share/6874cbfb-0500-8006-a910-11104c5248de
Midjourney i DALL-E promptovi
Za generiranje slika, ovi alati zahtijevaju:
- Deskriptivne riječi za stil (photorealistic, cartoon, oil painting)
- Specificiranje osvjetljenja (golden hour, studio lighting, natural light)
- Negativne promptove za ono što se ne želi vidjeti
Pristranost i etička odgovornost
AI modeli mogu naslijediti pristranosti iz svojih podataka za treniranje, što se može pojaviti u generiranim odgovorima. Prompt inženjeri moraju biti svjesni ovih ograničenja i implementirati zaštitne mehanizme.
Zamisli da dizajniraš prompt kojim od umjetne inteligencije tražiš ilustraciju „stručnog informatičara koji objašnjava mrežnu sigurnost grupi učenika u učionici“. Ako taj zahtjev napišeš bez dodatnih smjernica, model će najčešće generirati muškarca svijetle puti u ulozi stručnjaka, a učenike će prikazati uštogljeno, s izraženim stereotipnim rasporedom interesa i neverbalne komunikacije. Ta se pristranost pojavljuje jer su tijekom učenja trenutačni modeli učili iz sadržaja u kojem se visoko plaćene IT pozicije pretežito prikazuju kao muške, dok se ženskim likovima rjeđe pripisuje autoritet u tehnološkom kontekstu. Prompt inženjer to može preduhitriti tako da još u ranoj fazi izričito odredi raznolik sastav likova, jasno navede da stručnjak može biti bilo kojeg spola ili etničke pripadnosti te naglasi kako svi sudionici trebaju djelovati angažirano i ravnopravno. U konačnom promptu zato dodaješ formulaciju poput: „Prikaži stručnjaka u kibernetičkoj sigurnosti, rodno i etnički nedefiniranog, okruženog učenicima iz različitih kulturnih pozadina; svi sudionici nose izraze znatiželje i međusobnog poštovanja.“ Na taj način aktivno usmjeravaš model da zaobiđe uobičajene stereotipe, čime ujedno demonstriraš kako svijest o pristranosti postaje sastavni dio etičkog prompt dizajna.
Jasno smo definirali da želimo ljude različitih
Claude specifičnosti
Claude modeli pokazuju veću toleranciju za složene promptove i bolje odgovaraju na duže, kontekstualizirane instrukcije. Posebno su efikasni kod analize dokumenata i koda, te bolje reagiraju na etičke smjernice i ograničenja. Claude modeli preporučuju korištenje XML oznaka za strukturiranje promptova jer su fine-tunirani s ovim pristupom.
Primjer:
<Prompt>
<Context>
<Background>Ovo je pozadinska informacija o problemu koji imamo.</Background>
<Problem>Evo problema s kojim se susrećemo.</Problem>
<Examples>
<Example>Prvi primjer...</Example>
<Example>Drugi primjer...</Example>
</Examples>
</Context>
<Instructions>
<Request>Želim da učiniš ono što je potrebno.</Request>
<Steps>
<Step order=»1»>Izvrši ovo.</Step>
<Step order=»2»>Izvrši ono.</Step>
</Steps>
</Instructions>
</Prompt>
Zdravstvo predvodi u primjeni
Zdravstveni sektor pokazuje najveću stopu usvajanja prompt engineeringa (85%), koristeći ovu tehnologiju za analizu medicinskih podataka, personalizirane preporuke liječenja i automatizaciju dokumentacije. AI modeli pomažu u dijagnostici i istraživanju lijekova kroz sofisticirane promptove koji analiziraju velike količine medicinskih podataka. Što ne znači kako vi možete ChatGPT upitati kako da se liječite na osnovu nekog nalaza, već to znači da medicinski stručnjaci koji su usavršili pisanje promptova specifičnih za analizu snimaka (npr. mamografije) ranije i brže mogu otkriti maligne tvorevine nego što su mogli dosadašnjim metodama bez primjene AI alata.
Praktični primjeri implementacije
Automatizacija korisničke podrške
Kompanija koja prima stotine korisničkih upita dnevno implementirala je prompt engineering za automatizaciju odgovora. Prompt je strukturiran ovako:
- Zadatak: «Napiši profesionalni odgovor korisniku koji pita o statusu narudžbe koja nije stigla.»
- Kontekst: «Korisnik je naručio prije 10 dana, a obećana je dostava u 7 dana. Uključi ispriku i rješenje.»
- Ton: «Koristi pristojan i empatičan ton. Odgovor drži ispod 150 riječi.
Rezultat je bilo dramatično poboljšanje korisničkog zadovoljstva i smanjenje vremena odgovora.
Generiranje obrazovnog sadržaja
Nastavnik je koristio prompt engineering za stvaranje kvizova o obnovljivoj energiji:
- Zadatak: «Generiraj pitanja s više odgovora za srednjoškolce o obnovljivoj energiji.»
- Ograničenja: «Uključi 3 pitanja. Svako treba imati 4 ponuđena odgovora, s jednim točnim odgovorom i objašnjenjem.»
- Stil: «Drži pitanja jednostavnima ali obrazovnima, prikladnima za srednjoškolce.»
Izazovi i ograničenja
U navedenom primjeru možete primijetiti kako se u dijelu prompta „Stil:“ ponavlja zahtjev prikladnog sadržaja za srednjoškolce, iako je to već jasno iz prompt dijela „Zadatak:“, no AI neće uvijek poslušati te je bitne stvari potrebno naglasiti nekoliko puta – baš kao u navedenom primjeru.
Nepredvidljivost AI odgovora
AI modeli ponekad mogu generirati nepredvidljive ili neočekivane odgovore, čak i s pažljivo oblikovanim promptovima. Ova nepredvidljivost zahtijeva kontinuirano testiranje i prilagođavanje te ćete u startu morati odvojiti dovoljno vremena za testiranja putem metode pokušaja i promašaja kako biste postigli zadovoljavajući rezultat. Najčešće se nepredvidivost dešava uslijed finog podešavanja LLM-a od strane proizvođača, što se kod tvrtke OpenAI može vidjeti gotovo na mjesečnoj bazi. Haluciniranje AI-ja dešava se radi metoda koje stoje iza LLM koda, a to je zapravo neuronska mreža koja mora izbaciti nekakav odgovor ukoliko odgovora nema „u bazi“ – odnosno u podacima za treniranje.
LLM-ovi, među ostalim varijablama, koriste varijablu „temperature“ čiji je iznos negdje između 0 i 1, a o toj varijabli ovisi visina kreativnosti neuronske mreže. Kako ta varijabla nikada ne može biti niti 0 niti 1, tako nikada nemamo točan odgovor izvučen iz te velike neuronske mreže. Kada x puta pitamo LLM isto pitanje, x puta ćemo dobiti drugačiji odgovor.
AI modeli imaju ograničenja u duljini prompta koji mogu procesirati što može ograničiti kompleksnost promptova u slučajevima kada AI-ju želimo dati širi kontekst. Dulji promptovi zahtijevaju više tokena, što povećava troškove korištenja.
Adaptivni promptovi
Razvijaju se AI modeli koji mogu prilagoditi svoje odgovore na osnovu korisničkog stila unosa i preferencija. Ova tehnologija omogućit će personalizirane AI interakcije bez potrebe za eksplicitnim instrukcijama.
No-code platforme
Jedan od nastajućih trendova jest usvajanje no-code platformi koje omogućavaju ne-tehničkim korisnicima stvaranje sofisticiranih promptova pomoću drag-and-drop sučelja. Ove platforme približavaju pristup naprednim AI mogućnostima korisnicima koji su manje tehnički orijentirani te su vrlo popularni među školarcima ili drugim korisnicima koji žele naučiti programirati, a uvijek ih je toga bilo strah čim su vidjeli silne znakove koje nisu razumjeli na prvi pogled.
Multimodalni AI modeli
Budućnost prompt engineeringa uključuje rad s multimodalnim AI modelima koji mogu procesirati tekst, slike, audio i video istovremeno. To otvara nova područja za kreativne i praktične primjene.
Primjer ovoga isprobajte tako da pokušate savladati korištenje neke aplikacije koju do sada niste nikada koristili. Recimo, instalirajte i pokrenite Blender za 3D modeliranje. Zatim pokrenite Googleov AI Studio s linka: https://aistudio.google.com/live. Kliknite na ikonicu Stream. Dobit ćete gumb „Share Screen“ kojim svoj trenutni ekran računala dijelite s multimodalnim LLM modelom Gemini. Sada ga možete upitati kako kreirati 3D objekt – za početak, možda da krenete od jednostavnijih oblika, pa nastavite s kompliciranijima. Svakako istu stvar možete isprobati s aplikacijom Excel ili nekom trećom. Sesija je ograničena na 10 minuta, a nakon toga možete krenuti s novom sesijom.
Zaključak
Prompt engineering etablirao se kao jedna od najvažnijih vještina u eri umjetne inteligencije, spajajući tehničko znanje s kreativnim pristupom rješavanju problema. S tržištem koje konstantno raste, primanja prompt inženjera mogu dosezati šesteroznamenkaste cifre. Time ova vještina predstavlja iznimnu priliku za profesionalni razvoj.
Uspješni prompt inženjeri kombiniraju razumijevanje AI arhitektura s praktičnim vještinama kao što su NLP, poznavanje različitih AI alata i sposobnost strukturiranog pristupa rješavanju problema. Dok se područje brzo razvija, temeljni principi - specifičnost, kontekst, struktura i iteracija - ostaju ključni za uspjeh.
Organizacije koje žele uspješno implementirati AI rješenja moraju investirati u prompt engineering vještine svojih timova ili će morati angažirati specijalizirane stručnjake. S obzirom na rast AI tržišta, potražnja za ovim vještinama konstantno će se povećavati.
Budućnost pripada onima koji mogu efikasno komunicirati s AI sustavima, a prompt engineering predstavlja ključ za otvaranje punog potencijala umjetne inteligencije u poslovnom okruženju. Inženjer koji zna koristiti AI sposoban je puno brže napraviti izvještaj koji je donedavno morao raditi „pješke“, što ne može napraviti osoba koja ne zna verificirati AI tvrdnje o specifičnoj temi, i time će takav inženjer postati još produktivniji i vrjedniji za tvrtku.