Az OpenAI elnöke megosztja az első GPT-4o által generált képet | EatchbQ

Az OpenAI elnöke megosztja az első GPT-4o által generált képet

Csatlakozzon hozzánk, amikor június 5-én visszatérünk NYC-be, hogy felsőbb vezetőkkel együttműködve átfogó módszereket fedezzenek fel az AI-modellek torzítására, teljesítményére és etikai megfelelésére a különböző szervezetekben. Itt megtudhatja, hogyan vehet részt.


Az OpenAI elnöke, Greg Brockman írta az X fiókjából ez az első nyilvános kép, amelyet a cég vadonatúj GPT-4o modelljével hoztak létre.

Amint az alábbi képen is látható, meglehetősen meggyőzően fotorealisztikus, egy OpenAI logóval ellátott fekete pólót viselő személyt ábrázol, aki krétával ír szöveget egy táblára, amelyen ez áll: „Modalitások közötti átvitel. Tegyük fel, hogy közvetlenül modellezzük a P-t (szöveg, pixelek, hang) nagy autoregresszív transzformátorral Mik az előnyei és hátrányai?”

A hétfőn debütált új GPT-4o modell javítja a korábbi GPT-4 modellcsaládot (GPT-4, GPT-4 Vision és GPT-4 Turbo) azáltal, hogy gyorsabb, olcsóbb, és több információt tárol a bemeneti adatokból, mint pl. hang és látvány.

Azért képes erre, mert az OpenAI más megközelítést alkalmazott, mint a korábbi GPT-4 osztályú LLM-ei. Míg ezek több különböző modellt láncoltak össze, és más médiát, például audio- és képanyagot alakítottak át szöveggé és vissza, az új GPT-4o-t kezdettől fogva multimédiás tokenekre oktatták, lehetővé téve a látvány és a hang közvetlen elemzését és értelmezését anélkül, hogy azokat először átalakították volna. üzenni.

VB rendezvény

AI Impact Tour: AI Audit

Csatlakozz hozzánk, amikor június 5-én visszatérünk NYC-be, hogy kapcsolatba léphessünk a felsőbb vezetőkkel, és elmerüljünk az AI-modellek auditálási stratégiáiban, hogy biztosítsuk a méltányosságot, az optimális teljesítményt és az etikai megfelelést a különböző szervezetekben. Biztosítsa belépését erre az exkluzív, csak meghívásos eseményre.

Kérjen meghívót

A fenti kép alapján az új megközelítés észrevehető előrelépést jelent az OpenAI legutóbbi képgenerációs modelljéhez képest, a DALL-E 3-hoz képest, amely 2023 szeptemberében debütált. Hasonló promptot futtattam a DALL-E 3-on keresztül a ChatGPT-ben, és itt az eredmény.

Mint látható, a Brockman által GPT-4o-val készített kép jelentősen javítja a minőséget, a fotorealizmust és a szöveggenerálási pontosságot.

A GPT-4o natív képgenerálási képességei azonban még nem elérhetők nyilvánosan. Ahogy Brockman utalt X-bejegyzésében, mondván: “A csapat keményen dolgozik azon, hogy a világra vigye őket.”

Leave a Reply

Your email address will not be published. Required fields are marked *