Google I/O 2024: Eddig minden bejelentett | EatchbQ

Sundar Pichai, Google CEO, Google I/O, Google I/O 2024

Ez az a pillanat, amire egész évben vártál: a Google I/O vitaindító napja! A Google minden évben bejelentések özönével indítja fejlesztői konferenciáját, beleértve a legújabb munkák felfedését. Brian már elindított minket azzal, hogy megosztjuk, mit várunk.

Tudjuk, hogy ma nincs mindig időd megnézni a teljes kétórás prezentációt, ezért magunkra vállalkozunk, hogy a vitaindító legfontosabb híreit gyorsan közöljük, amint bejelentették őket, mindezt egy könnyen kezelhető formában. – emészthető, könnyen áttekinthető lista. Essünk neki!

A Google Play

Egy férfi 2020. május 20-án ellenőrzi a TIKTOK besorolását a Google Playen az indiai Újdelhiben. Az értékelést 2,0 csillagra csökkentették, miután egy, a savtámadásokat dicsőítő videó betiltását követelte. (Fotó: Nasir Kachroo/NurPhoto a Getty Images-en keresztül)
Kép jóváírása: Nasir Kachroo/NurPhoto/Getty Images

A Google Play az alkalmazások új felfedezési funkciójával, a felhasználók megszerzésének új módjaival, a Play Points frissítéseivel, valamint a fejlesztők számára készült eszközök, például a Google Play SDK Console és a Play Integrity API egyéb fejlesztéseivel kap némi figyelmet.

A fejlesztők számára különösen érdekes az Engage SDK, amely bevezeti az alkalmazásgyártók számára, hogy teljes képernyős, magával ragadó, személyre szabott élményben mutassák be tartalmukat a felhasználóknak. A Google szerint ez jelenleg nem egy olyan felület, amelyet a felhasználók láthatnak. Olvass tovább

Csalás észlelése hívás közben

Kép jóváírása: Google

Kedden a Google bemutatott egy funkciót, amely szerinte figyelmezteti a felhasználókat a lehetséges csalásokra a hívás során.

A funkció, amely az Android jövőbeli verziójába kerül beépítésre, a Gemini Nano-t használja, a Google Generative AI-kínálatának legkisebb verzióját, amely teljes egészében futhat az eszközön. A rendszer hatékonyan, valós időben figyeli a “csalásokkal gyakran összefüggő beszélgetési mintákat”.

A Google példát mutat arra, hogy valaki “banki képviselőnek” adja ki magát. Az olyan gyakori átverési taktikák, mint a jelszókérés és az ajándékutalványok, szintén elindítják a rendszert. Ezek mindegyike elég jól értelmezhető úgy, mint a pénz kivonásának módja, de a világon sok ember még mindig ki van téve az ilyen típusú csalásoknak. Az indítás után megjelenik egy értesítés, hogy a felhasználó kellemetlen karakterek áldozatává válhat. Olvass tovább

Kérjen képeket

Kép jóváírása: TechCrunch

A Google Fotók mesterséges intelligencia infúziót kap egy kísérleti funkció, az Ask Photos elindításával, amelyet a Google Gemini AI modellje hajt. A nyár végén megjelenő új kiegészítés lehetővé teszi a felhasználók számára, hogy természetes nyelvű lekérdezések segítségével kereshessenek a Google Fotók gyűjteményében, amelyek kihasználják a mesterséges intelligencia megértését fotóik tartalmáról és egyéb metaadatairól.

Míg azelőtt, hogy a felhasználók konkrét személyekre, helyekre vagy dolgokra kereshettek volna fotóikon, a természetes nyelvi feldolgozásnak köszönhetően az AI frissítés intuitívabbá és kevésbé manuális keresési folyamattá teszi a megfelelő tartalom megtalálását.

És a példa is aranyos volt. Ki ne szereti a tigristömött állat-Golden Retriever zenekar duót, az úgynevezett “Golden Stripes”-t? Olvass tovább

Minden az Ikrekről

Kép jóváírása: TechCrunch

Gemini 1.5 Pro: A generatív mesterséges intelligencia másik frissítése, hogy a Gemini mostantól hosszabb dokumentumokat, kódbázisokat, videókat és hangfelvételeket is képes elemezni, mint korábban.

A cég jelenlegi zászlóshajójának számító Gemini 1.5 Pro új verziójának privát előzetese során kiderült, hogy akár 2 millió token is elfér. Ez kétszerese a korábbi maximális összegnek. Ezen a szinten a Gemini 1.5 Pro új verziója a kereskedelmi forgalomban kapható modellek közül a legnagyobb bemenetet támogatja. Olvass tovább

Gemini élőben: A cég bemutatta a Gemini új élményét, a Gemini Live-t, amely lehetővé teszi a felhasználók számára, hogy “mélyreható” hangcsevegést folytathassanak a Geminivel okostelefonjaikon. A felhasználók megszakíthatják a Gemini-t, miközben a chatbot beszél, hogy tisztázó kérdéseket tegyen fel, és valós időben alkalmazkodik a beszédmintáikhoz. A Gemini pedig láthatja a felhasználók környezetét, és reagálhat rá, akár fényképeken, akár az okostelefonjuk kamerájával rögzített videókon keresztül.

Első pillantásra a Live nem tűnik drasztikus frissítésnek a meglévő technológiához képest. A Google azonban azt állítja, hogy a generatív mesterséges intelligencia területének újabb technikáit alkalmazza a kiváló, kevésbé hibás képelemzés érdekében – és ezeket a technikákat egy továbbfejlesztett beszédmotorral kombinálja a következetesebb, érzelmileg kifejezőbb és valósághűbb párbeszéd érdekében, több fordulattal. Olvass tovább

Gemini Nano: Most egy kis bejelentés. A Google a Gemini Nano-t, a legkisebb mesterségesintelligencia-modelljét is közvetlenül a Chrome asztali kliensbe építi be, kezdve a Chrome 126-tal. Ez a cég szerint lehetővé teszi a fejlesztők számára, hogy az eszközön lévő modellt használják saját mesterségesintelligencia-funkcióik működtetésére. A Google maga is azt tervezi, hogy ezt az új képességet olyan funkciók működtetésére használja majd, mint például a Gmail Workspace Lab meglévő „segítsen írni” eszköze. Olvass tovább

Gemini Androidon: A Google Gemini Androidon, a Google Assistant mesterségesintelligencia-helyettesítője, hamarosan kihasználja az Android mobil operációs rendszerével és a Google alkalmazásaival való mély integráció képességét. A felhasználók az AI által generált képeket közvetlenül a Gmailbe, a Google Messagesbe és más alkalmazásaikba húzhatják át. Addig is a YouTube-felhasználók a „Kérdezze meg ezt a videót” elemre koppintva konkrét információkat találhatnak az adott YouTube-videóról – mondja a Google. Olvass tovább

Gemini a Google Térképen: A Gemini modell funkciói megjelennek a Google Térkép platformon a fejlesztők számára, kezdve a Places API-val. A fejlesztők generatív mesterséges intelligencia-áttekintéseket jeleníthetnek meg a helyekről és területekről saját alkalmazásaikban és webhelyeiken. Az összefoglalók a Gemini elemzésén alapulnak, amely a Google Térkép több mint 300 millió közreműködőt tömörítő közösségéből származó betekintéseket tartalmaz. Mi a jobb? A fejlesztőknek többé nem kell saját egyedi leírásokat írniuk a helyszínekről. Olvass tovább

A Tensor feldolgozó egységek teljesítménynövekedést kapnak

A Google bemutatta Tensor Processing Units (TPU) AI chipje következő generációját – egészen pontosan a hatodik. Ezeket Trilliumnak hívják, és még ebben az évben piacra kerülnek. Ha emlékszel, a TPU-k következő generációjának bejelentése az I/O hagyományai közé tartozik, annak ellenére, hogy a chipek csak az év végén fognak megjelenni.

Ezeknek az új TPU-knak a számítási teljesítménye 4,7-szeresére nő chip az ötödik generációhoz képest. Talán még ennél is fontosabb, hogy a Trillium a SparseCore harmadik generációját tartalmazza, amelyet a Google a következőképpen ír le: „Speciális gyorsító az ultranagy beágyazások feldolgozásához, amelyek gyakoriak a fejlett rangsorolási és ajánlási munkaterhelésekben”. Olvass tovább

AI keresésben

A Google több mesterséges intelligenciát ad a kereséshez, eloszlatva a kételyeket, hogy a vállalat veszít piaci részesedéséből olyan versenytársakkal szemben, mint a ChatGPT és a Perplexity. AI-alapú listákat tesz közzé az Egyesült Államokban élő felhasználók számára. Ezenkívül a cég arra is törekszik, hogy a Geminit ügynökként használja, például utazástervezésre. Olvass tovább

A Google azt tervezi, hogy generatív mesterséges intelligencia segítségével szervezi meg egyes keresési eredmények teljes keresési eredményoldalát. Kiegészíti a meglévő mesterséges intelligencia áttekintése funkciót, amely rövid összefoglalót készít a keresett témával kapcsolatos összesített információkról. Az AI Overview funkció kedden válik általánosan elérhetővé, miután a Google AI Labs programjában szünetel. Olvass tovább

Generatív AI frissítések

Google kép 3

A Google bejelentette az Imagen 3-at, a technológiai óriás Imagen generatív AI modellcsaládjának legújabb darabját.

Demis Hassabis, a Google mesterséges intelligenciával foglalkozó kutatási részlegének, a DeepMind-nek a vezetője elmondta, hogy az Imagen 3 pontosabban érti az általa képekké alakított szöveges üzeneteket, mint elődje, az Imagen 2, és generációk óta “kreatívabb és részletesebb”. Ezenkívül a modell kevesebb “zavaró műterméket” és hibát termel, mondta.

“Ez (is) az eddigi legjobb modellünk a szöveg megjelenítésére, ami kihívást jelentett a képgeneráló modellek számára” – tette hozzá Hassabis. Olvass tovább

Gemma 2 frissítések

A Gemma 2, a Google Gemma modelljeinek következő generációja júniusban jelenik meg 27 milliárd paraméteres modellel. Olvass tovább

IDX projekt

A Project IDX, a vállalat következő generációs, mesterséges intelligencia-központú böngésző alapú fejlesztőkörnyezete már nyílt bétaverzióban van. Ezzel a frissítéssel integrálódik a Google Maps Platform az IDE-ben, amely segít földrajzi helymeghatározási képességekkel bővíteni alkalmazásait, valamint a Chrome Dev Tools és a Lighthouse integrációja segít az alkalmazások hibakeresésében. A Google hamarosan lehetővé teszi alkalmazások telepítését a Cloud Run-ra, a Google Cloud szerver nélküli platformjára az előtér- és háttérszolgáltatások futtatására. Olvass tovább

Jaj

A Google keresi az OpenAI Sora with Veo-t, egy mesterséges intelligencia-modellt, amely szöveges felszólítással körülbelül egy perces 1080p-s videoklipeket tud készíteni. A Veo különféle vizuális és filmes stílusokat rögzíthet, beleértve a tájképeket és timelapse-felvételeket, valamint szerkesztheti és módosíthatja a már elkészített felvételeket.

A Google előzetes, áprilisban bemutatott videógenerálási munkáira is épít, amely a vállalat Imagen 2 képgeneráló modellcsaládját használta fel hurkos videoklipek létrehozásához. Olvass tovább

Hívjon körbe a kereséshez

egy telefont tartó személy a Google Circle segítségével kereséshez

A mesterséges intelligencia által vezérelt Circle to Search funkció, amely lehetővé teszi az Android-felhasználók számára, hogy azonnali válaszokat kapjanak olyan gesztusokkal, mint a körözés, mostantól összetettebb problémák megoldására is képes lesz a pszichés és a matematikai szöveges feladatok között. Úgy tervezték, hogy természetesebbé tegye a Google Keresővel való interakciót bárhonnan a telefonjáról valamilyen művelettel – például karikázással, kiemeléssel, gépeléssel vagy koppintással. Ó, és az is jobb, ha közvetlenül a támogatott Android telefonokról és táblagépekről segít a gyerekeknek a házi feladat elvégzésében. Olvass tovább

Firebase Genkit

A Firebase platform új kiegészítése, a Firebase Genkit célja, hogy megkönnyítse a fejlesztők számára a mesterséges intelligencia által vezérelt alkalmazások készítését JavaScript/TypeScript nyelven, a Go támogatással hamarosan. Ez egy nyílt forráskódú keretrendszer, amely az Apache 2.0 licencet használja, amely lehetővé teszi a fejlesztők számára, hogy gyorsan építsenek mesterséges intelligenciát új és meglévő alkalmazásokba.

A Genkit néhány használati esete, amelyet a cég kedden kiemelt, számos szabványos GenAI használati esetet tartalmaz: tartalomgenerálás és összefoglalás, szövegfordítás és képgenerálás. Olvass tovább

Pixel 8a

Pixel 8 Call Screen frissítés
Kép jóváírása: Google

A Google alig várta az I/O-t, hogy megmutassa a Pixel termékcsalád legújabb kiegészítését, és a múlt héten bejelentette az új Pixel 8a-t. A készülék ára 499 dollár, és kedden szállítják. A frissítéseket is elvártuk ezektől a frissítésektől. A lista elején a Tensor G3 chip hozzáadása található. Olvass tovább

Pixel Slate

Kép jóváírása: Brian Heater

Már elérhető a Google Slate névre keresztelt Pixel táblagépe. Ha emlékszel, Brian tavaly ugyanebben az időben áttekintette a Pixel táblagépet, és csak az alapról beszélt. Érdekes módon a tablet enélkül is elérhető. Olvass tovább

Ezt a bejegyzést a nap folyamán frissítjük…

További információ a Google I/O 2024-ről a TechCrunch oldalon

Leave a Reply

Your email address will not be published. Required fields are marked *