• Autor: Matěj Toul
Spoločnosť Google už tradične predviedla svoje technologické novinky na prezentácii Google I/O 2024. Tento rok na to však išla trochu inak. Nový Google Pixel 8a výrobca ukázal už pred týždňom, predstavenie nadchádzajúceho Androidu 15 naopak nechal na neskôr. Prečo? Aby sa mohla celá prezentácia venovať umelej inteligencii. Ako bolo spomenuté na jej konci, slovo „AI“ za necelé dve hodiny I/O zaznelo presne 121× a noviniek je naozaj veľa. Poďme sa pozrieť na tie najzaujímavejšie.
Pokiaľ si chcete z Google I/O 2024 odniesť jednu vec, ktorá umelú inteligenciu posunula o obrovský kus ďalej, bude to Project Astra. Potom, čo organizácia OpenAI deň pred I/O oznámila svojho AI asistenta s odpoveďami v reálnom čase, ktorý navyše dokáže „vidieť“ cez kameru telefónu, to vyzeralo, že Google bude mať čo robiť, aby sa konkurencii priblížil. Internetová jednotka však bola viac ako pripravená so svojou odpoveďou.
Project Astra je praktickou a podľa videa nižšie veľmi praktickou implementáciou AI modelu ako osobného asistenta, ktorý dokáže v reálnom čase zodpovedať a spracovávať video vstup. Google vo svojom deme ukázal okrem iného skvelú schopnosť asistenta pracovať s kontextom, pamätať si zdanlivo nerelevantné veci z kúska videa (napr. kde ste nechali ležať svoje okuliare), a to všetko nielen v telefóne, ale aj v smart okuliaroch. Demo video nižšie hovorí za všetko.
Project Astra by mal eventuálne nahradiť klasického Asistenta Google v telefónoch s operačným systémom Android. Hoci Google zatiaľ nič priamo nepovedal, táto zmena by mala prísť ešte do konca roka a mohla by byť jedným z hlavných ťahákov nadchádzajúceho Androidu 15, o ktorom sa máme v nasledujúcich dňoch dozvedieť viac.
O Google Gemini sme už v minulosti počuli. Ide o aktuálne najviac používaný AI produkt spoločnosti Google a o priamu konkurenciu nástrojov ako ChatGPT od OpenAI alebo Microsoft Copilot vo vyhľadávači Bing. Jednou z hlavných vlastností tohto modelu je multimodálnosť v základe – Gemini bol už od začiatku navrhnutý ako nástroj na spracovanie alebo generovanie textu, obrázkov, videa, kódu atď., zatiaľ čo iné modely boli o tieto funkcie obohatené až s postupom času a často je u nich stále generovaný text ako medzikrok.
V čom má ale Google Gemini v súčasnosti oproti konkurencii naozaj výrazne náskok, je veľkosť tzv. „kontextového okna“. To si môžete predstaviť ako množstvo vami zadaných informácií, nad ktorými dokáže umelá inteligencia v jeden moment uvažovať. V súčasnosti dokáže najvyšší model Google Gemini 1.5 Pro konzistentne uvažovať nad až 1 miliónom tokenov. To je zhruba 10 hodín audia, 1 hodina videa, alebo 700 tisíc slov textu. Google predstavil svoje plány rozšíriť kontextové okno na 2 milióny tokenov do konca roku 2024.
Chat verzia modelu Gemini bude navyše po novom podporovať prednastavené chatové okná, podobne ako sme už videli v prípade konkurencie. Google túto funkciu pomenoval Gemini Gems. Bude si možné napríklad vytvoriť Gem osobného kuchára, ktorému nastavíte popis, o ktorom bude pri každom spustení uvažovať. Ukazuje sa totiž, že keď chatu vštepíte, že je michelinským kuchárom s rokmi skúseností, jeho výstup môže byť naozaj o niečo málo lepší. Do popisu môžete pridať napríklad aj štýl odpovedania, ktorý vyžadujete. Všetky odpovede sa potom budú držať vami daného formátu.
Doposiaľ najlepším z modelov rodiny Gemini bol Google Gemini 1.5 Pro. Na tejto skutočnosti sa nič nemení, Google však predstavil novú alternatívu v podobe Gemini 1.5 Flash. Ide o odľahčený model, ktorý má poskytovať čo najrýchlejšie odpovede. Má všetky výsady Gemini, teda multimodálnosť aj dlhé kontextové okno, odpovede však všeobecne budú o niečo menej kvalitnejšie ako s modelom Pro.
Hlavným využitím modelu Gemini 1.5 Flash budú aplikácie, ktoré pracujú s obrovským množstvom skôr jednoduchších požiadaviek, ktoré je potrebné čo najrýchlejšie odbaviť. Pokiaľ vyžadujete prepracované detailné výstupy a nevadí vám počkať si trochu dlhšie, Google stále odporúča variant Pro.
Veľmi zaujímavo sú modely tiež nacenené. Ak ich budete používať mimo aplikácie Google, teda vo forme API (programátorského rozhrania, vďaka ktorému je možné AI integrovať do rôznych aplikácií tretích strán), 1 milión tokenov otázok v Gemini 1.5 Pro vás vyjde na 7 dolárov (asi 6,5 €). Ak budú vaše jednotlivé otázky menšie ako 128 tisíc tokenov, cena bude ešte nižšia, zaplatíte 3,5 dolára (asi 3 €) za milión tokenov otázok. Naozaj cenovo lukratívnou ponukou je ale Gemini 1.5 Flash. Ceny za používanie tohto modelu začínajú na iba 35 centoch za 1 milión tokenov otázok.
Pre porovnanie, model GPT-4 Turbo od OpenAI, podporujúci maximálne 128 tisíc tokenov naraz, vás vyjde na 10 dolárov za milión tokenov otázok.
Veľká časť prezentácie bola venovaná tiež generatívnej umelej inteligencii. Predstavil sa model na generovanie videa z textu Veo, vylepšený model na generovanie obrázku z textu Imagen 3 a v neposlednom rade aj sada nástrojov na generovanie AI hudby Music AI Sandbox.
Nový model Veo je schopný generovať videá v rozlíšení Full HD, v rôznych štýloch, trvajúcich dlhšie ako jednu minútu. Model Imagen 3 sa potom zameriava hlavne na detaily. Dokáže verne zobraziť aj tie najkonkrétnejšie požiadavky a produkovať skutočne fotorealistické snímky. Výstupy v tomto prípade nemá zmysel popisovať slovami – pozrite sa na demo video nižšie.
Všetko, čo Gemini vygeneruje (po novom vrátane videí), bude opatrené nemenným „vodoznakom“ SynthID v snahe zabrániť šíreniu falošných informácií a vydávaniu generovaného obsahu za autorský.
Google krátko prehovoril aj o svojej rodine otvorených modelov Gemma, ktoré môže voľne využívať ktokoľvek. Model PaliGemma napríklad slúži na rozpoznávanie obrazu na účely prístupnosti, CodeGemma je potom špecificky trénovaný na pomoc pri programovaní. Google predstavil aj nový otvorený model na všeobecné využitie, Gemma 2, o ktorom sa vraj viac dozvieme v nadchádzajúcich týždňoch.
Testovanie Google Gemini v rámci vyhľadávania Google prebieha už nejaký čas. Na Google I/O 2024 sme dostali náhľad toho, čo všetko AI pri vyhľadávaní dokáže. Medzi kľúčové funkcie patrí zhrnutie – Gemini pospája informácie z vyhľadaných článkov a vám dá krátky a prehľadný výsledok, pričom pripojí všetky zdroje, pokiaľ sa chcete dozvedieť viac.
Vyhľadávanie je tiež schopné pojať zložitejšie požiadavky. Na prezentácii bola ukázaná otázka „nájdi najlepšiu jogu alebo pilates štúdio v Bostone, ukáž mi detaily o ponukách pre začiatočníkov a pešiu vzdialenosť od Beacon Hill“. Google Gemini si dokáže požiadavku rozdeliť na kroky, všetky požadované informácie získať, a nakoniec vám ich ucelene prezentovať v prehľadnom blokovom rozhraní prispôsobenom tomu, čo práve hľadáte.
Vyhľadávanie bude navyše opäť multimodálne – k už existujúcemu vyhľadávaniu textom, hlasom a obrázkami pribudne aj video (pravdepodobne na báze Project Astra).
Google oznámil, že po dlhom testovaní sú pripravení umelú inteligenciu vo vyhľadávaní uvoľniť verejne. Ešte tento týždeň by sa funkcia mala objaviť používateľom v USA, o zvyšku sveta zaznelo len ľahostajné „čoskoro“.
Ďalšie využitie pre Gemini našiel Google v prostredí Google Workspace. Ide o firemný balíček obľúbených produktov ako Gmail, Disk Google, Kalendár Google, Dokumenty Google a ďalšie – v jednej aplikácii, s pridanými funkciami. Google Gemini tu bude možné pridať ako nového „kolegu“. Potrebujete zorganizovať faktúry z emailov do jedného miesta? Pre Gemini to nie je problém a pri tej príležitosti vám vytvorí tabuľku príjmov a výdavkov, ktorú doplní o relevantné grafy.
Gemini môžete ďalej používať aj v skupinových chatoch rovnako tak, ako by ste si písali s kolegami. Chcete sa uistiť, že je nová verzia vášho produktu pripravená na vydanie? Stačí sa opýtať, a pokiaľ sa nikto z vašich skutočných kolegov nebude mať k odpovedi, Gemini prejde všetky súbory a dáta, ku ktorým má prístup, vytkne potenciálne problémy a navrhne vám ďalší postup.
Na výstup Gemini potom pokojne môže reagovať ďalší z kolegov napríklad zadaním náročnej úlohy, ktorá by bežne zabrala hodiny. Gemini bude za pár minút späť s výstupným súborom.
Gemini ako kolega v Google Workspace znie skvele, ale predsa len je to nástroj rýdzo profesionálny, ktorý zrejme väčšina používateľov nevyužije. Google ale chce umelú inteligenciu priniesť skutočne všetkým. Predstavujú sa preto tzv. AI Agenti. V podstate ide o veľmi pokročilé spojenie všetkého, čo Google AI ponúka. Zadanú úlohu si agent rozplánuje do niekoľkých krokov a dokáže pracovať naprieč rôznym softvérom.
Na Google I/O 2024 sme videli veľmi častú situáciu. Kúpili ste si topánky, ale veľkosť vám nesedí – stačí zadať jeden príkaz AI agentovi. Ten potom prejde vaše emaily a nájde faktúru, zistí, kde ste topánky zakúpili a všetky informácie dôležité pre vrátenie, vyplní reklamačný formulár a vám len povie, kam máte topánky priniesť, alebo dokonca objedná zvoz.
Nad všetkými týmito krokmi by ste pritom mali kontrolu – AI agent všetko naplánuje a urobí za vás, ale než urobí niečo, čo by ste možno nemuseli chcieť, vždy sa vás spýta na potvrdenie. Na prezentácii niekoľkokrát zaznelo, že mať kontrolu nad celým procesom je jedna z najvyšších priorít. Google však upozorňuje, že táto technológia je stále v ranom vývoji, a na prvé verejné testy si tak určite ešte pár mesiacov, ak nie dlhšie, počkáme.
Požiadavky na hardvér schopný bleskových výpočtov pre umelú inteligenciu sa v posledných rokoch exponenciálne zvyšuje a, zdá sa, nemá konca. Google preto predstavil svoj nový rad TPU (tensor processing unit, špeciálne čipy na urýchlenie tenzorových výpočtov, používaných v AI) nazvaný Trillium. Ten má byť 4,7× výkonnejší ako predchádzajúca generácia. Čipy budú dostupné používateľom platformy Google Cloud ku koncu roka 2024. Vlastné fyzické verzie TPU čipov v minulosti k dispozícii neboli a Google zatiaľ neukázal žiadne plány túto skutočnosť meniť.
Google si pre umelú inteligenciu vyhradil celé dve hodiny prezentácie Google I/O 2024 a ako môžeme vidieť, noviniek zďaleka nebolo málo. Hoci sa do AI pretekov Google poriadne pripojil až minulý rok, vďaka obrovským prostriedkom je schopný stále posúvať hranice a nám nezostáva nič iné, len čakať, kam sa umelá inteligencia posunie ďalej.
Google Mobilné telefónyTohtoročná úvodná základná myšlienka na Google I/O sa niesla v znamení umelej inteligencie. Okrem tej sa však firma nezdráhala predstaviť aj nejaký ten hardvér. Na čo hlavného sa značka Google zamerala?
Umelá inteligencia hrá veľkú úlohu v našich životoch a bude sa integrovať ešte oveľa viac takmer do všetkého, čo poznáme. Preto sa skratka AI v úvode konferencie objavovala často.
Google s jej pomocou vylepší svoje služby. Funkcia Help me write v Gmaile dovolí napísať vstupný príkaz (tzv. prompt) a Gamil napíše email za vás. Google mapy zvládnu trojrozmerne prejsť vami naplánovanú trasu. Do záberu pridá aj autá či vtáky na oblohe.
Umelá inteligencia je veľmi používaná v oblasti fotografií. Nie je teda nič prekvapujúce, že nové funkcie prídu aj do Google Photos. V Magic Editore napríklad posuniete do stredu záberu objekt, ktorý sa stráca v krajoch. Editor sám zvyšok fotky dopočíta a upraví aj svetelnosť, aby bol výsledok reálny. Google sa neobmedzuje iba na email, mapy a fotky. Dal si záväzok využiť AI k veciam prospešným spoločnosti.
i
Zhrnutie keynote v angličtine si môžete prečítať od samotného CEO na blogu Google.
PaLM 2 je ďalšia generácia rozsiahleho jazykového modelu. Pôjde o pohon služby Google Bard, teda chatbota konkurujúceho napríklad svetoznámemu ChatGPT. PaLM 2 zvládne vyladiť chyby v programovacích jazykoch. Bol trénovaný hneď na dvadsiatke takýchto jazykov. V rámci otázok z oblasti zdravotníctva si model dokázal poradiť natoľko, že dosiahol úroveň experta. Google si uvedomuje, že výsledky AI treba identifikovať, preto prináša ochranu v podobe vodoznakov a integrovaných metadát. AI sa dostane aj do vyhľadávania a mobilného systému Android.
Operačný systém Googlu prichádza už vo svojej 14. verzii. Viac ako 50 Google aplikácií bolo prispôsobených čoraz väčším uhlopriečkam telefónov i tabletov, napríklad Spotify, Minecraft či Disney+. Bude prispôsobený aj práve novému tabletu Google Pixel Fold. Novinky sa týkajú aj Wear OS, systému pre hodinky Google Pixel Watch a Samsung Galaxy Watch. Do systému novo pribudne aplikácia WhatsApp. Zmien sa dočká aj Gmail a kalendár.
Android môže čerpať z obrovskej základne zariadenia. To však môže spôsobiť ich roztrieštenosť, preto Google v Androide 14 myslí na ich lepšie prepojenie. Napríklad Fast Pair zrýchli proces párovania príslušenstva typu bezdrôtové slúchadlá. Ak ste blízko iného podporovaného zariadenia, môžete s ním okamžite zdieľať súbory, a funguje aj medzi Chromebookom, telefónom a tabletom. Aplikácia Find My Device udržuje geografický dohľad nad množstvom vašich produktov aj od výrobcov tretích strán.
Opäť sa dostávame k AI. Android 14 sám predpíše správu ako odpoveď na konverzáciu v chate, a to v niekoľkých variantoch. Z obrázku na ploche vyreže objekt v popredí a nechá ho vtiahnuť do rozmazaného pozadia. Ďalšie tapety môžete generovať práve vďaka umelej inteligencii. A bude sa jednať o unikáty, ktoré doteraz nikto iný na ploche svojho telefónu nikdy nemal. Do telefónov tiež prichádza štandard RCS. Má ísť o moderný spôsob komunikácie nahrádzajúcej SMS a MMS, ako ich poznáme.
Novým hardvérom sa stal telefón Google Pixel 7a. Má ísť o nástupcu Google Pixelu 6a a spadá pod smartfónovú strednú triedu. Svojím vzhľadom aj funkciou sa veľmi podobá aktuálnemu Google Pixelu 7, má však ísť o jeho odľahčený variant.
Najprv si rozdiel všimnúť takmer nemusíte, novinka má však menší displej s uhlopriečkou 6,1" a okolo neho je viditeľný hrubší čierny rámček. Zadnú stranu si s telefónom Pixel 7 pomýlite veľmi ľahko. Snáď len modrá verzia značí, že ide práve o najnovší Pixel 7a.
Telefón sa drahšiemu bračekovi môže vyrovnať svojim výkonom vďaka prítomnosti procesora Google Tensor G2 a 8 GB operačnej pamäte. Novinkou, ktorá určite poteší a zároveň stúpne jeho pomyselná hodnota, je podpora bezdrôtového nabíjania. Google Pixel 7a tiež šliapol do pedálov a nenechá sa zahanbiť ani svojimi fotoaparátmi. Narástol im počet pixelov.
Špekulácie neklamali. Google sa aktuálne pochválil svojim vlastným sklápacím smartfónom. Vstupuje tak na trh, ktorému vládne najmä rad Samsung Galaxy Z. Google Pixel Fold nie je skromný a podľa výrobcu má obsahovať tú najlepšiu fotografickú skúsenosť medzi véčkovými telefónmi. A že má napríklad vo vyklápacích telefónoch Samsung Galaxy Z Fold4 veľkú konkurenciu. Oproti kórejskému modelu pôsobí ako zavalitejší mobil z prémiových materiálov, ktorý skrýva vysoký výkon a 7,6" displej.
Google Pixel tabliet s 11" displejom je priamo zameraný na konzumáciu obsahu, čím sa Google nijako netají. Aj on sa spolieha na Google Tensor G2 procesor. Jeho nabíjacia základňa slúži ďalej ako stojan, ale aj reproduktor. Tablet je teda nielen vďaka tomu užitočný ako domáci asistent a zábavný prvok v jednom. Úzka spolupráca s Pixel telefónmi a Google službami ako Google Photos sa priam ponúka.
V umelej inteligencii vidí Google budúcnosť, ale už sa snaží preniknúť do jej tajov aj v súčasnosti. Predstavené služby a produkty sú toho jednoznačným dôkazom. Google predstavil svoje plány a my sa už tešíme na oznámenie nových vlajkových smartfónov pre tento rok.