Jak aktualizace Gemini a OpenAI hrají roli ve strategii AI společnosti Apple

Apple bude mít co dohánět, pokud chce konkurovat Googlu a OpenAI

Společnosti Google a OpenAI oznámily významné aktualizace svých modelů a funkcí umělé inteligence, čímž vytvořily větší konkurenci pro Apple před WWDC.

V pondělí OpenAI oznámila svůj inovativní model GPT-4o AI a zcela novou aplikaci pro Mac, zatímco Google v úterý představil hlavní vylepšení svého softwaru Gemini. Obě společnosti předvedly řadu pozoruhodných funkcí, díky nimž byl trh ještě více konkurenceschopný.

Zatímco Apple zdánlivě zaostává ve svém úsilí o umělou inteligenci, partnerství se společností Google nebo OpenAI by se mohlo ukázat jako snadný způsob, jak nabídnout své uživatelské základně generativní funkce umělé inteligence. Alespoň zvěsti naznačují, že je to cesta, kterou je Apple ochoten jít.

Aktualizace OpenAI

OpenAI nedávno představila GPT-4o, novou multimodální verzi firemního modelu GPT AI, která obsahuje vylepšené možnosti zpracování různých typů vstupů.

Na rozdíl od svých předchůdců bude GPT-4o schopen využívat jednu neuronovou síť pro zpracování zvuku, obrázků a textu, což ve výsledku nabídne modely významných vylepšení. Během oznámení produktu se také hovořilo o zvýšení rychlosti a jazykového zpracování.

OpenAI GPT-4o bude schopen porozumět a předávat emoce. Během nedávné akce společnosti to členové týmu demonstrovali tím, že požádali modelku, aby analyzovala výrazy obličeje a určila konkrétní emoce, které uživatel vyjadřuje.

Obrazovka počítače zobrazující sloupcový graf srovnávající hlavní stavební projekty římských císařů s kurzorem směřujícím na sloupec označený „Constantine“.

ChatGPT od OpenAI je nyní oficiálně k dispozici na macOS

Díky vylepšené funkci Voice Mode, která poskytuje zvukový výstup ve formě řeči, může GPT-4o upravit tón svého hlasu, takže je robotičtější nebo přirozenější v závislosti na požadavku uživatele.

Společnost také spustila novou desktopovou aplikaci pro ChatGPT, která je dostupná na macOS, a představila nové API pro vývojáře. GPT-4o bude uživatelům k dispozici prostřednictvím procesu postupného zavádění,

Aktualizace Google Gemini

Google na své úterní vývojářské konferenci I/O odhalil řadu vylepšení svého modelu Gemini. Nový a vylepšený Google Gemini bude schopen porozumět složitějším uživatelským vstupům, obrázkům a zároveň zohlednit kontext, který za nimi stojí.

Google Gemini je generativní nástroj umělé inteligence

Software AI bude obsahovat nové kontextové funkce, což znamená, že na obrazovce uvidí vše, ať už je to PDF, video nebo série textových zpráv. Gemini budou moci shromažďovat informace a generovat výstup, ale pouze na vybraných zařízeních Android.

Díky nové možnosti Circle to Search budou uživatelé například moci vybrat jednotlivé objekty v rámci obrázku a okamžitě získat výsledky vyhledávání Google o daném objektu.

Další funkce dostupná exkluzivně pro Android poskytne uživatelům možnost analyzovat videa z YouTube a soubory PDF prostřednictvím Gemini Advanced. S placenou službou budou uživatelé moci klást konkrétní otázky a obdrží odpovědi převzaté z obsahu uvedeného videa nebo PDF.

Aktualizovaný Gemini od Googlu bude schopen shrnout zdlouhavé konverzace a izolovat klíčové informace z dokumentů, obrázků a videí, což vše by mělo být velkým přínosem pro jeho koncové uživatele. Apple usiluje o podobné funkce prostřednictvím svých vlastních produktů.

Co zatím víme o strategii AI společnosti Apple

Apple znatelně zaostává za konkurencí, pokud jde o jeho nabídky AI, ale to se může velmi brzy změnit s oznámením iOS 18 na začátku června.

Již více než rok Apple pracuje na svém vlastním modelu velkého jazyka (LLM) známém jako Ajax. Se svým generativním softwarem AI má společnost za cíl nabídnout nové funkce podobné těm, které Google a OpenAI oznámily na začátku května.

Očekává se, že Apple v rámci svého nedávného zavádění AI představí několik funkcí poháněných umělou inteligencí ve svých nových operačních systémech. Analýza dokumentů a webových stránek, sumarizace textu, popisky obrázků a generování odpovědí jsou v práci.

Společnost se snaží začlenit generativní technologii AI do svého stávajícího sortimentu základních systémových aplikací. V důsledku toho se očekává, že aplikace jako Notes, Safari, Messages, Mail, Siri a Spotlight Search dostanou tak či onak vylepšení s umělou inteligencí.

Barevná ikona Siri, ikony Safari a Zprávy a vyhledávací lišta Spotlight na tmavém pozadí.

Apple Ajax LLM vylepší Safari, Spotlight a Zprávy

Z hlediska skutečné funkčnosti však existují limity toho, čeho byl Apple schopen dosáhnout. Model umělé inteligence na zařízení v testování je schopen pouze základní analýzy textu a základního generování odezvy na zařízení.

Pokročilejší funkce budou zdánlivě vyžadovat cloudové zpracování, což je důvod, proč Apple údajně usiluje o vytvoření licenční dohody s OpenAI. To by společnosti Apple umožnilo nabízet řadu vylepšení souvisejících s AI, která jeho vlastní modely na zařízení nemohou usnadnit.

Samostatná fáma tvrdí, že Apple chce vytvořit „AI App Store“, prostřednictvím kterého by uživatelé mohli nakupovat aplikace a produkty s AI od jiných společností. To by teoreticky dalo uživatelům možnost používat placené verze produktů, jako je Gemini Advanced.

Snahám společnosti Apple v oblasti umělé inteligence brzy lépe porozumíme, protože se očekává, že společnost představí své nové generativní funkce umělé inteligence na výroční konferenci Worldwide Developers‘ Conference 10.

Zdroj: appleinsider.com