Apple na WWDC oznámil nové modely jazyků AI. Tyto modely běží jak lokálně na zařízeních Apple, tak na vlastních serverech Apple Silicon s umělou inteligencí.
Umělá inteligence (AI) spoléhá na jazykové modely které poskytují znalostní vstup pro trénování umělé inteligence, aby produkovala výsledky pro výzvy (dotazy).
Pomocí jazykových modelů lze počítače školit v konkrétních předmětech, aby působily jako doménoví experti na určitá témata.
AI zarovnání odkazuje na proces navrhování a implementace systémů umělé inteligence tak, aby odpovídaly lidským cílům, hodnotám a požadovaným výsledkům. Jinými slovy, zarovnání je určeno k tomu, aby udržela AI na úkolu a nestala se nebezpečnou tím, že by se odchýlila od svého původního účelu.
Na WWDC 2024 Apple oznámil Apple Intelligence – vlastní AI společnosti Apple, která bude poskytovat AI na zařízení i na serveru. Použitím nových modelů v Apple Intelligence se AI společnosti Apple stane cílenější, rychlejší a přesnější.
Základní jazykové modely
Apple své obecné generativní modely umělé inteligence nazývá základní jazykové modely. Tyto modely jsou velké jazykové modely (LLM), které používají až 3 miliardy parametrů a jsou navrženy pro základní generativní umělou inteligenci, kterou může chtít používat většina uživatelů.
Apple tyto dva modely nazývá AFM na zařízenía AFM-on-server respektive.
Apple má také další univerzální modely zabudované do Apple Intelligence. Tyto modely mohou běžet jak na zařízení, tak na serverech společnosti Apple.
Apple poskytuje poměrně podrobnou čtyřiačtyřicetistránkovou bílou knihu o tom, jak fungují její základní jazykové modely. Z technického hlediska základní modely společnosti Apple využívají základní linii technik umělé inteligence, mezi které patří:
- Architektura transformátoru
- IO vkládací matice
- Přednormalizace
- Normalizace klíče dotazu
- Pozornost seskupeného dotazu
- Aktivace SwiGLU
- RoPE polohové vestavby
- Jemné doladění
- Lidské úpravy a vstupy
Apple Intelligence také používá automatizovaný webový prohledávač s názvem AppleBot. Weby mohou informovat AppleBot, aby nepoužíval jejich obsah, tím, že se odhlásí ve svých souborech robots.txt.
Pro kód AI se Apple Intelligence také učí z open source softwaru hostovaného na GitHubu, ze kterého se učí a zhušťuje, čímž automaticky odstraňuje duplicitní případy.
Bílá kniha společnosti Apple podrobně popisuje, jak modely fungují a používané tréninkové metody, včetně pokročilé matematiky na konci.
Private Cloud Compute
Apple Private Cloud Compute (PCC) je vzdálená služba umělé inteligence, která využívá všechny výše uvedené modely a navíc má přístup k dalším modelům pro rozšířenou inteligenci.
Podle tohoto blogového příspěvku, který popisuje PCC, má Apple několik cílů s PCC, které zahrnují rychlost, přesnost, soukromí a spolehlivost stránek.
PCC také používá stejné Secure Enclave a Secure Boot jako spotřebitelská zařízení Apple, aby bylo zajištěno, že operační systém a data nemohou být zmanipulovány.
Stejně jako mnoho dalších nabídek AI od technologických společností poskytuje PCC vzdálené provádění výzev AI, ale s rychlejším výkonem.
Apple shrnuje své základní modely takto:
„Naše modely byly vytvořeny s cílem pomáhat uživatelům provádět každodenní činnosti napříč jejich produkty Apple a byly vyvíjeny zodpovědně v každé fázi a vedeny základními hodnotami společnosti Apple. Těšíme se, že se brzy podělíme o další informace o naší širší rodině generativních modelů, včetně jazykové, difúzní a kódovací modely.“
Podívejte se také na naše články iOS 17.6 a další přichází po vydání beta verze Apple Intelligence a Apple přiznává, že používá hardware Google Tensor k trénování Apple Intelligence.
Apple Intelligence slibuje, že uživatelům iOS a Mac poskytne rychlejší, optimalizovanou AI na zařízeních a v cloudu. Budeme si muset počkat a uvidíme, jak to dopadne s blížícím se vydáním iOS 18 a další iterací macOS.
Zdroj: appleinsider.com