Apple doufá, že koncem tohoto roku zpřístupní přepis a sumarizaci zvuku v reálném čase v celém systému na mnoha svých zařízeních, protože výrobce iPhonů se snaží využít sílu umělé inteligence při poskytování zvýšení efektivity u několika svých základních aplikací, zjistil AppleInsider.
Lidé obeznámení s touto záležitostí nám řekli, že Apple pracuje na shrnutí a výrazně vylepšeném přepisu zvuku pro několik svých operačních systémů nové generace. Očekává se, že nové funkce umožní uživatelům jeho základních aplikací Notes, Voice Memos a dalších aplikací výrazně zlepšit efektivitu.
Apple v současné době testuje funkce jako přídavky funkcí k několika aktualizacím aplikací, které mají přijít s vydáním iOS 18 později v roce 2024. Očekává se, že se také dostanou do odpovídajících aplikací v macOS 15 a iPadOS 18.
Výchozí aplikace Voice Memos, kterou Apple zahrnuje do svého portfolia zařízení, bude mezi prvními, které obdrží upgradované funkce. Dřívější verze aplikace poskytují běžící přepis každé zvukové nahrávky a fungují podobně jako nedávná funkce Live Voicemail společnosti.
Přepisy zabírají centrální oblast okna aplikace a nahrazují větší grafické znázornění nahraného zvuku ve stávající verzi aplikace.
Přepis se také stahuje do další verze poznámek. Předběžné verze obou aplikací obsahují speciální tlačítko pro přepis ve formě bubliny, podle těch, kteří jsou obeznámeni se softwarem. Klepnutím na novou bublinu se zobrazí přepis zvuku nahraného v aplikaci.
Přepisovací nástroj půjde ruku v ruce s – a poskytne nový kontext – připravovaným funkcím nahrávání zvuku v Notes, které byly poprvé podrobně popsány AppleInsider v dubnu. Konkrétně aktualizace přidá možnost pro sumarizaci nahraného zvuku generovanou umělou inteligencí, která okamžitě poskytuje základní textové shrnutí klíčových bodů a akcí.
Očekává se, že funkce shrnutí umělé inteligence ve spojení s novým záznamem zvuku v aplikaci a možnostmi přepisu v reálném čase učiní z vestavěné aplikace Notes společnosti Apple skutečnou elektrárnu. Trojice funkcí bude sloužit jako užitek pro širokou škálu praktických aplikací, přičemž převezme náročnou práci se zpracováním velkého množství dat až do klíčových bodů. To vše znamená pro uživatele pohodlí a přehlednost na první pohled.
Studenti by mohli snadno nahrávat přednášky a hodiny, aniž by se spoléhali na nástroje třetích stran. Pokud nahráváte z nové aplikace Poznámky, existuje možnost zahrnout do poznámky přepis a shrnutí spolu s dalšími médii, jako jsou obrázky, odkazy a datové struktury, jako jsou tabulky.
Funkce se také vyplatí profesionálům, kteří se pravidelně účastní konferenčních hovorů, virtuálních obchodních schůzek nebo seminářů v rámci své pracovní činnosti. Takové události často prozradí velké množství informací, různé statistiky, podrobné obchodní plány, data a harmonogramy, které technologie AI společnosti Apple analyzuje a reorganizuje do správně strukturovaných souhrnných zpráv.
Totéž platí pro hodiny nebo přednášky na pokročilejších úrovních, které často obsahují řadu informací, jako jsou definice, vysvětlení složitých myšlenek nebo teoretických principů, názorné příklady a mnoho dalšího.
Mezitím by novináři získali extrémně efektivní způsob přepisu a shrnutí dlouhých rozhovorů. Kreativci, jako jsou autoři a scénáristé, mohli snadno zaznamenat klíčové myšlenky a prohlédnout si je později, aniž by museli přehrávat a poslouchat většinu nahrávek, aby jednoduše izolovali klíčové datové body.
Přestože Apple vynaložil velké úsilí, aby zajistil, že jeho funkce přepisu a sumarizace generují přesné výsledky, chyby jsou nevyhnutelné. Zachování původního zvuku vedle přepisu a souhrnu generovaného umělou inteligencí tedy zajišťuje, že se žádná ze zdrojových informací neztratí v procesu přepisu nebo sumarizace.
Shrnutí je pouze součástí většího úsilí Apple AI
Nové funkce pro přepis a sumarizaci budou součástí širšího úsilí Applu o AI od Applu v letošním roce. Očekává se, že se podobné funkce shrnutí dostanou také do Safari 18 prostřednictvím Intelligent Browsing a do vestavěné aplikace Zprávy – prostřednictvím integrace se softwarem umělé inteligence Apple na zařízení.
Případy použití a celkový účel souhrnných funkcí poháněných umělou inteligencí v Safari a Zprávy jsou zcela odlišné. Zatímco Notes umožní uživatelům shrnout schůzky, konferenční hovory a přednášky, Safari umožní sumarizaci webových stránek, zatímco Zprávy nabídnou zhuštěnou verzi obsahu zpráv.
Software AI od Applu by také mohl sloužit k ochraně soukromí uživatelů, protože se očekává, že některé funkce AI budou fungovat výhradně na zařízení. V případě přepisu zvuku a pokročilé sumarizace AI však může být prozatím vyžadováno zpracování na straně serveru.
Začleněním sumarizace a přepisu zvuku do svých systémových aplikací se společnost snaží předvést některé z nejlepších výhod použití umělé inteligence pro řešení reálných scénářů. Cílem snah společnosti Apple o AI je poskytovat vývojářské funkce, které slibují, že umožní zákazníkům být efektivnější a úspěšnější v jejich každodenních úkolech.
Společnost zároveň doufá, že se lépe postaví proti rozšiřování konkurenčních aplikací třetích stran, které nyní využívají technologii AI, z nichž několik zaznamenalo dobrou míru přijetí, když je spotřebitelé začlenili do svého digitálního života.
Aplikace Otter je například dalším držitelem ceny Apple Editors‘ Choice Award. Nabízí podobné funkce jako funkce popsané v tomto článku. Díky tomu mohou uživatelé zaznamenávat, přepisovat a sumarizovat schůzky prostřednictvím generativní umělé inteligence, vše v jedné aplikaci.
OneNote od Microsoftu také nabízí podporu pro záznam zvuku ve formě hlasových poznámek, což slouží jako další potenciální soupeř pro aplikace Apple Notes a Voice Memos.
Je však třeba zdůraznit, že ne všechny softwarové funkce, které Apple testuje v předběžných verzích softwaru, se dostávají do stávajícího cyklu vydání. Společnost Apple je známá tím, že na poslední chvíli ruší projekty nebo zpožďuje funkce pro další vydání operačního systému a aplikací, takže v konečném důsledku neexistují žádné záruky ohledně načasování a dostupnosti.
Zdá se však, že nová sumarizace AI a funkce přepisu v reálném čase jsou stále na cestě k očekávanému odhalení spolu s operačními systémy nové generace společnosti Apple na červnové konferenci Worldwide Developers‘ Conference (WWDC). Očekává se, že se k nim připojí mimo jiné vylepšené aplikace Kalendář a Kalkulačka.
Zdroj: appleinsider.com