Wat wordt Apple’s koers na de AI-blunder met de iPhone?

1 dag geleden 2

Hoe zat het ook alweer, met dat roeibootje, de wolf, de geit en de kool? Hoe breng je ze ongeschonden naar de overkant als je per keer maar één van de drie kunt meenemen? Voor mensen is dit raadsel niet zo ingewikkeld, maar de meest geavanceerde AI-technieken verslikken zich erin. Ook de nieuwste redeneermodellen, die beweren te ‘denken’, slagen er niet altijd in én de kool én de geit te sparen. Over het sparen van de wolf zullen we het maar niet hebben.

Met een paar van zulke raadsels legt een nieuw onderzoek van Apple-wetenschappers de tekortkomingen bloot van OpenAI’s o1, Google Gemini Thinking en DeepSeek R1. Deze methoden voor kunstmatige intelligentie (AI) zijn getraind om ‘langer na te denken’ en het antwoord eerst even op te breken in hapklare logische blokken. Dat levert een scala aan nieuwe AI-toepassingen op, die veel verder gaan dan een gesprek met een chatbot.

Toch redeneren redeneermodellen niet echt. De large language models of LLM’s, die de basis vormen van ChatGPT, genereren een antwoord op basis van patronen die ze herkennen in bergen trainingsdata, bij elkaar geschraapt van het web en andere bronnen.

Liever een nutteloze Siri die je nooit gebruikt dan een onbetrouwbare SuperSiri die je op stang jaagt

De large reasoning models of LRM’s hebben hetzelfde fundament en dus ook hetzelfde fundamentele probleem. Buiten hun comfortzone, zonder de juiste trainingsdata, slaat ook een LRM de plank mis, schrijven de onderzoekers. Bijvoorbeeld bij het rivieroversteekprobleem, maar ook bij de Torens van Hanoi (drie palen en een stapeltje ronde schijven, succes ermee).

Om je te herinneren wat logisch denken is: doe wat puzzels op mathisfun.com. Het voelt alsof je een spier aanspant die je een tijd niet hebt hoeven te gebruiken, dankzij ChatGPT en soortgenoten. Eén tip: neem de geit mee terug.

SuperSiri

Apple’s onderzoek, ‘De illusie van het denken’, werpt een nieuw licht op al bekende beperkingen van de grote taalmodellen. Wil AI verder komen, dan is een nieuwe aanpak nodig.

De publicatie was ook goed getimed, net voordat Apple zelf met de billen bloot moest. Het bedrijf had zich namelijk verslikt in zijn eigen AI-illusies.

Op ontwikkelaarsconferentie WWDC had deze week een verbeterde versie van de spraakassistent Siri het daglicht moeten zien. Dat was de belofte: eind 2024 toonde Apple’s tv-reclames een vlotte chatbot die persoonlijke gesprekken kan voeren à la ChatGPT én complexe taken verricht op je telefoon, zonder privédata met de buitenwereld te delen. Die commercial bevatte fictieve functies, te complex voor de iPhone.

Apple ontkent dat het vaporware betrof, maar schrapte de reclamecampagne, zette een streep door alle deadlines en deed de blamage op WWDC af met één bijzin: „De kwaliteit voldeed niet aan onze hoge standaarden”, aldus softwarebaas Craig Federighi. Dat is een understatement, want naar verluidt ging Siri bij een derde van de opdrachten de mist in.

Singapore onder de smartphones

Wat ging er mis? Volgens Bloomberg stak het bedrijf niet genoeg geld in nieuwe AI-chips om de eigen modellen te verbeteren. Intern gerommel en bureaucreatie deden het project de das om. Volgens The Information ontbrak het de leiders aan ‘durf en ambitie’ en zwalkte de strategie.

Er speelt nog iets anders mee. Met 2,2 miljard Apple-apparaten in omloop kan de techreus veel goodwill verliezen. De iPhonemaker stelt hoge eisen aan privacy van gebruikers, en wil niet riskeren dat privégegevens door een vraag aan de chatbot gaan rondzwerven.

Apple verkoopt een wereld die veilig en voorspelbaar is. En streng gereguleerd ook – iOS is het Singapore onder de smartphones. Denk aan de strikte regels van de App Store (‘geen expliciete beschrijvingen of vertoningen van seksuele organen of activiteiten die bedoeld zijn om erotische in plaats van esthetische of emotionele gevoelens te stimuleren’). Of aan de restricties op het uitwisselen van bestanden met de buitenwereld, vanaf een iPhone. Gij zult daarvoor alleen door Apple geselecteerde apps gebruiken.

Maar AI laat zich niet zo makkelijk afsluiten of voorspellen. Chatbots kunnen onverwacht uit de hoek komen als ze op ingewikkelde problemen stuiten (of een simpele puzzel). En ze kunnen hallucineren. Dat overkwam Apple met de geautomatiseerde samenvattingen van nieuws, die op aandringen van de BBC werd gestaakt.

Het idee van een radicale make-over voor Siri laat Apple vooralsnog varen. Liever een nutteloze Siri die je nooit gebruikt dan een onbetrouwbare SuperSiri die je op stang jaagt.

In plaats van AI met zevenmijlslaarzen zet de iPhone voorlopig kleine stapjes vooruit in kunstmatige intelligentie. Denk aan handigheidjes die ook al in Android zitten, zoals live vertalingen van telefoongesprekken of een assistent die objecten en teksten op je scherm herkent.

Onder de motorkap wordt AI-rekenwerk vooral ‘lokaal’ uitgevoerd, op de iPhone of computer zelf. Dat komt de privacy ten goede en de reactietijd is korter dan bij AI-modellen die eerst met de cloud moeten bellen. App-ontwikkelaars krijgen ook toegang tot de onderliggende AI-techniek. Maar dit Foundation Models Framework, benadrukt Apple, is zeker niét ontworpen om voor chatbot te spelen.

Als een druppel water

Apples belangrijkste concurrenten maken veel meer vaart. Google stopt AI-assistent Gemini in alle hoeken en gaten van Android en eigen diensten als Gmail. Samsung gooit het over een andere boeg: dat gaat Galaxy-telefoons waarschijnlijk uitvoeren met chatbot Perplexity. Samsung is volgens Bloomberg een van de nieuwe investeerders in dit AI-bedrijf, dat in één klap 14 miljard dollar waard zou zijn. Apple zou hebben overwogen om Perplexity als zoekmachine toe te voegen, maar een gedeeltelijke of volledige overname van het bedrijf ligt niet voor de hand.

Uiteindelijk wil Apple de techniek zelf in de vingers krijgen. Tot die tijd probeert het bedrijf de kool en de geit te sparen. De verwachtingen voor Siri worden getemperd, en om de boot niet helemaal te missen kunnen iPhone-gebruikers ondertussen de techniek van ChatGPT inzetten (straks waarschijnlijk ook Google Gemini). In Nederland werkt dit overigens nog niet.

Tijdens WWDC compenseerde Apple de AI-blunder met veel uiterlijk vertoon – van oudsher een sterke strategie. Alle besturingssystemen voor iPads, iPhones en MacBooks krijgen een glimmend nieuw jasje, dat Liquid Glass heet. De transparante knoppen ogen alsof er een druppel water over een glasplaat glijdt. Prachtig, maar even afwachten of de leesbaarheid en accuduur intact blijven.

Nog een kleine revolutie in Apple-land: de jongste generatie iPads krijgt ‘windows’, vensters met een menubalk en wat extra’s. Zo mag je je tablet van Apple eindelijk als een gewone computer gebruiken. Een beetje meer vrijheid, een beetje minder Singapore.

Lees het hele artikel