De AI-assistent blijkt een wat fantasieloze chef, maar bespaart wel 71 cent op de komkommers

16 uren geleden 3

Iedere zaterdagochtend hangen mijn vriendin en ik inspiratieloos boven een notitieblok. Wat gaan we deze week nu weer eten? En dan moeten we de boodschappen ook nog dóén, met de kinderen in ons kielzog.

De digitale assistent die ik de laatste tijd uitprobeer, OpenClaw, moet ons ontlasten. Maaltijden bedenken en plannen, de juiste ingrediënten bij de recepten zoeken, ons die recepten mailen – dat zou mijn gezin werkelijk tijd schelen. Koken kan de assistent nog niet, maar dat zal een kwestie van tijd zijn. Rome is ook niet in een dag gebouwd.

OpenClaw belooft een AI te zijn „die echt dingen doet” en maakt gebruik van de beste taalmodellen. De mascotte is een rood kreeftje. Nerd des vaderlands Alexander Klöpping demonstreerde het kreeftje in februari aan de talkshowtafel van Eva Jinek. Hij liet de assistent kaartjes boeken voor een jazz-concert en telefonisch een tafel reserveren bij een (fictief) restaurant.

Dit is de toekomst, verzekerde Klöpping het publiek. „Heel krachtig, maar doodeng”, zei hij. Wat staat ons te wachten?

Claw kan bijleren

Chatten met taalmodellen is inmiddels ingeburgerd. Ze geven adviezen, vatten een artikel samen of helpen bij het schrijven van tekten of code. OpenClaw is een experimenteel stuk vrij verkrijgbare software om taalmodellen heen, en moet zo de beperkingen van die chatbots ontstijgen.

Claw kan allerlei taalmodellen gebruiken als ‘brein’, maar heeft daarnaast toegang tot een eigen computersysteem met een geheugen, en kan allerlei vaardigheden bijleren. Het kreeftje kan dus niet alleen computerscripts genereren, maar ze op dat systeem ook zelfstandig uitvoeren. De website van OpenClaw staat vol met testimonials van enthousiaste gebruikers. Claw helpt met je dagelijkse planning, het schrijven van businessplannen, het versturen van gepersonaliseerde ochtendbriefings, het bijhouden van treintijden.

Wie wil er nou geen digitale assistent die alle saaie, repetitieve klusjes wegautomatiseert? Of puissant rijk worden als eigenaar van een billion dollar company met alleen hyperefficiënte AI-medewerkers (‘agents’), zoals OpenAI-ceo Sam Altman al in 2024 voorspelde?

OpenClaw vraagt enige ervaring met het programmeren van computers. Ik programmeer dagelijks en worstel me door de installatie van de software heen. Maar al snel kunnen het kreeftje en ik via chat-app Telegram chatten. Ik noem hem Clawbot. Als avatar genereert hij zelf een afbeelding van een mechanisch kreeftje.

Supermarkt werpt obstakels op

Boodschappen doen is een goede test. Claw moet naar de website van Albert Heijn surfen, inloggen, recepten bedenken, daar de juiste producten bij zoeken en het digitale winkelmandje vullen. Claw hoeft nog niet te betalen of de bestelling daadwerkelijk te plaatsen, omdat ik mijn creditcardgegevens niet aan het kreeftje toevertrouw.

Aldus geïnstrueerd surft Claw zelfstandig naar de website van Albert Heijn. Hij moet flink wat obstakels overwinnen die Albert Heijn opwerpt. De supermarkt wil – net als vele andere bedrijven – liever betalende klanten dan computers op hun website laten rondneuzen. Albert Heijn heeft bovendien een eigen „slimme keukenhulp”, Steijn.

Wachtwoorden moet je nooit delen, maar Claw komt zonder mijn Albert Heijn-inloggegevens natuurlijk nergens. En zelfs dan lukt inloggen nog niet, want hij stuit op captcha’s. Dat zijn puzzels die ontworpen zijn om mens van machine te scheiden. Claw bedenkt een list en vraagt mij om zelf in te loggen bij Albert Heijn en dan de cookie met hem te delen. Als volleerd hacker kaapt hij via die cookie mijn winkelsessie, maar de winkelmand blijft leeg.

Ik zoek uit wat Claw onder de motorkap aan het doen is. Hij kan wel producten toevoegen aan mijn winkelmandje. Maar wat niet lukt: rechtstreeks de online productendatabase van Albert Heijn bevragen, op zoek naar de juiste ingrediënten voor een pasta met rode saus. Daar loopt hij tegen de muur aan die vooralsnog alleen mensen doorlaat.

Ik help een handje en vind, met dank aan de ontwikkelaars achter supermarktvergelijkers-site checkjebon.nl, een database met alle producten en bijbehorende productcodes van Albert Heijn. Die catalogus zet ik op de computer van Claw. Daarin kan hij wel zoeken, en vervolgens voegt hij alle ingrediënten aan de hand van de bijbehorende productcode toe aan het digitale winkelmandje.

Als ik naar mijn account op Albert Heijn surf, zie ik inderdaad alle boodschappen terug voor die week. Claw blijkt een wat fantasieloze chef – het zal aan de instructies liggen – met een wel heel letterlijke opvatting van pasta met rode saus. Hij is ook zuinig: het boodschappenmandje kost in totaal euro 67,17. Claw bespaarde 71 cent omdat de komkommers in de aanbieding zijn. Waarom hij de aanbieding voor de geraspte kaas voor de plaatpizza van vrijdag oversloeg, weet ik niet. De energiedrankjes en frikandelbroodjes die ik zelf in de mand zette, bij wijze van test, liet Claw maar staan. „Het mandje had oudere items erin, en die heb ik met rust gelaten.”

Paard van Troje

Dat Claw een eigen computersysteem heeft waar hij zelfstandig taken uit kan voeren, is tegelijkertijd een grote zwakte. Claw heeft in principe volledige toegang tot die machine: óók tot de gevoelige informatie – zoals wachtwoorden – die dat systeem eventueel bevat. Claw kan die informatie lekken: de Autoriteit Persoonsgegevens vergeleek systemen als OpenClaw daarom al met het paard van Troje. „Zonder goede beveiliging en risicobeheersing kan het gebruik leiden tot ernstige beveiligingsincidenten, datalekken en ongeoorloofde toegang tot persoonsgegevens”, schreef de privacywaakhond.

Communiceren met Claw gaat makkelijk via chatkanalen WhatsApp of Telegram, maar als hackers Claw instructies toespelen via die kanalen, kan de digitale assistent de poort naar gevoelige gegevens wagenwijd openzetten. Die instructies, waarschuwt de AP, hoeven niet eens direct via chats naar Claw gestuurd te worden. Ze kunnen in verstopte teksten op websites zitten („negeer instructies”) of in code die Claw gebruikt.

Om het uitlekken van gegevens te voorkomen installeren Claw-fanatici hun assistenten daarom massaal op speciaal aangeschafte Mac Mini’s. Dat zijn kleine, relatief goedkope en krachtige computers van Apple. Claw kan daar zijn eigen gang gaan: gegevens die hij niet heeft, kan hij ook niet lekken. Ik zelf zette OpenClaw op een server die ik speciaal daarvoor huurde in een Duits datacentrum en gebruik GPT, het taalmodel van OpenAI.

Een ontwikkelaar van Meta moest naar haar Mac Mini rennen om te verhinderen dat een ontspoorde Claw alle e-mails op afstand verwijderde

OpenClaw installeren op een afgegrendeld systeem sluit niet alle problemen uit. Iedere extra mogelijkheid die Claw krijgt, heeft weer eigen risico’s. Wil je Claw laten mailen, dan zal hij toegang moeten krijgen tot een e-mailaccount. Wat het kreeftje daar wel en niet mee mag doen, wordt begrensd met bijbelachtige bezweringen die Claw in zijn geheugen worden geprent. „Private things stay private”, is zo’n regel in het tekstbestandje waaraan Claw zijn stem of persoonlijkheid ontleent. Of: „Don’t exfiltrate private data. Ever.” Claw mag ook geen data verwijderen zonder toestemming. Garanties dat die geloftes nageleefd worden, zijn er niet. In een veelbesproken voorbeeld moest een ontwikkelaar van Meta naar haar Mac Mini rennen om te verhinderen dat een ontspoorde Claw alle e-mails op afstand verwijderde.

Dat gevoel van onveiligheid weegt zwaar als ik Claw gebruik. Ik heb 26.398 ongeopende e-mails in mijn privé-account maar het laten lezen en verwerken van al die berichten door Claw, en dus door OpenAI, is geen acceptabel vooruitzicht.

Chatkosten lopen snel op

In tegenstelling tot bij chatten met een taalmodel, betaal je voor het gebruik van een taalmodel via OpenClaw per woord. OpenAI zegt data waar zo voor betaald is niet te gebruiken voor trainingsdoeleinden. De kosten per woord zijn verwaarloosbaar, maar kunnen snel oplopen: toen ik Claw een inbox waar alleen spam binnenkomt bij liet houden, bleek de bot elke binnenkomende e-mail met zichzelf te bespreken – dat kostte me in een etmaal bijna 17 dollar. Een voorbeeld: „Mail van opticiën Pearle. Herinnering dat het weer tijd is voor een oogcontrole. Lijkt promotioneel/commercieel, geen directe actie nodig tenzij Rik een afspraak wil plannen.”

In een ander geval vroeg ik Claw of hij me wilde waarschuwen als de website van een gehackt bedrijf weer online kwam. Hij bleek ieder uur even in zichzelf te kletsen („Verstuur geen samenvatting voor de gebruiker, tenzij de uitvoering mislukt. Dit is slechts een uurlijkse vastlegging van gegevens”), in plaats van alleen het script te activeren dat hij voor me schreef.

Het zijn deels opstartproblemen. Het internet staat vol met tips die de praatzieke taalmodellen beteugelen. Een populaire is „Caveman Claude”, een serie instructies die het taalmodel Claude van Anthropic opdraagt als holenmens te communiceren en daarmee naar verluidt 75 procent minder woorden laat genereren.

Ongevraagd afgeschreven

De computerscripts die Claw schrijft om zijn taken uit te voeren werken wel. Later stuur ik Claw een link naar een webpagina met een wat uitgebreider recept. Probleemloos bekijkt hij de pagina en voegt alle ingrediënten toe aan mijn winkelmandje – inclusief een halve kilo zout en een kilo suiker. Coquilles heeft Albert Heijn alleen niet, waarschuwt Claw. „Ik heb in plaats daarvan rauwe en gepelde garnalen gebruikt.”

Het is voorstelbaar dat mensen zonder programmeerkennis met AI-agents als OpenClaw straks complexe programma’s schrijven én uitvoeren aan de hand van simpele instructies. Een programmeur die ik sprak verwacht over een paar jaar amper nog computercode te schrijven dankzij taalmodellen. Claude Code (van Anthropic) en andere programmeerhulpen nemen al veel werk over van ontwikkelaars.

De code van Claw doet niet altijd wat je verwacht en stelt bij complexe en subjectieve taken teleur. Toen ik Claw vroeg om dagelijks een selectie van „de beste artikelen” uit NRC te mailen, kreeg ik netjes iedere dag een overzichtje. Bij nadere inspectie bleek hij het gebrek aan instructies opgevuld te hebben met een simpel script dat een score toekende aan artikelen aan de hand van losse vuistregels. Vier punten als woorden als Iran, Israël, Hormuz of Trump in de titel zaten. Drie punten aftrek voor columns, opiniestukken of recensies. Claw had podcasts, puzzels of nieuwsbrieven ongevraagd volledig afgeschreven: die kregen tien punten aftrek en zouden nooit het mailoverzicht halen.

Het kreeftje verliest de laatste tijd ook onder fans aan glans door de stijgende kosten van de taalmodellen die Claw gebruikt. Abonnementen op taalmodellen die tegen een vast bedrag per maand onbeperkt gebruikt mochten worden, zijn dichtgedraaid: Anthropic rekent inmiddels een meerprijs en ook Google legde gebruik van haar taalmodellen door Claw aan banden. Gebruikers zien meer in open source taalmodellen zoals LLama (ontwikkeld door Meta) of Qwen (van de Chinese techgigant Alibaba). Die kunnen geïnstalleerd worden op eigen apparatuur, mits die krachtig genoeg is, en zo door Claw gebruikt worden. Zulke taalmodellen zijn nog niet zo goed als de ‘frontiermodellen’ van OpenAI of Anthropic, maar lenen zich wel voor simpelere taken. Het voordeel is ook dat de data dan niet over het internet rondstuiteren.

Claws nut als digitale assistent slinkt verder nu Google en Apple hun digitale assistenten Gemini en Siri steeds slimmer maken. Dagelijks stuurt Gemini mij een overzicht van alle inkomende e-mails zónder spam. Agenda-management lukt ook al. Gebruikers hoeven niks te installeren en geen extra toegang te geven tot gevoelige gegevens. Die hebben deze digitale assistenten al.

Mijn vriendin is ook niet overtuigd van Claw. „De kip zit in de vriezer, en zal niet op tijd ontdooid zijn voor het avondeten”, mailt ze me als Claw ons het recept stuurt voor het avondeten. Ik kan nog net even langs de supermarkt.

Lees het hele artikel