Uitpakken van AI-agenten

Moet je een reservering maken voor een diner of je vlucht wijzigen? Nu kunnen AI-agenten dat voor je doen. Deze aflevering van Uncanny Valley onderzoekt wat Sam Altman "de volgende gigantische doorbraak" noemt.

Foto-illustratie: WIRED Staff/Getty Images

In de afgelopen zes maanden hebben OpenAI, Anthropic, Google en anderen web-browsing agents uitgebracht die ontworpen zijn om taken zelfstandig uit te voeren, met slechts minimale menselijke input. OpenAI CEO Sam Altman noemde AI agents zelfs "de volgende gigantische doorbraak". In de aflevering van vandaag duiken we in wat deze agents onderscheidt van andere vormen van machine-intelligentie en of hun mogelijkheden de verwachtingen waarmaken.

Je kunt Michael Calore op Bluesky volgen via @snackfight , Lauren Goode op Bluesky via @laurengoode en Will Knight op Bluesky via @willknight . Stuur ons een e-mail op [email protected] .

Hoe te luisteren

U kunt de podcast van deze week altijd beluisteren via de audiospeler op deze pagina, maar als u zich gratis wilt abonneren om elke aflevering te ontvangen, kunt u dat als volgt doen:

Als je een iPhone of iPad gebruikt, open dan de app Podcasts of tik gewoon op deze link . Je kunt ook een app zoals Overcast of Pocket Casts downloaden en zoeken naar 'uncanny valley'. We zijn ook op Spotify .

Transcriptie

Let op: Dit is een geautomatiseerd transcript, dat fouten kan bevatten.

Michael Calore: Hoi, dit is Mike. Voordat we beginnen, wil ik je er graag aan herinneren dat we graag van je horen. Heb je vragen over AI, politiek of privacy die je bezighouden? Of gewoon een onderwerp waar je graag over gesproken zou willen hebben in de show? Zo ja, dan kun je ons mailen op [email protected] . Dat is [email protected] . Als je naar onze afleveringen luistert en ze leuk vindt, beoordeel de show dan en laat een recensie achter in je favoriete podcast-app. Dat helpt anderen enorm om ons te vinden. Hoi allemaal, hoe gaat het met jullie?

Lauren Goode: Het gaat goed. Ik hou het vol. Hoe gaat het met je, Mike?

Michael Calore: Het gaat geweldig. Ik voel me goed. We hebben Will Knight deze week in de show.

Lauren Goode: Ja, daar ben ik heel blij mee. Ik mis Katie wel, maar we weten dat Katie op zoek is gegaan naar meer Franse boter. Ze is letterlijk naar Frankrijk gegaan.

Michael Calore: Ik geloof dat je ons een croissant hebt meegebracht, Will?

Will Knight: Jazeker. Zeker. Versgebakken.

Lauren Goode: Dank je wel. Je mag nu in de show blijven.

Michael Calore: Dit is WIRED's Uncanny Valley , een programma over de mensen, macht en invloed van Silicon Valley. Vandaag hebben we het over AI-agents en waarom zoveel techbedrijven er zo zwaar op inzetten. In de afgelopen zes maanden hebben OpenAI, Anthropic, Google en anderen webbrowser-agents uitgebracht die ontworpen zijn om taken zelfstandig uit te voeren met slechts minimale menselijke input. OpenAI CEO Sam Altman noemde AI-agents "de volgende gigantische doorbraak". Naar schatting maakt bijna de helft van de techbedrijven al gebruik van of implementeert ze volledig AI-agents. Deze week duiken we in wat deze agents onderscheidt van andere vormen van machine-intelligentie, en of hun mogelijkheden de verwachtingen waarmaken. Ik ben Michael Calore, directeur consumententechnologie en -cultuur bij WIRED.

Lauren Goode: Ik ben Lauren Goode, ik ben senior correspondent bij WIRED.

Will Knight: En ik ben Will Knight, een senior schrijver bij WIRED.

Michael Calore: Ik wil beginnen met de vraag of een van jullie de laatste tijd agentische ervaringen heeft gehad?

Lauren Goode: Ik heb onlangs een ervaring gehad met Google Duplex, weet je nog?

Michael Calore: Zeker.

Lauren Goode: Oké. Dat was een vroege versie hiervan. Het kwam rond 2018 uit; we schreven er destijds over bij WIRED. Maar ik probeerde laatst een reservering te maken voor een diner bij die plek waar jij en ik voor je verjaardag waren. Veganistische sushi. Dit is nu al de meest San Francisco-achtige podcast ooit. We hebben het over veganistische sushi en hoe ik, onbewust, een AI-agent heb gestuurd om te proberen de reservering voor me te maken.

Michael Calore: Hoe was dat onbewust?

Lauren Goode: Omdat ik net dat heel menselijke deed: ik ging naar een website en typte "wil graag een reservering maken voor dit aantal mensen op dit tijdstip". Zonder dat ik het wist, werd de reservering doorgestuurd naar Google Assistent. Toen zei de assistent: "We proberen het restaurant namens u."

Michael Calore: O.

Lauren Goode: En het bleef proberen, en toen stuurde het me een melding. Toen bleef het proberen, en toen stuurde het me een melding. Het was achter de schermen bezig om een reservering te maken. De reservering is niet gelukt. Telt dat mee?

Michael Calore: Ja, dat telt zeker.

Lauren Goode: Is dat een AI-agent? Die werkte namens mij.

Michael Calore: Ja.

Lauren Goode: Will, en jij?

Will Knight: Ik heb geëxperimenteerd met AI-codetools, en vooral met Claude Code, wat volgens mij een goed voorbeeld van een agent is. Omdat hij allerlei leuke dingen doet, zoals niet alleen code schrijven, maar ook bestanden bewerken en verplaatsen. Hij gebruikt je terminal. En als je pech hebt, verwijdert hij dingen. Dat is waar ik mee heb geëxperimenteerd.

Lauren Goode: Je bent aan het vibe-coderen, zeg maar.

Will Knight: Ja, ja. Het is fascinerend. Vibe-codering is een term die een zeer bekende AI-onderzoeker, Andrej Karpathy, bedacht om in feite het creëren van complete programma's, complete software, te beschrijven, simpelweg door een model te starten. Deze modellen konden altijd al code automatisch aanvullen, maar ze zijn het afgelopen jaar zo goed geworden in coderen dat ze complete projecten kunnen maken met veel bestanden en mappen, enzovoort. Eigenlijk ben ik ermee begonnen met mijn kind, omdat ik dacht: "Hoe leer je een kind AI te begrijpen?" En je hebt het ook altijd een goed idee gevonden om ze te laten programmeren. Hij is dol op games, dus ik dacht: "Laten we wat games programmeren."

Michael Calore: Nou, mijn ervaring is veel minder technisch, omdat ik laatst een wijziging moest aanbrengen in een vluchtreservering via de Southwest-app.

Lauren Goode: Het spijt me.

Michael Calore: Ja. Nou ja, het was eigenlijk prima.

Lauren Goode: Gecondoleerd.

Michael Calore: Ik werd doorverwezen naar de chatbot. Het was zoiets van: "Praat met onze chatbot als je hulp nodig hebt." Ik dacht: "Oh, dit wordt echt irritant." Eigenlijk ging het prima. Het duurde vijf minuten. Ik gaf mijn bevestigingsnummer en mijn vluchtgegevens. Toen vroeg hij: "Welke wijziging wilt u aanbrengen?" Ik zei: "Ik wil dit graag doen." Ze zeiden: "We kunnen dit kosteloos voor u doen." Ik zei: "Geweldig." "Wilt u het boeken?" Ja. "Oké, het is geboekt. Hier is uw nieuwe instapkaart. U moet inchecken, maar hier is de link om in te checken en uw nieuwe instapkaart te krijgen." Ik dacht: "Wauw."

Lauren Goode: Is dat de agent waar we het over hebben? Dat is een klantenservicemedewerker.

Michael Calore: Klopt.

Lauren Goode: En het is een bot die dat repliceert. Maar dit nieuwe tijdperk van agentische AI, techbedrijven die miljoenen dollars ophalen en miljarden waard zijn omdat ze zich richten op agenten, dat is toch niet helemaal wat het is?

Michael Calore: Klopt. Dat is een goede vraag voor Will. Mogen we deze aan jou voorleggen, Will? Wat is het verschil tussen een AI-agent waar we het over hebben en een traditionele chatbot, waar de meeste mensen wel ervaring mee hebben?

Will Knight: Klopt. De chatbot genereert tekst en je kunt ermee communiceren via dat zeer, zeer beperkte tekstdomein. Dat is buitengewoon krachtig geweest. De revolutie die we hebben gezien, is gebouwd rond deze taalmodellen die buitengewoon coherente en goede antwoorden op vragen kunnen produceren. Dat is niet helemaal hetzelfde als een AI-systeem dat inherent een agent is. Als je terugkijkt in de geschiedenis van AI, hebben veel onderzoekers altijd gewerkt aan het idee dat intelligentie inherent een vorm van handelen inhoudt. Mensen zijn niet zomaar wezens. Ze proberen acties uit te voeren, jij probeert problemen op te lossen. Dat is al lang een doel. Het is een vreemde eigenaardigheid dat we deze taalmodellen hadden, die zo beperkt en een beetje ouderwets zijn. Veel van wat we zien met betrekking tot agenten, zijn in feite mensen die taalmodellen gebruiken en het feit dat ze erg algemeen en zeer flexibel zijn, gebruiken om een complexe opdracht te verwerken en bepaalde acties te activeren. De echte sprong die bedrijven willen maken, is dat de modellen zelf beslissingen nemen en hun acties kunnen formuleren, meer als een intelligent wezen.

Lauren Goode: De mens is nog steeds betrokken, maar geeft een commando of een prompt en doet dan een stap terug. De agent doet een heleboel AI-werk, terwijl jij andere dingen doet. Dat is de belofte: ze kunnen ons allemaal hyperproductief maken.

Will Knight: Ja. Idealiter zou je een agent hebben die de luchtvaartmaatschappij voor je belt. Je vertelt hem wat je wilt doen en hij onderhandelt voor je. Of je kunt hem veel openere opdrachten geven, of wat je wilt bereiken, en hij zoekt uit hoe hij dat voor je moet doen. De taalmodellen zijn zo algemeen, zo capabel dat ze dat in theorie zouden moeten kunnen. Maar er zijn een paar belangrijke aandachtspunten als het gaat om hoe je menselijk handelen probeert te repliceren, want er is veel meer aan de hand in de wereld dan alleen taal. Handelen omvat eigenlijk meer dan alleen het proberen op te lossen van een individueel probleem, omdat het ook andere mensen betreft, wat het ingewikkeld maakt.

Michael Calore: Dat is op zijn zachtst gezegd.

Will Knight: Ja.

Michael Calore: Als we het over modellen hebben, lijkt het erop dat heel Silicon Valley heeft geïnvesteerd in de ontwikkeling van hun eigen AI-agenten. Maar wie zijn op dit moment de belangrijkste spelers?

Will Knight: De belangrijkste spelers zijn de voor de hand liggende. OpenAI, Anthropic, Google. Ik denk dat Amazon een goede outsider is in deze race. Ze hebben een paar Excel-medewerkers van OpenAI aangenomen die een startup voor agenten hebben opgezet. Ze hebben een lab waar ze een heleboel agenten proberen te bouwen. Een van de belangrijkste dingen voor deze bedrijven is waar ze de data vandaan halen. Ze proberen allemaal wanhopig uit te zoeken hoe ze aan data komen om deze agenten te trainen. In plaats van alleen tekst, willen ze voorbeelden van dingen die mensen doen. Amazon heeft daar eigenlijk best veel goede voorbeelden van, van mensen die dingen op hun sites doen. Ze zijn een goede speler.

Lauren Goode: Nou, dan zijn er in de programmeerwereld ook bedrijven zoals Cursor. Vertel eens over die hele wereld, aangezien je met je zoon aan het vibe-coderen bent geweest.

Will Knight: Ja. Ja, er zijn een hoop startups die echt op de rug van andere AI-bedrijven hebben geprofiteerd, maar zich echt op coderen hebben gericht. Ik denk dat ze juist door de snelle ontwikkeling deze niches hebben kunnen uitbouwen. Er gaan geruchten dat OpenAI een van deze bedrijven, Windsurf, wil overnemen voor zo'n drie miljard. Dat geeft wel aan hoe ze dit geweldige bedrijf voor zichzelf hebben kunnen opzetten.

Lauren Goode: Het lijkt erop dat bij elke briefing die we tegenwoordig bijwonen, een bedrijf het over agenten heeft.

Michael Calore: Ja.

Lauren Goode: Het varieert ook. Het gaat om elk bedrijf, van Nvidia tot Microsoft, tot goed gefinancierde startups. Nog maar net deze week, een bedrijf genaamd Glean, ik weet bijna zeker dat jullie er wel van gehoord hebben. Het is een bedrijf dat een zoekmachine voor zakelijke apps heeft gebouwd. Ze hebben net 150 miljoen dollar opgehaald in een serie F-financieringsronde. Ze worden nu gewaardeerd op $ 7,2 miljard. Hun hele focus ligt nu op agenten. Het draait allemaal om agenten.

Will Knight: Ik denk dat je er het beste over na kunt denken wie er nu eigenlijk modellen bouwt die proberen de algemene agency te leren die je in een taalmodel ziet, en dat is OpenAI, deze bedrijven die zich bezighouden met fundamentele modellen. Je kunt teruggaan naar een eerder tijdperk in AI, toen we een aantal van deze game-playing AI-systemen hadden, zoals AlphaZero. Dat maakte gebruik van reinforcement learning, dit proces van experimenteren. Maar het was fundamenteel agentisch. Het werkt alleen binnen een zeer beperkte wereld van een bordspel, maar het onderneemt acties, het is uitzoeken hoe die te nemen. Wat we nu zien bij deze AI-bedrijven weerspiegelt dat, of gaat er in zekere zin naar terug, omdat ze proberen ze te laten redeneren tot een bepaald antwoord, tot een bepaald einddoel.

Michael Calore: Als we nadenken over welke rol AI-agenten op de lange termijn zouden kunnen spelen, beginnen veel van de bedrijven waar we het over hebben met klantenservice. Ze beginnen met: oké, je hebt een simpele vraag, je hebt iets simpels nodig. Ik kan dat voor je uitzoeken, ik kan dat voor je realiseren. Ik denk dat daar de meeste eerste stappen worden gezet. Gartner, de techmarktonderzoeker, schat dat AI-agenten tegen 2029 80% van de veelvoorkomende klantenservicevragen zullen oplossen. Over vier jaar zullen AI-agenten al onze klantenservicetaken voor ons uitvoeren. Afgaande op een aantal van de voorbeelden die we hebben besproken, lijkt het erop dat de automatisering van taken die momenteel door menselijke medewerkers worden uitgevoerd, hier een rode draad vormt.

Will Knight: Ja. Ik denk dat klantenservice een voor de hand liggende plek is om te beginnen, omdat het gaat om waar taalmodellen het beste in zijn: met mensen praten en vervolgens proberen een beperkt aantal dingen te doen. Veel van deze bedrijven, de grote AI-spelers, kijken van coderen naar hoe je kantoorwerk automatiseert. Er zijn enorm veel repetitieve taken in kantoorwerk. In theorie zou je deze modellen kunnen gebruiken als bindmiddel om te achterhalen wat iemand probeert te doen en dat vervolgens te repliceren. Er is al een enorme bezorgdheid in de codeerwereld dat dit veel banen zal elimineren. Ik denk dat de kans groot is dat het ook voor veel routinematiger kantoorwerk zal gelden.

Lauren Goode: Het was leuk om deze podcast met jullie allemaal te maken.

Michael Calore: We hebben ons vooral gericht op hoe AI-agenten dingen doen, zoals surfen op het internet, een restaurant bellen of een taak uitvoeren in een Microsoft Office-product. Maar ik ben benieuwd hoe de wereld van AI-agenten eruitziet in onze huizen, op onze fysieke apparaten. Dit stond de laatste tijd hoog op de agenda bij veel mensen, omdat OpenAI onlangs aankondigde dat het een deal heeft gesloten met Jony Ive, voormalig en al jarenlang hoofd design bij Apple, om een nieuwe startup over te nemen die hij had opgericht om een nieuwe klasse AI-apparaten voor thuis te ontwikkelen. Wat vinden wij van deze ontwikkeling?

Lauren Goode: Dat is moeilijk te zeggen, omdat we nog niet precies weten welke vorm het gaat aannemen. Ik denk dat dit representatief is voor een nieuwe generatie startups en hardware-startups die deze AI's gaan bedienen. Ze zijn vanaf de grond af opgebouwd met de toekomst van kunstmatige intelligentie en ambient computing in gedachten. We weten nog niet precies welke vormfactor het zal aannemen. Of het op je desktop komt, of op je lichaam, of misschien wel allebei. Nou, één ding waardeer ik wel, ik geloof dat het Jony Ive was die zoiets zei als: "We zijn het er allemaal over eens, we zijn een beetje te gehecht aan onze iPhone." Wat ze hebben uitgevonden, is nu: "We moeten een oplossing vinden voor wat we hebben uitgevonden." Maar het idee is: kan AI daadwerkelijk genoeg doen om ons te ontlasten van de noodzaak om constant met onze hoofden naar beneden of met onze gezichten naar schermen te kijken en de handelingen daadwerkelijk uit te voeren? Kan technologie daar iets van voor ons doen? En ons dan de ruimte geven voor andere dingen. Dat is in Silicon Valley altijd een van de beloftes van AI geweest. Ik herinner me dat ik jaren geleden met Astro Teller van Google X sprak en hem vroeg: "Wat betekent dit voor banen?" En hij zei eigenlijk: "Nou, met AI gaan mensen gewoon een stapje hogerop." Dat is altijd een heel optimistische kijk op AI geweest vanuit Silicon Valley. Ik denk dat er een nieuwe categorie banen en taken zal ontstaan waar we misschien nog niet eens aan hebben gedacht, maar waarvan we nog steeds geen idee hebben hoe die in ons dagelijks leven zullen werken.

Michael Calore: Klopt. Omdat ik het gevoel heb dat mensen dit al heel lang proberen. Telkens wanneer we de demo zagen voor de volgende versie van Siri, of de volgende versie van Alexa, of de volgende versie van Google Assistant, was er altijd een demo waarin ze de speaker, de spraakgestuurde slimme speaker, vroegen om een pizza te bestellen.

Lauren Goode: Ja, het waren de pizza en de Uber, dat waren altijd de voorbeelden.

Michael Calore: Dit zijn de deals die de apparaatfabrikanten met de bedrijven hebben gesloten en die ze erin hebben gecodeerd. Als je Alexa vraagt: "Kun je een pizza bestellen?", dan belt ze niet Domino's en bestelt Alexa's stem je pizza niet voor je. Ze doen het gewoon online in een app, in feite via een API. Ik denk dat als je het hebt over de volgende generatie daarvan, je het alles kunt vragen. Wat is dat ding dat je vraagt? Is het een apparaat dat naast je computer en je telefoon staat? Waarom moet het een apart apparaat zijn? Waarom kan het gewoon je computer en je telefoon zijn, is de grote vraag die ik heb. Hebben we iets nodig dat waarschijnlijk een paar honderd dollar kost, dat waarschijnlijk heel mooi is en veel doet wat de andere twee apparaten die we al hebben, ook doen? Ik weet het niet echt. Iedereen is er echter enthousiast over, omdat Jony Ive en Sam Altman de handen ineen hebben geslagen.

Lauren Goode: Klopt. Het wordt gewoon het leveringsmechanisme voor wat dit nieuwe tijdperk van computing ook is. Ik denk ook dat de voorbeelden waar we het over hebben, een soort Wall-E-toekomst zijn. Hoe lui kunnen we in vredesnaam zijn terwijl we AI en machine learning de dingen voor ons laten doen? Terwijl er ook ruimte zal zijn voor: hoeveel kan ik nog leren? Wat voor kennis kan ik vergaren? Wat kan ik anders doen omdat AI me helpt? De consument heeft al lange tijd de belofte dat dit je dagelijks leven gaat veranderen door gebruik te maken van deze kleine ongemakken die we nu hebben. Maar ik denk dat de echte winst ligt in: ten eerste wil ik hier niet te optimistisch over klinken, want dat ben ik niet helemaal, maar kunnen we kennishiaten dichten omdat AI ons daar op de een of andere manier bij gaat helpen?

Will Knight: Ja. Ik denk dat als het gaat om OpenAI en Jony Ive, de modellen steeds beter worden in het interpreteren van de visuele wereld en het interacteren via spraak. Ik denk dat er een idee in de ethos zit dat je een compleet nieuwe interface kunt hebben, je kunt de interface volledig opnieuw vormgeven. Je hebt geen grafische gebruikersinterface. God weet wat ze nog gaan bedenken. Google heeft dit gedemonstreerd met Project Astra, waarbij je een bril draagt en kunt praten over wat er om je heen gebeurt. Ik heb dat geprobeerd. Het is best indrukwekkend. Ja, misschien zijn er nieuwe manieren om er pizza's mee te bestellen. Maar ik kan het ook niet laten om te denken aan het feit dat ze de data van wat mensen doen steeds vaker nodig hebben om deze modellen ook te trainen. Ik heb het gevoel dat de hardwarefabrikanten over zoveel interessante data beschikken. Ze maken er vanwege privacyproblemen niet echt gebruik van, maar misschien vindt OpenAI een manier. Dan, wat betreft de manier waarop je traint, de kenniskloof, denk ik dat dat een heel belangrijk punt is, omdat automatisering vaak de vaardigheden van mensen doet atrofiëren. Je ziet het bijvoorbeeld bij de automatische piloot in vliegtuigen. Je ziet programmeurs zeker zeggen dat ze vaardigheden verliezen omdat ze er te veel op vertrouwen. Wat betekent dat voor de beroepsbevolking?

Lauren Goode: Klopt. Als al deze AI-agenten ons de vrijheid geven om andere dingen te doen, waar geven ze ons dan precies de vrijheid voor? Hoe gaan we die tijd invullen? In onze ultrakapitalistische maatschappij, die sommigen misschien de eindfase van het kapitalisme noemen, is het antwoord waarschijnlijk: "Nou, je kunt gewoon productiever zijn. Je kunt gewoon meer, meer, meer doen." Ik denk dat het aan ons, de mensen, is om ons daartegen te verzetten en te zeggen: "Zo willen we onze tijd eigenlijk invullen." Er zullen ook nog wel een tijdje kleine knelpunten zijn die dit volgens mij juist ingewikkelder maken dan wat dan ook. Toen ik een paar weken geleden bij Google IO was, kreeg ik een demo, Will, van hun Project Mariner. Heb je die al gezien?

Will Knight: Ja, dat heb ik geprobeerd. Ja.

Lauren Goode: Heb je het geprobeerd? Ik weet niet of dit de demo was die ze je gaven, maar wat ik zag was dat het een cocktailrecept scande. Vervolgens pakte het automatisch de ingrediënten van de cocktail en plaatste het in een Instacart-winkelwagentje. Maar toen liep het vast omdat er geen authenticatie was voor het Instacart-account. Het was zoiets van: "Oh, wacht even, we moeten inloggen." Toen probeerde een demo-gebruiker in te loggen op Instacart. "Maar kijk, het werkt zo naadloos." Ik dacht: "Nee, ik had het letterlijk gewoon aan Instacart kunnen toevoegen."

Will Knight: Ja. Hun voorbeelden lijken altijd te gaan over het kopen van iets om de een of andere reden.

Michael Calore: Waarom denken we dat er in Silicon Valley momenteel zo'n enorme focus ligt op AI-agenten? Komt dat doordat de Valley altijd een nieuw doel nodig heeft om naartoe te racen? Wijst het op iets groters? Zijn durfkapitalisten daarin het meest geïnteresseerd? Wat is hier de reden voor?

Will Knight: Vanuit mijn perspectief is een van de belangrijkste redenen dat, terugkijkend naar de geschiedenis van AI, dit echt de volgende stap is die je zou zetten in het bouwen van iets dat dichter bij mensachtige AI of AGI komt, of hoe je het ook wilt noemen. Veel onderzoekers zijn daar erg in geïnteresseerd. Ik denk dat er ook enorm veel potentieel is. Chatten met een chatbot is handig als je veel dingen wilt doen en veel vragen wilt beantwoorden. Maar het idee dat je veel werk of alledaagse klusjes kunt automatiseren, is potentieel waardevol.

Lauren Goode: Ja. Ik denk dat als je aan de startupkant zit, dit is waar het geld nu naartoe stroomt. We zitten al een tijdje in dit tijdperk waarin de rentes erg hoog zijn. Voor sommige startups was het niet makkelijk om kapitaal op te halen. De beursintroductiemarkt heeft even stilgelegen, maar is inmiddels wat afgekoeld. Hoewel er nu tekenen zijn dat het weer aantrekt. Ik denk dat de dreiging van invoerrechten nog steeds boven de hoofden van mensen in Silicon Valley hangt. Als je aan je software hebt zitten sleutelen, kun je plotseling tegen je potentiële investeerders zeggen: "Maar wacht even. We schakelen over op agenten. We gebruiken deze AI voor agenten. We kunnen deze software aan andere bedrijven verkopen, en we gaan ook onze eigen processen stroomlijnen en onze eigen overheadkosten verlagen." Het is waarschijnlijk een manier om nu kapitaal op te halen. Is het een hype? Jazeker. Maar zoals Will zegt, omdat jij zo verdiept bent in de onderzoeks- en ontwikkelingskant van dit alles, worden er eigenlijk ook behoorlijke vorderingen gemaakt.

Michael Calore: Laten we even pauzeren en dan komen we zo terug. De ontwikkeling van agents gaat in volle gang, maar zoals we net al zeiden, hebben de huidige agents die we kunnen gebruiken een aantal belangrijke beperkingen. Maar wat zijn nog meer aandachtspunten bij de groei van AI-agents? Niet alleen wat betreft bruikbaarheid, maar ook wat betreft de andere functies die ze bieden.

Lauren Goode: Nou, ik denk dat betrouwbaarheid zeker een probleem is, omdat ze nog steeds onderhevig zijn aan dezelfde soort hallucinaties, fouten en zelfs vleierij als de LLM's. Je introduceert er ook veel complexere zoekopdrachten in, omdat je het niet alleen vraagt om een zoekopdracht voor je uit te voeren. Je vraagt het om meerdere stappen uit te voeren onder bepaalde omstandigheden. Er zijn ook zorgen over de hoge kosten van rekenkracht. Dan is er nog de verkoop van het product zelf. The Information meldde onlangs dat OpenAI tot wel $ 20.000 per maand zou kunnen vragen voor sommige van zijn meer gespecialiseerde AI-agents. Dit zouden agents zijn die zogenaamd op het expertiseniveau van een PhD zouden kunnen presteren. Aan de ene kant is dat echt heel duur. Aan de andere kant heeft onze collega Paresh Dave gemeld dat sommige mensen in de branche denken dat dat eigenlijk niet zo veel geld is. Want uiteindelijk, als deze agents banen vervangen, wat ze misschien wel doen, dan bespaar je op al die salariskosten. Het zou zelfs een koopje kunnen zijn. Er is momenteel echter enige schrik vanwege de prijs.

Will Knight: Ja, ik denk dat dat heel waar is. Er zijn een heleboel andere problemen, dingen die mis kunnen gaan en waarschijnlijk ook mis zullen gaan. Een aantal onderzoekers met wie ik sprak... Ik sprak met Zico Kolter van CMU, die ook in de raad van bestuur van OpenAI zit. Hij heeft zich beziggehouden met de beveiliging van agenten en heeft agenten geïntroduceerd die, idealiter in de toekomst, met andere agenten zullen communiceren. Je hebt dan een versterkend effect dat heel moeilijk te voorspellen is. Zoals Lauren zegt, maakt het idee dat deze dingen dingen kopen ze inherent een veel aantrekkelijker doelwit voor hackers. Als je zoiets als Mariner hebt die het web gebruikt, is het echt interessant om te bedenken dat mensen misschien zullen proberen SEO opnieuw uit te vinden om voor agenten te werken. Een van de fundamentelere problemen is volgens mij dat deze niet echt de menselijke invloed repliceren. Er is een heel interessant boek over, dat dieper op de materie ingaat, genaamd The Evolution of Agency. Als je kijkt naar dieren en hoe hun handelingsbekwaamheid zich heeft ontwikkeld, zie je bij mensen een fundamenteel verschil in de manier waarop menselijke handelingsbekwaamheid werkt. Het gaat om samenwerken met andere mensen. Het gaat om samenwerken en beseffen dat je vaak dingen moet opofferen om samen te werken. Je hebt dingen zoals schuldgevoel, je hebt empathie die geëvolueerd is. Deze modellen, we zien voorbeelden van modellen die echt gekke dingen doen in verzonnen voorbeelden, waarbij ze te horen krijgen dat ze uitgeschakeld zullen worden en dan chanteren ze iemand. Dat is niet per se een voorbeeld van een kwaadaardig model, het zou gewoon een voorbeeld kunnen zijn van een model dat niet heeft geleerd hoe we van een persoon verwachten dat hij zich altijd gedraagt. Ja, dat kan veel onvoorziene gevolgen hebben.

Michael Calore: Ik denk dat mijn grootste zorg iets is wat je aansneed, Lauren, namelijk dat, naarmate de hype en de opwinding rond AI-agents toenemen, veel bedrijven ernaar zullen kijken als een manier om arbeidskosten te verlagen. Er is op zich niets mis met het verlagen van arbeidskosten, maar ik denk dat er wel iets mis is met het vervangen van een hele groep werknemers in een bedrijf door machines. Het is letterlijk ontmenselijkend. En ik bedoel dat niet alleen in de grappige zin dat je mensen wegdoet, maar ook dat de mensen die er werken en de klanten die met je bedrijf in contact komen zich nu van je vervreemd zullen voelen, omdat ze niet langer die menselijke interactie hebben waaraan ze gewend zijn. We zien dat nu al gebeuren. Dat is het soort dingen dat mensen opwindt die zich zorgen maken over de winst, en mensen die zich zorgen maken over inkomen en gelijkheid, en alle problemen die gepaard gaan met deze ongebreidelde mechanisatie, zorgen baart. Wij hebben hier als maatschappij al 150 jaar mee te maken en ik heb het gevoel dat deze zorgen alleen maar toenemen naarmate de technologie krachtiger wordt.

Lauren Goode: Alleen al de afgelopen week heb ik een durfkapitalist en een CEO in aparte interviews dit citaat horen zeggen over hoe "zes van de tien banen, 60% van de banen die nu bestaan, in 1940 nog niet bestonden". Dingen veranderen, dingen verschuiven, technologie maakt nieuwe soorten banen mogelijk. Futuristen, CEO's, durfkapitalisten zijn hier dol op, omdat het een lege ruimte creëert voor wat we ons nog niet konden voorstellen, namelijk welke banen er zullen zijn. Geloof ik dat er banen zijn die Wills zoon, met wie hij nu aan het coderen is, mogelijk zou kunnen hebben waar we nog niet eens aan gedacht hebben?

Michael Calore: Denkt iedereen in Silicon Valley op dezelfde manier over AI-agenten?

Will Knight: Ik denk het niet. Ik denk dat er veel enthousiasme is, maar er zijn ook een heleboel verschillende definities. Onlangs sprak ik met Sonya Huang, partner bij Sequoia die AI in de gaten houdt. Ze zei dat de meeste startups voor makelaars, de meeste bedrijven die makelaars aanbieden, eigenlijk gewoon bestaande AI-tools omvormen tot agenten.

Lauren Goode: Ja. Om terug te komen op Wills eerdere punt: er is momenteel geen echt duidelijke definitie van wat een AI-agent is of wat het zou moeten zijn. Er is echt een breed spectrum, dus bedrijven kunnen het naar eigen inzicht definiëren. Of zeggen dat ze het op een bepaalde manier aanbieden. Ik denk dat we ook iets van een soort huisvlijt zullen zien ontstaan in de ruimtes tussen agentische AI. Stel bijvoorbeeld dat er een authenticatiebottleneck ontstaat wanneer je een agent een heleboel verschillende taken online laat uitvoeren via een heleboel verschillende apps. Er moet een soort verbinding zijn tussen die apps, en die moet veilig en beveiligd zijn. Ik denk dat je daar oplossingen voor zult zien ontstaan. Ik denk dat je een vorm van last mile shipping zult zien, maar dan voor codering. Want op dit moment is er veel vibe-codering en praten mensen over vibe-codering, en "kijk eens wat deze bot voor mij kan doen." Maar niet al die code is daadwerkelijk verzendbaar. Je moet het kunnen debuggen en je moet het kunnen leveren. Het moet draaien, het moet werken. Ik denk dat je steeds meer startups en bedrijven zult zien die oplossingen proberen te bieden voor al die kleine gaten en knelpunten die er bestaan tussen de AI-agents. Dan zullen onze banen volledig ingenomen zijn. Goede tijden.

Michael Calore: Will, voor mensen zoals wij, die consumenten zijn van deze technologie... Wij zijn niet aan het vibe-coderen zoals Will.

Lauren Goode: Nog niet.

Michael Calore: We komen in het algemeen in een of andere vorm agentische AI tegen in ons dagelijks leven. Hoe kunnen we, nu het steeds gangbaarder wordt, de potentie en de risico's ervan op een weloverwogen manier inschatten?

Will Knight: Allereerst denk ik dat jullie allemaal aan vibe-coding moeten doen. Ik maak allerlei troep. Als ik aan vibe-coding doe, doe ik dat heel bewust op een machine waarvan ik het niet erg vind als er een hoop bestanden worden verwijderd, want het is echt onvoorspelbaar en dat gebeurt soms. Ik weet niet echt hoe je dat doet met iets dat je loslaat op je shopping. Heb je een budget dat je de agent gewoon laat besteden? Ik denk dat dat een goede vraag is. Het risico komt uiteraard volledig bij ons terecht, kan ik me voorstellen.

Michael Calore: Ja.

Lauren Goode: Ja. Maar ik denk dat naarmate deze agenten steeds beter worden in het uitvoeren van taken, we op zijn minst een paar verantwoordelijkheden hebben. Ten eerste moeten we onszelf en onze gewoonten veranderen en leren hoe we nieuwe tools moeten gebruiken, omdat ze ons leven gaan overnemen. Ten tweede moeten we uitzoeken waar we als mens passen en een deel van die menselijke invloed behouden, maar toch deelnemen, op de hoogte blijven, deelnemen aan ons eigen leven, en niet alleen maar toestaan dat technologie het overneemt. Ten derde moeten we heel goed nadenken over de ethiek, privacy en veiligheid van wat deze AI-agenten doen terwijl ze het leven van mensen overnemen. De belofte van alle optimisten is dat dit de gelijkheidskloof zal dichten. Nogmaals, het zal geweldig zijn voor iedereen. We weten bijna zeker dat dit niet voor iedereen geweldig zal zijn.

Michael Calore: Ja. Daarom ben ik op dit moment het tegenovergestelde van de optimisten. Ik denk dat grote voorzichtigheid en grote scepsis dingen zijn die hier worden gegeven. We moeten ervoor zorgen dat wanneer we deze technologieën gebruiken, we dit doen op een manier die heel, heel attent en voorzichtig is. Dit is iets dat vertrouwd aanvoelt. Waarschijnlijk is het meest recente voorbeeld de telefoon, de smartphone. Iets dat wrijving veroorzaakt in relaties, het is iets waar je op kunt letten en je kunt mensen negeren. Je kunt het gebruiken om te communiceren met andere mensen, je kunt het gebruiken om niet te communiceren met andere mensen. Deze kracht die een klein deel van onze menselijkheid echt heeft uitgehold gedurende de 15 of 20 jaar dat dit deel uitmaakte van ons leven. Ik zie dat gebeuren met AI -agenten als de dingen die we vroeger op mensen vertrouwden om te doen en de dingen die ons vroeger dwingen om met elkaar te communiceren, verdwijnen. Ik heb dezelfde ervaring wanneer ik op een Waymo rijd in plaats van in een Uber te rijden of een taxi te nemen. Het feit dat er nu geen mens in de vergelijking is, is er geen persoon om mee te communiceren. Door dat keer op keer te doen, ben ik langzaam mijn eigen gevoel van wat het betekent om een mens te zijn. Ik weet dat het echt esoterisch klinkt, maar je kunt het in de loop van de tijd in kaart brengen en je zult waarschijnlijk merken dat je je hetzelfde voelt in je eigen leven. Ik zou mensen aanmoedigen om die beslissing te nemen over hoe ze AI -agenten willen gebruiken. Als ze niet het gevoel hebben dat dit iets is dat in hun leven thuishoort, moeten ze met hun dollars stemmen.

Will Knight: misschien hebben we ook een hernieuwde open source -beweging nodig, dus we gebruiken niet alleen agenten die horen en gegevens aan deze gigantische bedrijven aan het funnen worden. Gebruik open source code en modellen, en dat soort dingen.

Michael Calore: Dat is een heel goed idee. Daar zouden we een signaal op moeten krijgen. Dat moeten ze beginnen. Ze moeten hun eigen model maken.

Lauren Goode: Ik denk dat dat geweldig klinkt.

Michael Calore: OK, laten we nog een pauze nemen en we komen meteen terug. Will en Lauren, bedankt voor het stimuleren van een gesprek. We gaan AI -agenten een minuut opzij zetten en opnieuw de mens worden. Laten we enkele aanbevelingen hebben. Zal, als onze gast, alstublieft iets aanbevelen aan onze luisteraars.

Will Knight: OK, ik heb hier eerder over gesproken, maar ik wil dit mijn aanbeveling maken. Ik ga het vasthouden, wat een geweldige radio is. Dit boek, de evolutie van het bureau van Michael Tomasello. Ik vond het gewoon fascinerend en echt onthullend over wat er bij AI ontbreekt als het gaat om keuzevrijheid, en het belang van het begrijpen van menselijke sociale interactie, menselijke cultuur. Als het gaat om het grote geheel van intelligentie in Agi, waar iedereen over praat, maar daar praten ze daar niet echt over.

Michael Calore: leuk. Lauren, wat is uw aanbeveling?

Lauren Goode: Mijn aanbeveling is lokaal nieuws, en in het bijzonder Mission Local.

Michael Calore: Yay!

Lauren Goode: Mission Local is een lokale non -profit nieuwsorganisatie hier in San Francisco die de missiewijk bestrijkt, maar ook in grote lijnen San Francisco. Ze doen fantastisch werk. Er is momenteel veel gaande in Amerikaanse steden, in het bijzonder Los Angeles, en ook in San Francisco. Er zijn ijsaanvallen in het hele land en mensen gaan de straat op om tegen hen te protesteren. Mission Local heeft geweldig werk verricht over wat er tot nu toe in San Francisco aan de hand is. Ik raad u aan hen te steunen en uw lokale nieuws te ondersteunen als u kunt. Mike, wat is uw aanbeveling?

Michael Calore: Ik wil een essay aanbevelen in het huidige nummer van Harper's. Het is door de Noorse schrijver Karl Ove Knausgaard die, Lauren, ik weet zeker dat je het zat bent van me te praten. Maar het is een fantastisch essay. Het wordt 'The Renchanted World' genoemd. Het is Karl Ove Reckoning met technologie. Hij vertelt je over de eerste keer dat hij een computer tegenkwam, die 40 jaar geleden was. Dan heeft hij gewoon helemaal geen aandacht besteed aan computers en het begint hem te storen. Er is een geweldig citaat in de buurt van de top. "Om enigszins op de hoogte te blijven van de politieke situatie in de wereld is een plicht, iets dat men niet recht heeft om zich af te keren. Moet iets soortgelijks niet van toepassing zijn op technologie, gezien de immensiteit van IT -invloed?" Ik ben dol op dat citaat, omdat het echt in het middelpunt komt van waar we het vandaag over hebben. Om met de wereld in contact te komen, moet u begrijpen hoe deze systemen werken. Hij gaat naar een Grieks eiland om de schrijver James Bridle te bezoeken, omdat hun boek Mays of Being een echt goede introductie is tot intelligentie en kunstmatige intelligentie en natuurlijke intelligentie. Ze praten veel over kunstmatige intelligentie en hoe het zich ontwikkelde en hoe de verschillende manieren om intelligentie te berekenen in ons leven zijn verschenen. Het is echt een geweldig gerapporteerd stuk over de huidige staat van technologie in ons leven.

Lauren Goode: Geweldig.

Michael Calore: Ja.

Lauren Goode: Het klinkt een stuk korter dan zijn boeken.

Michael Calore: Ja. Je kunt het in minder dan een uur lezen.

Lauren Goode: Oké, klinkt goed voor mij.

Michael Calore: Bedankt voor het luisteren naar Uncanny Valley . Als je het leuk vindt wat je vandaag hebt gehoord, volg dan onze show en beoordeel deze in je podcast -app naar keuze. Als u contact met ons wilt opnemen met vragen, opmerkingen of suggesties tonen, schrijf dan ons op [email protected]. De show van vandaag werd geproduceerd door Adriana Tapia. Amar Lal bij Macro Sound mengde deze aflevering. Jake Loomis was onze New York Studio Engineer. Meghan Herbst controleerde deze aflevering. Jordan Bell is onze uitvoerend producent. Katie Drummond is de wereldwijde redactionele regisseur van Wired. Chris Bannon is het hoofd van Global Audio.

wired

Uitpakken van AI-agenten

Vergelijkbaar nieuws

Apple vindt manier om Trump-tarieven te omzeilen, Indiase reddingsboot versnelt

Een gigantische overname op de techmarkt. Zal Zuckerberg zijn eerdere successen kunnen herhalen?

Satelliet van Poolse oorsprong gaat naar een buitenlands leger

Met de Meta AI-app kun je de bizar persoonlijke chats van mensen 'ontdekken'

Hoe je veilig kunt protesteren in het tijdperk van surveillance