Selecteer taal

Dutch

Down Icon

Selecteer land

Italy

Down Icon

HRM: Twee 'geesten' om de beperkingen van LLM's te overwinnen

HRM: Twee 'geesten' om de beperkingen van LLM's te overwinnen

De startup Sapient Intelligence, die zich bezighoudt met kunstmatige intelligentie (AI), heeft een architectuur voor een hiërarchisch redeneermodel ontwikkeld dat beter presteert dan de huidige grote taalmodellen (LLM's) en tegelijkertijd minder data en rekenkracht verbruikt.

Het is niet zomaar een aankondiging die gericht is op het creëren van een markt. De onderzoekers van de in Singapore gevestigde startup hebben hun onderzoek naar hiërarchische redeneermodellen gepubliceerd en de code vrijgegeven waarmee iedereen verificaties en tests kan uitvoeren .

De meest significante resultaten worden gezien in complexe redeneertaken die kenmerkend zijn voor denkketens. Maar laten we stap voor stap te werk gaan.

LLM, Gedachteketen en hiërarchisch redeneermodel

Een groot taalmodel (LLM) is een model voor kunstmatige intelligentie dat is getraind met enorme hoeveelheden data om natuurlijke taal te begrijpen en te genereren. Het vormt de kern van ChatGpt , Gemini, Claude en alle generatieve AI die met mensen communiceert.

Chain of Thought (CoT) is een intermediair redeneringsproces dat LLM's gebruiken om tot een gedetailleerder en preciezer antwoord te komen. Door het concept te vereenvoudigen, voert het model logische stappen uit , berekent het berekeningen en verbindt het concepten en begrippen, waarbij alleen het eindresultaat van deze redenering aan de gebruiker wordt geretourneerd.

Voor deze stappen zijn grote hoeveelheden data, een aanzienlijke hoeveelheid rekencapaciteit en een hoge latentie nodig. Juist om deze redenen zijn Hiërarchische Redeneermodellen (HRM) van groot belang.

Hoe een hiërarchisch redeneermodel werkt

De werking van een HRM doet deels denken aan die van recurrente neurale netwerken , wiskundige modellen die figuurlijk de werking van het menselijk brein weergeven.

HRM maakt specifiek gebruik van twee modules die we, heel eenvoudig gezegd, "minds" kunnen noemen. De eerste module is op hoog niveau en houdt zich bezig met planning . De tweede, gedefinieerd als laag niveau, voert snelle en gedetailleerde functies uit.

De twee modules communiceren via een hiërarchische convergentie. Hierbij werkt de hogere module alleen bij wanneer de lagere module haar taken heeft voltooid. Zo gaat ze stap voor stap verder totdat het vooraf vastgestelde doel is bereikt.

Om een praktisch voorbeeld te geven: als een AI die een Gedachtenketen gebruikt, gevraagd zou worden om zijn weg uit een doolhof te vinden, zou hij meerdere pogingen doen, waarbij hij de genomen richtingen, de doodlopende wegen en de terugweg bijhoudt. Dit alles vereist data, tijd en, last but not least, een fout in de Gedachtenketen kan de hele redenering verstoren.

De hogere module van een HRM-systeem zou neerkijken op het doolhof en de lagere module de nodige begeleiding bieden om er doorheen te navigeren. De twee 'geesten' kunnen zo minder tijd besteden en minder data gebruiken om het gewenste resultaat te bereiken.

HRM heeft 27 miljoen parameters en is getraind met een zeer kleine hoeveelheid data. Parameters zijn numerieke waarden die het model aanpast om de door gebruikers gevraagde resultaten te leveren. Ter vergelijking: de GPT-4 van OpenAI heeft naar schatting 1,8 biljoen parameters (d.w.z. 1,8 biljoen).

Het trainen van modellen met biljoenen parameters vereist hoogwaardige en dure hardware en maanden rekenwerk. Een HRM bereikt dezelfde niveaus met veel minder inspanning en kan volgens onderzoekers van Sapient Intelligence zelfs nog betere resultaten opleveren.

De toekomstige implicaties

De hiërarchische organisatie van HRM is een eigenschap die voortkomt uit training . Het is een kenmerk dat niet inherent is aan de architectuur, maar dat het model zelf leert.

Een HRM-organisatie maakt gebruik van een organisatieprincipe dat in staat is tot solide en flexibel redeneren , zodat het optimaal tot zijn recht komt bij taken op de lange termijn.

Volgens onderzoekers is HRM een volgende stap in de richting van algemeen redeneren . Naast deze twee aspecten, die grotendeels futuristisch zijn, blijft het een feit dat de eerste mogelijke implicaties liggen in contexten waar data schaars zijn en computerbronnen beperkt . Denk bijvoorbeeld aan landbouw in ontwikkelingslanden of de analyse van zeldzame ziekten in onderzoekscentra voor minderheden.

La Repubblica

La Repubblica

Vergelijkbaar nieuws

Alle nieuws
Animated ArrowAnimated ArrowAnimated Arrow