econometrie-vacature.nl

Waarom GPT niet kan denken zoals wij

Nieuws
21-02-2025
Martha Lewis
Kunstmatige intelligentie (AI) wordt steeds beter in het oplossen van complexe problemen, maar hoe goed begrijpt een AI-model eigenlijk de logica achter zijn antwoorden? Nieuw onderzoek testte de ‘analogievaardigheden’ van GPT-modellen—oftewel hun vermogen om patronen en verbanden te herkennen en toe te passen op nieuwe situaties.

GPT-modellen schieten tekort als de problemen worden aangepast, wat belangrijke zwakheden in hun redeneercapaciteiten blootlegt.

Analogisch redeneren is het vermogen om een ​​vergelijking te trekken tussen twee verschillende dingen op basis van hun overeenkomsten in bepaalde aspecten. Het is een van de meest voorkomende methoden waarmee mensen proberen de wereld te begrijpen en beslissingen te nemen. Een voorbeeld van analoog redeneren: een kopje is tot koffie wat soep is tot ??? (het antwoord is: kom).

Kunnen AI-modellen echt redeneren?

Grote taalmodellen zoals GPT-4 presteren goed op allerlei tests, waaronder die waarbij analoog redeneren belangrijk is. Maar kunnen deze AI-modellen écht redeneren, of herkennen ze simpelweg patronen uit hun trainingsdata? Zijn ze net zo flexibel en robuust als mensen bij het maken van analogieën?

[....]

Lees verder op: uva.nl

Gerelateerde vacatures

Geïnteresseerd in een carrière bij organisaties in ditzelfde vakgebied? Bekijk hieronder de gerelateerde vacatures en vind de perfecte match voor jou!
AZL
Marktconform
Medior, Senior
Heerlen, hybride
Als (Senior) Actuaris bij AZL adviseer je pensioenfondsen strategisch, maak je berekeningen en analyses, verbeter je modellen en processen voor het nieuwe pensioenstelsel en geef je klanten inzicht en onderbouwd...
CACEIS
Marktconform
Senior
Amsterdam
As a Data Officer M/F at CACEIS Pension Centre, you ensure accurate, complete and timely investment data in SimCorp Dimension, validate instruments, prices and corporate actions, resolve incidents, improve processes,...
Bunq
Marktconform
Medior
Amsterdam
As a Data Scientist - Marketing at bunq, you build and own predictive marketing models and Looker dashboards, develop end-to-end SQL/Python analytics pipelines, and translate complex data into actionable strategy...
Triple A - Risk Finance
3.200 - 4.000
Junior
Amsterdam
Als Pensions Consultant bij Triple A - Risk Finance adviseer je over nieuwe pensioenregelingen en veranderingen in bestaande regelingen. Je werkt hands-on aan actuariële waarderingen en oplossingen binnen een ondernemend...