Je kunt AI-modellen zover krijgen dat ze onwaarheden voor waar aannemen, blijkt uit onderzoek
Diffusietaalmodel blijken gevoelig voor "trajectory locking": beloningsgestuurde updates concentreren de kansmassa op een smalle set aan ruisonderdrukkingspaden, waardoor alternatieve correcte oplossingen bij herhaald samplen buiten beeld raken — TraFL pakt dit aan.
🔗 lees originele bron