← terug naar overzicht

Rotatiebehoudende supervised fine-tuning

onderzoek 📅 2026-05-13
arXiv:2605.10973v1 Aankondigingstype: nieuw Samenvatting: Supervised fine-tuning (SFT) verbetert de prestaties binnen het domein, maar kan de generalisatie buiten het domein (OOD) verslechteren. Eerder werk suggereert dat deze degradatie verband houdt met veranderingen in dominante enkelvoudige deelruimten van voorgetrainde gewichtsmatrices. Het direct identificeren van verliesgevoelige richtingen met Hessische of Fisher-informatie is echter rekentechnisch duur op LLM-schaal. In dit werk stellen we voor om de geprojecteerde rotaties in vooraf getrainde enkelvoudige s te behouden

🔗 lees originele bron