Sturingsmechanismen voor alignment tijdens inferentie over uitvoeringstrajecten
Harness engineering is opgekomen als een belangrijke inference-time techniek voor LLM-agents, gericht op betere langetermijnprestaties via taakdecompositie en begeleide uitvoering. Uitgebreidere harnesses zijn echter niet zonder meer beter: meer decompositie of sturing kan de uitvoering soms verbeteren, maar kan het uiteindelijke taaksucces ook schaden. We bestuderen harness-ontwerp door de lens van inference-time trajectory alignment.
🔗 lees originele bron