Systematische optimalisatie van real-time diffusiemodel-inferentie op Apple M3 Ultra
arXiv:2605.16259v1 Aankondigingstype: nieuw Samenvatting: Terwijl realtime beeldgeneratie met diffusiemodellen razendsnel is gevorderd op NVIDIA GPU's, blijft systematisch optimalisatieonderzoek op niet-CUDA-platforms zoals Apple Silicon uiterst beperkt. In deze studie hebben we uitgebreide optimalisatie-experimenten uitgevoerd in 10 fasen, gericht op de Apple M3 Ultra (60-core GPU, 512 GB unified memory), met als doel realtime camera img2img-transformatie te bereiken. We onderzochten een breed scala aan technieken
🔗 lees originele bron