[논문분석] Gentron : Delving Deep into Diffusion Transformers for Image and Video Generation
U-Net 대신 transformer를 사용하는, DiT를 발전 시킨 모델
U-Net 대신 transformer를 사용하는, DiT를 발전 시킨 모델
U-Net을 기반으로 하는 image deblurring, low cost
Image generaion에서 다양한 Condition을 위한 Finetuning 방법
StoryDiffusion : 텍스트 기반 이야기를 일관성 있는 이미지나 영상으로 표현
conditioning을 제어할 수 있는 Finetuning 방법 ControlNet을 제안