[논문분석] A Survey of Large Language Models
Pre-training, Adaptation, Utilization, Capability Evaluation 에 대한 내용 탐구
Pre-training, Adaptation, Utilization, Capability Evaluation 에 대한 내용 탐구
audio signals + face images + landmarks → 통합으로 conditioning
KAT에 기반한 Network algorithm : 중간 과정 의미 해석 + 수식 유도 (MLP blackbox와 대조)
diffusion model에 대한 Practical한 고찰
object에 맞는 사람의 pose를 denoise estimate 하고 diffusion based image editing
Wav2vec + animatediff - Talking Face generation
Audio Conditioned Diffusion Models - Talking Face generation
GAN을 활용한 sound guided video generation, clip의 latent space를 활용
기존 Unit based audio Multilingual translate으로 제안된 논문에 Korean을 추가
기존 Unit based audio Multilingual translate으로 제안된 논문에 Korean을 추가
Hubert, [Speech audio Unit encoding] conditioning, diffusion video generation
Scene Graph를 Condition으로 받는 image generation diffusion model finetuning
Scene Graph를 Condition으로 받는 image generation diffusion model finetuning
GAN을 활용해 압축된 표현에서 오디오로 변환, one generator and two discriminators
Scene Graph를 Condition으로 받는 image generation diffusion model finetuning
Scene Graph를 Condition으로 받는 image generation diffusion model finetuning
Score-Based Models 스터디
Self-supervised learning을 통해 graph autoencoders 성능 개선
BERT를 활용한 Audio Hidden-Unit 생성
Hubert를 활용한 Unit Multilingual S2S translation
Audio와 Video의 멀티모달 Translate 모델
Latent space 에서 diffusion process
Inha Dacon LLM - QA task
Image generaion에서 다양한 Condition을 위한 Finetuning 방법
high quality video generation, Google Research
Graph를 처리할 수 있는 Convolution Network
GAN을 활용해 압축된 표현에서 오디오로 변환, one generator and two discriminators
diffusion model에 Transformer 구조 사용, video generation model
transformer based Diffusion model
Multi-model image generation diffusion model
transformer based Diffusion model
U-Net 대신 transformer를 사용하는, DiT를 발전 시킨 모델
U-Net을 기반으로 하는 image deblurring, low cost
Image generaion에서 다양한 Condition을 위한 Finetuning 방법
StoryDiffusion : 텍스트 기반 이야기를 일관성 있는 이미지나 영상으로 표현
conditioning을 제어할 수 있는 Finetuning 방법 ControlNet을 제안
Diffusion model의 Video generation, base 논문
AI Spark 6회 챌린지 참가 후기
Noise 공유를 통한 프레임 간 연관성 향상
VDM 코드 분석 및 예제 학습 돌리기
Stable diffusion의 video generation version
LLM을 활용한 multimodal diffusion generation
효율적인 LVDM, Reuse and Diffuse : VidRD
task를 나눠 quality를 높히자
Diffusion model의 Video generation, base 논문
Inha univ, Deep Learning lecture
Inha univ, Deep Learning lecture
Inha univ, KSAE
Inha univ, Alpha project