Diffusers 뜯기 - 프롤로그

kortress | 2024년 10월 5일
어.. 어..

Diffusers는 Huggingface에서 만들고 배포하는 Diffusion (확산) 모델을 위한 Python 라이브러리이다.

Diffusers는 성능보다 사용성, 간편함보다 단순함, 그리고 추 상화보다 사용자 지정 가능성에 중점을 두고 설계되었다 [1]. 이걸 뜯으려는 이유는 내가 언젠가 이미지 생성 서비스를 하기로 결심했기 때문이다.

이미지 생성 서비스에서 중요한건 생성된 이미지의 품질일 것이다. 확산 모델은 GAN 대비 안정적이고 생성된 데이터의 질이 높으니까, 사용자가 만족할 수 있을 만큼의 결과물을 얻자면 결국 확산 모델정도는 사용해야한다고 생각했다.

확산모델의 근본을 파해쳐보는 것도 좋은 경험이 되겠지만, 최근 대부분의 AI 모델이 그러하듯, 학습에 개인이 넘볼 수 없을 만큼의 데이터와 자원들이 필요하기에 (대표적인 Diffusion 모델인 Stable diffusion은 50억개가 넘는 이미지-텍스트 쌍 데이터 로 학습되었다), 나는 감히 Diffusion 모델의 원리와 학습 방법에 대해 파고드는 대신, 이를 활용하기 쉽게 구현해놓은 Diffusers를 뜯기로 결심했다.

네모바지 스폰지밥 1기 6-2화 피클이 빠졌어! 中

한 라인 한 라인 제대로 뜯을 시간도, 끈기도, 지식도 없다.

그냥 발버둥 쳐보는거다. 하다보면 더 잘, 깔끔하게 활용할 수 있게 될거라는 희망을 가져본다.

참고 자료

  1. 나의 벗, ChatGPT
  2. Diffusers 공식문서

Comments

로그인과 댓글 기능을 개발중입니다.