- comfyUI 0.8 버전 이상 필수
- 저 시점부터 지원이 들어감
- 하드웨어 사양
- RTX 4090 + 메인램 96기가.
- https://www.reddit.com/r/StableDiffusion/comments/1q5jb3s/ltx2_fp4_first_comfy_test_streaming_weights_from/?tl=ko
- comfyUI 실행 시 --novram 옵션 필수. 안하면 바로 OOM 발생으로 크래시
- LTX-2 의 github 쪽을 가보면 권고사항이 나와 있으며, --reserve-vram 을 통하여 램 크기를 제한하는 것을 권하고 있음. 그리고 얘네들의 기본 환경은 VRAM 32GB, 즉 5090 임.
- VRAM 보다는 메인램이 중요함. 해상도와 시간을 늘리면 메인램 요구량이 크게 증가
- 공유램 소모량이 크게 증가하며
- 성공 사양은 아래에 적어둠.
- fp8 기준 (novram)
- 1920x1080, 96 + 1 frame (first: 210.18초, next: 141.32)
- 1280x720, 168 + 1 frame (first: 188초, next: 119.04초)
- fp4 기준 (novram)
- 960x540, 120 + 1 frame (first: 149초, next: 83.37초)
- fp4 기준 (lowvram)
- 960x540, 72 + 1 frame (first: 121.62초, next: 57.49초)
- fp8 기준 (novram)
- nvidia 의 권고사항은 아래이나 별 도움이 안됨.
- https://www.nvidia.com/en-us/geforce/news/rtx-ai-video-generation-guide/
- 문서 안에 는 NVFP8 모델 쓰라고 되어 있는데, LTX-2 측에서는 (누가 huggingface 에 문의함) 그런 거 없다고 함. 굳이 쓸라면 q4 쓰라 하는데...
- https://www.reddit.com/r/StableDiffusion/comments/1q5jb3s/ltx2_fp4_first_comfy_test_streaming_weights_from/?tl=ko
- AI MAX+ 395
- 기본 템플릿은 그냥 잘 된다.
- 기본템플릿 기준 생성시간은 10-11분 정도. 보통 11분 10초 이내에 끝난다.
- 권장 시스템 세팅은 RAM : VRAM = 64 : 64.
- 실제로 굴려보면 fp8 기준 메인메모리 40기가, VRAM 50기가 정도 소모.
- 양자화 아닌 모델의 경우 52기가, 50기가 소모.
- AMD 는 ROCM 7.1.1 + ComfyUI 지원을 시작하면서 권장 설정도 같이 설명을 추가했는데, 64 : 64 비율을 권하고 있다.
- 실제로 굴려보면 fp8 기준 메인메모리 40기가, VRAM 50기가 정도 소모.
- 성공 사양은 아래와 같다
- 비양자화 기준
- 1280x720, 144 + 1 frame
- 1920x1080, 120 + 1 frame (first: 33분. 음성구간에서 스왑발생하며 속도 크게 저하)
- fp8
- 1920x1080, 96 + 1 frame (first: 20분 30초)
- 비양자화 기준
- 기본 템플릿은 그냥 잘 된다.
- Mac Studio M4 Max
- 기본 템플릿은 구동 불가.
- fp8, fp4 모두 안되는데, 오류 메시지를 보면 양자화에 사용된 e4m3 타입을 맥에서 제대로 변환하지 못해 문제가 발생되는 것으로 보임.
- 실제로 위의 오류가 원인인 것으로 보이는 게, fp16은 일단 구동 자체는 잘 됨. 하지만... 아래 참고.
- 양자화 모델 대신 오리지널 모델로 교체하면 일단 생성작업은 진행됨. 하지만 여전히 mps 전용 타입이 없는 관계로 메모리 대비 타 제품군보다 짧은 영상만 생성 가능함.
- 비양자화 기준
- 1280x720 96 + 1 frame
- 960x540 120 + 1 frame
- 비양자화 기준
- 기본 템플릿은 구동 불가.
- RTX 4090 + 메인램 96기가.
반응형