LMArena 에서 현재 이미지 생성 쪽에서 핫한 게 nano-banana 죠.
주어진 이미지를 정확하게 3디 공간으로 인식한다는 이야기를 도처에서 보게 되면서, 한번 저도 이전에 그린 이미지로 시도를 해 보았습니다.

이전에도 올려두었던 mio rustyblood 를 그린 것인데요. 요건 배경 없는 버전이죠.
이걸 테스트용으로 썼던 이유는, 들고 있는 두 자루의 낫에 대한 입체 정보를 제대로 인식한 이미지 모델들이 없었기 때문입니다. 대부분 이상하게 해석을 했었죠.
그렇다면 기대만큼 잘 되었는지 넣어 봅니다. 프롬프트는 아래와 같이 입력했습니다.
"Create a hyper-realistic photo of a collectible figure placed on a computer desk, with its packaging box visible in the background."


와 어마어마하네요.
낫만 놓고 보면 두 번째 이미지가 낫고, 전체적으로는 첫 번쨰 이미지가 나은데요. 어느쪽이든 낫에 대해 잘 해석을 했고, 외투 안쪽에 총열이 가려진 피스톨도 잘 인식되어서 보여줍니다. 장전도구는 첫 번쨰 이미지가 깔끔하게 나왔구요.
무엇보다 그림 왼쪽에 적어 둔 캐릭터 이름을 제대로 이름으로 인식해서, 이미지의 박스 안에 제품명처럼 삽입한 게 진짜 인상적이더라구요. 정확하게 글자라는 것을 인식했단 거겠죠.
아무튼 결과가 굉장히 잘 나와 올려 봤습니다.
반응형