AI그림 업계를 경천동지 시킨 단부루를 대털한 NAI 대털 사건

카찾사 실장

2025.06.01

추천 0

먼저 사건을 다루기 전에 AI의 학습에 대해 알아봅시다

먼저 간단한 질문을 해보려고 하는데요

이 캐릭터의 이름은 무엇일까요??

대답할 수 있는 사람은 거의 없을 것입니다

대충 애니도 망하고 가챠겜도 폭파된 마이너 IP 때문이죠

그런 여러분들을 위해서 다음과 같은 정보를 드리겠습니다

이 캐릭터의 이름은 '미나모토 모모' 입니다

자 그럼,

나의 이름을 말해 봐라!

넵, 미나모토 모모입니다

위에서 배웠으니 금방 말하실 수 있을 것입니다

이제 여러분은

생판 처음 보는 짤이여도

짤의 캐릭이 미나모토 모모인것을 알 수 있습니다

여러분은 이제 '미나모토 모모'를 학습하신 것입니다

여러분이 '미나모토 모모'를 학습하게 된 것은 이 캐릭터의 생김새와, '미나모토 모모'라는 정답이 머릿속에서 입력되었기 때문입니다

여기서 위 그림은 학습을 위한 데이터가 되겠고, '미나모토 모모'라는 정보는 이 학습 데이터에 대한 정답이 됩니다

그리고 여러분의 머리에서 이 데이터와 정답을 대응시켜서 '학습'을 한 것이지요

AI 또한 학습 시 이러한 학습 데이터와 이에 대응되는 정답을 보고 학습을 진행합니다

학습 데이터에 대응되는 정답을 AI쪽에서는 '라벨'이라고, 학습 데이터에 이런 라벨을 붙이는 작업을 '라벨링'이라고 합니다

이번엔 좀 다른 짤을 가져왔습니다

이 캐릭터도 미나모토 모모로 보이시나요?

대부분은 그렇다고 하실겁니다

우리는 위에서 계속 봐온 닌자복, 카타나, 망또 등의 요소가 없어도 이 캐릭은 미나모토 모모라는것을 알 수 있습니다

인간의 우수한 추론능력으로 캐릭터의 머리색, 헤어스타일, 그림체 등을 종합하여 이 캐릭은 미나모토 모모라는 결론을 내린 것이지요

축하합니다! 미나모토 모모를 학습한 여러분들은 이제 미나모토 모모의 그림이 없어도

'핑크 머리', '숏컷', '유루유리 그림체'라는 정보만 가지고도 ~~앗카링~~미나모토 모모를 떠올리실 수 있습니다. 이것이 추론입니다

그렇다면 AI 이야기를 해 봅시다

이런 AI 한테

이 짤 = 미나모토 모모라는 라벨을 가진 데이터를 학습시키고

자! 나의 이름을 말해봐라!!

물론 과정과 결과를 예상하기 힘든 AI 특성상 어떻게 될지는 모르겠지만 십중팔구는

흥, 바카밧카! 몰라!

이런 식의 엉뚱한 답을 낼 것입니다

인간은 우수한 추론능력으로 사진 한장만 봐도 '미나모토 모모'를 구성하는 요소를 파악하여

다른 사진을 식별하는 것에 응용할 수 있지만 AI는 그렇지 않거든요

그래서 AI가 판단에 활용할 수 있는 요소들을 늘리기 위해 '미나모토 모모'를 구성하는 '특징'들을 우리가 다 '라벨링'하여 학습시켜줘야 합니다

물론 라벨링은 정답을 알고 있는 인간이 해야합니다

아아, 이건 미나모토 모모라는 것이다------

핑크머리에 숏컷에 유루유리 그림체에 카타나를 들고 있지

바카밧카! 핑크머리가 뭔데!

....아아, 이게 핑크머리라는 것이다

바카밧카! 카타나가 뭔데!

...아아, 이게 카타나라는 것이다

바카밧카! 유루유리가 뭔데!

으아아아아아악!!!

그렇습니다! 아무것도 모르는 AI에게 누군가가 데이터에 라벨링을 해서 계속 먹여가면서 학습시켜야 하는데 이게 고통입니다!

기계학습 모델과 학습 목표에 따라 다르지만,

전통적으로 학습을 시키려면 AI가 판단에 활용하는 '특징'의 제곱개에 달하는 학습 데이터가 필요하다고 합니다

예를 들어 '미나모토 모모'를 '머리색', '헤어 스타일', '그림체' 3가지 요소로 판단한다면

전통적인 AI학습론으로 봤을 때 최소 9개의 라벨이 되어있는 훈련 데이터가 필요한 것이죠

그리고 이 9개의 학습 데이터는 누군가가 라벨링을 해줘야 합니다.

물론 정답을 알고 있는 사람이 해줘야하죠

아직까지는 고작 9개, 할만합니다

하지만 미나모토 모모쨩의 동료는 5명!!!

얘네들까지 학습을 시킨다면???!

...아아, 얘는 한죠몬 유키다---- 파란 머리이고 숏컷에 애꾸눈이지

아아, 얘는 이시카와 고에다---- 검은 머리에 장발, 뻐친 머리이지

아아, 얘는 야치요 메이다---- 주황머리에 사이드업 포니테일, 젖을 살짝 까고 다니지

바카밧카! 머리가 뭔데!

아니 ㅅㅂ! 거기서부터라고???

이렇게 AI가 판단을 해야하는 요소가 많아질수록 학습 데이터의 요구량이 기하급수적으로 늘어납니다!

그리고 이 데이터의 라벨링은 인간이 다 손을 해줘야 합니다

AI한테 정답을 알려줘야 학습을 하니까요!

그래서 AI가 이런 복잡한 그림에 대해서 '올바른 판단'을 내리게 만들기 위해선

인간의 손으로 라벨이 된 수만~수백만장의 학습 데이터가 필요합니다. 까놓고 말해서 많으면 많을수록 좋습니다

정말 아득한 작업이지요

실제로 AI개발하는 회사들은 이런 학습 데이터에 라벨링을 하는 알바를 굴리기도 합니다

재택근무가 가능해서 요즘 부업으로 좀 뜨고있다나봐요

그런데!!!

2022년 10월!

원래 AI소설 서비스를 제공하던 NovelAI (통칭 NAI)에서 그 누구보다도 빠르게 이런 씹덕그림 AI 서비스를 시작합니다!!

그림 AI 모델인 스테이블 디퓨전이 2022년 8월에 발표되었으니 NAI측은 단 2개월만에!!!

이 까마득한 데이터 라벨링 작업을 거치고 AI학습을 거쳐 상업화 레벨까지 완성시켰다는 것이죠!!

그 방법이 정말 씽크빅했는데...!

단부루를 대털하자!!!

단부루는 각종 씹덕 이미지를 불펌해다가 모아놓는 그런 싸이트였는데요

이 싸이트는 tag라는 형식으로 해당 이미지를 설명하는 방식을 가지고 있었습니다!

그렇습니다! 단부루의 이 tag가 AI에서 말하는 '라벨'인 것입니다

단부루는 근 20년간 집단지성과 무급봉사로 운영되며 라벨링 데이터 고물보블린이 된 것입니다!!

원래라면 알바를 구해서 데이터에 일일히 라벨링을 하는 상황!

단 털!

(단부루를 털자는 뜻ㅎ)

단부루는 크리에이터의 그림을 무단으로 수집하는 싸이트!

태생부터 썩 적절한 데이터 소스는 아닙니다...

이런 곳에서 데이터를 대털해서 상업화 해버린 NAI 또한 지탄 받는건 당연한 일!

하지만 여기서 더 골때리는 상황이 벌어졌으니...

아 글쎄...!

NAI가 단부루를 긴빠이해서 AI이미지 서비스를 시작한지.. 3일만에!!!

NAI의 AI그림 모델이 통째로 해킹당해서 토렌트로 뿌려진 것입니다!!!!

거의 예수님의 기적에 비견되는 무시무시한 위업!!!!

그리고 그 해킹 방법 또한 불알을 탁! 치게 만드는데...!

바로 제로 데이 공격으로 해킹을 했다는 것입니다!!

제로 데이 공격이란 방어측도 모르는 보안상의 약점을 처음으로 공격하는 해킹 방법 입니다

그야말로 초견필살(初見必殺), 처음 사용하면 반드시 승리할 수 있는 무적의 기술이지요!

사실 단부루의 라벨링 데이터를 이용해서 AI 학습을 연구하는건 꽤 흔한 시도라고 합니다

하지만 이걸로 상업화까지 해버린 NAI가 괘씸한 것이었을까요??

NAI측이 어떤 보안 솔루션을 사용하고 있는지는 모르겠지만...

해커는 해당 보안 체계에 대해 반드시 한번은 승리할 수 있는 기술을

야짤 생성기를 대털하는데 사용했다는 것입니다!!!

그리고 이 해커가 뿌린 NAI 모델을 기반으로 수많은 AI그림 모델이 파생됩니다

위에 설명한 것처럼 AI그림 모델을 학습시키는건 품이 많이 드는 일인데, NAI측에서 단부루를 대털해서 기초공사는 다 끝내버렸거든요

후발주자들은 유출된 NAI 모델도 있겠다 이 모델을 +1강 +2강... 강화만 시키면 됩니다!

그야말로 이 사건으로 인해 AI그림계의 대해적시대가 시작되었다고 해도 과언이 아닐 정도입니다

원작자 허가없이 이미지를 수집하는 단부루,

이걸 또 허가없이 긴빠이한 NAI

이걸 또 털어버린 어느 해커,

도덕적으로 이게 맞나 싶기도 하고 저작권따위도 개나 줘버린 상황

AI업계에서 긍정적인 사례는 분명 아닙니다

하지만 단부루를 통째로 대털 해버린 NAI, 그리고 이 NAI를 다시 대털해버린 해커

AI그림 격동기의 김성모스러움은 아마도 두고두고 회자될 것입니다

어떻게 끝낼줄 모르겠어서 모모쨩 수영복짤

AI그림 업계를 경천동지 시킨 단부루를 대털한 NAI 대털 사건

댓글

유머게시판