AI 스타일 저작권 - 확산 모델이 화풍을 배우는 방법과 법적 경계

그렉 러트코프스키(Grzegorz Rutkowski)는 2022년 Lexica.art에서 자기 이름을 검색했다. Lexica는 Stable Diffusion으로 생성된 이미지와 프롬프트를 모아두는 사이트다.
검색결과 그의 이름이 프롬프트로 사용된 이미지가 약 93,000개였다. 약 2,000개로 나오는 피카소보다 많았다.

그 이미지 중 일부에는 “by Greg Rutkowski”라는 서명이 붙어 있었다. 그가 그린 적 없는 그림들이었다.

무서웠어요. 그리고 지금도 무섭습니다.

이게 어떻게 가능했을까. 그리고 법적으로 허용된 일일까.

AI는 스타일을 어떻게 배우는가

AI가 스타일을 “배우는” 방식은 화가가 다른 화가를 흉내 내는 방식과 다르다.

Stable Diffusion 같은 확산 모델(diffusion model)은 수십억 개의 이미지에 무작위 노이즈를 더했다가 제거하는 과정을 반복하며 학습한다. 이 과정에서 모델은 어떤 이미지가 어떤 텍스트 설명과 연결되는지를 파악한다. CLIP이라는 모델이 텍스트와 이미지를 같은 수학적 공간에 배치하는 역할을 한다.

당신이 프롬프트에 “in the style of Greg Rutkowski”라고 입력하면, 모델은 러트코프스키의 이름과 연결된 수천 개 이미지의 시각 패턴을 활성화한다. 따뜻한 광원, 정밀한 디테일, 판타지적 분위기. 그의 스타일이 재현된다.

중요한 것은 이렇다. 러트코프스키의 특정 그림 파일이 모델 어딘가에 저장되어 있는 게 아니다. 스타일은 수억 개의 파라미터(가중치) 전체에 분산된 통계 패턴으로만 존재한다. 악보가 저장된 게 아니라 그 음악을 들은 감각이 근육 기억으로 남은 것에 가깝다.

그렇다면 훔친 건가, 배운 건가

켈리 맥커넌(Kelly McKernan)은 앨범 아트와 책 표지를 만드는 일러스트레이터다. 2023년 초, 그들은 Midjourney Discord 서버에서 자기 스타일로 생성된 이미지를 11,000개 이상 발견했다.한 달에 몇 건씩 들어오던 프리랜서 의뢰가 줄고 있었다.

맥커넌은 말했다.

AI는 도구가 아닙니다. 표절 슬롯머신입니다.

기술적으로는 “배운 것”이다. 특정 작품을 복사해서 출력하는 구조가 아니다. 그런데 그게 왜 문제를 해결해주지 않을까.

두 가지 이유가 있다.

첫째, 학습 데이터를 수집하는 과정 자체가 쟁점이다.

Stability AI는 수십억 개의 이미지를 인터넷에서 긁어 학습에 사용했다. 미 저작권청이 2025년 5월 발표한 보고서는 이 데이터 수집 과정이 저작물 복제권을 “명백히 수반할 수 있다“고 명시했다. 학습이 끝난 뒤 원본 데이터를 삭제해도 침해 분석에는 영향이 없다고도 덧붙였다.

둘째, 통제가 사실상 불가능하다.

Stability AI는 Stable Diffusion 2.0에서 러트코프스키의 스타일 재현 기능을 제거했다. [사실] 그러나 AI 커뮤니티는 그의 스타일로 별도 학습된 LoRA 모델을 만들어 무료 배포했다. 모델 레벨에서 이름을 차단해도 스타일 재현 자체를 막기는 어렵다.

법은 어디서 선을 긋는가

노트북 화면과 책상 위의 사진들 옆에 법관용 의사봉이 놓여 있어 디지털 이미지의 저작권이나 법적 쟁점을 상징하는 모습

미국 저작권법 17 USC 102(b)는 아이디어, 절차, 개념, 스타일에는 저작권 보호가 미치지 않는다고 명시한다. “모네풍의 그림”을 그린다고 모네 저작권을 침해하는 게 아닌 이유다. 창작이란 선배의 스타일을 배우고 변형하는 과정의 연속이기 때문이다. 그 계보를 막으면 창작 자체가 멈춘다는 논리가 이 조항의 배경에 있다.

그런데 소송은 살아남았다.

2023년 1월, 러트코프스키, 맥커넌을 포함한 작가들이 Stability AI, Midjourney, DeviantArt를 상대로 집단 소송(Andersen v. Stability AI, Case No. 3:23-cv-00201, N.D. Cal.)을 제기했다. 법원은 DMCA 청구를 기각했지만, 직접 저작권 침해와 상표권 청구는 심리를 허용했다. [사실] 2026년 2월 3차 소장이 제출됐고, 소송은 현재 증거 수집 단계다.

법원이 주목하는 핵심은 두 가지다. 학습 데이터 수집 과정에서의 복제권 침해, 그리고 생성된 이미지가 원본 작품과 “실질적으로 유사한가”의 여부다. 스타일이 법으로 보호받지 못해도, 출력 이미지가 원본 표현에 충분히 가깝다면 침해가 성립할 수 있다.

어디서 선이 그어지는지는 아직 법원이 그리는 중이다.

디자이너가 지금 할 수 있는 것

당신의 스타일이 이미 어딘가의 학습 데이터에 포함됐을 가능성은 높다. 그렇다면 무엇을 할 수 있을까.

Spawning.ai의 “Have I Been Trained”(haveibeentrained.com)에서 자기 작품이 LAION-5B 같은 주요 학습 데이터셋에 포함됐는지 확인할 수 있다. 포함된 경우 opt-out 신청도 가능하다. 단, 이미 학습이 완료된 모델에서 데이터를 소급 제거하는 건 기술적으로 어렵다.

Adobe Firefly처럼 라이선스된 이미지만 학습에 쓴다고 명시하는 플랫폼을 선택하는 것도 방법이다. 자주 쓰는 AI 도구의 서비스 약관(ToS)에서 학습 관련 조항이 어떻게 되어 있는지 확인해두는 게 좋다.

Nightshade와 Glaze는 육안으로 보이지 않는 노이즈를 이미지에 심어 AI 학습을 방해하는 도구다. 시카고대 SAND Lab이 개발했다. 완벽하진 않으며, 충분한 양의 데이터가 있으면 우회 가능하다는 연구도 있다. 선택지 중 하나다.

Andersen 소송의 결과도 주시할 필요가 있다. 판결 방향에 따라 AI 학습의 법적 지형 자체가 바뀔 수 있다.

에이릿이 이전에 다룬 AI 학습 데이터와 포트폴리오 저작권 문제도 함께 읽어볼 것을 권한다.

내 포트폴리오가 AI를 가르쳤다

마무리

AI가 스타일을 배우는 것과 인간이 스타일을 배우는 것은 같은가. 메커니즘은 다르지만 결과는 비슷해 보인다. 그 차이가 법적으로, 그리고 도덕적으로 무엇을 의미하는지는 아직 결론이 없다.

러트코프스키는 AI 학습 데이터에서 살아 있는 작가를 제외해야 한다고 말한다. 맥커넌은 슬롯머신이라고 부른다. 법원은 선을 긋는 중이다.

당신의 스타일은 당신이 수년에 걸쳐 만든 것이다. 그게 5초짜리 프롬프트로 소환된다는 사실이 어떤 의미인지는, 각자가 판단해야 할 차례다.

FAQ

AI 이미지 생성 모델에 내 작품이 학습 데이터로 쓰였는지 어떻게 확인하나?

A. Spawning.ai의 “Have I Been Trained”(haveibeentrained.com) 서비스에서 확인할 수 있다. LAION-5B 등 주요 학습 데이터셋에 포함 여부를 검색하고, opt-out 신청도 가능하다.

확산 모델은 학습 후 원본 이미지를 보관하는가?

Stable Diffusion이 특정 작가 이름으로 프롬프트를 막으면 해결되는가?

A. 아니다. Stability AI는 Stable Diffusion 2.0에서 러트코프스키의 스타일 재현 기능을 제거했다. 그러나 AI 커뮤니티는 그의 스타일로 별도 학습된 LoRA 모델을 만들어 배포했다. 모델 레벨에서 이름을 차단해도 스타일 재현 자체를 막기는 어렵다.

Nightshade나 Glaze는 실제로 효과가 있나?

제한적이다. Glaze는 스타일 모방을 방해하는 노이즈를 이미지에 심고, Nightshade는 AI 학습 과정을 교란하는 함정 데이터를 만든다. 시카고대 SAND Lab이 개발한 도구들이다. 충분한 양의 데이터가 있으면 이 방어를 우회할 수 있다는 연구도 있지만, 완벽한 방어 수단은 아니다.

AiLit에서 더 알아보기

구독을 신청하면 최신 게시물을 이메일로 받아볼 수 있습니다.

AI는 “스타일”을 훔치는가, 배우는가

AI의 도덕과 윤리는 누가 설계하는가

AI를 야근시켰더니 마르크스주의자가 됐다

노이즈에서 이미지가 나온다

AI의 도덕과 윤리는 누가 설계하는가

바이브코딩의 새 보안 위험, 슬롭스쿼팅

가족 단톡방에 부모님이 AI 가짜뉴스를 공유했다면

AI가 고르는 글은 따로 있다

AI는 “스타일”을 훔치는가, 배우는가

(1) 노이즈에서 이미지가 나온다

(2) AI는 “스타일”을 훔치는가, 배우는가

AI는 스타일을 어떻게 배우는가

그렇다면 훔친 건가, 배운 건가

첫째, 학습 데이터를 수집하는 과정 자체가 쟁점이다.

둘째, 통제가 사실상 불가능하다.

법은 어디서 선을 긋는가

디자이너가 지금 할 수 있는 것

마무리

FAQ

AiLit에서 더 알아보기

Related Posts

이메일로 블로그 구독하기

AiLit에서 더 알아보기