AI에게 불펌 당한 팬픽 작가들의 분노 (번역)

“그냥 훔쳐간거죠. 제 허락은 구하지도 않고요.”

온라인에서 영화, 책, 게임에서 영감을 받아 이야기를 쓰고 무료로 공유하는 팬픽 작가들의 세계에는 말없는 행동 강령이 존재한다. 그중 가장 중요한 두 가지는 1) 팬픽으로 절대 (공식적으로) 상업활동을 하지 말 것과, 2) 다른 사람의 작품을 절대 훔치지 말 것이다.

따라서 팬픽 작가들이 자신도 모르는 사이 자신들의 작품이 생성형 AI를 구동하는 언어 모델 학습 자료로 사용되고 있다는 사실에 가장 먼저 예민하게 반응한 것은 당연해 보인다. 그러나 팬덤의 은밀한 공간으로 파고드는 AI를 막으려는 그들의 싸움은 험난하다.


가장 최근의 공격은 4월 초에 있었다. 이용자 nyuuzyou가 온라인 저장소 Archive of Our Own(AO3)에서 팬픽 1,260만 편을 무단 수집해, 오픈 소스 AI 모델과 소프트웨어를 호스팅하는 회사 허깅페이스에 데이터 세트로 벌크 업로드한 것이다.

nyuuzyou의 업로드는 곧 레딧 커뮤니티 r/AO3에 포착되었고, 수백 명의 이용자가 분노로 들끓었다. 텀블러 계정 ao3scrapesearch는 작가들이 자신의 사용자 이름을 검색해 nyuuzyou에 의해 작품이 수집되었는지 확인할 수 있는 검색 엔진을 만들었다.


“이건 시간과 노력은 물론 열정과 혼을 쏟아야 하는 일이고, 우리 커뮤니티 안에서 이루어져야 하는 일입니다.”

팬픽 작가들은 허깅페이스 데이터 세트의 댓글란을 뒤덮으며 AI 옹호자들과 논쟁을 벌였다. dckchili는 이미 빅테크 크롤러 봇이 수차례 아카이브를 긁어 갔기 때문에 상관없다고 주장하며 nyuuzyou의 무단 수집을 옹호했다. RaraeAves는 “AI 쪽 너드들”은, 팬픽 작가들이 자신의 노동과 창의성이 착취당해도 반격하지 않을/못할 것이라 기대하고 있다고 주장했다.

온라인에서 infinitegalaxies라는 이름으로 활동하는 스타워즈 팬픽 작가 니키(Nikki)는 검색 엔진에 자신의 이름을 입력했고, 70편이 넘는 작품이 무단 수집된 것을 보았다.

그 중 하나가 특히 눈에 들어왔다. AI의 팬덤 위협을 알리기 위해 다른 작가 11명과 함께 쓴 공동 에세이로, 그녀가 AO3에 올린 글이었다. 아이러니가 아닐 수 없었다.

니키는 스타워즈 속 레이와 카일로 렌의 로맨스, 즉 ‘레일로(Reylo)’ 커플링 팬픽을 주로 쓴다. ‘레일로’ 팬덤은 끈끈하고 왕성해 AO3에 3만 편이 넘는 레일로 이야기가 올라와 있다.

레일로 팬픽 절반은 광선검과 우주 모험이 펼쳐지는 스타워즈 정사(canon) 세계관에, 나머지 절반은 대체 우주(AU)에서 커피숍 로맨스, 직장 드라마, 중세 기사, 요정 왕국까지 모든 것을 탐험한다.

팬덤에서 특히 사랑받는 작품 중 하나는 1994년을 배경으로 카일로 렌을 소련 붕괴 직후 러시아의 마피아 보스 ‘키릴’로 재해석한 이야기이다. 이 팬덤은 팬픽에서 상업 로맨스 작가로 성공적으로 전향한 앨리 헤이즐우드(Ali Hazelwood)와 티아 과존(Thea Guazon) 같은 작가를 배출했다.

니키에게 ‘레일로’ 팬덤은 새로운 소속감을 주었다. 니키는 작가와 독자들의 커뮤니티에서 안식처를 찾았고, 원하는 대로 자유롭게 글을 쓸 수 있는 자유를 만끽했다.

“팬덤은 대체로 커뮤니티 경제입니다. 우리는 재미를 위해, 선의로 여기 있고, 서로에게 무언가를 주고 커뮤니티 안에서 작품을 만들기 위해 있습니다.”라고 니키는 말한다.

이러한 감정은 필명 okapijones로 글을 쓰는 Em을 포함한 ‘레일로’ 커뮤니티의 많은 이들이 공유한다. Em은 레이와 카일로 렌이 보여주는 ‘적에서 연인으로’라는 빛과 어둠의 클리셰가 「미녀와 야수」 혹은 「오만과 편견」을 떠올리게 해 두 캐릭터를 사랑하게 되었다. 그러나 스타워즈 속 그들의 결말이 마음에 들지 않아 다른 결말을 원하는 팬들을 찾았다.

“팬픽은 제 인생을 바꿨어요. 팬픽과 팬픽 커뮤니티를 통해 인생 최고의 친구들을 만났어요.”라고 Em은 말한다.

“여기엔 규칙도, 편집자도 없어요. 그 자체로 온전한 창작 놀이터이며, 그래서 창의성이 태어나죠. 제가 읽어 본 가장 창의적인 이야기, 가장 대담한 스토리텔링 중 상당수가 팬픽이에요. 그것이 창작자인 저를 흥분시키죠. 원하는 건 뭐든 할 수 있으니까요.”

“이건 시간과 노력, 마음과 영혼이 들어가는 일이고, 커뮤니티 안에서 하는 일입니다.”라고 니키는 말한다. “그런데 당신들은 그걸 몇 초 만에 화면에 뿌려 내겠다고 하더군요. 누가 이런 걸 원했나요? 역겹습니다.”


2023년에는 오픈AI의 ChatGPT를 일부 기반으로 한 Sudowrite의 Story Engine이 등장했다. 니키는 사용자가 캐릭터와 플롯 정보를 입력하면 소설 전체를 생성해 주는 새로운 ‘글쓰기 보조’ AI 소프트웨어에 관한 영상을 본 기억이 있다.

그는 너무 충격을 받아 울었다. 소프트웨어 회사에 다니는 그는 이미 직장에서 AI 통합을 목격했지만, 자신의 취미까지 영향을 받을 줄은 상상하지 못했다.

“저런 것들을 무너뜨리는 것이 지금 누군가가 할 수 있는 최선일 겁니다.”

그해 말, Sudowrite에서 늑대인간 팬픽인 오메가버스와 관련된 매우 구체적인 성적 용어가 다수 발견되면서, 챗지피티가 작가들의 모르는 사이 팬픽을 학습했을 가능성이 드러났다.

그때부터 니키와 많은 이들은 팬덤에서 AI가 만든 팬픽이나 팬아트를 포함해 AI의 모든 형태에 반대해 왔다.

“본질적으로 도둑질입니다. 훔친 노동 위에 지어진 것에는 윤리가 성립할 수 없습니다.”라고 니키는 말한다. 그녀는 동의 없이 가져간 데이터에 의존한다는 이유로 생성형 AI 자체에 반대하면서, 동시에 이것이 ‘무상 교류’라는 팬덤 커뮤니티의 규범을 깨뜨린다고 덧붙인다.

“저는 그 캐릭터들을 사랑했고, 그 놀이터에서 놀고 싶었고, 그들을 사랑하는 사람들이 읽어 주길 바랐기 때문에 썼습니다. 이건 우리를 위한 선물 같은 거에요.” 라고 Em은 말한다. “그들은 내 허락 없이 그걸 훔쳤습니다.”

그러나 지난 몇 년 동안 팬픽 작가들은 생성형 AI 기업가들이 자신의 작품으로 돈을 벌려 한 사례가 여럿 있었다고 말한다.

예를 들어, 텍스트 음성 변환 앱 Speechify의 CEO인 Cliff Weitzman은 AO3에서 팬픽 수천 편을 무단 수집해 앱과 연결된 웹사이트 WordStream에 올렸다가 팬들의 SNS 항의로 재빨리 삭제했다.

또 Wishroll Inc.의 텍스트 음성 변환 앱 Lore.fm은 틱톡에서 “AO3용 오더블”이라 홍보했지만, 2024년 5월 발표 후 같은 달 팬들의 반발로 철회됐다.


“마치 두더지잡기 같아요. 고개 돌릴 때마다 또 다른 사기꾼이 당신 물건을 훔치려 해요.”

대부분의 팬픽 작가처럼 저작권 있는 지적 재산을 ‘놀이터’ 삼아 자신의 이야기를 만드는 작가에게서 이런 강한 감정이 나온다니 다소 의아할 수도 있다.

그러나 팬워크 옹호자들은 팬작품은 ‘변형적(transformative)’이라고 말한다. AO3에 따르면 이는 “팬워크 창작자가 전문 작가·아티스트와 마찬가지로 자신의 콘텐츠에 대한 권리를 가진다”는 뜻이다.

이것은 예를 들어 프롬프트를 기반으로 소설을 생성하는 LLM이 하는 일과 매우 다르다. AI는 새로운 아이디어를 발명하고 통합하는 인간의 ‘변형’ 과정을 복제할 수 없으며, 이미 존재하는 콘텐츠를 섞어 재생산할 수 있을 뿐이다.

그리고 아마존을 휩쓸고 있는 AI 생성 도서와 달리, 팬픽의 원칙 중 하나는 작가가 자신의 작품으로 공식적인 수익을 얻지 않는다는 점이다.

그렇다고 AI가 다른 논란의 방식으로 팬덤에 침투하는 것을 막지는 못했다. 일부 독자는 좋아하는 팬픽의 새로운 업데이트를 빨리 보고 싶어 작품을 챗지피티에 업로드해 새 장을 생성했고, 이는 일부 작가들을 당황하게 했다.

몇몇 작가는 작품을 ‘잠금’ 설정해 AO3 계정이 있어야 접근할 수 있게 하거나, 아예 인터넷에서 삭제했다.


nyuuzyou의 무단 수집 사건에서는 팬들이 온라인에서 힘을 모아 디지털 밀레니엄 저작권법(DMCA)에 따른 삭제 요청을 제출했고, AO3를 관리하는 비영리단체 Organization for Transformative Works(OTW)도 삭제 요청을 냈다.

4월 9일, 허깅페이스는 해당 데이터 세트를 비활성화했다. OTW는 4월 26일 이사회 회의에서 “AI 크롤링과 기타 봇을 막기 위해 CloudFlare 도구를 추가했다. 도움이 되지만 완벽하진 않다. 더 강력한 해결책은 특히 구형 기기를 쓰는 일부 이용자에게 큰 불편을 줄 것”이라고 말했다.

nyuuzyou는 반성하지 않았고, 반대성명을 내며 데이터를 러시아와 중국 서버에 다시 업로드했다. 두 나라의 사이트는 DMCA 요청에 훨씬 덜 민감하다.

허깅페이스 프로필에 링크된 텔레그램 계정을 통해 『더 버지』가 접촉했을 때, nyuuzyou는 자신을 러시아의 18세 학생이자 IT 종사자라고 밝히며 “팬픽엔 관심 없고 ‘정당한 연구 목적’으로 데이터를 업로드했다”고 말했다.

“콘텐츠 모더레이션, 표절 방지 도구, 추천 시스템, 아카이브 보존 같은 커뮤니티 연구를 지원하는 것이 제 목표였습니다.”라고 nyuuzyou는 텔레그램으로 썼다. “많은 의견 충돌은 이런 데이터 세트가 왜 존재하는지에 대한 오해에서 비롯된다고 생각합니다. 이건 상업적 용도의 챗봇이나 LLM을 만들기 위한 것이 아니었습니다.”

2016년 프랑스 기업가들이 설립한 허깅페이스는 처음엔 10대를 위한 챗봇을 만들었다. 이후 회사는 머신러닝 개발을 대중에게 개방해 “AI 민주화”를 목표로 오픈 소스 모델을 호스팅하는 쪽으로 확장했다.

“우리 목표는 전 세계 모든 기업이 자체 AI를 구축할 수 있게 하는 것입니다.”라고 허깅페이스 제품 총괄 제프 부디에는 2월 아마존웹서비스(AWS)에 말했다.

그러나 허깅페이스는 대기업과 긴밀히 연결돼 있다. AWS와의 협업 외에도 IBM은 2023년에 허깅페이스에 2억 3,500만 달러를 투자했고, 자사의 생성형 AI 플랫폼 watsonx와의 협업을 발표했다.

nyuuzyou는 OTW가 데이터 세트에 대해 공격적으로 대응한 것에 놀랐다며 “연구 데이터 세트가 보존 목표와 어떻게 조화될 수 있는지 대화하길 바랐다”고 썼다.

“그건 정말 안일해요.”라고 분산 AI 연구소(DAIR) 연구 책임자이 알렉스 한나는 말한다. 그는 허깅페이스에 업로드된 모든 데이터 세트는 결국 LLM 훈련에 사용되고야 말 것이라고 생각한다. “언어 모델을 훈련하지 않을 거라면, 왜 웹에 방대한 비정형 데이터를 올리나요?”

한나는 OpenAI 같은 수십억 달러 규모 기업이 지배하는 생성형 AI 경제에서 nyuuzyou 같은 개인 수집자는 ‘새 발의 피’일지라도, AO3 같은 사이트가 이용자 작품을 적극적으로 보호해야 한다고 말한다.


팬픽션 작가들은 어쩔 수 없이 니키의 ‘두더지잡기 전략’이 길이다. “저런 것들을 무너뜨리는 것이 지금 누군가가 할 수 있는 최선일 겁니다.”라고 한나는 말한다.

니키와 Em, 두 팬픽션 작가는 nyuuzyou의 무단 수집 해명에 더 격렬하게 반응했다.

“꺼져, AI 자식아.”라고 Em은 말한다. “우리는 그 IP 사랑해서 공짜로 작업을 하고, 커뮤니티를 만들고, 글쓰기 연습을 하고, 우리가 사랑하는 캐릭터와 이야기의 콘텐츠를 만드는 거예요. 그런데 그걸 훔쳐서 더 큰 파장을 낳는 일에 쓰다니요.”

니키는 팬덤 공간으로 파고드는 AI에 계속 맞설 것이라고 말한다.

“제가 싸움을 찾아다니는 건 아니에요.”, 니키는 말한다.

“하지만 누군가 우리에게 싸움을 걸어오면, 싸울 겁니다.”


댓글 남기기

이 사이트는 스팸을 줄이는 아키스밋을 사용합니다. 댓글이 어떻게 처리되는지 알아보십시오.