메뉴

AI학습에 사용되는 콘텐츠, 저작권료 부과 어렵다?

URL복사

뉴스아트 이명신 기자 |

 

AI가 온 세계를 휩쓸고 있다. 각종 AI포럼도 여기저기서 열리고 있다. 지난 6월 12일 한국콘텐츠진흥원에서 개최한 <2024 콘텐츠산업포럼>도 그 중 하나이다. 여기서 영화, 광고, 방송, 게임, 음악, 이야기 등에서 실제로 AI가 활용되고 있는 현장의 모습을 통해 상상 이상으로 급격하게 높아지고 있는 AI 파고를 실감할 수 있었다. 첫째 날은 정책 세션이었다. AI가 영상제작에 미치는 영향 사례 발표와 함께 저작권 문제가 다루어졌다.

 


발표 현장에서 느끼기에 학습데이터의 저작권 문제는 이미 큰 관심사가 아니었다. 법무법인 린의 구태언 TMT 총괄 파트너는 다른 나라의 AI규제동향을 소개하면서, 디지털 주권을 지키기 위해서는 토종 AI가 반드시 필요하고, 이를 위해서는 대량의 데이터를 확보하고 유통할 수 있도록 해야 한다고 하였다.

 

AI발전 가로막지 못하게 저작권법 개방적 운영해야?

 

이는 개인정보나 저작권보호법이 AI발전을 가로막지 못하도록 개방적인 운영을 해야 한다는 뜻이다. 그는 이를 "디지털금모으기"에 비유하면서, 외환위기 시절 국민들이 금을 모아 위기를 극복(?)했듯이, 지금은 합심하여 데이터를 모아야 한다는 것이다. 하지만, 위기는 다같이 극복하고 과실은 일부에게만 돌아가는 경험을 한 국민들에게 이 말이 설득력을 가질지는 의문이다.

 

유럽연합이 정의한 AI시스템은, ▲다양한 수준의 자율성을 갖고, ▲적응성을 갖고 발전하며, ▲목적에 따라 추론하여 환경에 영향을 미칠 수 있으며, ▲예측, 추천, 의사결정과 같은 결과물을 생성하는 시스템을 말한다. 

 

미국 AI기술 규제, 시장 제재 많지 않음

 

이런 AI에 대한 규제는 자국내 AI 기술 발전 정도에 따라 다르다. 전세계 AI발전을 주도하는 미국의 경우, 100개 이상의 지침을 통해 AI기술 개발과 사용을 규제하고 있다. 그런데 이는 주로 공적 영역에 해당하는 것으로, 딥페이크 기술이나 국가안보에 영향을 미치는 기술에 대한 것을 빼면 사기업이나 시장에 대한 제재는 많지 않다고 한다.

 

 

반면에 유럽연합은 제재 대상이 포괄적이고 대규모 학습데이터를 사용하는 범용 AI모델에 대한 규제가 엄격하며, 위반시 제재도 강력하다. 유럽연합은 AI가 유럽을 장악하지 못하도록 하는 장치로 법률제정을 선택한 것이다. 하지만 구태언 파트너는, "법률전쟁은 경제전쟁을 이길 수 없다"고 잘라 말한다. 결국, AI를 선점하는 곳이 승리할 것이라는 말이다. 그래서 그는 "제재보다는 (토종) AI개발이 시급하다"고 주장한다.     

 

영국, 일본, 혁신 위해 최소법 제정

 

한편, 영국와 일본은 혁신을 억제하는 경직된 법안 도입을 최소화하는 방향을 선택했다고 한다. 특히 일본은 인공지능 학습에 필수적인 TDM(text data mining)을 허용하는 방향으로 저작권법을 개정했다. 저작물에 표현된 사상이나 감정을 직접 즐기거나 타인이 즐기게 하는 것을 목적으로 하지 않으면. 저작권 침해로 보지 않기로 한 것이다. 정보해석 및 기술개발을 촉진할 목적이다. 

 

한국은 현재 국회에 AI법안이 계류 중이며, 이 법안이 허술하다고 비판하는 의견도 있다. 이 법안에서는 정보분석을 위해 적법한 접근을 통한 복제와 전송을 허용하고 있다. 그런데 상업적 연구가 "정보분석을 목적으로 하는 공정이용"인지 기준이 애매하다. 게다가 정보통신망 이용 촉진 및 정보보호에 관한 법률은 이를 더욱 어렵게 만든다고 한다. 

 

개인정보보호법이 기술발전 억제, AI법안까지 덧붙이면

 

김혜창 한국저작권위원회 정책연구본부 김혜창 본부장도 비슷한 발언을 했다.

 

미국은 개인정보보호법이 없다. 우리는 제재가 너무 포괄적이고 강력이다. 심지어 형사처벌 대상이다. 미국은 민사소송대상이라 소송 과정에서 산업을 발전시켜 그 수익으로 보상해줄 수 있다. (우리는 산업 발전 자체가 불가능해서) 골든타임을 놓칠 수 있다. 국가적 결단이 필요하다.   - 김혜창 본부장 

 

그는 AI학습과정에서의 저작권 침해 문제는 최근에 대두된 문제라고 하면서, 이에 따른 규제가 급히 만들어지긴 했지만 구체적이지도 않고 어느 수준까지 허용할지가 합의되지 않았다고 한다. 이에 관련 소송이 급격하게 늘어나고 있으며, 미국에서만 30개 이상이 진행중이다. 

 

저작권 시장 혼돈 상태, 사용자 주의 필요

 

저작권 시장은 혼돈 상태다. 인공지능제작물임이 드러나 저작권 등록이 취소되는가 하면, AI산출물 중에 작가가 직접 창작한 문장 등 일부 내용만 저작권 인정을 받기도 한다. 게다가 인공지능 서비스 업체는 서비스이용약관을 수시로 바꿈으로써 법적 책임을 피하고자 하기 때문에 사용자의 주의가 필요하다. 

 

 

김혜창 본부장은 저작권은 "의거성 및 유사한 결과"가 판단 근거가 된다고 했다. 현행법상 AI가 토해낸 결과가 저작권을 침해하는 것이 명백할 때만 저작권 위반을 논할 수 있으면, 학습단계에서 사용한 저작물에 대해서는 저작권 침해 여부를  판단하기가 어렵다는 말이다. 물론 그렇다고 학습에 창작물을 사용하는 것이 저작권 침해가 아니라는 법조항이 있는 것도 아니다.

 

현재 네이버 등은 일단 AI 학습에 필요한 데이터를 모으고 있다. 하지만 대량의 데이터가 필요하다는 점에서, 저작권자 동의 없이 초법적으로 모으는 경우도 많다고 한다. 그러나 이번 포럼 참석자들은 급격한 기술발전 단계에서 뒤처지지 않으려면 규제보다는 개발에 힘써야 한다는 분위기다. 주최측이 산업 진흥을 목표로 하는 한국콘텐츠진흥원이라는 공공기관이라서 그런 듯하다.


창작자는 디지털화되면서 더 많은 보상을 받았을까?

 

문제는, '개발' 과정에서 이용만 당하고 버려질 사람들이다. 발표자들은 디지털 혁신으로 영화(=영상을 의미)와 음악 창작자들이 훨씬 많은 보상을 받았다고 주장했다. 시장 규모는 커졌으니까근거가 있는 주장일 수도 있다. 하지만 승자독식 구조가 강화되고, 국내 음원시장은 3년째 내리막길이며, 인디음악이 거의 사라지면서 음악의 다양성도 사라졌다. 영상산업도 마찬가지다. 승자독식 구조의 가장 큰 부분을 플랫폼 기업이 차지한다. 창작자'들'이 훨씬 많은 보상을 받았다고 주장할 수 있을까?

 

규제보다 개발 강조, 보상 안한다는 말?

 

토종 AI를 개발하는 네이버는 직접적으로 고소당하기 쉬운 영상 데이터만 빼고 아무튼 대규모 데이터를 수집 중이라고 한다. 사람이 학습과정에서 접한 저작물에 대하여 저작권료를 지불하지 않는다. 그 사람이 저작권을 침해하는 결과물을 내놓거나 상업적으로 이용하지 않는 한 말이다.


같은 논리가 AI에 적용되는 것같다. 하지만 AI의 영향력과 파괴력은 한 명의 학습하는 인간보다 훨씬 강하다. AI학습은 수억 광년 떨어져 있던 블랙홀이 지구로 접근하는 것과 같은 효과를 가질 수 있다. 그래서 "AI학습에 콘텐츠 전면 허용해야 뒤지지 않는다. 사용저작권이나 수익배분은 나중에 고민해도된다"는 저작권 관련자들의 결론은, 창작자들에 대한 보상을 "안한다"는 말로 들린다. 

 

포럼 내용에 대하여 한 예술가는 "어도비, 셔터스톡 등은 데이터 구축할 때 비용 지급이 기본 정책인데..." 라며 공공기관의 포럼에서 나온 내용에 대한 실망을 표시했다. 씁쓸한 AI정책 포럼이었다.