공공정책 위키(Public Policy Wiki)에 오신 것을 환영합니다


공공정책 위키 시작하기

생성형 AI 모델의 저작권

Public Policy Wiki
둘러보기로 이동 검색으로 이동

생성형 AI 모델이란?

  • 생성형 AI는 대규모 데이터셋에 기반한 딥러닝(Deep Learning)[1] 기술을 활용하여 이용자가 요구하는 새로운 데이터나 콘텐츠 등의 산출물을 제시하는 AI 기술을 의미한다. 다시 말해 컴퓨터가 새로운 산출물을 만들어내는 것, 특히 실제 데이터와 유사한 데이터를 산출하는 것에 초점을 두고 있으며, 인공 신경망(Artificial Neural Network)[2]을 학습 모델로 활용한다.

저작권이란?

저작권 페이지 참조.

생성형 AI 모델의 사례

  • 산업계에서는 서비스의 목적에 따라 다양한 생성형 AI 모델을 개발하여 적용하고 있으며, 언론기사나 소설, 리뷰 작성 등 주로 자연어 생성 분야[3](챗봇 서비스)에서 많이 사용되고 있다.
  • 텍스트 또는 이미지 입력에 대한 응답으로 고품질의 이미지를 생성하는 기술로 확산 (Diffusion) 모델을 활용한 서비스[4]가 등장하고 있다.
  • 분위기, 장르, 길이 등의 언어적 입력 이외에도 유사음악, 악보, 미디음악, 코드, 템포 등의 입력을 통하여 새로운 음악을 생성하는 서비스[5]가 등장하고 있다.
  • 비디오 데이터의 시간적 특성 때문에 여전히 해결해야 할 기술적 문제점(주제의 일관성, 깜박임 등)이 있지만, 딥러닝 기술 발전으로 스타일 전이와 이미지 합성이 실시간으로 가능해짐에 따라 직관적이고 높은 성능의 비디오 편집도구(Make-a-videoMeta AI research)가 제공되고 있다.
  • 코딩 프로세스를 최적화 또는 자동화하거나, 코드를 작성하도록 보조하는 등 코드 생성 서비스 (CopilotGitHub, CodeWhispererAmazon) 분야나, 사용자 입력(텍스트, 이미지, GUI 등)을 통해 사물의 외형과 텍스쳐(질감)를 생성함으로써 3D 모델링, 공간 환경 구성, 디지털 휴먼 제작 등 메타버스 서비스(관광, 교육, 제조, 국방, 엔터테인먼트 등), CAD 서비스 분야에서도 활용된다.

생성형 AI 모델의 저작권 침해 쟁점

저작권 관점에서의 생성형 AI 기술

AI 학습 단계에서의 저작권 침해 쟁점

  • AI 학습을 위해서는 데이터를 수집·가공하여 데이터셋을 구성한 뒤 이를 인공 신경망에 전달하여 학습시키는 일련의 절차를 거치게 되는데, 그 과정에서 학습 데이터에 포함된 저작물에 대한 복제 등의 행위가 필연적으로 수반된다.
  • AI 학습 목적으로 인터넷에 공개된 데이터를 무단으로 이용하는 경우에는, 저작권법상 학습 데이터에 포함된 저작물에 대한 복제권 등의 침해 여부가 주요 쟁점이 된다.
  • 현행 저작권법은 AI 학습 목적으로 저작물을 이용하는 경우를 개별적인 저작재산권 제한 사유로 규정 하고 있지 않으므로, 저작재산권이 제한되는 사유를 포괄적인 형태로 정하고 있는 공정이용 규정 (저작권법 제35조의5)의 적용 여부가 주요 쟁점으로 부각된다.[6]

AI 산출물의 저작권 침해 쟁점

  • 생성형 AI 산출물은 이용자의 프롬프트 등 입력에 따라서 학습 완료된 AI 모델로부터 확률적으로 도출된 것이다.
  • AI 산출물이 기존의 저작물과 같거나 유사하다고 판단되는 경우에는 저작권 침해 문제가 제기될 수 있다.
  • AI 산출물이 기존 저작물을 인식하고 이에 근거하여 만든 것인지(의거성), AI 산출물과 기존 저작물이 같거나 유사하다고 볼 수 있는지(실질적 유사성)에 대한 판단에 따라 저작권 침해 여부가 결정된다.
  • 궁극적으로 AI 산출물이 기존 저작물에 대한 저작권을 침해하였는지 여부는 구체적인 사실관계 등을 고려하여 법원의 판단을 통해 결정다.

AI 학습 단계에서 고려할 사항

  • 인터넷 등에 게시되어 누구나 접근할 수 있게 공개된 저작물에 대해서는, 사업자들이 크롤링[7](Crawling) 등을 통해 데이터셋을 구성함으로써 AI 학습에 이용하는 경우가 많다.
  • 저작권자는 자신의 저작물이 AI 학습에 이용되는 것을 원하지 않을 시 그에 반대하는 의사를 적절한 방식으로 명시하거나 이를 방지하기 위한 기술적인 조치를 취하는 것이 적절하다.(예: 약관규정 명시, 로봇배제표준[8] 적용 등)
  • 비록 저작권자가 본인의 저작물이 AI 학습에 이용되었다는 사실을 뒤늦게 알게 되었다고 하더라도, 해당 저작물이 추가적으로 AI 학습에 이용되는 것을 방지하기 위하여 위와 같은 조치들을 고려할 수 있다.

AI 산출물과 관련된 저작권 쟁점

AI 산출물의 저작물성 인정 여부

  • 저작권법상 ‘저작물’은 ‘인간의 사상 또는 감정을 표현한 창작물’을 의미한다.[9]
  • 현행법의 해석상 인간이 아닌 AI가 만들어낸 산출물 자체에 대해서는 저작물성을 불인정한다.
  • 2022년 7월 한국음악저작권협회에서는 AI 산출물을 저작물로 인정할 수 없다는 점을 이유로, AI 프로그램 ‘이○’이 작곡한 총 6곡의 노래에 대한 저작권료 지급 중단 결정을 한 바 있다.

AI 산출물의 저작자 인정 여부

  • 저작권법에서 ‘저작물’을 인간의 사상 또는 감정을 표현한 창작물로, ‘저작자’는 ‘저작물을 창작한 자’ 라고 정의한다.[10]
  • 즉, 자연인만이 저작자가 될 수 있고 예외적으로 업무상저작물의 경우와 같이 법률에서 별도로 정하고 있는 경우에 한하여 법인·단체 등도 가능하므로 현행법상 AI 자체에 대해서 저작자로서의 지위는 인정이 불가능하다.
  • AI 산출물 자체는 저작물로 보호되지 않으므로, AI 산출물에 인간이 창작성을 부가함으로써 저작물 성이 인정되는 경우에만 저작자 내지 저작권 귀속에 대한 논의가 가능하다.
  • 이 경우 일반적인 저작권 법리에 따라서 해당 저작물에 대한 창작적 기여 여부 및 기여의 정도를 고려하여 결정될 것이며, 그에 대한 최종적인 판단은 법원의 판결에 의한다고 볼 것이다.

AI 산출물과 인간 창작물의 구분

  • 최근 국내외에서는 인간이 창작한 저작물과 구분하여 생성형 AI 산출물에 AI 기술을 활용한 사실을 별도 표시하는 방안[11]이 논의되고 있다.
  • 2023년 5월 발의된 콘텐츠산업 진흥법 개정안에서는 콘텐츠제작자가 AI 기술을 이용하여 콘텐츠를 제작한 경우 해당 콘텐츠가 AI 기술을 이용하여 제작된 콘텐츠라는 사실을 표시하도록 규정했다.
  • 미국 정부는 2023년 7월 A사, G사, M사, O사 등 7개 기업과 AI로 생성된 콘텐츠에 워터마크 표시를 넣는 등 안전 조치를 도입하는 방안에 합의, 10월에는 해당 콘텐츠에 대한 워터마크 사용 지침 개발을 지시하는 행정명령을 발표했다.
  • A사의 이미지 및 영상 편집 도구의 경우 이용자들에게 콘텐츠 자격 증명 기능을 제공함으로써, 생성형 AI 활용 여부를 포함한 콘텐츠 작성 및 편집 이력 등을 확인할 수 있도록 하고 있다.

생성형 AI 이용 시 저작권의 침해될 수 있는 예시

“곰돌이 푸”와 “스누피”를 프롬프트로 입력하여 생성한 것

텍스트의 경우

  • 이용자가 기존 저작물을 그대로 프롬프트 창에 입력하거나 그와 동일·유사한 작품의 생성을 유도하는 텍스트를 입력함으로써 기존 저작물과 동일·유사한 AI 산출물을 생성한 뒤 인터넷에 게시하는 등의 방식으로 이용할 경우, 복제권·공중송신권·동일성유지권을 비롯한 저작권 침해 문제가 야기될 수 있다.
  • 이미지 생성형 AI를 이용하면서 “뽀로로” 등 유명 캐릭터를 유도하는 프롬프트를 입력한 뒤, 생성된 이미지를 SNS상의 프로필 사진 등으로 활용하거나, 유사한 스토리의 창작을 유도하고 작성된 글을 블로그에 게시하는 경우 저작권의 침해가 될수 있다.

이미지 및 영상의 경우

  • 이용자가 AI 이미지나 영상 제작을 위하여 특정 이미지나 영상 그 자체를 무단으로 입력한 뒤 생성된 AI 산출물을 이용할 경우에도 복제권 등 저작권 침해 소지가 있다.
  • 홍보 포스터 제작을 위해 이미지 생성형 AI에 저작권이 있는 이미지를 입력한 후, (텍스트 등으로)자사 제품에 맞게 수정하여 홈페이지에 사용하는 경우
  • 유명 캐릭터 이미지를 AI를 이용하여 기존 가수의 음악방송 무대영상에 합성한 뒤, 이를 유튜브에 올리는 경우

음악의 경우

  • 이용자가 AI 산출물(영상, 음악 등)을 만드는 과정에서 타인의 음악 저작물을 무단 입력하여 생성된 AI 산출물을 이용할 경우 역시 복제권 등 저작권 침해 소지가 있다.
  • 특히, 기존 가수의 곡을 AI가 학습한 다른 가수의 목소리로 재생성한, 이른바 AI 커버곡 제작 과정 에서 타인의 음원을 무단 활용하거나 생성된 AI 커버곡을 온라인 플랫폼에 게시하여 공유하는 경우 에는 해당 음악 또는 음반에 대한 복제행위 등이 수반될 수 있으므로 저작권 및 저작인접권 침해 가능성 있다.
  • 그 외에도 사안에 따라서 부정경쟁방지법 위반, 일반적 인격권 침해행위 등으로 규율될 여지가 있다.

그 외의 경우

  • 일부 생성형 AI(예: S사의 ‘스테이블 디퓨전(Stable Diffusion))’ 등의 경우에는 이용자가 직접 모델에 대한 미세 조정 작업을 통해 원하는 스타일을 반영하는 것이 가능하다.
  • 이 경우 이용자가 원하는 학습 데이터를 활용해 추가적인 학습을 진행하는 과정이 수반되며, 마찬 가지로 학습 데이터의 저작권 침해 쟁점이 문제 될 수 있다.
  • 원하는 스타일의 AI 산출물을 도출하기 위하여 특정 작가의 작품 또는 특정한 이미지 등을 집중 적으로 학습시켜 이를 적용할 경우에는, 해당 작품 등과 동일·유사한 산출물이 생성됨으로써 저 작권 침해 가능성 또한 현저히 높아질 수 있으므로 유의가 필요하다.

AI 산출물의 저작권 등록 가능 여부

  • 어떠한 표현 행위에도 인간의 창작적 기여가 있었다고 볼 수 없는 AI 산출물에 대한 저작권 등록이 불가능하다.
  • 저작권 등록은 인간의 사상 또는 감정이 표현된 창작물에 대해서만 가능하다.
  • 저작권은 저작물의 창작과 동시에 발생하는 것으로 등록·납본·기탁 등 일체의 절차나 방식을 요하지 않으며[12], 저작권 등록이 되었다고 하여 저작물이 아닌 것에 대해 저작물성 인정 내지 저작권 부여의 효과가 발생하는 것도 아니다.
  • 다만, AI 산출물에 인간이 수정·증감 등 창의적으로 ‘추가 작업’을 하여 추가 작업한 부분만으로 저작 물성이 인정되는 경우에는 저작권 등록이 가능하다.[13]
  • 또한, AI 산출물 자체는 등록할 수 없더라도 AI 산출물들을 선택하고 배열한 것에 창작성이 있으면 ‘편집저작물’로 등록 가능하다.
  • 저작자는 저작물을 창작한 자를 의미하므로, 인간(또는 법인)이 아닌 AI 그 자체는 저작자가 될 수 없어 AI를 저작자로 등록이 불가능하다.
  • AI를 단독 저작자 혹은 공동저작자로 하여 등록할 수 없으며, AI 산출물을 개발자 명의로 등록 신청 하거나 업무상저작물로 하여 대표 명의나 법인 명의로 등록 신청하는 것도 불가능하다.

AI 산출물의 저작권 등록 관련 국내외 사례

파라다이스로의 최근 입구
  • 국내에서는 유명 작가의 시를 텍스트 프롬프트로 삼고, 이를 통해 AI가 만들어낸 영상물을 2차적저작물이라고 주장하며 저작권 등록을 시도한 사례가 있다.
  • 한국저작권위원회는 현행 저작권법상 저작물은 ‘인간’의 사상 또는 감정을 표현한 창작물을 말한 다(저작권법 제2조 제1호)고 하면서, AI가 영상화한 영상물의 등록을 반려했다.
  • 인간이 입력한 프롬프트를 활용하여 AI가 이를 영상화한 경우 그 행위는 AI만이 한 것으로 볼 수 있어 해당 영상물은 등록의 대상이 아니다.
  • 새벽의 자리야
    우리나라의 경우 저작권법 제2조 제1호 규정에 근거하여 인간의 창작물만을 저작물로 보기 때문에 저작권 등록 대상 또한 인간의 창작물에 한정되므로, AI 산출물에 대해서는 저작권 등록을 할 수 없다.
  • 신청인 스티븐 탈러(Stephen Thaler)는 저작자를 AI 프로그램인 ‘창작 기계(Creativity Machine)’로 기재하고 자신을 기계의 소유자라고 하면서 ‘파라다이스로의 최근 입구’라는 그림을 업무상저작물로 저작권 등록을 시도했다. 이에 대해 미국 저작권청은 ‘인간 저작자 요건(The Human Authorship Requirement)’이 결여되었음을 이유로 등록 거절했다.
  • 미국 저작권청은 AI 산출물에 대해서는 인간의 창작물이 아니므로 저작물로 볼 수 없으며, 저작권 등록의 대상 또한 아니라고 판단하였다.
  • 신청인 크리스티나 카슈타노바는 이미지 생성 AI ‘미드저니(Midjourney)’를 이용 하여 만든 18쪽 분량의 만화책 ‘새벽의 자리야’에 대해 저작권을 등록하였다. 이후 미국 저작권청은 기존 등록을 취소하고 신규 등록증 발급, 신규 등록은 신청인이 창작에 기여한 부분인 텍스트(문학작품), AI로 생성된 그림을 선택, 배열 및 조정한 것(편집저작물)에 대한 것만 인정하고 AI 산출물(그림)은 제외하였다.
  • 미국 저작권청은 ‘인간 저작자 요건’에 근거하여, 인간의 창작적인 개입이 없는 AI 산출물의 저작권 등록을 불인정하였다.
  • 다만, 인간이 AI 산출물을 선택, 배열 등 수정했다면 해당 창작적 기여 부분에 한하여 저작권이 인정될 수 있다고 판단하였다.

저작권 침해 방지를 위한 조치

저작물이 AI 학습에 이용되었는지를 확인할 수 있는 인터넷 사이트
  • AI 사업자는 해당 서비스 제공 시 기존 저작물과 동일하거나 유사한 AI 산출물이 도출되지 않도록 함으로써 저작권 침해를 미연에 방지하는 것이 바람직하다.(예: 필터링 조치 등)
  • 기존 파운데이션 모델(Foundation Model)[14]을 활용하여 응용서비스를 제공하는 사업자의 경우 에는 해당 파운데이션 모델에 학습된 데이터를 전부 파악하기 어려울 수 있으므로 별도의 기술 등을 활용하여 AI 산출물의 저작권 침해 예방 필요
  • AI 모델을 미세 조정(Fine-tuning)[15]함으로써 특정 작가의 작품이나 특정 이미지 등을 집중적으로 학습 시킬 경우에는 생성된 AI 산출물의 저작권 침해 가능성 또한 높아진다고 볼 수 있다.
  • AI 사업자가 이를 직접 수행하거나 이용자에게 관련 서비스를 제공한다면 사안에 따라서 해당 사업자 또한 저작권 침해 책임을 질 우려가 있으므로 유의 필요
  • AI 산출물의 저작권 침해로 인한 분쟁이 발생할 경우 각 사업자 사이에서도 책임 소재와 관련한 논란이 생길 수 있으므로, 파운데이션 모델 제공자와 파운데이션 모델을 활용하여 응용서비스를 제공하는 사업자는 이용 계약 체결 시에 책임 귀속에 관한 부분까지 명확히 할 필요가 있다.
  • 최근에는 각 저작물이 AI 학습 등에 제공되었더라도 유사한 산출물이 도출되는 것을 방지 하는 기술[16]들도 등장하고 있으므로, 저작권자에게는 이와 같은 기술 등을 활용하여 본인의 저작권에 대한 침해 방지책을 마련할 것을 권장한다.

AI-저작권 제도개선 워킹그룹[17]

AI-저작권 제도개선 워킹그룹이란 ?

  • 문화체육관광부와 한국저작권위원회는 생성형 AI의 등장 및 확산에 따른 저작권 이슈를 점검하고 AI 기술 발전에 대비한 제도적 개선방안을 논의하기 위하여 2023년 2월부터 저작권 학계와 법조계, 산업기술계 전문가 및 이해관계자 등으로 구성된 "AI-저작권 제도개선 워킹그룹"을 운영하였다.
  • 현재 문화체육관광부는 생성형 AI의 저작물 학습 및 산출물 생성과 유통 전반에 걸친 저작권 보호 및 유통·관리 기술 개발[18] 지원 계획을 마련하고 있다.

향후 추진계획

  • AI 학습에 이용되는 저작물에 대한 보상이 필요한 경우, AI 기술 및 관련 산업 발전을 도모하면서도 창작자를 보호하는 선순환 시스템이 구축될 수 있도록 투명하고 신뢰성 있는 소통 창구 마련이 필요하다.
  • AI 학습 관련 적절한 보상 등의 방법으로 적법한 이용 권한 확보 마련 방안, 저작물 거래 활성화 방안, AI 산출물에 대한 보호 여부 및 AI 산출물 표시 의무화 여부 등에 대해서는 창작자의 권익 보호, AI 산업 발전 측면에서 추가적인 검토가 필요할 것으로 보이므로 후속 연구나 워킹그룹 등을 통해 논의되어야 할 사항이다.
  • 구체적인 대안 마련을 위해서는 해외에서의 AI 관련 입법 동향뿐만 아니라 국내외 AI 기술 발전 및 산업 구조 등을 함께 고려해야 하며, 국제적인 관점에서 저작권 보호 체계 전반에 대한 재논의 과정이 병행되어야만 할 것이다.
  • AI 학습에 필요한 저작물의 원활한 이용을 도모하면서도 인간 창작의 가치를 충분히 인정해 줄 수 있는 상생 협력 방안 마련 필요하다.

각주

  1. 인간의 뇌 신경망을 모방한 방식으로 데이터를 계층적으로 학습한 패턴에 기반하여 추론할 수 있도록 한 AI 기술
  2. 인공 신경망은 인간의 뇌가 동작하는 원리를 모방하여 구현한 학습 알고리즘을 지칭
  3. 대규모 언어 모델(Large Language Model, LLM)이 대표적인 자연어 생성 분야의 AI 모델이며, 하이퍼 클로버X네이버, 챗GPTOpenAI, 바드Google 등 비전문가도 쉽게 사용할 수 있도록 챗봇 형태로 서비스되어 Q&A, 요약, 번역 등 생산성을 향상시키는 목적으로 활용됨
  4. DALL-E3OpenAI, Make-a-sceneMeta, ImagenGoogle, Generative-FillAdobe 등
  5. MusicLMGoogle, MusicGenMeta, Stable AudioStability AI 등
  6. 공정이용 규정 적용 여부에 대한 학계의 의견 대립이 있으며, AI 학습에 있어 공정이용 규정 적용 여부를 직접적으로 판단한 국내외 법원의 판례는 없음
  7. 인터넷상의 데이터들을 자동화된 방법으로 탐색하여 수집·저장하는 것을 의미하며, 크롤링을 위해 개발된 프로그램을 크롤러(Crawler)라고 함
  8. 인터넷 사이트에 크롤러와 같은 로봇이 접근하는 것을 방지하기 위한 규약을 의미하며, 일종의 권고안으로서 강제성이 있는 것은 아님
  9. 저작권법 제2조 제1호
  10. 저작권법 제2조 제1호, 제2호
  11. ‘AI 산출물과 인간의 창작물’ 또는 ‘AI가 산출한 부분과 인간이 창작한 부분’ 구분 등
  12. 저작권법 제10조 제2항, 무방식주의
  13. 다만, 해당 저작권 등록의 효력은 추가 작업한 부분에 한함
  14. 방대한 양의 데이터를 자기 지도 학습을 통해 학습한 모델로서 이용자가 목적에 맞게 미세 조정(Fine-tuning) 하여 사용할 수 있는 범용 모델을 의미하며, 예시로 GPT나 BERT, CLIP 등을 들 수 있음
  15. 사전 학습이 완료된 AI 모델에 특정 작업과 관련된 데이터를 추가로 학습시켜 해당 작업에 맞게 최적화하는 것을 의미
  16. C대학 연구팀의 ‘글레이즈(Glaze)’, M대학 연구팀의 ‘포토가드(Photo Guard)’ 등
  17. 생성형 AI 기술의 최근 동향 및 관련된 저작권 쟁점 등을 논의
  18. 생성형 AI를 활용해서 만들어진 산출물(어문, 영상, 음악 등)의 유사도 비교 및 원본 추적 기술, AI 기반 3D 산출물에 대한 워터마킹 기술 개발 등