블로그로 돌아가기
테크

레딧, 앤스로픽 상대로 소송 제기 — AI 데이터 스크래핑 전쟁의 서막

레딧이 Claude AI를 만든 앤스로픽을 상대로 무단 데이터 스크래핑 소송을 제기했습니다. AI 회사와 플랫폼 간의 데이터 주권 싸움, 어떻게 될까요?

2026년 3월 7일2분 읽기

레딧이 앤스로픽을 고소했다

2026년 3월, 레딧이 AI 기업 **앤스로픽(Anthropic)**을 상대로 소송을 제기했습니다. 혐의는 무단 데이터 스크래핑 — 즉, 앤스로픽이 레딧 사용자들의 댓글과 게시물을 허가 없이 긁어가 AI 모델 'Claude' 학습에 활용했다는 것입니다.

이 소식은 r/technology, r/artificial, r/legaladvice 등 수많은 서브레딧에서 열띤 토론을 불러일으켰습니다.

무엇이 문제인가?

레딧은 수십억 건의 사용자 대화, 질문, 답변이 쌓인 방대한 데이터 저장소입니다. AI 기업 입장에서는 이보다 좋은 학습 데이터가 없죠.

레딧의 주장:

  • 앤스로픽이 레딧의 API 이용 약관을 위반하면서 대규모 데이터를 수집했다.
  • 사용자 동의 없이 개인의 발언을 AI 훈련에 이용했다.
  • 이는 저작권법 및 컴퓨터 사기 방지법(CFAA) 위반에 해당한다.

레딧의 데이터 정책 강화 흐름

이번 소송은 갑작스러운 일이 아닙니다. 레딧은 최근 AI 데이터 활용에 대한 강경 정책을 잇따라 내놓고 있습니다.

  • 인터넷 아카이브(Wayback Machine) 접근 차단: 홈페이지를 제외한 모든 게시물·댓글·프로필 아카이빙을 막았습니다. AI 스크래핑 우려가 직접적인 원인.
  • API 유료화: 2023년부터 무료 API를 대폭 제한하고 유료 계약을 요구.
  • OpenAI와의 유료 계약: OpenAI는 레딧 데이터 접근 대가로 연간 약 7,000만 달러 지불하는 계약을 체결한 것으로 알려졌습니다.
  • Google과도 데이터 계약 체결.

앤스로픽은 이러한 유료 계약 대신 무단으로 데이터를 수집했다는 것이 레딧 측의 주장입니다.

앤스로픽의 입장

현재 앤스로픽은 공식 반박 성명을 내지 않은 상태입니다. 다만 AI 업계 전반적으로 "인터넷에 공개된 데이터는 학습에 활용할 수 있다"는 시각이 일부 존재합니다.

레딧 여론 반응

흥미롭게도, 이 뉴스에 대한 레딧 내 반응은 복잡합니다.

레딧 지지 측:

  • "내 댓글이 내 허락 없이 AI 학습에 쓰인다는 게 말이 되냐"
  • "플랫폼이 데이터 주권을 지키는 건 당연한 일"

회의적 시각:

  • "레딧도 결국 돈을 받고 OpenAI·Google에 팔면서 앤스로픽만 잡는 건 위선 아니냐"
  • "어차피 인터넷에 올린 글은 이미 공개된 것"

이 소송이 중요한 이유

이번 소송은 단순한 기업 분쟁이 아닙니다. AI 시대의 데이터 주권을 둘러싼 선례가 될 수 있는 사건입니다.

  • 판결 결과에 따라 AI 기업들의 웹 스크래핑 관행 전체가 흔들릴 수 있습니다.
  • 플랫폼들이 자신들의 데이터에 더 강한 법적 보호를 주장할 근거가 될 수 있습니다.
  • 반대로 AI 학습 데이터 확보 비용이 폭등해 AI 발전 속도에 영향을 줄 수도 있습니다.

AI와 데이터, 그리고 인터넷 생태계의 미래가 달린 싸움. 앞으로의 판결을 주목해야 합니다.


이 글은 보도된 뉴스를 바탕으로 작성됐으며, 법적 조언을 목적으로 하지 않습니다.

새 글을 이메일로 받아보세요 ✉️

새 글이 올라오면 바로 알려드릴게요