Reddit은 매우 인간적인 아카이브에서 AI 모델을 교육하는 데 비용을 청구하기 시작합니다.
AI에게 대규모 언어 모델(LLM)을 가르치는 사업을 하고 있고 그것이 u/420NarutoConspiracy 서브레딧에서 배우기를 원한다면 곧 비용을 지불해야 합니다.
소셜 뉴스 및 토론 애그리게이터 Reddit의 창립자이자 CEO인 Steve Huffman은 최근 The New York Times에 자신의 API에 액세스하여 대부분 사람이 만든 콘텐츠를 18년 동안 추출하는 회사에 비용을 청구할 계획이라고 말했습니다. 새로운 이용 약관에 대한 자세한 내용은 Reddit의 다음 발표 에서 확인할 수 있습니다 .
API는 봇 및 기타 Reddit 도구에서 작업하는 개발자와 학술 또는 비영리 프로젝트에서 작업하는 연구원에게 계속해서 무료로 제공됩니다. 그러나 AI 교육 목적으로 Reddit 토론을 사용하는 것만으로도 비용이 발생하며 정확한 금액은 앞으로 몇 주 안에 나타날 것입니다.
“Reddit 데이터 세트는 정말 가치가 있습니다.”라고 Huffman은 Times와의 인터뷰에서 말했습니다. “그러나 우리는 세계에서 가장 큰 일부 회사에 그 모든 가치를 무료로 제공할 필요가 없습니다.
“Reddit을 크롤링하고 가치를 창출하고 그 가치를 사용자에게 반환하지 않는 것은 우리에게 문제가 있습니다. 지금은 우리가 일을 바로잡을 때입니다.”
Reddit의 댓글과 대화는 AI LLM 학습을 위한 풍부한 리소스가 되었습니다. ChatGPT 와 Google Bard는 Reddit 데이터를 소스 중 하나로 인용합니다. Andy Baio와 Simon Willison은 Stable Diffusion(23억) 이미지 생성 데이터 세트 중 단 하나의 하위 집합(1,200만)에 대한 분석에서 “사용자 생성 콘텐츠 플랫폼은 이미지 데이터의 거대한 소스였습니다.”라고 언급 했습니다 . 워싱턴 포스트가 오늘 발표한 많은 AI에 대한 데이터 소스는 “Reddit 사용자가 높은 평가를 받은 링크에서 텍스트를 컴파일하는 것”이 GPT-3에 포함되어 있음을 발견했습니다.
Reddit은 AI에 대한 액세스를 제한하려고 하지만 개발자와 중재자에게 커뮤니티 내에서 작업할 수 있는 더 나은 도구를 제공하려고 합니다. iOS 및 Android용 Reddit 앱은 사용자의 스토리를 빠르게 보고, 커뮤니티 규칙을 업데이트하고, 여러 모드 대기열을 더 잘 처리할 수 있는 방법을 제공합니다.
The Information에 따르면 Reddit의 API 액세스 변경은 회사가 2023년 하반기에 공개될 예정이므로 이루어집니다 . 회사는 2021년 12월에 비공개로 기업공개를 신청했습니다 . Reuters에 따르면 150억 달러의 가치 평가를 기대했지만 특히 기술 회사 주변의 시장 상황이 개선될 때까지 제출을 연기했습니다.
답글 남기기