Reddit kommer att börja debitera dig för att träna AI-modeller från dess extremt mänskliga arkiv
Om du är i branschen med att lära ut en stor språkmodell (LLM) till en AI och vill att den ska lära sig av u/420NarutoConspiracy subreddit, måste du snart betala för det.
Steve Huffman, grundare och VD för sociala nyheter och diskussionsaggregator Reddit, berättade nyligen för The New York Times att han planerar att debitera företag som får tillgång till hans API för att extrahera 18 år av mestadels mänskligt skapat innehåll. Detaljer om de nya villkoren finns i följande meddelande på Reddit .
API:et kommer att fortsätta att vara gratis för utvecklare som arbetar med bots och andra Reddit-verktyg, och för forskare som arbetar med akademiska eller ideella projekt. Men att bara använda Reddit-diskussioner för AI-träningsändamål kommer att kosta en kostnad, vars exakta mängd bör dyka upp under de kommande veckorna.
”Reddit-datauppsättningen är verkligen värdefull,” sa Huffman i en intervju med Times. ”Men vi behöver inte ge bort allt det värdet gratis till några av de största företagen i världen.
”Att genomsöka Reddit, skapa värde och inte returnera det värdet till våra användare är något vi har problem med. Nu är det dags för oss att göra saker rätt.”
Kommentarerna och konversationerna på Reddit har blivit en rik resurs för att lära sig AI LLM. ChatGPT och Google Bard citerar Reddit-data som en av sina källor. I sin analys av bara en delmängd (12 miljoner) av Stable Diffusion (2,3 miljarder) bildgenereringsdatauppsättning, noterade Andy Baio och Simon Willison att ”användargenererade innehållsplattformar har varit en enorm källa för bilddata.” En studie av vanliga datakällor för många AI: er publicerad idag av The Washington Post fann att ”sammanställning av text från länkar högt rankade av GPT-användare” ingår .
Reddit har för avsikt att begränsa åtkomsten till AI, men det avser att ge utvecklare och moderatorer bättre verktyg för att arbeta inom sina samhällen. Reddit-apparna för iOS och Android kommer att erbjuda sätt att snabbt se en användares berättelse, uppdatera communityregler och bättre hantera flera mod-köer.
Reddits förändring till API-åtkomst kommer när företaget är inställt på att bli börsnoterat under andra halvan av 2023, enligt The Information. Bolaget har konfidentiellt ansökt om en börsnotering i december 2021 . Enligt Reuters hade man hoppats på en värdering på 15 miljarder dollar, men försenade inlämnandet tills marknadsförhållandena, särskilt kring teknikföretag, förbättrades.
Lämna ett svar