Tumblr et WordPress vont vendre les données des utilisateurs à OpenAI

Automattic, la société derrière WordPress et Tumblr, prévoit des discussions pour monétiser le contenu des utilisateurs en vendant leurs données à des entreprises d'intelligence artificielle, y compris MidJourney et OpenAI. Ces données des plateformes de blogging Tumblr et WordPress.com seront utilisées pour former des modèles d'IA.

Bien que les détails de la transaction soient encore flous, cette nouvelle a suscité des inquiétudes parmi les utilisateurs concernant une utilisation potentiellement inappropriée de leur contenu privé sur les deux plateformes de blogging. De plus, 404 Media suggère qu'il y a eu des conflits internes au sein d'Automattic car le contenu collecté comprend des données privées qui n'étaient pas destinées à être conservées au sein de l'entreprise.

En réponse aux réactions négatives, Automattic prévoit d'introduire une nouvelle fonctionnalité qui permettra aux utilisateurs de choisir de ne pas partager leurs données pour la formation de l'IA. Dans un article de blog, la société réaffirme son engagement à offrir aux utilisateurs de Tumblr et WordPress un plus grand contrôle sur leur contenu. Elle mentionne le lancement d'un paramètre pour "décourager l'exploration par les entreprises d'IA", expliquant que les principales plates-formes d'exploration d'IA sont bloquées par défaut.

Le problème de l'utilisation du contenu des blogs par les entreprises développant des modèles d'IA ne se limite pas aux plateformes gérées par Automattic. Tant OpenAI que Google utilisent des robots d'exploration pour collecter des informations sur tous les sites Web afin de former des modèles d'intelligence artificielle. Le processus est similaire à la collecte de données par les moteurs de recherche.

Comment pouvez-vous bloquer OpenAI et Gemini (Bard) pour empêcher la récupération de données de votre blog ?

Si vous possédez un blog ou un site Web et que vous ne souhaitez pas que ses données soient utilisées pour former les modèles d'intelligence artificielle OpenAI et Gemini, vous pouvez bloquer l'accès des robots (crawlers) au contenu. Cette restriction peut être mise en place via le fichier robots.txt.

OpenAI Crawlers

User-agent: GPTBot
Disallow: /

Gemini Crawlers

User-agent: Google-Extended
Disallow: /

Après avoir enregistré le fichier robots.txt avec les nouvelles lignes, accédez à Google Console à : Paramètres > robots.txt > cliquez sur le menu avec les trois points, cliquez sur "Demander une nouvelle exploration".

Tumblr et WordPress vont vendre les données des utilisateurs à OpenAI
Recrawl Demande

Connexe: GPT-5 et le nouveau robot d'exploration web GPTBot développé par OpenAI.

Pour les utilisateurs de Tumblr et WordPress, l'accès à la récupération des données des blogs par OpenAI ou d'autres entreprises de développement d'intelligence artificielle peut être bloqué via les outils fournis par Automattic.

Passionné par la technologie, j'écris avec plaisir sur StealthSettings.com depuis 2006. J'ai une expérience approfondie dans les systèmes d'exploitation : macOS, Windows et Linux, ainsi que dans les langages de programmation et les plates-formes de blogging (WordPress) et pour les boutiques en ligne (WooCommerce, Magento, PrestaShop).

Comment » WordPress » Tumblr et WordPress vont vendre les données des utilisateurs à OpenAI
Laisser un commentaire