De quoi s'agit-il et comment nous bloquons l'accès d'un agent utilisateur (Bot ou navigateur) sur un site Web [Astuces NGINX]

Tout d’abord, voyons d’une manière générale ce que cet utilisateur-agent d’un navigateur Internet est et ce qu’il utilise.

Qu'est-ce que User Agent (ou User-Agent)?

Tout cela signifie un navigateur Internet (Internet Explorer, Safari, Opera, Firefox, Chrome, etc.) disposent d'un logiciel agent qui interagit avec le site Web que vous visitez, au niveau du serveur hôte. Ce logiciel établit la connexion Internet avec le site Web, comprend, vérifie et affiche le contenu de la page consultée. En bref, il assure l'interaction entre l'utilisateur et le serveur hôte qui sert à l'utilisateur les pages Web demandées en accédant à une URL spécifique sur le protocole HTTP / HTTPS.
L'agent utilisateur contient dans l'en-tête fourni au serveur auquel il accède des informations sur le logiciel utilisé par l'utilisateur, le système d'exploitation, la version du progiciel du navigateur. Par exemple, l'agent utilisateur de Google Chrome fournira au serveur des informations sur la version de Google Chrome utilisée et sur le système d'exploitation de l'utilisateur.

Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3163.100 Safari/537.36 

L’en-tête user-agent ci-dessus signifie qu’une version de Google Chrome 70 sur un ordinateur avec Processeur AMD, Architecture 64-bit OS Windows 10.
Vous vous demanderez probablement Pourquoi Mozilla apparaît-il en tant qu'agent utilisateur Chrome?. C'est une sorte d'astuce utilisée par Google (et par Microsoft dans IE) pour faciliter l'accès des utilisateurs de Chrome à tous les sites compatibles avec Mozilla et Safari. AppleWebKit est le moteur de lecture du contenu.

Webmestres ou administratorii les serveurs Web peuvent bloquer l'accès de certains agents utilisateurs sur les hébergeurs hébergés. La plupart du temps, cette limitation est définie robots web (web bots) l'accès chaotique ou excessif aux pages Web d'un site Web. Heureusement, ces robots ont un agent utilisateur spécifique et peuvent être facilement détectés dans les journaux du serveur Web.

Comment bloquer l'accès utilisateur-agent sur un serveur Web avec NGINX

Prenons le scénario dans lequel nous ne voulons plus permettre aux utilisateurs d'accéder au site Web avec des systèmes d'exploitation. Windows Navigateur Internet XP et Mozilla Firefox 5.0.

Nous ajoutons le code sous le fichier de configuration nginx, dans le bloc «serveur»:

  if ($http_user_agent = "Mozilla/5.0 (Windows NT 5.1; rv:52.0) Gecko/20100101 Firefox/52.0"){
 return 403;
 }

Enregistrez le fichier nginx.conf ou le fichier spécifique à un site Web, si vous utilisez une configuration personnalisée (gen sites-available), puis redémarrer le service NGINX.
Tous les utilisateurs de Firefox 5.0 (y compris toutes les versions jusqu’à 5.9) sur Windows XP, sera redirigé vers erreur 403 (Interdite).

Je n'ai pas choisi accidentellement cet exemple. À partir de Firefox 52.9.0, Mozilla a cessé de prendre en charge les utilisateurs. Windows XP oui Windows Vista. Systèmes d'exploitation dont la prise en charge a été arrêtée par Microsoft sous 2014, respectivement 2017 pour Windows Vista.

Passionné par la technologie, j'écris avec plaisir sur StealthSettings.com depuis 2006. J'ai une expérience approfondie dans les systèmes d'exploitation : macOS, Windows et Linux, ainsi que dans les langages de programmation et les plates-formes de blogging (WordPress) et pour les boutiques en ligne (WooCommerce, Magento, PrestaShop).

Comment » Internet » Internet Explorer » De quoi s'agit-il et comment nous bloquons l'accès d'un agent utilisateur (Bot ou navigateur) sur un site Web [Astuces NGINX]
Laisser un commentaire