De quoi s'agit-il et comment nous bloquons l'accès d'un agent utilisateur (Bot ou navigateur) sur un site Web [Astuces NGINX]

Tout d’abord, voyons d’une manière générale ce que cet utilisateur-agent d’un navigateur Internet est et ce qu’il utilise.

Qu'est-ce que User Agent (ou User-Agent)?

Tout ce qui signifie un navigateur Internet (Internet Explorer, Safari, Opera, Firefoc, Chrome, etc.) comporte un agent logiciel qui interagit avec le site Web que vous visitez, au niveau du serveur hôte. Ce logiciel établit la connexion Internet avec le site Web, comprend, vérifie et rendra le contenu de la page consultée. En bref, il assure l’interaction entre l’utilisateur et le serveur hôte qui sert les pages Web demandées à l’utilisateur en accédant à une URL spécifique sur le protocole HTTP / HTTPS.
L'agent utilisateur contient dans l'en-tête fourni au serveur auquel il accède des informations sur le logiciel utilisé par l'utilisateur, le système d'exploitation, la version du progiciel du navigateur. Par exemple, l'agent utilisateur de Google Chrome fournira au serveur des informations sur la version de Google Chrome utilisée et sur le système d'exploitation de l'utilisateur.

Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3163.100 Safari/537.36

L’en-tête user-agent ci-dessus signifie qu’une version de Google Chrome 70 sur un ordinateur avec Processeur AMD, Architecture 64-bit OS Windows 10.
Vous vous demanderez probablement Pourquoi Mozilla apparaît-il en tant qu'agent utilisateur Chrome?. Il s’agit d’une astuce utilisée par Google (et Microsoft dans IE) pour faciliter l’accès des utilisateurs de Chrome à tous les sites compatibles Mozilla et Safari. AppleWebKit est le moteur de lecture du contenu.

Les webmasters ou les administrateurs de serveur Web peuvent bloquer l'accès de certains agents utilisateurs sur les hébergeurs hébergés. La plupart du temps, cette limitation est définie robots web (web bots) l'accès chaotique ou excessif aux pages Web d'un site Web. Heureusement, ces robots ont un agent utilisateur spécifique et peuvent être facilement détectés dans les journaux du serveur Web.

Comment bloquer l'accès utilisateur-agent sur un serveur Web avec NGINX

Prenons le scénario dans lequel nous ne voulons plus permettre aux utilisateurs d'accéder au site Web avec des systèmes d'exploitation. Windows Navigateur Internet XP et Mozilla Firefox 5.0.

Nous ajoutons le code sous la configuration du fichier nginx au bloc "serveur":

if ($http_user_agent = "Mozilla/5.0 (Windows NT 5.1; rv:52.0) Gecko/20100101 Firefox/52.0"){
return 403;
}

Enregistrez le fichier nginx.conf ou le fichier spécifique à un site Web, si vous utilisez une configuration personnalisée (gen sites-available), puis redémarrer le service NGINX.
Tous les utilisateurs de Firefox 5.0 (y compris toutes les versions jusqu’à 5.9) sur Windows XP, sera redirigé vers erreur 403 (Interdite).

Je n'ai pas choisi accidentellement cet exemple. À partir de Firefox 52.9.0, Mozilla a cessé de prendre en charge les utilisateurs. Windows XP oui Windows Vista. Systèmes d'exploitation dont la prise en charge a été arrêtée par Microsoft sous 2014, respectivement 2017 pour Windows Vista.

De quoi s'agit-il et comment nous bloquons l'accès d'un agent utilisateur (Bot ou navigateur) sur un site Web [Astuces NGINX]

A propos de l'auteur

infiltration

Passionné par tout ce qui concerne les gadgets et l'informatique, je suis heureux d'écrire sur stealthsettings.com de 2006 et j'aime découvrir de nouvelles choses sur les ordinateurs et MacOS, les systèmes d'exploitation Linux, Windows, iOS et Android.

Laisser un commentaire