Oracle Data Cloud Crawler

Qu'est-ce qu'Oracle Data Cloud Crawler ?

Oracle Data Cloud Crawler est un robot automatisé qui visite des pages Web pour examiner et analyser leur contenu. En ce sens, il est similaire aux robots utilisés par les entreprises de moteurs de recherche.

Oracle Data Cloud Crawler est identifié par l'un des agents utilisateur suivants :

Mozilla/5.0 (compatible; GrapeshotCrawler/2.0; +http://www.grapeshot.co.uk/crawler.php)

Mozilla/5.0 (iPhone; CPU iPhone OS 8_3 like Mac OS X) AppleWebKit/600.1.4 (KHTML, like Gecko) Version/8.0 Mobile/12F70 Safari/600.1. 4 (compatible; GrapeshotCrawler/2.0; +http://www.grapeshot.co.uk/crawler.php)

Oracle Data Cloud Crawler peut être identifié, car il envoie des requêtes à partir de plages d'adresses IP détenues par Oracle. Si vous pensez que des demandes sont usurpées, vérifiez l'adresse IP de la demande par rapport à la base de données RIPE appropriée à l'aide d'un outil whois ou d'un service de recherche approprié. Au moment de l'écriture, les seules adresses utilisées pour Oracle Data Cloud Crawler sont les suivantes :

  • 132.145.9.5
  • 132.145.11.125
  • 132.145.14.70
  • 132.145.15.209
  • 132.145.64.33
  • 132.145.66.116
  • 132.145.66.156
  • 132.145.67.248
  • 140.238.81.78
  • 140.238.83.181
  • 140.238.94.137
  • 140.238.95.47
  • 140.238.95.199
  • 152.67.128.219
  • 152.67.137.35
  • 152.67.138.180

ou

  • de 148.64.56.64 à 148.64.56.80
  • de 148.64.56.112 à 148.64.56.128

Pourquoi l'analyseur de liens Oracle Data Cloud analyse-t-il mon site ?

Oracle Data Cloud aide les publicitaires à placer des publicités contextuelles sur des pages Web. Pour ce faire, il est nécessaire d'examiner ou d'analyser les pages afin de déterminer la ou les catégories qui correspondent le mieux.

Les pages ne sont consultées qu'à la demande. Si Oracle Data Cloud Crawler a visité votre site, cela signifie qu'une annonce a récemment été placée sur une page où les informations n'étaient pas encore disponibles ou devaient être actualisées. Pour cette raison, vous verrez souvent une demande de l'analyseur de liens (crawler) Oracle Data Cloud peu de temps après qu'un utilisateur a visité une page. Les systèmes sont conçus pour être aussi conviviaux que possible. Ils limitent les taux de demandes à un site spécifique et reculent automatiquement si un site est en panne ou lent ou renvoie de manière répétée des réponses d'erreur (pas 200).

Une chaîne de systèmes importante peut amener Oracle Data Cloud à analyser votre site. Oracle Data Cloud Crawler fournit des informations contextuelles en temps réel à plusieurs systèmes d'enchères en temps réel (RTB), tels que Rubicon, AppNexus et bien plus encore. Ces systèmes RTB sont souvent utilisés par des systèmes de serveurs publicitaires tiers dans le cadre de leur stratégie de diffusion d'annonces.

Blocage avec le fichier robots.txt

Oracle Data Cloud ne fournit aucun système de moteur de recherche à personne et ne rend jamais le contenu analysé de votre site disponible par une recherche ou un autre système. Nous analysons votre site uniquement lorsqu'une annonce a été placée qui nous a amenés à être interrogés sur le contexte de la page.

Vous pouvez utiliser les fichiers robots.txt pour bloquer Oracle Data Cloud Crawler à partir de votre site, comme indiqué dans les exemples suivants :

Bloquer des parties spécifiques de votre site

User-agent: grapeshot
Disallow: /private/
Disallow: /messages/

Bloquer tout votre site

User-agent: grapeshot
Disallow: /

Autoriser Oracle Data Cloud Crawler à analyser votre site

User-agent: grapeshot
Disallow:

Nous prenons au sérieux les demandes de ne pas analyser un site, une partie d'un site ou toute autre rétroaction sur nos opérations et nous y répondrons rapidement et de manière appropriée. En tant que bonne pratique, nous vérifions les fichiers robots une fois par jour. Dès lors, les modifications apportées à un fichier de sites peuvent prendre 24 heures pour devenir actives. Contactez-nous à l'adresse odc-crawler_ww@oracle.com et nous exclurons votre site ou enquêterons immédiatement.

En savoir plus

Si vous pensez que votre site est visité par erreur ou si Oracle Data Cloud Crawler est à l'origine de problèmes sur votre site, contactez Oracle Data Cloud à l'adresse odc-crawler_ww@oracle.com et nous examinerons votre requête.