Qu’est-ce que le projet Web Discovery? S’abonner
Le projet Web Discovery est une manière respectueuse de la vie privée de contribuer à la croissance et à l’indépendance de Recherche Brave. Si vous choisissez de participer, vous contribuerez des données anonymes sur les recherches et les visites de pages web effectuées dans le navigateur Brave (y compris les pages atteintes via certains, mais pas tous, autres moteurs de recherche). Ces données aident à construire l’index indépendant du moteur de recherche Brave, et à s’assurer que nous affichons des résultats pertinents pour vos requêtes de recherche et à soutenir des expériences plus pertinentes avec les produits et services Brave. Par « données », nous entendons les requêtes de recherche, les clics sur les résultats de recherche, les URL des pages visitées dans le navigateur, le temps passé sur ces pages, et certaines métadonnées sur les pages elles-mêmes.
Le projet Web Discovery fonctionne en arrière-plan, donc il ne nécessite aucun effort de la part des contributeurs. Les données contribuant ne peuvent être reliées à celui qui les a fournies, ni regroupées ensemble, ce qui empêche les tentatives de dé-anonymisation. Choisissez de ne plus participer à tout moment.
Pourquoi avons-nous créé le projet Web Discovery
Fournir des résultats de recherche pertinents est essentiel pour créer un moteur de recherche que les gens veulent utiliser. C’est ainsi que nous créons un moteur de recherche respectueux de la vie privée qui concurrence encore les Big Tech en termes de qualité et d’exhaustivité. Pour garantir que les résultats de recherche sont les plus pertinents possibles, Brave doit comprendre certaines informations clés :
- Dans quelle mesure les résultats de recherche correspondent aux mots-clés de la recherche (correspondance exacte avec les mots, des parties de mots ou des synonymes)
- Dans quelle mesure les recherches sont récentes pour ces mots-clés
- À quelle fréquence un résultat de recherche est cliqué pour un mot-clé donné
- Dans quelle mesure les mots-clés de recherche sont populaires
- Quelles pages sont populaires ou nouvelles
- Quels sites permettent uniquement le crawl par le robot de recherche Google
Assurer la pertinence signifie également réduire le « bruit » provenant du contenu web qui rend une recherche moins pertinente. Par exemple, si vous recherchez « météo Europe » et trouvez des résultats relatifs à l’histoire européenne ou aux affaires européennes, vous diriez que les résultats sont moins pertinents pour votre requête. Apprendre à travers le projet Web Discovery permet à Recherche Brave de filtrer ce bruit, mais de manière respectueuse de la vie privée. Rendre la recherche plus pertinente ne doit pas se faire au détriment de votre confidentialité en ligne.
Contexte
La plupart des fournisseurs de recherche - comme Google et Microsoft - collectent des données sur votre comportement de recherche, à la fois dans le moteur de recherche et dans le navigateur (comme Chrome ou Edge). Ces données incluent vos requêtes, sur quels résultats de recherche vous cliquez, les URL des pages que vous visitez, le temps passé sur ces pages ainsi que les métadonnées (comme le titre de la page, le type de contenu, etc.) sur les pages elles-mêmes. D’autres moteurs de recherche non indépendants (comme DuckDuckGo) ne collectent pas nécessairement des données eux-mêmes. Mais ils s’appuient toujours sur ce type de collecte via leur dépendance à l’égard d’autres grands index technologiques (comme Bing). Et ces données peuvent être - et sont souvent - associées à vous personnellement.
Les fournisseurs de recherche collectent ce type de données pour accroître continuellement leurs index (la liste de milliards de pages Web qu’ils analysent pour fournir des résultats) et s’assurer que les résultats sont pertinents et jamais dépassés. Cette collection n’est pas mauvaise en soi. Mais ses lacunes deviennent évidentes lorsque vous regardez l’autre façon de faire de Brave :
- Le projet de découverte du Web vous permet de fournir des données anonymes et généralisées.
- Le projet de découverte du Web est conçu pour nous empêcher d’associer ces données à vous. Cela signifie qu’il n’y a pas de données que Brave puisse vendre à des annonceurs, ou perdre à cause d’un vol ou d’un piratage, ce qui nous permet de promettre par la technologie plutôt que par les mots.
- Le projet de découverte du Web de Brave est uniquement facultatif et totalement transparent.
La protection de l’intraçabilité
Brave ne suit pas les pratiques sournoises des autres moteurs de recherche des Big Tech. Le projet Web Discovery est facultatif, et les données collectées dans le cadre de ce projet bénéficient de protections spécifiques pour garantir l’anonymat. En plus de ces protections, le projet Web Discovery adhère au principe de l’« unlinkability ». Cela signifie que nous ne lions pas les données à vous, à votre navigateur ou à votre appareil. Le moteur de recherche Brave n’a pas de concept d’ID utilisateur ou de session, ce qui empêche la liaison des enregistrements. De plus, le projet Web Discovery inclut de multiples protections pour empêcher que des sites web ou des recherches spécifiques à vous, ou contenant des informations personnelles ou sensibles, ne soient inclus.
Quels mots-clés sont les plus souvent recherchés ? Vers quels sites web ces mots-clés mènent-ils ? Comment interagit-on avec ces sites web ? Ce type de questions directionnelles aide le moteur de recherche Brave à naviguer dans le monde des pages web disponibles et à séparer le signal du bruit. Et cela, à son tour, nous aide à comprendre les parties du web qui méritent d’être indexées pour les utilisateurs.
Si vous choisissez de participer au projet Web Discovery, votre navigateur traitera les données suivantes sur votre appareil et les enverra de manière sécurisée aux serveurs de Brave :
- Une fraction des adresses (URL) des pages web visitées dans le navigateur Brave, avec des mesures d’engagement (le temps passé sur la page)
- Une fraction des requêtes (par exemple, « météo New York aujourd’hui ») effectuées dans certains moteurs de recherche (hors du moteur de recherche Brave) dans le navigateur Brave, ainsi que le clic associé sur un résultat (le cas échéant)
- Les métadonnées de ces pages visitées (par exemple, si la page contient une vidéo, des informations sur l’auteur ou le propriétaire de la page, le titre de la page, etc.), jamais le contenu de la page elle-même.
- Pour une liste complète, consultez le dépôt GitHub de Brave
Avec ces données, Brave peut apprendre (de manière privée et non traçable) par exemple combien de visites sur un site web (comme Wikipédia) ont duré plus de 20 secondes ou combien de fois une requête donnée (comme « Qu’est-ce que Wikipédia ? ») a conduit un utilisateur à cliquer pour accéder à ce site web. Cela permet au moteur de recherche Brave de savoir qu’un site web est légitime et que les utilisateurs trouvent le contenu précieux. Cela, à son tour, permet au moteur de recherche de comprendre la pertinence des résultats et de classer les pages les plus pertinentes en haut des résultats de recherche.
Ces données ne permettent pas à Brave de savoir, par exemple, les requêtes associées (comme d’autres requêtes effectuées par des personnes ayant recherché « Qu’est-ce que Wikipédia ? ») ou les autres sites web visités. Et, bien sûr, cela ne nous permet en aucun cas de lier les données à un individu ou à son appareil.
Par défaut, tous les utilisateurs sont désinscrits du projet Web Discovery. Si vous avez choisi de vous inscrire, vous pouvez à nouveau vous désinscrire à tout moment. Quel que soit votre choix (inscription ou désinscription), votre expérience avec Brave ou le moteur de recherche Brave ne changera pas.
Pour vous désinscrire, ouvrez un nouvel onglet dans le navigateur Brave et cliquez sur « Paramètres ». Faites défiler jusqu’à « projet Web Discovery » et désactivez ce paramètre.Le projet Web Discovery est léger et fonctionne uniquement en arrière-plan. Il ne devrait y avoir aucun impact notable sur la vitesse de navigation, la vitesse de rendu des pages ou d’autres métriques similaires. Cependant, il peut y avoir une petite surcharge (mais probablement indiscernable) sous forme de consommation supplémentaire de CPU et de bande passante. Notez que le projet Web Discovery ne fonctionne que sur les appareils de bureau, de sorte qu’il n’y a aucun impact sur les forfaits de données mobiles. Si vous remarquez des problèmes de performance, veuillez nous en informer immédiatement.
Toutes les URL envoyées doivent être accessibles au public — c’est-à-dire qu’elles doivent avoir le même contenu quelle que soit la personne qui les contribue. Cela ne peut être vrai que si les pages ne sont pas protégées par une connexion, une session individuelle ou une autre authentification. Toutes les URL envoyées doivent avoir été visitées par au moins 20 personnes différentes, ce qui établit un quorum distribué similaire à l’anonymat de groupe.
Additionally, there are a variety of heuristics applied to rule out URLs that encode access i.e. capability URLs (such as shared docs, Dropbox links, invoice links, etc). Par conception, aucune de ces URL ne sont envoyées. Et, même si elles l’étaient, le protocole de non-association des enregistrements signifie que personne ayant accès aux données ne pourrait récupérer d’autres URL de la même origine, ou associer des données à une quelconque personne.
Les protections ci-dessus s’appliquent également aux requêtes de recherche. Toute requête contenant ce qui semble être des données personnelles, telles que des emails, des numéros de téléphone ou des hachages, est automatiquement supprimée plutôt qu’envoyée.
- Un aperçu du projet Web Discovery est disponible sur le dépôt GitHub de Brave.
- Lisez le README de haut niveau.
- Consultez le code source.
Si vous découvrez un problème potentiel, veuillez créer une issue sur le dépôt, ou contactez-nous.