Was ist das Web Discovery Project? Folgen
Das Web Discovery Project ist eine datenschutzfreundliche Möglichkeit für dich, zum Wachstum und zur Unabhängigkeit von Brave Search beizutragen. Wenn du dich dafür entscheidest, trägst du einige anonyme Daten über Suchanfragen und Webseitenbesuche bei, die mit dem Brave Browser durchgeführt wurden (einschließlich Seiten, die über einige, aber nicht alle, andere Suchmaschinen aufgerufen wurden). Diese Daten helfen dabei, den unabhängigen Index der Brave Suche aufzubauen und sicherzustellen, dass wir relevante Ergebnisse für deine Suchanfragen anzeigen und relevantere Erfahrungen mit Brave Produkten und -Diensten unterstützen.1 Unter "Daten" verstehen wir Suchanfragen, Klicks auf Suchergebnisse, die URLs der im Browser besuchten Seiten, die auf diesen Seiten verbrachte Zeit und einige Metadaten über die Seiten selbst.
Das Web Discovery Project läuft im Hintergrund, so dass es keinen Aufwand für die Mitwirkenden erfordert. Die Daten können nicht mit der Person, die sie beigesteuert hat, in Verbindung gebracht oder gruppiert werden, was Deanonymisierungsversuche verhindert. Du kannst dich jederzeit abmelden.
Warum wir das Web Discovery Project aufgebaut haben
Um eine Suchmaschine zu entwickeln, die von den Menschen gerne genutzt wird, ist es wichtig, relevante Suchergebnisse zu liefern. So schaffen wir eine private Suchmaschine, die in puncto Qualität und Vollständigkeit mit den großen Suchmaschinen mithalten kann. Um sicherzustellen, dass die Suchergebnisse so relevant wie möglich sind, muss Brave einige wichtige Dinge verstehen, darunter:
- Wie genau die Suchergebnisse mit den Suchbegriffen übereinstimmen (Übereinstimmung mit exakten Wörtern, Wortteilen oder Synonymen)
- Wie aktuell die Suchanfragen für diese Schlüsselwörter sind
- Wie oft ein Suchergebnis für einen bestimmten Suchbegriff angeklickt wird
- Wie beliebt Suchbegriffe sind
- Welche Seiten sind beliebt oder neu
- Welche Websites nur das Crawlen durch den Google-Suchbot zulassen
Relevanz zu gewährleisten bedeutet auch, das "Rauschen" von Webinhalten zu reduzieren, das eine Suche weniger relevant macht. Wenn du zum Beispiel nach "Wetter in Europa" suchst und Ergebnisse zur europäischen Geschichte oder zur europäischen Wirtschaft siehst, würdest du sagen, dass die Ergebnisse weniger relevant für deine Anfrage sind. Das Lernen durch das Web Discovery Project ermöglicht es Brave Search, dieses Rauschen herauszufiltern, aber auf eine Art und Weise, die die Privatsphäre schützt. Eine relevantere Suche sollte nicht auf Kosten deiner Online-Privatsphäre gehen.
Kontext
Die meisten Suchanbieter - wie Google und Microsoft - sammeln Daten über dein Suchverhalten, sowohl in der Suchmaschine als auch im Browser (wie Chrome oder Edge). Zu diesen Daten gehören deine Suchanfragen, welche Suchergebnisse du anklickst, die URLs der Seiten, die du besuchst, die Zeit, die du auf diesen Seiten verbringst, und Metadaten (wie Seitentitel, Inhaltstyp usw.) über die Seiten selbst. Andere, nicht-unabhängige Suchmaschinen (wie DuckDuckGo) sammeln nicht unbedingt selbst Daten. Aber durch ihre Abhängigkeit von anderen großen Tech-Indizes (wie Bing) sind sie immer noch auf diese Art der Erfassung angewiesen. Und diese Daten können - und werden oft - mit dir persönlich in Verbindung gebracht.
Suchanbieter sammeln diese Art von Daten, um ihre Indizes - die Liste der Milliarden von Webseiten, aus denen sie Ergebnisse liefern - kontinuierlich zu erweitern und sicherzustellen, dass die Ergebnisse relevant und nie veraltet sind. Diese Sammlung ist nicht per se schlecht. Aber seine Unzulänglichkeiten werden deutlich, wenn du dir den alternativen Weg von Brave ansiehst:
- Das Web Discovery Project ermöglicht es dir, anonyme, verallgemeinerte Daten beizusteuern.
- Das Web Discovery Project soll verhindern, dass wir diese Daten mit dir in Verbindung bringen können. Das bedeutet, dass Brave keine Daten an Werbetreibende verkauft oder sie durch Diebstahl oder Hackerangriffe verliert, so dass wir unser Versprechen durch Technologie statt durch Worte geben können.
- Das Web Discovery Project von Brave ist ein Opt-in-Projekt, das vollkommen transparent ist.
Der Schutz der Unverkettbarkeit
Brave folgt nicht den hinterhältigen Praktiken anderer großer Tech-Suchmaschinen. Das Web Discovery Project ist ein Opt-in-Projekt, und die im Rahmen des Web Discovery Project gesammelten Daten sind besonders geschützt, um die Anonymität zu gewährleisten. Zusätzlich zu diesen Schutzmaßnahmen hält sich das Web Discovery Project an das Prinzip der "Unverknüpfbarkeit". Das heißt, wir verknüpfen keine Daten mit dir, deinem Browser oder deinem Gerät. Brave Search hat kein Konzept für eine Benutzer- oder Sitzungs-ID, was die Verknüpfung von Datensätzen verhindert. Außerdem enthält das Web Discovery Project mehrere Schutzmechanismen, um zu verhindern, dass Websites oder Suchanfragen, die für dich spezifisch sind oder persönliche oder sensible Informationen enthalten, aufgenommen werden.
Nach welchen Schlüsselwörtern wird am häufigsten gesucht? Zu welchen Websites führen diese Schlüsselwörter? Wie wird mit diesen Websites interagiert? Diese Art von Richtungsfragen helfen Brave Search, sich in der Welt der verfügbaren Webseiten zurechtzufinden und das Signal vom Rauschen zu trennen. Und das wiederum hilft uns zu verstehen, welche Teile des Webs es wert sind, für die Nutzer indiziert zu werden.
Wenn du dich für das Web Discovery Project entscheidest, verarbeitet dein Browser die folgenden Daten auf deinem Gerät und sendet sie sicher an die Server von Brave:
- Ein Teil der Adressen (URLs) der im Brave Browser besuchten Webseiten, zusammen mit Engagement-Metriken (wie viel Zeit auf der Seite verbracht wird)
- Ein Bruchteil der Suchanfragen (z. B. "New Yorker Wetter heute"), die in einigen Suchmaschinen (außerhalb von Brave Search) innerhalb des Brave Browsers durchgeführt wurden, zusammen mit dem zugehörigen Klick auf ein Ergebnis (falls vorhanden)
- Metadaten der besuchten Seiten (z. B. ob die Seite ein Video enthält, Informationen über den Autor oder Eigentümer der Seite, den Seitentitel usw.), niemals der Inhalt der Seite selbst.
- Eine vollständige Liste findest du im GitHub-Repositorium von Brave
Mit diesen Daten kann Brave (auf private, nicht verknüpfbare Weise) Dinge lernen, wie z.B. wie viele Besuche auf einer Website (z.B. Wikipedia) länger als 20 Sekunden dauerten oder wie oft eine bestimmte Anfrage (z.B. "Was ist Wikipedia?") einen Nutzer dazu verleitet hat, sich zu dieser Website durchzuklicken. Dadurch erkennt Brave Search, dass eine Website seriös ist und dass die Nutzer/innen den Inhalt wertvoll finden. Dies wiederum ermöglicht es der Suchmaschine, die Relevanz der Ergebnisse zu verstehen und Seiten mit höherer Relevanz an die Spitze der Suchergebnisse zu setzen.
Diese Daten sind nicht ermöglichen es Brave, Dinge wie verknüpfte Suchanfragen zu kennen (z. B. andere Suchanfragen von Personen, die nach "Was ist Wikipedia?" gesucht haben) oder die anderen besuchten Websites. Und es sagt uns natürlich nichts, was es uns erlauben würde, die Daten mit einer Person oder ihrem Gerät zu verknüpfen.
Standardmäßig sind alle Nutzer abgemeldet aus aus dem Web Discovery Project ausgeschlossen. Wenn du dich entschieden hast, dich entschieden hastgewählt hast, kannst du dich jederzeit wieder abmelden. Wie auch immer du dich entscheidest - ob du dich anmeldest oder nicht - deine Erfahrungen in Brave oder Brave Search werden sich nicht ändern.
Um dich abzumelden, öffne einen neuen Tab im Brave Browser und klicke auf Einstellungen. Blättern Sie zu "Web Discovery Project" und schalten Sie diese Einstellung aus.Das Web Discovery Project ist leichtgewichtig und läuft nur im Hintergrund. Es sollte keine spürbaren Auswirkungen auf die Browsing-Geschwindigkeit, die Geschwindigkeit des Seitenaufbaus oder andere ähnliche Messgrößen geben. Allerdings kann es zu einem kleinen (aber wahrscheinlich unbemerkten) Mehraufwand in Form von zusätzlichem CPU- und Bandbreitenverbrauch kommen. Beachte, dass das Web Discover Project nur auf Desktop-Geräten läuft, also keine Auswirkungen auf mobile Datentarife hat. Wenn du Leistungsprobleme bemerkst, , benachrichtige uns bitte sofort.
Alle gesendeten URLs müssen öffentlich zugänglich sein, d.h. sie müssen denselben Inhalt haben, unabhängig davon, wer sie zur Verfügung stellt. Das kann nur der Fall sein, wenn die Seiten nicht hinter einem Log-in, einer individuellen Sitzung oder einer anderen Authentifizierung stehen. Alle gesendeten URLs müssen von mindestens 20 verschiedenen Personen besucht worden sein, wodurch ein verteiltes Quorum ähnlich wie bei der K-Anonymität geschaffen wird.
Darüber hinaus gibt es eine Reihe von Heuristiken, um URLs auszuschließen, die den Zugriff verschlüsseln, z. B. Capability-URLs (wie freigegebene Dokumente, Dropbox-Links, Rechnungslinks usw.). Es ist so vorgesehen, dass keine dieser URLs gesendet wird. Und selbst wenn dies der Fall wäre, bedeutet das Protokoll zur Unverknüpfbarkeit der Aufzeichnungen, dass niemand, der Zugang zu den Daten hat, andere URLs desselben Ursprungs wiederherstellen oder die Daten mit jemandem in Verbindung bringen kann.
Die oben genannten Schutzmaßnahmen gelten auch für Suchanfragen. Alle Anfragen, die scheinbar persönliche Daten wie E-Mails, Telefonnummern oder Hashes enthalten, werden automatisch verworfen und nicht gesendet.
- Eine Übersicht über das Web Discovery Project findet sich auf Braves GitHub-Repositorium.
- Lies die README der obersten Ebene.
- Den Quellcode ansehen.
Wenn du ein potenzielles Problem entdeckst, erstelle bitte eine Meldung im Repo, oder kontaktiere uns.