Czym jest Projekt Web Discovery? Obserwuj
Projekt Web Discovery to sposób chroniący prywatność, dzięki któremu możesz przyczynić się do rozwoju i niezależności Brave Search. Jeśli się zdecydujesz, przyczynisz się do udostępnienia anonimowych danych o wyszukiwaniach i odwiedzanych stronach internetowych w przeglądarce Brave (w tym o stronach znalezionych przez niektóre, ale nie wszystkie, inne wyszukiwarki). Te dane pomagają budować niezależny indeks Brave Search i zapewniają wyświetlanie odpowiednich wyników dla zapytań wyszukiwania oraz wsparcie bardziej odpowiednich doświadczeń z produktami i usługami Brave. Przez „dane” rozumiemy zapytania wyszukiwania, kliknięcia wyników wyszukiwania, URL odwiedzanych stron w przeglądarce, czas spędzony na tych stronach oraz niektóre metadane o samych stronach.
Projekt Web Discovery działa w tle, więc nie wymaga żadnego wysiłku ze strony kontrybutorów. Danych udostępnionych nie można powiązać z osobą je udostępniającą ani grupować razem, co zapobiega próbom deanonimizacji. Możesz zrezygnować w dowolnym momencie.
Dlaczego stworzyliśmy Projekt Web Discovery
Dostarczanie odpowiednich wyników wyszukiwania jest kluczowe dla tworzenia wyszukiwarki, której ludzie chcą używać. Tak tworzymy prywatną wyszukiwarkę, która nadal konkuruje z Big Tech pod względem jakości i kompletności. Aby zapewnić maksymalną trafność wyników wyszukiwania, Brave musi zrozumieć kilka kluczowych rzeczy, w tym:
- Jak dokładnie wyniki wyszukiwania odpowiadają słowom kluczowym (dopasowanie do dokładnych słów, części słów lub synonimów)
- Jak niedawne są wyszukiwania tych słów kluczowych
- Jak często klikany jest wynik wyszukiwania dla danego słowa kluczowego
- Jak popularne są słowa kluczowe wyszukiwania
- Jakie strony są popularne lub nowe
- Które witryny pozwalają na indeksowanie tylko przez bota wyszukiwarki Google
Zabezpieczanie trafności oznacza również zmniejszenie „szumu” z treści internetowych, które sprawiają, że wyszukiwanie jest mniej trafne. Na przykład, jeśli szukasz „pogoda w Europie” i widzisz wyniki dotyczące historii Europy lub biznesu europejskiego, powiesz, że wyniki są mniej trafne dla twojego zapytania. Uczenie się przez Projekt Web Discovery pozwala Brave Search odfiltrować ten szum, ale w sposób chroniący prywatność. Uczynienie wyszukiwania bardziej trafnym nie powinno odbywać się kosztem twojej prywatności online.
Kontekst
Większość dostawców wyszukiwania — jak Google i Microsoft — zbiera dane o twoim zachowaniu w wyszukiwaniu, zarówno w wyszukiwarce, jak i przeglądarce (takiej jak Chrome lub Edge). Dane te obejmują twoje zapytania, na które wyniki wyszukiwania klikasz, URL odwiedzanych stron, czas spędzony na tych stronach oraz metadane (takie jak tytuł strony, typ treści, itp.) dotyczącą samych stron. Inne, nie-niezależne wyszukiwarki (jak DuckDuckGo) niekoniecznie zbierają dane same. Ale nadal polegają na takim zbieraniu danych poprzez swoją zależność od innych indeksów Big Tech (jak Bing). I te dane mogą — i często są — powiązane z tobą osobiście.
Dostawcy wyszukiwania zbierają tego rodzaju dane, aby nieustannie rozwijać swoje indeksy — listy miliardów stron internetowych, z których czerpią wyniki — oraz zapewniać, że wyniki są trafne i nigdy nie są przestarzałe. To zbieranie samo w sobie nie jest złe. Ale jego niedoskonałości stają się widoczne, gdy spojrzysz na alternatywną drogę Brave:
- Projekt Web Discovery pozwala ci na udostępnianie anonimowych, uogólnionych danych.
- Projekt Web Discovery jest zaprojektowany tak, aby zapobiec powiązaniu tych danych z tobą. Oznacza to, że Brave nie ma danych do sprzedaży reklamodawcom, ani nie ma co utracić wskutek kradzieży lub włamania, co pozwala nam obiecywać przez technologię, a nie słowa.
- Projekt Web Discovery Brave jest tylko na zasadzie opt-in i całkowicie przejrzysty.
Ochrona braku powiązań
Brave nie stosuje podstępnych praktyk innych dużych wyszukiwarek technologicznych. Projekt Web Discovery jest opcjonalny, a dane zbierane w ramach Projektu Web Discovery mają określone zabezpieczenia zapewniające anonimowość. Oprócz tych zabezpieczeń, Projekt Web Discovery przestrzega zasady „nielinkowalności”. Oznacza to, że nie łączymy danych z Tobą, Twoją przeglądarką lub Twoim urządzeniem. Brave Search nie ma pojęcia o identyfikatorze użytkownika lub sesji, co uniemożliwia powiązanie rekordów. Ponadto, Projekt Web Discovery obejmuje wiele zabezpieczeń, aby zapobiec uwzględnianiu witryn lub wyszukiwań specyficznych dla Ciebie, lub zawierających dane osobowe lub wrażliwe.
Jakie słowa kluczowe są najczęściej wyszukiwane? Do jakich witryn prowadzą te słowa kluczowe? Jak są te witryny używane? Tego rodzaju pytania kierunkowe pomagają Brave Search nawigować w świecie dostępnych stron internetowych i oddzielać sygnały od szumu. A to z kolei pomaga nam zrozumieć, które części sieci warto indeksować dla użytkowników.
Jeśli zdecydujesz się dołączyć do Projektu Web Discovery, Twoja przeglądarka przetworzy następujące dane na Twoim urządzeniu i bezpiecznie wyśle je na serwery Brave:
- Ułamek adresów (URL) odwiedzanych stron internetowych w Brave Browser wraz z metrykami zaangażowania (ile czasu spędzono na stronie)
- Ułamek zapytań (np. „pogoda w Nowym Jorku dzisiaj”) przeprowadzonych w niektórych wyszukiwarkach (poza Brave Search) w Brave Browser, wraz z powiązanym kliknięciem wyniku (jeśli występuje)
- Metadane tych odwiedzanych stron (np. jeśli strona zawiera wideo, informacje o autorze lub właścicielu strony, tytuł strony itp.), nigdy treść samej strony.
- Pełną listę znajdziesz w repozytorium GitHub Brave
Dzięki tym danym Brave może się nauczyć (w prywatny, niepowiązany z użytkownikiem sposób) rzeczy, takie jak ile odwiedzin witryny (np. Wikipedia) trwało dłużej niż 20 sekund, lub ile razy dane zapytanie (np. „Co to jest Wikipedia?”) skłoniło użytkownika do kliknięcia w tę witrynę. To kalibruje Brave Search, aby wiedziało, że witryna jest wiarygodna i że użytkownicy uważają jej zawartość za wartościową. To z kolei pozwala wyszukiwarce zrozumieć relewantność wyników i wyświetlać strony o wyższej relewantności na górze wyników wyszukiwania.
Te dane nie pozwalają Brave wiedzieć, takie jak powiązane zapytania (np. inne zapytania przeprowadzone przez osoby, które szukały „Co to jest Wikipedia?”) lub inne odwiedzane witryny. I oczywiście nie mówi nam to niczego, co pozwoliłoby nam powiązać dane z osobą lub jej urządzeniem.
Domyślnie wszyscy użytkownicy są wyłączeni z Projektu Web Discovery. Jeśli wyraziłeś zgodę, możesz ją wycofać w dowolnym momencie. Bez względu na to, co wybierzesz—wyrażenie zgody lub jej wycofanie—twoje doświadczenia w Brave lub Brave Search nie ulegną zmianie.
Aby zrezygnować, otwórz nową kartę w przeglądarce Brave i kliknij Ustawienia. Przewiń do „Projekt Web Discovery” i wyłącz to ustawienie.Projekt Web Discovery jest lekki i działa tylko w tle. Nie powinno być zauważalnego wpływu na prędkość przeglądania, prędkość renderowania stron ani inne podobne wskaźniki. Może jednak wystąpić niewielkie (ale prawdopodobnie niezauważalne) obciążenie w postaci dodatkowego zużycia CPU i pasma. Należy zauważyć, że Projekt Web Discovery działa tylko na urządzeniach stacjonarnych, więc nie ma wpływu na plany danych mobilnych. Jeśli zauważysz problemy z wydajnością, powiadom nas natychmiast.
Wszystkie przesyłane URL muszą być publicznie dostępne—tzn. ich treść powinna być taka sama niezależnie od tego, kto je dostarcza. Może to być prawdą tylko wtedy, gdy strony te nie są chronione przez logowanie, sesje indywidualne lub inną autoryzację. Każdy przesyłany URL musi zostać odwiedzony przez co najmniej 20 różnych osób, co ustanawia rozproszony kworum podobny do k-anonimowości.
Dodatkowo, stosowanych jest wiele heurystyk, aby wykluczyć adresy URL, które kodują dostęp, np. adresy URL możliwości (takie jak udostępnione dokumenty, linki do Dropbox, linki do faktur itp.). Z założenia żadne z tych adresów URL nie są wysyłane. I nawet jeśli w jakiś sposób by były, protokół niezależności rekordów oznacza, że nikt, kto ma dostęp do danych, nie mógłby odzyskać innych adresów URL z tego samego źródła ani powiązać jakichkolwiek danych z kimkolwiek.
Powyższe zabezpieczenia dotyczą również zapytań wyszukiwania. Każde zapytanie zawierające coś, co wygląda na dane osobowe, takie jak adresy e-mail, numery telefonów lub hashe, jest automatycznie odrzucane zamiast wysyłane.
- Przegląd Projektu Web Discovery można znaleźć w repozytorium GitHub Brave.
- Przeczytaj README na najwyższym poziomie.
- Sprawdź kod źródłowy.
Jeśli zauważysz potencjalny problem, utwórz zgłoszenie w repozytorium, lub skontaktuj się z nami.