O que é o Web Discovery Project? Seguir
O Web Discovery Project é uma maneira de preservar a privacidade para que você contribua para o crescimento e a independência do Pesquisa Brave. Se optar por participar, você contribuirá com alguns dados anônimos sobre pesquisas e visitas a páginas da Web feitas no Brave Browser (incluindo páginas acessadas por meio de alguns, mas não todos, outros mecanismos de pesquisa). Esses dados ajudam a construir o índice independente da Pesquisa Brave e garantem que mostremos resultados relevantes para suas consultas de pesquisa e apoiemos experiências mais relevantes com os produtos e serviços da Brave. Por "dados" entendemos consultas de pesquisa, cliques em resultados de pesquisa, URLs de páginas visitadas no navegador, tempo gasto nessas páginas e alguns metadados sobre as próprias páginas.
O Web Discovery Project é executado em segundo plano e, portanto, não exige nenhum esforço por parte dos colaboradores. Os dados contribuídos não podem ser vinculados a quem os contribuiu ou agrupados, o que impede tentativas de desanonimização. Você pode optar por não participar a qualquer momento.
Por que criamos o Web Discovery Project
Fornecer resultados de pesquisa relevantes é essencial para criar um mecanismo de pesquisa que as pessoas queiram usar. É assim que criamos um mecanismo de pesquisa privado que ainda compete com a grande tecnologia em termos de qualidade e integridade. Para garantir que os resultados da pesquisa sejam os mais relevantes possíveis, o Brave precisa entender alguns aspectos importantes, incluindo:
- A proximidade dos resultados da pesquisa com as palavras-chave da pesquisa (correspondência com palavras exatas, partes de palavras ou sinônimos)
- Como as pesquisas para essas palavras-chave são recentes
- Com que frequência um resultado de pesquisa é clicado para uma determinada palavra-chave
- Qual a popularidade das palavras-chave de pesquisa
- Quais páginas são populares ou novas
- Quais sites permitem apenas o rastreamento pelo bot de pesquisa do Google
Garantir a relevância também significa reduzir o "ruído" do conteúdo da Web que torna uma pesquisa menos relevante. Por exemplo, se você pesquisar "Europe weather" (clima na Europa) e vir resultados relacionados à história europeia ou a negócios europeus, você diria que os resultados são menos relevantes para a sua consulta. O aprendizado por meio do Web Discovery Project permite que o Pesquisa Brave filtre esse ruído, mas de uma forma que preserve a privacidade. Tornar a pesquisa mais relevante não deve ser feito às custas de sua privacidade on-line.
Contexto
A maioria dos provedores de pesquisa, como o Google e a Microsoft, coleta dados sobre seu comportamento de pesquisa, tanto no mecanismo de pesquisa quanto no navegador (como o Chrome ou o Edge). Esses dados incluem suas consultas, os resultados de pesquisa em que você clica, os URLs das páginas que você visita, o tempo gasto nessas páginas e os metadados (como título da página, tipo de conteúdo etc.) sobre as próprias páginas. Outros mecanismos de pesquisa não independentes (como o DuckDuckGo) não necessariamente coletam dados. Mas eles ainda contam com esse tipo de coleta por meio de sua dependência de outros grandes índices tecnológicos (como o Bing). E esses dados podem ser associados a você pessoalmente, e muitas vezes são.
Os provedores de pesquisa coletam esse tipo de dados para aumentar continuamente seus índices - a lista de bilhões de páginas da Web que eles utilizam para fornecer resultados - e garantir que os resultados sejam relevantes e nunca obsoletos. Essa coleção não é inerentemente ruim. Mas suas deficiências se tornam evidentes quando você observa a forma alternativa do Brave:
- O Web Discovery Project permite que você contribua com dados anônimos e generalizados.
- O Web Discovery Project foi desenvolvido para evitar que associemos esses dados a você. Isso significa que não há dados para a Brave vender aos anunciantes ou perder para roubo ou hacking, o que nos permite prometer por meio da tecnologia em vez de palavras.
- O Projeto de Descoberta na Web da Brave é apenas opcional e totalmente transparente.
A proteção da desvinculação
O Brave não segue as práticas sorrateiras de outros mecanismos de pesquisa de grande tecnologia. O Projeto de Descoberta na Web é opcional, e os dados coletados no Projeto de Descoberta na Web têm proteções específicas para garantir o anonimato. Além dessas proteções, o Web Discovery Project adere ao princípio de "desvinculação". Isso significa que não vinculamos dados a você, ao seu navegador ou ao seu dispositivo. A Pesquisa Brave não tem o conceito de ID de usuário ou de sessão, o que impede a vinculação de registros. Além disso, o Web Discovery Project inclui várias proteções para impedir a inclusão de sites ou pesquisas específicas para você ou que incluam informações pessoais ou confidenciais.
Quais palavras-chave estão sendo pesquisadas com mais frequência? Para quais sites essas palavras-chave levam? Como você interage com esses sites? Esses tipos de perguntas direcionais ajudam o Pesquisa Brave a navegar pelo mundo das páginas da Web disponíveis e a separar o sinal do ruído. E isso, por sua vez, nos ajuda a entender as partes da Web que valem a pena indexar para os usuários.
Se você optar pelo Web Discovery Project, seu navegador processará os seguintes dados no seu dispositivo e os enviará com segurança aos servidores da Brave:
- Uma fração dos endereços (URLs) das páginas da Web visitadas no Brave Browser, juntamente com métricas de envolvimento (quanto tempo você gasta na página)
- Uma fração das consultas (por exemplo, "New York weather today") realizadas em alguns mecanismos de pesquisa (fora do Pesquisa Brave) dentro do Brave Browser, juntamente com o clique associado em um resultado (se houver)
- Metadados dessas páginas visitadas (por exemplo, se a página contém um vídeo, informações sobre o autor ou proprietário da página, título da página etc.), nunca o conteúdo da página em si.
- Para obter uma lista completa, confira o repositório do GitHub da Brave
Com esses dados, a Brave pode saber (de forma privada e não vinculada) coisas como quantas visitas a um site (por exemplo, Wikipédia) duraram mais de 20 segundos ou quantas vezes uma determinada consulta (por exemplo, "O que é a Wikipédia?") levou um usuário a clicar nesse site. Isso calibra o Pesquisa Brave para saber que um site é legítimo e que os usuários consideram o conteúdo valioso. Isso, por sua vez, permite que o mecanismo de pesquisa compreenda a relevância dos resultados e exiba páginas com maior relevância na parte superior dos resultados de pesquisa.
Esses dados não não permitem que a Brave saiba coisas como consultas associadas (por exemplo, outras consultas realizadas por pessoas que pesquisaram "O que é a Wikipédia?") ou os outros sites visitados. E, é claro, não nos diz nada que nos permita vincular os dados a um indivíduo ou a seu dispositivo.
Por padrão, todos os usuários são excluídos excluídos do Projeto de descoberta na Web. Se você optou por emvocê pode optar por não participar novamente a qualquer momento. Independentemente do que você escolher - aceitar ou não - sua experiência no Brave ou no Pesquisa Brave não será alterada.
Para desativar, abra uma nova guia no navegador Brave e clique em Configurações. Role até "Projeto de descoberta na Web" e desative essa configuração.O Web Discovery Project é leve e é executado somente em segundo plano. Não deve haver nenhum impacto perceptível na velocidade de navegação, na velocidade de renderização de páginas ou em outras métricas semelhantes. No entanto, pode haver uma pequena (mas provavelmente imperceptível) sobrecarga na forma de consumo extra de CPU e largura de banda. Observe que o Projeto Web Discover só é executado em dispositivos de desktop, portanto, não há impacto nos planos de dados móveis. Se você notar problemas de desempenho, , notifique-nos imediatamente.
Todos os URLs enviados devem estar disponíveis publicamente, ou seja, devem ter o mesmo conteúdo, independentemente de quem os está contribuindo. Isso só pode ser verdade se as páginas não estiverem por trás de um login, de uma sessão individual ou de outra autenticação. Todos os URLs enviados devem ter sido visitados por pelo menos 20 pessoas diferentes, o que estabelece um quorum distribuído semelhante ao k-anonimato.
Além disso, há uma variedade de heurísticas aplicadas para descartar URLs que codificam o acesso, ou seja, URLs de recursos (como documentos compartilhados, links do Dropbox, links de faturas etc.). Por padrão, nenhum desses URLs é enviado. E, mesmo que de alguma forma fossem, o protocolo de desvinculação de registros significa que ninguém com acesso aos dados poderia recuperar outros URLs da mesma origem ou associar qualquer dado a alguém.
As proteções acima também se aplicam a consultas de pesquisa. Qualquer consulta que contenha o que parece ser dados pessoais, como e-mails, números de telefone ou hashes, é automaticamente descartada em vez de enviada.
- Uma visão geral do Projeto de Descoberta da Web pode ser encontrada no repositório GitHub da Brave.
- Leia o README de nível superior.
- Exibir o código-fonte.
Se você identificar um possível problema, crie um problema no repositório, ou entre em contato conosco.