¿Qué es el Proyecto Descubrir la Web? Seguir
El Proyecto de Descubrimiento Web (WDP en inglés) es una forma de preservar tu privacidad para que contribuyas al crecimiento y la independencia del Buscador de Brave. Si aceptas, contribuirás con algunos datos anónimos sobre búsquedas y visitas a páginas web realizadas dentro del Navegador Brave (incluidas las páginas a las que se llega a través de algunos, pero no todos, los demás motores de búsqueda). Estos datos ayudan a construir el índice independiente del Buscador de Brave, y a garantizar que mostramos resultados relevantes a tus consultas de búsqueda y apoyamos experiencias más relevantes con los productos y servicios de Brave. Por "datos" entendemos consultas de búsqueda, clics en los resultados de búsqueda, las URL de las páginas visitadas en el navegador, el tiempo pasado en esas páginas y algunos metadatos sobre las propias páginas.
El Proyecto Descubrimiento de la Web funciona en segundo plano, por lo que no requiere ningún esfuerzo por parte de los colaboradores. Los datos aportados no pueden vincularse a quien los aportó, ni agruparse, lo que impide los intentos de desanonimización. Puedes darte de baja en cualquier momento.
Por qué creamos el Proyecto Descubrir la Web
Proporcionar resultados de búsqueda relevantes es esencial para construir un motor de búsqueda que la gente quiera utilizar. Así es como creamos un motor de búsqueda privado que sigue compitiendo con las grandes tecnológicas en calidad e integridad. Para garantizar que los resultados de la búsqueda sean lo más relevantes posible, Brave necesita comprender algunas cosas clave, entre ellas
- En qué medida coinciden los resultados de la búsqueda con las palabras clave (coincidencia con palabras exactas, partes de palabras o sinónimos)
- Cuán recientes son las búsquedas de esas palabras clave
- Con qué frecuencia se hace clic en un resultado de búsqueda para una palabra clave determinada
- Cuán populares son las palabras clave de búsqueda
- Qué páginas son populares o novedosas
- Qué sitios sólo permiten el rastreo del robot de búsqueda de Google
Garantizar la relevancia también significa reducir el "ruido" del contenido web que hace que una búsqueda sea menos relevante. Por ejemplo, si buscas "el tiempo en Europa" y ves resultados relacionados con la historia europea o los negocios europeos, dirías que los resultados son menos relevantes para tu consulta. El aprendizaje a través del Proyecto de Descubrimiento de la Web (WDP) permite al Buscador de Brave filtrar este ruido, pero preservando la privacidad. Hacer que las búsquedas sean más relevantes no debe hacerse a expensas de tu privacidad en Internet.
Contexto
La mayoría de los proveedores de búsquedas -como Google y Microsoft- recopilan datos sobre tu comportamiento de búsqueda, tanto en el motor de búsqueda como en el navegador (como Chrome o Edge). Estos datos incluyen tus consultas, en qué resultados de búsqueda haces clic, las URL de las páginas que visitas, el tiempo que pasas en esas páginas y metadatos (como el título de la página, el tipo de contenido, etc.) sobre las propias páginas. Otros motores de búsqueda no independientes (como DuckDuckGo) no necesariamente recopilan datos por sí mismos. Pero siguen confiando en este tipo de recopilación a través de su dependencia de otros grandes índices tecnológicos (como Bing). Y estos datos pueden -y a menudo están- asociados a ti personalmente.
Los proveedores de búsquedas recopilan este tipo de datos para hacer crecer continuamente sus índices -la lista de miles de millones de páginas web de la que se nutren para ofrecer resultados- y garantizar que los resultados sean relevantes y nunca se queden obsoletos. Esta colección no es intrínsecamente mala. Pero sus deficiencias se hacen evidentes cuando observas el modo alternativo de Brave:
- El Proyecto Web Discovery te permite aportar datos anónimos y generalizados.
- El Proyecto Descubrir la Web está diseñado para evitar que asociemos estos datos contigo. Esto significa que Brave no tiene datos que vender a los anunciantes, ni que perder en caso de robo o pirateo, lo que nos permite prometer a través de la tecnología y no de las palabras.
- El Proyecto de Descubrimiento Web de Brave es sólo opt-in y totalmente transparente.
La protección de la disociabilidad
Brave no sigue las prácticas furtivas de otros grandes buscadores tecnológicos. El Proyecto Descubrir la Web es de participación voluntaria, y los datos recogidos en el marco del Proyecto Descubrir la Web tienen protecciones específicas para garantizar el anonimato. Además de estas protecciones, el Proyecto Descubrir la Web se adhiere al principio de "desvinculabilidad". Esto significa que no vinculamos datos a ti, a tu navegador o a tu dispositivo. El Buscador de Brave no tiene el concepto de ID de usuario o de sesión, lo que impide la vinculabilidad de los registros. Además, el Proyecto Descubrir la Web incluye múltiples protecciones para evitar que se incluyan sitios web o búsquedas específicas para ti, o que incluyan información personal o sensible.
¿Qué palabras clave se buscan con más frecuencia? ¿A qué sitios web conducen esas palabras clave? ¿Cómo se interactúa con esos sitios web? Este tipo de preguntas direccionales ayudan al Buscador de Brave a navegar por el mundo de las páginas web disponibles, y a separar la señal del ruido. Y esto, a su vez, nos ayuda a comprender las partes de la web que merece la pena indexar para los usuarios.
Si optas por participar en el Proyecto de Descubrimiento Web, tu navegador procesará los siguientes datos en tu dispositivo y los enviará de forma segura a los servidores de Brave:
- Una fracción de las direcciones (URL) de las páginas web visitadas en el Navegador Brave, junto con métricas de compromiso (cuánto tiempo se pasa en la página)
- Una fracción de las consultas (por ejemplo, "El tiempo en Nueva York hoy") realizadas en algunos motores de búsqueda (fuera del Buscador de Brave) dentro del Navegador Brave, junto con el clic asociado en un resultado (si lo hay)
- Metadatos de esas páginas visitadas (por ejemplo, si la página contiene un vídeo, información sobre el autor o propietario de la página, título de la página, etc.), nunca el contenido de la página en sí.
- Para obtener una lista completa, consulta el repositorio GitHub de Brave
Con estos datos, Brave puede aprender (de forma privada y no vinculable) cosas como cuántas visitas a un sitio web (por ejemplo, Wikipedia) duraron más de 20 segundos, o cuántas veces una determinada consulta (por ejemplo, "¿Qué es Wikipedia?") llevó a un usuario a hacer clic en ese sitio web. Esto calibra el Buscador de Brave para reconocer que un sitio web es legítimo y que los usuarios encuentran el contenido valioso. Esto, a su vez, permite que el motor de búsqueda entienda la relevancia de los resultados y que muestre páginas con mayor relevancia en la parte superior de los resultados de búsqueda.
Estos datos no permiten que Brave sepa cosas como búsquedas asociadas (por ejemplo, otras búsquedas realizadas por personas que buscaron “¿Qué es Wikipedia?”) o los otros sitios web visitados. Y, por supuesto, no nos dice nada que nos permita vincular los datos a un individuo o su dispositivo.
Por predeterminado, todos los usuarios están excluidos del Web Discovery Project. Si has elegido optar por, puedes volver a optar por no participar en cualquier momento. Lo que elijas—optar por entrar o salir—tu experiencia en Brave o el Buscador de Brave no cambiará.
Para darte de baja, abre una nueva pestaña en el navegador Brave y haz clic en Ajustes. Desplázate hasta “Web Discovery Project,” y desactiva esta configuración.El Proyecto Descubrir la Web es ligero y sólo se ejecuta en segundo plano. No debería haber ningún impacto perceptible en la velocidad de navegación, la velocidad de representación de la página u otras métricas similares. Sin embargo, puede haber una pequeña sobrecarga (probablemente imperceptible) en forma de consumo adicional de CPU y ancho de banda. Ten en cuenta que el Proyecto Descubrir la Web sólo se ejecuta en dispositivos de sobremesa, por lo que no afecta a los planes de datos móviles. If you notice performance issues, please notify us immediately
Todas las URLs enviadas deben estar disponibles públicamente, es decir, deben tener el mismo contenido independientemente de quién las esté contribuyendo. Esto solo puede ser verdad si las páginas no están detrás de un inicio de sesión, sesión individual u otra autentificación. Todas las URLs enviadas deben haber sido visitadas por al menos 20 personas diferentes, lo que establece un quórum distribuido similar a k-anonimato.
Además, se aplican diversas heurísticas para descartar las URL que codifican el acceso, es decir, las URL de capacidad (como documentos compartidos, enlaces a Dropbox, enlaces a facturas, etc.). Por diseño, no se envía ninguna de estas URL. And, even if they somehow were, the record-unlinkability protocol means no one with access to the data could recover other URLs from the same origin, or associate any data with anyone.
Las protecciones anteriores también se aplican a las consultas de búsqueda. Cualquier consulta que contenga lo que parecen ser datos personales, como correos electrónicos, números de teléfono o hashes, se descartan automáticamente en lugar de enviarse.
- Una visión general del Proyecto Descubrimiento de la Web en el repositorio GitHub de Brave.
- Lee el README de nivel superior.
- Ver el código fuente.
Si detectas un posible problema, crea una incidencia en el repositorio, o ponte en contacto con nosotros.