Что такое проект Web Discovery? Подписаться
Проект Web Discovery позволяет вам в частной и безопасной форме помочь развитию и независимости Поиска Brave. Если вы согласитесь, вы предоставите анонимные данные о поисковых запросах и посещенных веб-страницах в Браузере Brave (включая страницы, посещенные через некоторые, но не все, другие поисковики). Эти данные помогают формировать независимый индекс Поиска Brave и обеспечивают показ релевантных результатов для ваших поисковых запросов, а также поддерживают более релевантные взаимодействия с продуктами и услугами Brave. Под «данными» мы понимаем поисковые запросы, клики по результатам поиска, URL-адреса страниц, посещенных в браузере, время, проведенное на этих страницах, и некоторые метаданные о самих страницах.
Проект Web Discovery работает в фоновом режиме и не требует усилий со стороны Участников. Данные, предоставленные вами, не могут быть связаны с вами или скомпонованы вместе, что предотвращает попытки деанонимизации. Вы можете отключить это в любое время.
Почему мы создали проект Web Discovery
Предоставление релевантных результатов поиска является ключевым для создания поисковика, который люди хотят использовать. Это то, как мы создаем частный поисковик, который по качеству и полноте конкурирует с большим технологическим сектором. Чтобы обеспечить максимально релевантные результаты поиска, Brave нужно понимать ключевые вещи, включая:
- Насколько точно результаты поиска соответствуют поисковым ключевым словам (точное совпадение слов, частичное совпадение или синонимы)
- Насколько недавно выполнены поисковые запросы для этих ключевых слов
- Как часто кликают по результату поиска для данного ключевого слова
- Насколько популярны поисковые ключевые слова
- Какие страницы популярны или новы
- Какие сайты позволяют сканирование только поисковому роботу Google
Обеспечение релевантности также означает уменьшение «шума» от веб-контента, который делает поиск менее релевантным. Например, если вы ищете «погода в Европе» и видите результаты, связанные с европейской историей или бизнесом, вы бы сочли, что результаты менее релевантны вашему запросу. Изучение с помощью проекта Web Discovery позволяет Поиску Brave отфильтровывать этот шум, но в частный и безопасный способ. Обеспечение релевантности поиска не должно происходить за счет вашей онлайн-конфиденциальности.
Контекст
Большинство поставщиков поиска, таких как Google и Microsoft, собирают данные о вашем поведении в поиске, как в поисковике, так и в браузере (напоминаем, такие как Chrome или Edge). Эти данные включают ваши запросы, какие результаты поиска вы кликаете, URL-адреса посещенных вами страниц, время, проведенное на этих страницах, и метаданные (например, заголовки страниц, тип контента и т. д.) о самих страницах. Другие, НЕнезависимые поисковики (такие как DuckDuckGo) не обязательно сами собирают данные. Но они продолжают полагаться на такой сбор через их зависимость от других индексов большого технологического сектора (таких как Bing). И эти данные могут и часто ассоциируются с вами лично.
Поставщики поиска собирают такого рода данные для непрерывного роста своих индексов—списка миллиардов веб-страниц, которые они используют для предоставления результатов—и для обеспечения того, чтобы результаты всегда были релевантными и свежими. Этот сбор не является чем-то внешне плохим. Но его недостатки становятся очевидными, когда вы обращаете внимание на альтернативный способ Brave:
- Проект Web Discovery позволяет вам предоставлять анонимные, обобщенные данные.
- Проект Web Discovery разработан так, чтобы предотвратить связь этих данных с вами. Это означает, что у Brave нет данных для продажи рекламодателям или потери из-за кражи или взлома, позволяя нам обещать это через технологии, а не слова.
- Проект Web Discovery от Brave является только по соглашению и абсолютно прозрачным.
Защита от связываемости данных
Brave не использует скрытые практики других крупных технологических поисковиков. Проект Web Discovery является опциональным, и данные, собранные в рамках Проекта Web Discovery, имеют специальные защиты для обеспечения анонимности. В дополнение к этим защитам, Проект Web Discovery придерживается принципа "unlinkability". Это означает, что мы не связываем данные с вами, вашим Браузером или вашим Устройством. Поиск Brave не имеет понятия пользовательского или сеансового идентификатора, что предотвращает возможность связывания записей. Кроме того, Проект Web Discovery включает несколько мер защиты, предотвращающих включение сайтов или поисковых запросов, связанных с вами или включающих личную или конфиденциальную информацию.
Какие ключевые слова ищутся чаще всего? На какие сайты ведут эти ключевые слова? Как происходит взаимодействие с этими сайтами? Такие направляющие вопросы помогают Поиску Brave ориентироваться в мире доступных веб-страниц и отделять сигнал от шума. Это, в свою очередь, помогает нам понять, какие части веба стоит индексировать для пользователей.
Если вы включаете Проект Web Discovery, ваш Браузер будет обрабатывать следующие данные на вашем Устройстве и безопасно отправлять их на серверы Brave:
- Часть адресов (URL) посещённых веб-страниц в Brave Браузере вместе с метриками вовлечённости (например, как много времени проведено на странице)
- Часть запросов (например, "Погода в Нью-Йорке сегодня") выполненных в некоторых поисковиках (вне Поиска Brave) в Brave Браузере, вместе с соответствующими кликами по результатам (если таковы были)
- Метаданные этих посещённых страниц (например, если страница содержит видео, информацию об авторе или владельце страницы, заголовок страницы и т.д.), никогда само содержимое страницы.
- Для полного списка, ознакомьтесь с репозиторием Brave на GitHub
С этими данными, Brave может узнать (в частном, ненадёжно связываемом виде) такие вещи, как сколько посещений сайта (например, Википедия) длились дольше 20 секунд или сколько раз заданный запрос (например, "Что такое Википедия?") привёл пользователя к клику по этому сайту. Это калибрует Поиск Brave, чтобы он знал, что сайт является легитимным и что пользователи находят содержимое ценным. Это, в свою очередь, позволяет поисковику понять релевантность результата и выдавать страницы с более высокой релевантностью в верхних строчках результатов поиска.
Эти данные не позволят Brave узнать такие вещи, как ассоциированные запросы (например, другие запросы, сделанные людьми, которые искали "Что такое Википедия?") или другие посещённые сайты. И, конечно, это не сообщает нам ничего, что могло бы позволить нам связать данные с конкретным человеком или его устройством.
По умолчанию все пользователи не участвуют в Проекте Web Discovery. Если вы выбрали принять участие участвовать, вы можете отказаться в любое время. Что бы вы не выбрали—участвовать или не участвовать—ваш опыт использования Brave или Поиска Brave не изменится.
Чтобы отказаться от участия, откройте новую вкладку в Браузере Brave и нажмите Настройки. Прокрутите до “Проект Web Discovery” и выключите эту настройку.Проект Web Discovery легковесный и работает только в фоновом режиме. Не должно быть заметного влияния на скорость просмотра, скорость отрисовки страниц или другие подобные метрики. Однако может быть небольшая (но, вероятно, незаметная) нагрузка в виде дополнительного использования ЦП и пропускной способности. Обратите внимание, что Проект Web Discovery работает только на настольных устройствах, поэтому он не влияет на мобильные тарифные планы. Если вы заметите проблемы с производительностью, сообщите нам об этом немедленно.
Все отправляемые URL должны быть общедоступны—то есть у них должно быть одинаковое содержание независимо от того, кто их предоставляет. Это возможно только в том случае, если страницы не защищены логином, индивидуальной сессией или другой аутентификацией. Все отправляемые URL должны быть посещены как минимум 20 разными людьми, что создаёт распределённый кворум, схожий с k-анонимностью.
Кроме того, применяется множество эвристик, чтобы исключить URL-адреса, которые кодируют доступ, т.е. URL-адреса возможностей (например, общие документы, ссылки Dropbox, ссылки на счета и т.п.). По задумке, ни один из этих URL-адресов не отправляется. А даже если бы они как-то и отправились, протокол разрыва связи записей означает, что никто, имея доступ к данным, не смог бы восстановить другие URL-адреса с того же источника или сопоставить любые данные с кем-либо.
Указанные выше защиты также применяются к поисковым запросам. Любой запрос, содержащий что-то вроде личных данных, таких как электронные письма, номера телефонов или хэши, автоматически отклоняется, а не отправляется.
- Обзор Проекта Web Discovery можно найти в репозитории Brave на GitHub.
- Прочитайте основное руководство README.
- Просмотрите исходный код.
Если вы заметите потенциальную проблему, пожалуйста, создайте обращение в репозитории, или свяжитесь с нами.