Apa itu Proyek Web Discovery? Ikuti
Proyek Web Discovery adalah cara yang menjaga privasi untuk Anda berkontribusi pada pertumbuhan dan kemandirian Penelusuran Brave. Jika Anda ikut serta, Anda akan menyumbangkan beberapa data anonim tentang pencarian dan kunjungan halaman web yang dilakukan dalam Brave Browser (termasuk halaman yang dicapai melalui beberapa, tetapi tidak semua, mesin pencari lain). Data ini membantu membangun indeks independen Penelusuran Brave, dan memastikan kami menunjukkan hasil yang relevan untuk permintaan penelusuran Anda dan mendukung pengalaman yang lebih relevan dengan produk dan layanan Brave. Dengan “data” kami maksudkan permintaan pencarian, klik hasil pencarian, URL halaman yang dikunjungi di browser, waktu yang dihabiskan di halaman tersebut, dan beberapa metadata tentang halamannya sendiri.
Proyek Web Discovery berjalan di latar belakang, sehingga tidak memerlukan usaha apapun dari kontributor. Data yang disumbangkan tidak dapat dikaitkan kembali kepada siapa pun yang menyumbangkannya, atau dikelompokkan bersama-sama, yang mencegah upaya deanonimisasi. Keluar kapan saja.
Mengapa kami membangun Proyek Web Discovery
Menyediakan hasil pencarian yang relevan sangat penting untuk membangun mesin pencari yang ingin digunakan orang. Itulah cara kami menciptakan mesin pencari pribadi yang masih bersaing dengan big tech dalam hal kualitas dan kelengkapan. Untuk memastikan hasil pencarian se-relevan mungkin, Brave perlu memahami beberapa hal utama, termasuk:
- Seberapa dekat hasil pencarian sesuai dengan kata kunci pencarian (cocokan dengan kata-kata lengkap, bagian dari kata-kata, atau sinonim)
- Seberapa baru pencarian untuk kata kunci tersebut
- Seberapa sering hasil pencarian diklik untuk kata kunci yang diberikan
- Seberapa populer kata kunci pencarian
- Halaman apa yang populer atau baru
- Situs mana yang hanya mengizinkan crawling oleh bot pencarian Google
Memastikan relevansi juga berarti mengurangi “kebisingan” dari konten web yang membuat pencarian menjadi kurang relevan. Misalnya, jika Anda mencari “cuaca Eropa” dan melihat hasil yang berhubungan dengan sejarah Eropa atau bisnis Eropa, Anda akan mengatakan hasil tersebut kurang relevan dengan permintaan Anda. Belajar melalui Proyek Web Discovery memungkinkan Penelusuran Brave menyaring kebisingan ini, tetapi dengan cara yang menjaga privasi. Membuat pencarian lebih relevan tidak boleh mengorbankan privasi online Anda.
Konteks
Sebagian besar penyedia pencarian—seperti Google dan Microsoft—mengumpulkan data tentang perilaku pencarian Anda, baik di mesin pencari maupun di browser (seperti Chrome atau Edge). Data ini mencakup permintaan pencarian Anda, hasil pencarian mana yang Anda klik, URL halaman yang Anda kunjungi, waktu yang dihabiskan di halaman-halaman tersebut, dan metadata (seperti judul halaman, jenis konten, dll.) tentang halaman-halaman itu sendiri. Mesin pencari lain yang tidak mandiri (seperti DuckDuckGo) tidak selalu mengumpulkan data mereka sendiri. Namun, mereka masih mengandalkan jenis pengumpulan ini melalui ketergantungan mereka pada indeks big tech lain (seperti Bing). Dan data ini dapat—dan sering kali—dikaitkan dengan Anda secara pribadi.
Penyedia pencarian mengumpulkan jenis data ini untuk terus menumbuhkan indeks mereka—daftar miliaran halaman web yang mereka gunakan untuk memberikan hasil—dan memastikan hasil selalu relevan dan tidak usang. Pengumpulan ini tidak secara inheren buruk. Namun kekurangan-kekurangannya menjadi jelas ketika Anda melihat cara alternatif Brave:
- Proyek Web Discovery memungkinkan Anda berkontribusi data anonim yang digeneralisasi.
- Proyek Web Discovery dirancang untuk mencegah kami mengaitkan data ini dengan Anda. Ini berarti tidak ada data untuk Brave jual kepada pengiklan, atau hilang karena pencurian atau peretasan, memungkinkan kami untuk berjanji melalui teknologi daripada kata-kata.
- Proyek Web Discovery dari Brave hanya memilih masuk, dan sepenuhnya transparan.
Perlindungan terhadap unlinkability
Brave tidak mengikuti praktik licik dari mesin pencari Big Tech lainnya. Proyek Web Discovery adalah opt-in, dan data yang dikumpulkan di bawah Proyek Web Discovery memiliki perlindungan khusus untuk memastikan anonimitas. Selain perlindungan ini, Proyek Web Discovery mengikuti prinsip "unlinkability." Ini berarti kami tidak menghubungkan data ke Anda, browser Anda, atau perangkat Anda. Penelusuran Brave tidak memiliki konsep ID pengguna atau ID sesi, yang mencegah keterkaitan catatan. Selanjutnya, Proyek Web Discovery mencakup beberapa perlindungan untuk mencegah situs web atau pencarian tertentu yang berkaitan dengan Anda, atau yang mencakup informasi pribadi atau sensitif, untuk disertakan.
Apa kata kunci yang paling sering dicari? Ke situs web apa kata kunci tersebut mengarah? Bagaimana interaksi dengan situs web tersebut? Jenis pertanyaan arah seperti ini membantu Penelusuran Brave menavigasi dunia halaman web yang tersedia, dan memisahkan sinyal dari kebisingan. Dan ini, pada gilirannya, membantu kami memahami bagian web yang layak diindeks untuk pengguna.
Jika Anda memilih untuk ikut serta dalam Proyek Web Discovery, browser Anda akan memproses data berikut di perangkat Anda, dan mengirimkannya dengan aman ke server Brave:
- Sebagian dari alamat (URL) halaman web yang dikunjungi di Browser Brave, bersama dengan metrik keterlibatan (berapa banyak waktu yang dihabiskan di halaman)
- Sebagian dari kueri (misalnya "Cuaca New York hari ini") yang dilakukan di beberapa mesin pencari (di luar Penelusuran Brave) dalam Browser Brave, bersama dengan klik terkait pada hasil (jika ada)
- Metadata dari halaman yang dikunjungi (misalnya jika halaman tersebut memuat video, info tentang penulis atau pemilik halaman, judul halaman, dll.), bukan konten halaman itu sendiri.
- Untuk daftar lengkap, lihat repo GitHub Brave
Dengan data ini, Brave dapat mempelajari (dengan cara yang privasi dan tidak dapat dihubungkan) hal-hal seperti berapa banyak kunjungan ke sebuah situs web (misalnya Wikipedia) yang berlangsung lebih dari 20 detik, atau berapa kali kueri tertentu (misalnya "Apa itu Wikipedia?") mengarah pada pengguna untuk mengklik ke situs web tersebut. Ini mengkalibrasi Penelusuran Brave untuk mengetahui bahwa sebuah situs web sah, dan bahwa pengguna menemukan konten tersebut berharga. Ini, pada gilirannya, memungkinkan mesin pencari untuk memahami relevansi hasil, dan untuk menyajikan halaman dengan relevansi lebih tinggi di bagian atas hasil pencarian.
Data ini tidak memungkinkan Brave mengetahui hal-hal seperti kueri terkait (misalnya kueri lain yang dilakukan oleh orang-orang yang mencari "Apa itu Wikipedia?") atau situs web lain yang dikunjungi. Dan tentu saja tidak memberi tahu kami apa pun yang memungkinkan kami untuk menghubungkan data dengan individu atau perangkat mereka.
Secara default, semua pengguna tidak ikut bergerak dalam Web Discovery Project. Jika Anda memilih untuk memilih masukAnda dapat memilih untuk tidak ikut serta lagi kapan saja. Apapun yang Anda pilih—ikut atau tidak ikut—pengalaman Anda di Brave atau Penelusuran Brave tidak akan berubah.
Untuk keluar, buka tab baru di browser Brave dan klik Pengaturan. Gulir ke “Web Discovery Project,” dan matikan pengaturan ini.Web Discovery Project ringan dan hanya berjalan di latar belakang. Seharusnya tidak ada dampak yang terlihat pada kecepatan penelusuran, kecepatan rendering halaman, atau metrik serupa lainnya. Namun, mungkin ada sedikit (tetapi kemungkinan tidak terlihat) overhead dalam bentuk konsumsi CPU tambahan dan bandwidth. Perhatikan bahwa Web Discover Project hanya berjalan di perangkat desktop, jadi tidak ada dampak pada paket data seluler. Jika Anda melihat masalah kinerja, silakan beri tahu kami segera.
Semua URL yang dikirim harus tersedia secara publik—artinya, mereka harus memiliki konten yang sama tanpa mempedulikan siapa yang menyumbangkannya. Hal ini hanya dapat terjadi jika halaman tidak berada di balik log-in, sesi individu, atau autentikasi lainnya. Semua URL yang dikirim harus telah dikunjungi oleh setidaknya 20 orang berbeda, yang menetapkan kuorum distribusi yang mirip dengan k-anonimitas.
Selain itu, ada berbagai heuristik yang diterapkan untuk mengesampingkan URL yang menyandikan akses, misalnya capability URLs (seperti dokumen yang dibagikan, tautan Dropbox, tautan faktur, dll). Secara desain, tidak satu pun dari URL ini yang dikirim. Dan, bahkan jika mereka entah bagaimana dikirim, protokol record-unlinkability berarti tidak ada satu orang pun dengan akses ke data yang dapat memulihkan URL lain dari sumber yang sama, atau mengaitkan data apa pun dengan siapa pun.
Perlindungan di atas juga berlaku untuk query pencarian. Setiap query yang berisi apa yang tampaknya adalah data pribadi, seperti email, nomor telepon, atau hash, secara otomatis akan dihapus daripada dikirim.
- Tinjauan umum tentang Proyek Web Discoverydapat ditemukan di repo GitHub Brave.
- Baca README tingkat atas.
- Lihat kode sumber.
Jika Anda menemukan masalah potensial, silakan buat masalah di repo, atau hubungi kami.