JAKARTA (IndoTelko) - Setiap kali Anda melakukan penelusuran, ada ribuan, bahkan kadang jutaan situs yang memiliki informasi yang Anda cari.
"Cara Google menentukan hasil yang akan ditampilkan dimulai jauh sebelum Anda mulai mengetikkan istilah penelusuran, dengan dipandu oleh komitmen untuk menyediakan informasi terbaik bagi Anda," kata Public Liaison for Search, Google Danny Sullivan, kemarin.
Crawling
Internet mirip dengan perpustakaan yang berisi miliaran buku, namun tanpa sistem pengarsipan yang terpusat.
"Kami menggunakan software yang disebut sebagai web crawler untuk menemukan halaman-halaman web yang bisa diakses secara publik. Crawler ini menganalisis dan mengikuti link-link yang ada di sebuah halaman, sama seperti saat Anda melihat konten di halaman tersebut. Crawler berpindah dari link ke link dan mengirim data tentang halaman-halaman web tersebut ke server Google," jelasnya.
Pengindeksan
Saat crawler menemukan sebuah halaman web, sistem Google memuat kontennya, sama seperti yang dilakukan oleh sebuah browser. "Kami mencatat sinyal-sinyal penting dari kata kunci hingga keaktualannya lalu melacak semuanya itu di index Penelusuran," katanya.
Ini mirip dengan indeks yang ada di bagian akhir buku—setiap kata yang ada di setiap halaman web dicatat di indeks. Saat mengindeks sebuah halaman web, Google menambahkan entri untuk semua kata yang ada di dalamnya.
Dipaparkannya, selama 20 tahun ini, Google telah membantu menyajikan lebih banyak informasi yang ada di dunia sehingga bisa diakses secara online.
"Saat Anda menggunakan Google Search, kami ingin agar Anda bisa mendapatkan informasi yang bermanfaat sesegera mungkin. Bentuk informasi itu bisa bermacam-macam, dan seiring berjalannya waktu, halaman hasil penelusuran telah berevolusi untuk tidak hanya menampilkan daftar link halaman web, namun juga fitur-fitur bermanfaat yang membantu Anda menemukan hal yang Anda cari dengan lebih cepat,"ulasnya.
Ditambahkannya, inti dari Google Search adalah memahami bahasa. "Tugas kami adalah memahami apa yang Anda telusuri dan menemukan informasi yang bermanfaat di web, bagaimana pun cara Anda mengeja atau menyusun istilah penelusuran tersebut. Meskipun selama ini kami terus menyempurnakan kemampuan pemahaman bahasa kami, kadang-kadang masih terjadi kekeliruan, khususnya dengan istilah penelusuran yang kompleks atau menggunakan bahasa percakapan," katanya.
Dengan kemajuan yang diraih oleh tim riset Google di bidang pemahaman bahasa telah membuat kemajuan besar dalam cara memahami istilah penelusuran. Hal ini adalah lompatan kemajuan terbesar dalam lima tahun terakhir ini, dan juga merupakan salah satu kemajuan terbesar dalam sejarah Google Penelusuran.
Tahun lalu, Google memperkenalkan sebuah teknik open source berbasis jaringan neural untuk pelatihan awal natural language processing (NLP) yang disebut sebagai Bidirectional Encoder Representations from Transformers, atau BERT. Teknologi ini memungkinkan siapa saja untuk melatih sistem penjawab pertanyaan canggih milik mereka sendiri. Dengan menerapkan model BERT di Google Search, mampu membantu Anda menemukan informasi yang bermanfaat dengan lebih baik.
"Kami juga menerapkan BERT untuk membuat Google Search lebih bermanfaat bagi orang-orang di seluruh dunia. Salah satu keunggulan dari sistem ini adalah kemampuannya untuk belajar dari sebuah bahasa dan menerapkannya ke bahasa yang lain. Jadi kami bisa mengambil model yang belajar dari penyempurnaan dalam bahasa Inggris (bahasa yang dipakai untuk sebagian besar dari konten web) dan menerapkannya ke bahasa lain. Ini membantu kami menyajikan hasil yang lebih relevan dalam berbagai bahasa yang ditawarkan oleh Google Search, termasuk Bahasa Indonesia," katanya.(pg)