Senin, 08 Juni 2015

Tugas 1 Teori Bahasa dan Otomata

Proses Pencarian (Google Bekerja)
Mari kita lihat apa yang terjadi ketika kita mengetikkan kata / kalimat di mesin pencari google? Bagaimana situs tersebut bekerja? Bagaimana Google memberikan data yang cukup akurat di halaman hasil pencariannya?
Pertanyaan-pertanyaan tersebut kadang terlintas di hati dan fikiran kita. Bagaimana bisa segala informasi yang sangat berlimpah di dunia maya ini dapat di kelompokkan. Sebagai catatan ada lebih dari 100 Petabytes = 100.000.000 Gigabytes data yang tersimpan di indeks Google.
Nah bagaimana Google bisa memilah dan memilih data yang sudah begitu banyak sehingga menampilkan data yang dibutuhkan oleh pengguna saja?
Setidaknya ada 4 langkah sederhana (sederhana bagi kita tetapi bagi google ini adalah langkah yang sangat rumit) dimulai dari kita mengunjungi situs Google dan mulai mengetikkan huruf per huruf kata yang akan kita cari.
Langkah-langkah tersebut adalah :
1. Perayapan & Pengindeksan
Perjalanan kueri dimulai sebelum Anda mengetik penelusuran, dengan perayapan dan pengindeksan web dari triliunan dokumen.
Google mengolah data yang 100 Petabytes tadi agar sesuai dengan kata yang kalian cari yaitu dengan cara merayapi semua situs web dan blog yang ada du dunia ini, bagi blogger tentunya sudah tidak terlalu asing dengan kata "GoogleBot" atau sering disebut robot perayap google / google spider.
Ada 3 hal yang dilakukan oleh Google yang berkaitan hal ini, yaitu :
  1. Mencari Informasi Dengan Perayapan
    "GoogleBot" adalah progam khusus yang dirancang Google untuk jalan-jalan menelusuri situs web / blog guna mencari informasi yang akan ditampilkan kepada pencari informasi. Perayap ini akan memberikan perhatian yang berlebih mengenai situs-situs baru, perubahan pada situs yang sudah ada, tautan mati yang ada di website.
  2. Mengatur Informasi Dengan Pengindeksan
    Google diibaratkan adalah sebuah perputakaan besar dengan dukungan dari milyaran informasi yang ada di dalamnya. Nah perayap google ibarat seorang pustakawan yang mengindeks dan mengingat dimana letak informasi-informasi itu berada. Jadi ketika kalian menginginkan suatu informasi mengenai "PPC" kalian tidak serta merta diberikan informasi mengenai "
    apa itu ppc" tetapi kalian juga mungkin akan diberitahu "masa depan ppc indonesia" dan "Belajar ppc bersama adsensecamp", semua yang berkaitan dengan ppc akan ditampilkan oleh Google. Hal ini selain akan memberikan pilihan yang lebih luas kepada penguna juga akan memberika informasi yang baru dan memang harus diketahui oleh pengguna google.
  3. "robot.txt" atau pengikdeksan khusus
    Ada kalanya ketika kita membuat artikel atau informasi tertentu di dunia maya ini, kita tidak ingin informasi tersebut dilihat oleh sembarang orang. Karena informasi tersebut bersifat khusus (contoh hanya untuk diri sendiri atau hanya untuk anggota dari situs tersebut saja), kita sebagai pemilik website dapat mengatur mana informasi yang boleh ditampilkan oleh google dan mana yang tidak boleh ditampilkan, hal ini dapat diatur menggunakan file robot.txt
2. Algoritme
Anda mau jawaban, bukan triliunan laman web. Algoritme adalah program komputer yang mencari petunjuk untuk memberikan tepat apa yang Anda inginkan. Algoritme Google hari ini mengandalkan lebih dari 200 sinyal unik atau “petunjuk” yang membuatnya dapat menebak apa yang mungkin benar-benar Anda cari. Sinyal ini meliputi hal-hal seperti istilah di situs web, kesegaran konten, wilayah Anda, dan PageRank.

Sama seperti contoh PPC diatas, meski kita mencari kata ppc bukan berarti kita hanya mencari kata ppc saja mungkin kita juga mencari hal-hal yang berkaitan dengan ppc. Google senantiasa mengupdate algorithma mereka sehingga dapat mengesampingkan informasi-informasi yang kurang bermanfaat dan hanya menampilkan informasi yang akan memberikan manfaat nyata bagi pencarinya. Secara spesifik Google mengatakan bahwa hasil pencarian yang sesuai dengan situs web (semakin terpercaya situs web maka akan semakin sering di pajang di rak pertama oleh google), kesegaran konten (apabila kalian mengetikkan kata "berita bola terbaru" maka google secara spesifik akan mencari informasi mengenai berita bola dengan tanggal update tak jauh dari tanggal kalian mencari kata tersebut), Wilayah (contoh ketika kalian mencari informasi mengenai "pabrik kereta mini" kalian tentu tidak mencari pabrik kereta mini yang berada di luar negeri bukan? kalian tentu mencari yang dalam negeri dahulu, nah Google juga mengetahui tentang hal itu karenanya google akan menampilkan situs web yang masih masuk dalam regional kalian terlebih dahulu), PageRank (semakin tinggi pagerank suatu website maka akan ditempatkan terdahulu oleh google, meski pada beberapa kasus hal ini tidak berart).
Apabila kalian menginginkan hasil pencarian yang netral kalian dapat menggunakan Google IP Adress 173.194.69.94/id

3. Memerangi Spam
Setiap hari, jutaan laman spam yang tidak berguna dibuat. Kami memerangi spam melalui kombinasi algoritme komputer dan tinjauan manual.  
Ada banyak cara yang dilakukan oleh para blogger nakal untuk membuat konten yang berisi spam. Beberapa jenis spam yang masuk kedalam indikasi google adalah :
  1. Pengalihan licik dan atau penyelubungan
    Yang masuk kategori ini adalah situs yang menampilkan halaman yang berbeda dengan apa yang kita pilih.
  2. Spam murni
    Situs yang melakukan copy paste atikel milik situs lain, atau memberikan informasi yang murni hanya membohongi pengguna dimasukkan kedalam kategori spam murni.
  3. Tautan tidak wajar dari situs
    Hampir sama dengan
    point 1, tapi terkadang tautan yang diberikan berupa iklan dari situs lain.
  4. Situs yang diretas
    Situs yang telah diretas oleh orang lain akan menyajikan informasi yang tidak sesuai dengan informasi aslinya. Nah google secara spesifik akan menyingkirkan situs-situs
    yang diretas ini dari halaman pencariannya agar pesan-pesan dari peretas situs tersebut tidak dibaca oleh orang banyak.
  5. Hosting gratis yang menyajikan spam
    Sebagian besar hosting gratis akan memberikan spam berupa iklan kepada situs-situs
    yang mereka kelola, hal ini yang dicoba untuk disingkirkan oleh google.
  6. Teks tersembunyi dan penjejalan kata kunci
    Teknik yang sering juga disebut sebagai Black Hat SEO ini sangat amat teramat dibenci oleh Google. adi jagan pernah mencoba teknik ini agar situs kalian tidak dikenai sanksi oleh goolge berupa penghapusan situs kalian dari daftar pencarian mereka.
  7. Konten tanpa nilai tambah
    Kalian tentu mencari informasi yang bermutu bukan? Oleh karena itu google akan menyajikan konten-konten yang bermutu saja, sebuah konten tanpa nilai tambah yang berarti akan ditampilkan belakangan
    oleh sanga raksasa pencari ini.
Nah tugas dari GoogleBot juga mencari konten-konten spam ini dan sesegera mungkin mengambil tindakan agar informasi yang didaptkan oleh pengguna adalah informasi yang berguna. GoogleBot akan memberikan tangkapan langsung atau screenshot tentang konten spam, ketika mereka (perayap .pen) menemukan konten spam hal yang pertama dilakukan adalah menyingkirkan konten tersebut dari halaman pencarian atau apabila kasusnya sudah sangat fatal Google akan menghapus konten tersebut secara permanen dari hasil pencarian mereka. Sebelum google menghapus konten dari sebuah situs google akan memberitahu kepada pemilik situs tersebut tentang kesalahannya dan menerima masukan tentang penangguhan penghapusan tersebut.

4. Kebijakan Pencarian Google
Google sangat memperhatikan informasi yang dibaca dan ditemukan di halaman hasil pencarian google. Google akan menyajikan informasi yang benar-benar dibutuhkan pengguna dengan berbagai pendekatan tertentu.
Dalam hal ini Google memiliki kebijakan tersendiri berupa akses informasi yang sesuai,telusur aman, konten dewasa, pencurinan identitas, spam, kebijakan sesuai hukum yang berlaku, dll.
Mengenai kebijakan Google dapat kalian lihat secara detail disini.

Demikianlah 4 langkah sederhana yang dilakukan oleh Google ketika kalian ingin mencari tentang segala macam informasi di dunia ini. Dengan mengetahui cara-cara google bekerja kita tentu dapat melakukan teknik seo terbaik agar blog / website yang kita kelola semakin bersahabat dengan Google. Ada istilah tuntutlah ilmu pada gurunya, kalau mau mencari ilmu tentang search engine optimizations / SEO bertanya / bergurulah pada search engine itu sendiri.

Tidak ada komentar:

Posting Komentar