Sunday, June 24, 2018

√ Information Retrieval

Apa itu Information Retrieval ?

Information Retrieval ialah seni dan ilmu mencari informasi di sementara dokumen, mencari dokumen itu sendiri, mencari metadata yang menjelaskan dokumen, maupun mencari dalam database, apakah relasional database itu bangun sendiri ataupun database hypertext jaringan ibarat Internet atau intranet, untuk teks , suara, gambar, atau data.

Menurut Kowalaski: Informasi Retrieval ialah konsep sederhana dalam pencarian yang dilakukan oleh seseorang. ibarat pola dikala user akan mengusut informasi yang beliau butuhkan, maka sistem menerjemahakan kepada bentuk statment yang kemudian di sanksi oleh sistem pencari.
 ialah seni dan ilmu mencari informasi di sementara dokumen √ Information Retrieval
Information Retrieval

Information Retrieval digunakan untuk menemukan kembali informasi-informasi yang relevan terhadap kebutuhan pengguna dari suatu kumpulan informasi secara otomatis. Salah satu pola aplikasi umum dari informasi retrieval ialah search-engine (SE) maupun mesin pencarian yang terdapat pada jaringan internet.

Baca Juga: Kumulan Materi Teknik Informatika

Dari tumpuan definisi diatas, sudah terang dimaksudkan bahwa information retrevial ialah bidang keilmuan dalam Teknologi informasi yang menjelaskan ihwal Pencarian dan Pengambilan Kembali Informasi. Ada dua elemen penting dalam Information Retrieval, yaitu Precision dan Reacall.

Precision merupakan rasio jumlah dokumen relevan yang ditemukan dengan total jumlah dokumen yang ditemukan oleh SE. Precision mencerminkan kualitas himpunan jawaban, tetapi tidak memandang total jumlah dokumen yang relevan seraya kumpulan dokumen.

 ialah seni dan ilmu mencari informasi di sementara dokumen √ Information Retrieval
Precision

Recall meruakan rasio jumlah dokumen relevan yang ditemukan kembali dengan total jumlah dokumen seraya kumpulan dokumen yang dianggap relevan.

 ialah seni dan ilmu mencari informasi di sementara dokumen √ Information Retrieval
Recall

Tujuan Di Dalam Information Retrieval yang harus dipenuhi ialah bagaimana mendapat dokumen relevan dan tidak mendapat dokumen tidak relevan. Tujuan lainnya merupakan bagaimana menyusun dokumen atau data yang telah didapatkan untuk ditampilkan secara terurut dari dokumen yang mempunyai tingkat relevansi paling tingi ke tingkat relevansi paling rendah.

Baca Juga: Kumpulan Cerita Motivasi Terbaik

Contoh sederhana Information Retrieval ialah media penyimpanan kita sendiri. Terkadang dikala semakin banyak data yang kita simpan dalam sebuah media penyimpanan, kita akan lupa dimana kita meletakan data yang kita simpan, sehingga kita perlu melaksanakan proses pencarian data yang kita lupa tadi, sanggup dengan memakai tools pencarian ataupun sanggup dengan mengusut satu persatu peta simpanan data kita.

Dalam studi perkara yang lebih kompleks penerapan IF yakni Search Engine (Mesin Pencari) ibarat google dan yahoo. SE (Search Engine) merupakan implementasi yang sangat kompleks dari IF (Information Retrieval).

Cara Kerja Information Retrieval (IR)

Untuk menemukan informasi relevan yang kita cari, maka kata kunci (Keyword, Kueri) yang dimasukan sebaiknya sesuai dengan informasi yang ingin didapat, alasannya yakni dengan keyword yang seusai maka proses pencarian dalam index di mesin Information Retrieval akan lebih cepat, sehingga korpus yang sesuai dengan katakunci yang dimasukan akan ditampilkan kembali pada si enduser.

Keyword, Kueri: merupakan inputan kata kunci pencarian yang diberikan pengguna kepada Mesin Pencari (Google atau Yahoo);

Indexing: merupakan proses penyusunan index dari seluruh dokumen pada korpus, yang terdiri dari kata-kata (token)

Korpus: ialah kumpulan dokumen yang disalin ke mesin IR Misalnya Google “menjepret” seluruh halaman website yang sanggup diakses umum (tanpa login terlebih dahulu) kemudian menyalinnya ke mesin IR di ruang servernya google.

Bagaimana mesin Information Retrieval menyalin dokumen-dokumen yang berada di dunia maya ?. mesin IR mempunyai robot (BOT) sejenis kegiatan yang sanggup disebut juga dengan crawler, kegiatan tersebut yang kemudian berfungsi untuk menyalin dokumen / informasi yang berada disalasatu sumber misal website kepada server IR tersebut.

Selain melaksanakan crawling BOT tersebut juga melaksanakan indexing (pemberian index atau pembaharuan index), index bersisi kata - kata (token) yang terdapat dalam suatu web/blog, lebih simplenya dikala kita akan memposting suatu informasi melualui blog kita selalu di minta memasukan TAG dalam artikel yang akan kita posting, begitulah citra indexing dalam google, jadi index yang berada di mesin pencari merupakan kumpulan miliyaran tag tag informasi.

Berikut pola video crawling salasatu mesin Pencari yang sedang dikembangkan oleh seorang developer yang mempunyai blog di alamat berikut: Proses Crawling

Sedangkan vidio dibawah ini adalah, ilustrasi bagaimana Google Search Engine bekerja:



Proses yang terjadi di dalam Information Retrieval sendiri terdiri dari 2 pecahan utama, yakni Indexing subsystem, dan Searching subsystem (matching system).

Proses indexing dipakai untuk membentuk basisdata terhadap koleksi dokumen yang dimasuk, dengan kata lain, indexing ialah proses persiapan yang dilakukan kepada dokumen sehingga dokumen siap untuk diproses. Proses indexing sendiri mencakup 2 proses, Term indexing dan  document indexing. Hasil Term indexing akan menghasilkan koleksi kata yang akan dipakai dalam meningkatkan performansi pencarian pada tahapan selanjutnya.

Tahap dalam proses indexing ialah:
  • Word Token, yakni mengubah dokumen menjadi kumpulan term dengan cara menghapus semua abjad dalam tanda baca yang terdapat kepada dokumen dan mengubah kumpulan term menjadi lowercase.
  • Stopword Removal. Proses pembatalan kata-kata yang sering ditampilkan dalam dokumen seperti: and, or, not dan sebagainya.
  • Stemming. Proses mengubah suatu kata bentukan menjadi kata dasar.
  • Term Weighting. Proses pembobotan setiap term di dalam dokumen.

Baca Juga: Kumpulan Kata Motivasi Terbaik

Model Information Retrieval ada 3 jenis:
  • Model Vector Space: yakni model IR yang merepresentasikan dokumen dan query dalam bentuk vektor dimensional
  • Model Probabilistic: yakni model IR yang memakai framework probabilistik
  • Model Boolean: yakni model IR sederhana yang menurut atas teori himpunan dan aljabar boolean

Model ruang vektor dan model probabilistik yakni model yang memakai pembobotan kata dan perangkingan dokumen. Hasil retrieval yang didapat dari model-model ini merupakan dokumen terangking yang dianggap paling relevan terhadap query.

Dalam model ruang vektor, dokumen dan juga query direpresentasikan sebagai vektor di dalam ruang vektor yang disusun di dalam indeks term, kemudian dimodelkan dengan persamaan geometri. Sedangkan dalam model probabilistik direpresentasikan dengan menciptakan asumsi-asumsi distribusi term dalam dokumen yang relevan dan tidak relevan dalam orde estimasi kemungkinan relevansi suatu dokumen terhadap query.


Sekian artikel tentang Information Retrieval, biar dari artikel ini sahabat sanggup lebih tau ihwal Apa itu Information Retrieval dan dimana implementasi nya.

MARKIJAR : MARi KIta belaJAR


Sumber http://www.markijar.com/