Jumat, September 06, 2019

HTML URL encoding

Sebuah Uniform Resource Locator (URL) secara sederhana adalah sebuah alamat dari situs untuk mengakses konten website. Tetapi hanya beberapa karakter yang diperbolehkan untuk digunakan pada URL seperti alpabet A-Z dan a-z, angka 0-9 dan beberapa karakter khusus. Karakter-karakter tersebut dapat dipergunakan sebagaimana bentuknya tetapi, beberapa karakter lain yang tidak disebutkan baru bisa digunakan sebagai URL apabila diubah sebagai encoding karakter. URL encoding adalah proses konversi URL menjadi sebuah format yang valid yang dapat dikenali atau diterima oleh web browser. URL encoding berfungsi sebagai pengambil tempat atau pengganti semua karakter yang tidak diperbolehkan pada url dengan tanda '%' yang diikuti dengan digit hexadecimal. Dua nilai hexadecimal merepresentasikan nilai numerik dari karakter pada sekumpulan karakter ASCII. Contohnya tanda space pada keyboard tidak bisa digunakan sebagai alamat url dan harus diganti dengan '%20' atau tanda '+' ketika encoding. Sama halnya dengan tanda '$' yang diganti dengan '%24'.

Karakter terbalik: Terdapat beberapa karakter yang terkadang memiliki makna khusus pada URL dan dapat digunakan dengan dua cara. Contohnya karakter '/' adalah reserved karakter dan memiliki arti khusus jika tetap digunakan dalam bentuk delimeter '/' yang berfungsi untuk memilisahkan path dari URL. Jika diubah dalam bentuk encoding menjadi '%2F'.

Terdapat banyak sekali reserved karakter seperti terdapat pada list berikut ini:

penggunaan tabel reserved karakter pada html
Gambar 1 tabel reserved karakter

Beberapa karakter ada yang harus digunakan dalam bentuk encoding sementara beberapa lainnya ada yang tidak perlu. Berikut ini memperlihatkan klasifikasi dari kelompok karakter yang harus dilakukan encoding.

satu, safe karakter: Alfanumerik 0-9, a-z dan A-Z, spesial karakter $, -, _, ., +, !, *, ‘, (, ), dan reserved karakter digunakan untuk tujuan cadangan. Karakter ini tidak terlalu dibutuhkan untuk dilakukan encoding.
dua, ASCII karakter kontrol: karakter ini antara 00-1F dalam hex (0-31 decimal) dan 7F (127 decimal). Karakter-karakter ini perlu dilakukan encoding.
tiga, Non-ASCII karakter kontrol: termasuk 80-FF dalam hex (128-255 decimal). Karakter-karakter ini perlu dilakukan encoding.
empat, Reserved karakter: karakter ini digunakan untuk tujuan khusus dan memerlukan encoding.
lima, Karakter unsafe: karakter ini rentan mengalami kesalahpahaman pada URL karena berbagai alasan sehingga memerlukan encoding. Karakter '<' dan '>' termasuk tidak aman (unsafe) karena digunakan sebagai delimeter pada URL dalam text bebas, serta qoute mark(" ") juga termasuk tidak aman karena digunakan untuk delimit URL pada beberapa sistem.

Berikut ini diberikan daftar karakter unsafe:

beberapa jenis karakter yang termasuk dalam kategori unsafe akrakter
Gambar 2 tabel unsafe karakter

Daftar lengkap karakter-karakter encoding URL diperlihatkan sebagai berikut

daftar lengkap karakter dan encoding karakter
Gambar 3 daftar lengkap tabel karakter encoding





Tidak ada komentar:

Posting Komentar

Respon komentar 7 x 24 jam, so please be patient :D

Footer Adsense