Kratak uvod u URL kodiranje

URL veb-sajta, poznat i pod nazivom "adresa veb-sajta", je ono što će neko pristupiti web pretraživaču kako bi pristupio određenoj web lokaciji. Kada prenete informacije putem URL-a, morate se uveriti da koristi samo određene dozvoljene znakove. Ovi dozvoljeni znakovi uključuju abecedne znakove, brojeve i nekoliko specijalnih znakova koji imaju značenje u URL-u. Svaki drugi znak koji treba dodati URL-u treba da bude kodiran tako da oni ne izazivaju probleme tokom putovanja pretraživača da lociraju stranice i resurse koje tražite.

Kodiranje URL-a

Najčešće kodirani znak u URL-u je znak . Vidite ovaj lik kad god vidite plus znak (+) u URL-u. Ovo predstavlja prostorni karakter. Znak plus deluje kao poseban znak koji predstavlja taj prostor u URL-u. Najčešći način na koji ćete videti ovo je link za mailto koji uključuje predmet. Ako želite da subjekt ima prostore u njemu, možete ih kodirati kao pluse:

mailto: email? subject = ovo + je + moj + predmet

Ovaj deo kodiranja tekstova prenosiće temu "ovo je moj predmet". Znak "+" u kodiranju bi se zamenio stvarnim kada je prikazan u pregledaču.

Za kodiranje URL-a, jednostavno zamenite specijalne znakove sa svojim kodom za kodiranje. Ovo će skoro uvek početi sa znakom%.

Kodiranje URL-a

Striktno govoreći, uvek treba kodirati bilo koji poseban karakter koji se nalazi u URL-u. Jedna od važnih napomena, u slučaju da se osećate malo zastrašujućim ovim čitanjem ili kodiranjem, da uopšte nećete naći nikakve posebne znakove u URL-u izvan njihovog normalnog konteksta, osim u obliku podataka.

Većina URL adresa koristi jednostavne znakove koji su uvek dozvoljeni, tako da uopšte nije potrebno kodiranje.

Ako podnosite podatke CGI skriptama koristeći GET metod, trebate kodirati podatke pošto će biti poslani preko URL-a. Na primjer, ako pišete vezu za promoviranje RSS feed-a , vaš URL će morati biti kodiran kako biste dodali URL adresu skripte koju promovišete.

Šta treba kodirati?

Svaki znak koji nije abecedni znak, broj ili poseban karakter koji se koristi van svog normalnog konteksta moraće biti kodiran na vašoj stranici. Ispod je tabela običnih znakova koji se mogu naći u URL-u i njihovom kodiranju.

Rezervisani URL-ovi kodiranje

Karakter Svrha u URL-u Encoding
: Odvojeni protokol (http) iz adrese % 3B
/ Odvojeni domen i direktorijumi % 2F
# Odvojena sidra % 23
? Odvojeni niz upita % 3F
& Odvojeni elementi upita % 24
@ Odvojite korisničko ime i lozinku iz domena % 40
% Označava kodirani karakter % 25
+ Označava prostor % 2B
Ne preporučuje se u URL-ima % 20 ili +

Imajte na umu da se ovi kodirani primjeri razlikuju od onog kojeg pronađete kod HTML specijalnih znakova . Na primjer, ako želite kodirati URL sa znakom ampersand (&), koristićete% 24, što je prikazano u gornjoj tabeli. Ako ste upisali HTML i hteli ste da dodate ampersand u tekst, ne biste mogli koristiti% 24. Umesto toga, koristićete ili "& amp;"; ili "& # 38;", koji bi obojica zapisali & na HTML stranici kada je prikazan. Ovo može izgledati zbunjujuće u početku, ali u osnovi je razlika između teksta koji se pojavljuje na samoj stranici, koja je dio HTML koda i URL string-a, koji je poseban entitet i stoga podleže različitim pravilima.

Činjenica da se znak "&", kao i mnogi drugi likovi mogu pojaviti u svakom ne bi trebalo da vas zbunjuju u razlikama između njih.

Originalni članak Jennifer Krynin. Uredio Jeremy Girard.