HTML kodavimas – tai procesas, kurio metu HTML simboliai, turintys specialią reikšmę (pvz., <, >, ", & ir kt.), konvertuojami į atitinkamus HTML objektus. Tai užtikrina, kad šie simboliai tinklalapyje būtų rodomi teisingai, o ne interpretuojami kaip HTML žymės ar atributai. Pavyzdžiui:
< tampa <
> tampa >
& tampa &
HTML kodavimas yra labai svarbus siekiant užtikrinti, kad tekstas, kuriame yra specialiųjų simbolių, naršyklėje būtų rodomas teisingai ir saugiai.
Siekiant išvengti HTML injekcijos atakų, pvz. Skirtingų svetainių scenarijų (XSS) naudojimas, kai nepatikimas turinys gali sutrikdyti puslapio struktūrą arba sukelti kenkėjiškus scenarijus.
Siekiant užtikrinti, kad specialieji simboliai (pvz., <, >, &, " ir kt.) būtų vaizduojami kaip tekstas ir naršyklės jų neinterpretuotų kaip HTML ar „JavaScript“.
Saugiai rodyti vartotojų sukurtą turinį žiniatinklio programoje nepakenkiant saugumui ar išdėstymui.
HTML kodavimas paprastai atliekamas naudojant integruotas funkcijas daugelyje programavimo kalbų:
„JavaScript“ galite naudoti tokias bibliotekas kaip „DOMParser“ arba sukurti savo kodavimo funkciją.
Python kalboje tokios bibliotekos kaip html teikia tokias funkcijas kaip html.escape().
Daugelis žiniatinklio sistemų ir serverio kalbų siūlo integruotas funkcijas, skirtas automatiškai koduoti turinį.
Paprastai šis procesas apima specialiųjų simbolių pakeitimą atitinkamais HTML objektais.
Kai tinklalapyje rodoma vartotojo įvestis (pvz., formos duomenys, komentarai ar pranešimai), kad ji nebūtų interpretuojama kaip HTML arba „JavaScript“.
Kai įdedate specialiuosius simbolius į HTML (pvz., kabutes arba kampinius skliaustus), kad jie būtų rodomi teisingai ir nebūtų traktuojami kaip kodas.
Dirbant su dinaminiu turinys, kuriame gali būti specialiųjų simbolių, galinčių pažeisti HTML formatavimą arba sukelti saugumo riziką.
Perduodant duomenis per tinklalapius ir užtikrinant, kad turinys būtų saugiai atvaizduojamas, netrukdant naršyklės HTML interpretacijai.