HTML kodēšana ir process, kurā HTML rakstzīmes ar īpašu nozīmi (piemēram, <, >, ", & utt.) tiek konvertētas atbilstošajās HTML entītijās. Tas nodrošina, ka šīs rakstzīmes tīmekļa lapā tiek parādītas pareizi, nevis tiek interpretētas kā HTML tagi vai atribūti. Piemēram:
< kļūst par <
> kļūst par >
& kļūst par &
HTML kodēšana ir ļoti svarīga, lai nodrošinātu, ka teksts, kas satur īpašas rakstzīmes, pārlūkprogrammā tiek parādīts pareizi un droši.
Lai novērstu HTML injekcijas uzbrukumus, piemēram, Starpvietņu skriptēšana (XSS), kur neuzticams saturs varētu sabojāt lapas struktūru vai ieviest ļaunprātīgus skriptus.
Lai nodrošinātu, ka īpašās rakstzīmes (piemēram, <, >, &, " utt.) tiek atveidotas kā teksts un pārlūkprogrammas tās neinterpretē kā HTML vai JavaScript.
Lai droši attēlotu lietotāja ģenerētu saturu tīmekļa lietojumprogrammā, neapdraudot drošību vai izkārtojumu.
HTML kodējums parasti tiek veikts, izmantojot iebūvētas funkcijas daudzās programmēšanas valodās:
JavaScript valodā varat izmantot tādas bibliotēkas kā DOMParser vai izveidot savu kodēšanas funkciju.
Python valodā tādas bibliotēkas kā html nodrošina tādas funkcijas kā html.escape().
Daudzi tīmekļa ietvari un servera puses valodas piedāvā iebūvētas funkcijas satura automātiskai kodēšanai.
Process parasti ietver speciālo rakstzīmju aizstāšanu ar atbilstošajām HTML entītijām.
Tīmekļa lapā parādot lietotāja ievadi (piemēram, veidlapas datus, komentārus vai ziņojumus), lai novērstu tās interpretāciju kā HTML vai JavaScript.
Iegult speciālās rakstzīmes HTML (piemēram, pēdiņas vai leņķiskās iekavas), lai nodrošinātu, ka tās tiek pareizi parādītas un netiek uzskatītas par kodu.
Strādājot ar dinamisko saturs, kas varētu saturēt īpašas rakstzīmes, kuras varētu potenciāli sabojāt HTML formatējumu vai radīt drošības riskus.
Pārvadot datus tīmekļa lapās un nodrošinot, ka saturs tiek droši atveidots bez pārlūkprogrammas HTML interpretācijas traucējumiem.