HTML kódovanie je proces prevodu znakov, ktoré majú v HTML špeciálny význam (ako napríklad <, >, ", & atď.), na ich zodpovedajúce HTML entity. To zabezpečuje, že tieto znaky sa na webovej stránke zobrazia správne a nie ako HTML tagy alebo atribúty. Napríklad:
< sa stane <
> sa stane >
& sa stane &
Kódovanie HTML je kľúčové na zabezpečenie správneho a bezpečného zobrazenia textu obsahujúceho špeciálne znaky v prehliadači.
Aby ste zabránili útokom HTML injection, ako napríklad Cross-Site Scripting (XSS), kde nedôveryhodný obsah môže narušiť štruktúru stránky alebo zaviesť škodlivé skripty.
Aby sa zabezpečilo, že špeciálne znaky (ako <, >, &, " atď.) budú vykreslené ako text a prehliadače ich nebudú interpretovať ako HTML alebo JavaScript.
Aby sa bezpečne zobrazoval obsah vygenerovaný používateľom vo webovej aplikácii bez ohrozenia bezpečnosti alebo rozloženia.
Kódovanie HTML sa zvyčajne vykonáva pomocou vstavaných funkcií v mnohých programovacích jazykoch:
V JavaScripte môžete použiť knižnice ako DOMParser alebo si vytvoriť vlastnú kódovaciu funkciu.
V Pythone knižnice ako html poskytujú funkcie ako html.escape().
Mnoho webových frameworkov a serverových jazykov ponúka vstavané funkcie na automatické kódovanie obsahu.
Proces vo všeobecnosti zahŕňa nahradenie špeciálnych znakov ich zodpovedajúcimi entitami HTML.
Pri zobrazovaní používateľského vstupu (ako sú údaje z formulára, komentáre alebo správy) na webovej stránke, aby sa zabránilo jeho interpretácii ako HTML alebo JavaScript.
Pri vkladaní špeciálnych znakov do HTML (ako sú úvodzovky alebo lomené zátvorky), aby sa zabezpečilo ich správne zobrazenie a aby sa nepovažovali za kód.
Pri práci s **dynamický obsah**, ktorý môže obsahovať špeciálne znaky, ktoré by mohli potenciálne narušiť formátovanie HTML alebo predstavovať bezpečnostné riziká.
Pri prenose **údajov cez webové stránky** a zabezpečovaní bezpečného vykreslenia obsahu bez rušenia interpretáciou HTML prehliadačom.