Lektioner

Teckenkoder

I HTML finns det ett antal teckenkoder (HTML entities) som ersätter specialtecken som kanske inte finns på ditt tangentbord, eller inte finns med i den teckenuppsättning du har valt. Det kan vara allmänna specialtecken, tecken som hör till ett annat språk än ditt tangentbord, matematiska symboler eller emojis, och så vidare…

Faktum är att alla tecken du kan skriva på tangentbordet också går att ersätta med teckenkoder Exempel på hur det kan se ut när tecken inte fungerar kan du se när du skriver de svenska bokstäverna å, ä eller ö i ett HTML-dokument utan att ange teckenuppsättning i <head>.

Teckenkoder kan anges med ett namn, en sifferkod med vanliga decimalsiffror eller hexadecimala siffror.

Alla teckenkoder börjar med ett och-tecken (&) och avslutas med ett semikolon (;)

Teckenkoder med namn

Av alla tecken som kan anges som teckenkoder i HTML finns det ett antal som kan anges med namn. Dessa namn är alltid baserade på tecknets namn på engelska. Och-tecknet (&) heter till exempel ampersand på engelska och har teckenkoden &amp;. Den svenska bokstaven å ser ut som ett a med en ring över, så den heter &aring;, stora Å har teckenkoden &Aring;. Mindre-än-tecknet < heter "less than" på engelska, och har teckenkoden &lt;… Det finns alltid någon form av logik i namnen, vilket gör att de blir relativt enkla att komma ihåg. Ibland finns det också fler än ett namn för samma tecken.

Tecken angivna med siffror

Unicode-standarden innehåller över en miljon olika tecken. Alla dessa har ett nummer som kan anges som teckenkod. I användarens webbläsare kan dock bara de som finns med i något på datorn installerat teckensnitt (eller i en medskickad webfont) visas.

Numeriska teckenkoder kan anges antingen som vanliga decimalsiffror, eller som hexadecimala siffror.

Numeriska teckenkoder i decimalsiffror börjar med &# och slutar med ;. Numeriska teckenkoder i hexadecimala siffror börjar med &#x och slutar med ;.

Alla teckenkoder med namn kan också anges som numerisk kod.

Exempel:

tecken dec hex
😀 &#128512; &#x1F600;
😁 &#128513; &#x1F601;
😂 &#128514; &#x1F602;
😃 &#128515; &#x1F603;
😄 &#128516; &#x1F604;
😅 &#128517; &#x1F605;

Tecken som alltid ska bytas ut

Vissa tecken har särskilda funktioner i HTML och ska alltid ersättas med teckenkod, dessa kallas för reserverade tecken.

tecken teckenkod
" (citationstecken) &quot;
' (apostrof) &apos;
& (och-tecken) &amp;
< (mindre än) &lt;
> (större än) &gt;

Om du använder dig av teckenuppsättningen UTF-8 behöver du normalt bara byta ut de reserverade tecknen eller tecken som inte går att hitta på tangentbordet.

Referens

En bra och lättanvänd förteckning (på engelska) över alla teckenkoder du kan behöva om du använder utf-8 kan du hitta hos w3schools.