Základní struktura HTML souboru je následující:
Výše uvedená struktura musí být vždy dodržena. Každá značka zde uvedená se musí v rámci dokumentu vyskytovat právě jednou a to na správném místě.
Tato struktura není ještě zcela kompletní - je nutné uvést typ dokumentu. Ten je velmi důležitý, protože uvedený typ velmi mění způsob, jak se daný dokument vykresluje v prohlížečích. My budeme používat XHTML 1.0 Strict. Základní struktura dokumentu pak bude následující:
Metaznak <meta http-equiv="content-type" content="text/html; charset=iso-8859-2" /> informuje prohlížeč o použitém kódování. Kódování je přiřazení čísel (pro starší kódování typicky 0..255) jednotlivým znakům. Na obrazovce jsou ukazovány znaky, v paměti počítače a na disku jsou uchovávána jejich "očíslování". Historicky jsou pro češtinu používány nejčastěji dvě kódování: starší ISO-8859-2, novější code page 1250 (obě jsou rozšířením ASCII kódování pro angličtinu, které má definováno 128 znaků), které přišlo s MS Windows. Code page 1250 se od ISO-8859-2 liší pouze v několika znací. Příklad: Kód písmene "A" v ASCII kódování je 65. Kód písmene "č" v ISO-8859-2 ale i v code page 1250 je 232.