12-345-678

E-mail

Suport

Struktura dokumentów HTML

Super User
Odsłony: 238

Czym jest dokument HTML?

Być może wiele osób sądzi, że strona w języku HTML jest jakimś tajemnym dokumentem, o specjalnym formacie, do tworzenia której potrzebne są specjalistyczne narzędzia i daleko idąca wiedza. Nic z tych rzeczy! Do utworzenia takiej strony nie jest potrzebne nic więcej niż... zwykły edytor tekstów. Może to być, przynajmniej teoretycznie, najprostszy edytor, jak Notatnik, który potrafi zapisywać dokument w postaci tekstowej. Listę dobrych edytorów znajdziesz na stronie HTML dla początkujących.

Przypomnijmy, że w języku HTML 4 wielkość liter w znacznikach jest obojętna, jednak zalecane jest stosowanie małych liter, a więc <h1>, a nie <H1> - w jego kontynuacji, językach XHTML i HTML 5, małe znaczniki są już obowiązkowe!

Przez wiele lat w tym miejscu deklarowaliśmy wsparcie dla standardu kodowania polskich liter ISO-8859-2 w dokumentach HTML, uzasadniając to następująco:

  • Po pierwsze, jest to międzynarodowy standard, przyjęty także w charakterze Polskiej Normy.
  • Po drugie, jest to standard bardziej uniwersalny, gdyż jest dostępny w wielu systemach operacyjnych.

Jednak w ostatnich latach na czoło wysuwa się standard kodowania wyraźnie znacznie bardziej uniwersalny technicznie, mianowicie UTF-8 (Unicode), dziś już dominujący na platformach blogowych (np. WordPress czy Blogger), w aplikacjach webowych typu CMS (jak Joomla, Drupal czy Witryny Google), a także w mediach społecznościowych. Według informacji Google, już na początku 2010 roku około 50 procent stron było już kodowanych w UTF, zatem dzisiaj udział ten musi być znacznie większy.

Należy unikać używania innych "polskich" standardów, a szczególnie Windows-1250, typowego jedynie dla Windows. W tej chwili praktycznie wszystkie systemy operacyjne są obsługiwane przez przeglądarki potrafiące rozpoznawać deklarację strony kodowej, umieszczanej w ramach części nagłówkowej strony (HEAD). W HTML 4 deklaracja obu stron kodowych ma następującą postać:

<head>
<meta http-equiv="content-type" content="text/html; charset=iso-8859-2">
</head>

W przypadku standardu Unicode informacja o stronie kodowej ma następującą postać:

<head>
<meta http-equiv="content-type" content="text/html; charset=utf-8">
</head>

W języku HTML 5 deklaracja strony kodowej została znacznie uproszczona i w przypadku UTF-8 przyjmuje następującą postać:

<head>
<meta charset="UTF-8" />
</head>

Dokument HTML jest więc najzwyczajniejszym plikiem tekstowym, który zawiera jednak pewne osobliwe znaczniki, zwane z angielska "tagami". "Tagi", których jest blisko setka, stanowią wraz z parametrami język HTML. Same składają się z nawiasów kątowych, między którymi znajdują się ściśle określone litery. Na przykład <h1> jest otwierającym znacznikiem tytułu pierwszego stopnia. Większość znaczników składa się z części otwierającej oraz zamykającej, która zawiera dodatkowo tzw. ukośnik (slash).

Gdybyśmy chcieli wprowadzić tytuł drugiego stopnia, powinniśmy napisać:

<h2>Treść tytułu drugiego stopnia</h2>

co w efekcie powinno dać wynik:

Treść tytułu drugiego stopnia

W podobny sposób możemy wprowadzić do dokumentu poziomą linię, posługując się pojedynczym znacznikiem <hr>, dzięki czemu uzyskamy na ekranie przeglądarki


Doszliśmy w tym miejscu do związku dokumentu HTML z przeglądarką World Wide Web. Przeglądarka jest wyspecjalizowanym programem, który interpretuje znaczniki i "przetwarza" je na właściwą postać graficzną. Do tej pory zaprojektowano już wiele przeglądarek, różniących się zaawansowaniem technicznym, a najdoskonalszymi z nich są obecnie programy oparte na pracach Fundacji Mozilla (jak Firefox), Opera firmy Opera Software, Safari firmy Apple, Chrome firmy Google oraz Internet Explorer firmy Microsoft.

Wróćmy jednak do HTML.

Do zbudowania dokumentu HTML nie potrzeba więc niczego więcej jak znajomości języka i prostego edytora tekstów (ale zalecam stosowanie specjalizowanych edytorów!). Powszechnie przyjętym standardem języka HTML jest opublikowany w grudniu 1997 roku HTML 4.0. Obszerny opis specyfikacji, czyli HTML 4.01 Specification (24 grudnia 1999), znajduje się na internetowej stronie http://www.w3.org/TR/html4/ - można tam również pobrać spakowane archiwum. W chwili obecnej (2013 rok) wiele firm i instytucji przetwarza swoje witryny do poziomu HTML 5, który jest jeszcze w stadium opracowywania (Candidate Recommendation - strona http://www.w3.org/TR/html5/) i ma być gotowy jako rekomendacja w 2014 roku. Na rok 2016 przewiduje się udostępnienie wersji 5.1. 

Ważna uwaga: formalnie zalecane jest stosowanie wyłącznie języka wchodzącego w skład oficjalnej specyfikacji HTML. Jest to oczywiście zalecenie, a nie bezwzględny przymus stosowania, którego ignorowanie pociąga za sobą jakiekolwiek sankcje, np. usunięcie witryny z Sieci - przynajmniej w tej chwili. Decyzję o przestrzeganiu lub wykraczaniu poza standard powinien podjąć SAM AUTOR serwisu, który przyjmuje tym samym płynące z tego tytułu konsekwencje. Skutkiem nieprzestrzegania specyfikacji może być to, że niektóre przeglądarki będą wadliwie interpretować przygotowane strony.

 

Kategoria: