Un’analisi interessante proviene dai laboratori Google: nel Dicembre 2005 sono state controllate 1 miliardo di pagine aventi appropriate caratteristiche tali da rientrare nel target di analisi, il codice è stato sviscerato tag per tag ed il risultato è disponibile in un apposito report disponibile online. Queste alcune delle statistiche traibili:
- Ogni pagina ha una media di 19-20 differenti tag in uso. Tra questi i più usati sono ovviamente HEAD, HTML, TITLE e BODY, seguiti nell’ordine da A, IMG, BR, TABLE (con i relativi TR e TD), P e SCRIPT;
- Interessante anche l’elenco degli attributi. Per il tag IMG, ad esempio, “src” è ovviamente il più comune mentre “width” ed “height” superano sia “border” che “alt”. Per TABLE è più usuale la definizione del “border” che non del “width”, con “cellspacing” leggermente in vantaggio su “cellpadding”. Per TD la dimensione “width” risulta molto più usata della “height”;
- Tra i molti attributi che può avere il tag BODY si segnala che nel 50% dei casi circa il tag è accompagnato dalla definizione del colore di sfondo (“bgcolor”), mentre in proporzioni minori ed in ordine decrescente figurano “topmargin”, “leftmargin”, “marginheight”, “marginwidth”, “link”, “text”, “vlink”, “alink”, “onload”, “background” ed altri ancora; a questo proposito Google fa notare come tra i 20 attributi più usato per il tag BODY ben 9 siano assolutamente non validi e 5 siano «deprecati» ormai da anni;
- Attributi particolari compaiono per i tag P e BR ma risultano essere un retaggio di software quali Frontpage o Netscape: nella fattispecie si fa esplicito riferimento ad attributi quali “soft” e “dynamicanimation”.
Il report è frutto delle ricerche del WHAT working group, gruppo che «sta scrivendo le proposte per la nuova versione di HTML». La statistica è decisamente ampia e gli interessati all’argomento possono sicuramente trarre ampi spunti di riflessione circa quella che è la pratica di composizione del codice delle pagine web al giorno d’oggi.