Editeurs HTML

Même lorsque l'on connaît parfaitement les différents marqueurs HTML, il devient rapidement fastidieux de taper de longues pages "à mains nues"... surtout si vous devez le faire toute la journée.

Pour vous simplifier la tâche, il existe divers outils logiciels vous permettant de créer plus facilement vos pages HTML. Ces outils remplissent une ou plusieurs des fonctions suivantes:

  • Conversion d'un fichier issu d'un traitement de texte (.DOC.RTF, etc.) en fichier HTML.
  • Insertion des tags HTML par simple clic sur un bouton ou par raccourci clavier.
  • Insertion aisée de caractères accentués ou caractères spéciaux, conversion automatique.
  • Insertion d'images et liens vers tous types de fichiers au moyen d'un sélecteur de fichiers.
  • Vérification de la syntaxe.
  • D'autres petits gadgets qui simplifient la vie...

Vous choisirez vos outils en fonction de vos préférences, mais aussi en fonction de la machine sur laquelle vous travaillez.

N'oubliez pas que vous pouvez très bien éditer vos pages HTML sur un PC ou un Macintosh et ne les transférer sur le serveur HTTP (sous UNIX par exemple) que lorsqu'elles sont terminées.

Cette méthode présente néanmoins certains inconvénients. L'un d'eux est le fait que beaucoup d'éditeurs sur PC utilisent encore exclusivement les noms de fichier au format 8.3. Par conséquents ils génèrent souvent des références vers des fichiers portant l'extension .htm alors que sur la machine serveur, les fichiers doivent impérativement porter l'extension .html. Dans ce cas, il faudra ajouter des 'l' à la main aux endroits concernés...

HTML: Imagemaps

Qu'est-ce que c'est exactement?

Un Imagemap est une image incluse dans une page HTML qui, lorsque vous cliquez dessus, vous renvoie vers une autre URL. Jusque là, rien de bien étonnant... si ce n'est le fait que l'URL sur laquelle vous allez être renvoyé dépend de l'endroit précis de l'Imagemap sur lequel vous avez cliqué.

Voici une petite démonstration dans laquelle vous serez renvoyé vers une page HTML différente selon que vous cliquiez sur le rectangle, le cercle ou le fond de l'image:

 

  (cet exemple ne peut pas fonctionner sur ce serveur, désolé.)

Bien sûr, cet exemple n'est pas d'une grande utilité en soi. Quelques applications pratiques de l'Imagemap sont:

  • Barre d'icônes permettant d'accéder à différentes fonctions
  • Plan de bâtiment permettant d'accéder aux différents salles
  • Photo permettant d'obtenir des informations sur tel ou tel détail

Comment ca marche?

Il existe plusieurs méthodes pour gérer un Imagemap:

  • Lorsque vous cliquez sur l'image, le client envoie les coordonnées exactes (en pixels) de l'endroit sur lequel vous avez cliqué à un petit programme CGI (exécuté sur le serveur) qui se charge ensuite de vous rediriger vers l'URL associée à la zone dans laquelle vous avez cliqué.

    Cette méthode fonctionne avec la quasi totalité des serveurs HTTP et il vous suffit de disposer de l'utilitaire imagemap dans le dossier cgi-bin

  • Les serveurs HTTP les plus récents tels que NCSA HTTPd version 1.5 intègrent directement la gestion des Imagemap et il n'est plus nécessaire de passer par un quelconque module CGI.

    Cette méthode est beaucoup plus efficace que la précédente et nous vous recommandons vivement de l'utiliser si votre serveur la supporte.

  • Les clients les plus récents tels que Netscape Navigator 2 offrent la possibilité de gérer ce que l'on appelle des Client-Side Imagemaps. Dans ce cas, c'est le client qui s'occupe de déterminer dans quelle zone vous avez cliqué et qui fait directement la requête vers l'URL correspondante.

    C'est de loin la méthode la plus efficace en termes de performances. Ceci dit, très peu d'utilisateurs disposent à ce jour d'un client compatible avec cette méthode!

ATTENTION: Dans ce qui suit, nous expliquons comment mettre en oeuvre la première méthode (universelle): utilisation d'un script CGI.


Méthode à suivre

1-Installation du module CGI imagemap

Le module CGI imagemap est généralement fourni avec votre serveur HTTP. Il doit se trouver dans le répertoire cgi-bin.

Si le répertoire cgi-bin de votre serveur ne contient pas ce module, vous avez deux solutions:

  • Si vous avez accès en écriture au répertoire cgi-bin, vous pouvez vous procurer le module et l'installer vous même.
  • Sinon, demandez à l'administrateur de votre serveur de s'en charger...

2-Créer l'Imagemap

Votre Imagemap sera en fait constitué de deux parties:

  • L'image en elle même, telle qu'elle apparaîtra à l'écran. Elle doit être au format GIF.
  • Le fichier décrivant les différentes régions de l'image et leur URL associée. Il s'agit d'un fichier texte auquel on donnera en général l'extension .MAP.

L'image GIF sera créée avec vos outils de dessin favoris. Quant au fichier .MAP, vous pourrez soit utiliser un utilitaire adapté tel que mapedit , soit l'écrire à la main...

ATTENTION: Dans ce qui suit, nous expliquons la syntaxe de .MAP de NCSA, par opposition à la syntaxe CERN.

Le fichier .MAP utilisé pour l'exemple donné plus haut est le suivant:

default /~fplanque/Publier/imapdef.html
#rectangle
rect    /~fplanque/Publier/imapbox.html 11,12 52,47 
#cercle
circle  /~fplanque/Publier/imapcir.html 73,68 81,91 

Les lignes commençant par un # sont des commentaires. Les autres lignes définissent des zones. Chaque ligne consiste en une indication de la forme de la zone, suivie de l'URL associée, suivie d'un certain nombre de coordonnées x,y en pixels, relatives au coin supérieur gauche de l'image et définissant la zone en question.

Les différentes formes disponibles sont les suivantes:

default
Définit l'URL par défaut. 
Coordonnées: aucune
rect
Définit un rectangle. 
Coordonnées: haut-gauche bas-droit
circle
Définit un cercle (un disque pour être précis). 
Coordonnées: centre un_point_du_périmetre
poly
Définit un polygone de 100 sommets au plus. 
Coordonnées: coordonnées de tous les sommets
point
Définit un point, l'URL retenu sera alors celle du point le plus proche de l'endroit ou l'utilisateur a clique. 
Coordonnées: le_point

3-Intégrer l'Imagemap dans une page HTML

L'Imagemap de l'exemple donné plus haut a été inclus dans cette page HTML de la manière suivante:

<A HREF="http://www.dom.org/cgi-bin/imagemap/~fplanque/Publier/imap.map">
  <IMG SRC="imap.gif" ISMAP>
</A>

Vous devez donc commencer par intégrer l'image GIF dans votre page HTML au moyen du marqueur IMG. Notez la présence de l'attribut ISMAP. C'est grâce à la présence de cet attribut que le client saura qu'il faut envoyer les coordonnées précises du point de l'image sur lequel on a cliqué.

Vous devez ensuite inclure cette image dans un lien au moyen du marqueur <A>. Vous ferez référence au module CGI qui traite les imagemaps (ici http://www.dom.org/cgi-bin/imagemap) et vous ajouterez derrière le chemin d'accès au fichier .MAP (ici /~fplanque/Publier/imap.map). Ce chemin d'accès (extra PATH_INFO) sera transmis au module CGI imagemap qui saura ainsi où trouver le fichier .MAP.


Autres sources d'informations

  • mapedit, un petit utilitaire permettant de générer graphiquement les fichiers .map (existe sur différentes plates-formes).

Compteurs d'accès Web

L'installation d'un compteur d'accès sur votre site web vous permet d'avoir un retour d'informations sur le nombre de personnes qui consultent effectivement votre site. La présence d'un compteur permet également aux lecteurs d'en connaître la popularité...

Il existe deux méthodes pour compter les accès:

  • Examiner le fichier de log de votre serveur http.
  • Intégrer un appel à un programme CGI depuis l'une de vos pages.

Simple et efficace

Nous allons ici nous intéresser uniquement à la deuxième méthode, qui consiste à appeler un programme CGI "compteur" depuis une page HTML. Le principe en est le suivant: à chaque fois qu'un client charge la page HTML en question, il y trouve une image intégrée à l'aide du marqueur <IMG>. Il demande donc le chargement de cette image. Or il se trouve que cette image fait en fait référence à un programme CGI. Ledit programme CGI consulte son fichier compteur, l'incrémente de 1 puis produit en temps réel une petite image représentant les chiffres d'un compteur...

Certains compteurs permettent aussi de ne pas afficher de compteur et se contentent alors d'enregistrer les accès dans un fichier. Pour ne pas afficher le compteur, le programme va en fait afficher une image GIF transparente de 1 pixel sur 1 pixel!

Inconvénients

Un tel compteur d'accès présente néanmoins quelques limitations:

  • A chaque fois qu'une même personne se reconnecte sur un site, le compteur est incrémenté. Le compteur ne compte donc pas les personnes mais les accès à la page.
  • Le compteur est également incrémenté si un lecteur appuye sur le bouton reload de son browser.
  • Le compteur n'est pas toujours incrémenté si la page est dans le cache local du client.
  • Le compteur n'est jamais incrémenté si un lecteur référence directement une page précise d'un site Web, sans passer par la page de garde (en admettant que seule la page de garde comporte un compteur!) Le compteur ne compte donc pas les accès au service mais à la page de garde su service.

Un certain nombre de ces inconvénients pourraient être contournés avec un compteur s'appuyant sur les fichiers de log du serveur httpd, mais cela se fait au prix d'une plus grande complexité. Nous ne relèverons pas ce défi là ici.


Odometer

Odometer est un compteur très simple écrit en C sous UNIX.

Il est peut être appelé très simplement de la manière suivante:

<IMG SRC="http://www.planete.net/cgi-bin/odometer?test>

Voici le code source en C pour UNIX: odometer.c.

Common Gateway Interface (CGI)

Introduction

La Common Gateway Interface (CGI) est une norme définissant l'interfaçage d'applications externes avec des serveurs d'information (dans le cas qui nous intéresse: des serveurs HTTP).

La motivation qui vous conduira à utiliser CGI pour faire appel à des programmes externes est la suivante: lorsqu'un document HTML est envoyé sur le Web, il s'agit d'un document statique, un fichier texte dont l'information ne change pas tant que vous n'avez pas édité ledit fichier. Il existe néanmoins un grand nombre de cas où vous aimeriez envoyer de l'information dynamique, voire changeante d'un instant à l'autre. Un programme externe appelé par CGI ("programme CGI") permet d'arriver à ce résultat dans la mesure où ce programme est exécuté en temps réel, au moment où le client fait une requête au serveur HTTP.

Imaginez par exemple que vous vouliez connecter votre base de données sous UNIX au World Wide Web de manière à ce que les gens du monde entier puissent l'interroger en temps réel. Pour ce faire, vous pouvez créer un programme CGI que le serveur HTTP invoquera pour transmettre des critères de recherche au moteur de votre base de données et recevoir les résultats de la recherche qu'il transmettra alors au client pour affichage. Ceci est un exemple typique de passerelle - gateway en anglais - d'où le nom de Common Gateway Interface.

Cet exemple de base de données est une idée relativement simple mais néanmoins assez délicate à implémenter dans les faits. Il existe en fait un grand nombre d'applications beaucoup plus simples de CGI, par exemple: inclure l'heure courante dans un document HTML. Mais il n'y a pratiquement aucune limite à ce que vous pouvez faire avec un programme CGI. Rappellez vous simplement que votre programme est exécuté en direct et ce que vous y faites ne doit donc pas prendre trop de temps, faute de quoi l'utilisateur ne ferait rien d'autre que d'attendre devant un écran vide que votre programme veuille bien envoyer de l'information.

 


Spécification

Etant donné qu'un programme CGI est un exécutable, son utilisation correspond quasiment à laisser n'importe qui dans le monde e xécuter un programme sur votre ordinateur... ce qui n'est pas précisément la chose la plus sûre à faire (piratage, malveillance, virus...). Cela induit la nécessité de prendre quelques précautions au niveau de la sécurité.

L'une des précautions qui affectera le plus la plupart des utilisateurs est le fait que tous les programmes CGI devront généralement être placés dans un repértoire spécifique de l'arborescence, généralement nommé cgi-bin. Lorsque le serveur reçoit alors une requête sur une URL du type http://www.dom.org/cgi-bin/prog.html il saura qu'il doit exécuter le programme nomméprog.html plutôt que de l'envoyer tel quel vers le client comme on aurait pu s'y attendre à la vue de l'extension .html. En effet, tout fichier se trouvant dans le répertoire cgi-bin sera considéré par le serveur HTTP comme étant un exécutable.

D'autre part, le répertoire cgi-bin est généralement contrôlé par l'administrateur du serveur. Cela a deux conséquences:

  • N'importe qui ne peut pas créer un programme CGI et l'administrateur du serveur peut vérifier leur sécurité avant de les rendre accessible au public.
  • Le serveur HTTP n'exécutera que les programmes se trouvant dans ledit répertoire ou l'un de ses sous-répertoires et n'exécutera jamais un programme placé ailleurs sur vos disques. Cela empêchera un individu malveillant d'éxécuter n'importe lequel des programmes figurant sur votre ordinateur depuis l'autre bout de la planète. Cela empêchera également n'importe quel utilisateur (par exemple vous!) autorisé à placer des pages HTML sur un serveur d'y placer également des programmes CGI sans visa de l'administrateur.

Il existe d'autres moyens de faire éxécuter un programme CGI par votre serveur HTTP, mais seul l'administrateur du serveur peut les mettre en place. Un administrateur particulièrement laxiste laissera par exemple son serveur exécuter n'importe quel fichier possèdant l'extension .cgi.

En pratique, les utilisateurs peuvent souvent placer librement des documents statiques (pages HTML, images, etc.) sur le serveur Web de leur organisation en les copiant dans un répertoire spécial. Par contre, ils ne peuvent généralement pas rendre leurs programmes accessibles par le Web en utilisant CGI parce qu'ils n'ont pas la permission de les copier dans le répertoire cgi-bin.

Dans la majorité des cas, vous devrez donc vous adresser à l'administrateur de votre serveur WWW pour installer un programme CGI... à moins que vous ne soyez administrateur de serveur vous même!

Un programme CGI peut être écrit dans la plupart des langages disponibles sur vot re système. Les seules conditions sont que le langage en question vous donne accès aux variables d'environnement et qu'il permette d'écrire sur la sortie standard. Parmi les langages que vous pouvez utiliser vous trouverez:

  • C et C++
  • Fortran
  • Perl
  • TCL
  • sh, csh, ksh ou n'importe quel autre shell UNIX
  • Visual Basic (sous Windows)
  • AppleScript (sur Macintosh)

Si vous utilisez un langage de programmation tel que C, C++ ou Fortran, vous savez que vous devez compiler vos programmes avant de pouvoir les exécuter. Par contre, si vous utilisez un langage de script tel que Perl, TCL ou un shell UNIX, vous pouvez directement exécuter le fichier source (pour être précis, on doit dire que le fichier source sera interprété).

Attention: Dans tous les cas, vérifiez que le fichier à exécuter possède bien une permission d'exécution, en particulier si vous êtes sous UNIX.

Beaucoup de personnes préfèrent écrire leurs programmes CGI sous forme de scripts plutôt que sous forme de programmes compilés. En effet, sous forme de scripts, ils sont plus faciles à débugguer, à modifier et à maintenir. Un autre avantage du script est que l'administrateur du serveur peut vérifier facilement que ledit script n'ouvre pas de brèche dans la sécurité du système. Un script interprété induit néanmoins une sérieuse dégradation de performances par rapport à un programme compilé. 


Exemples

Voici deux exemples relativement simples de scripts CGI.

  • Date courante est un script CGI extrêmement simple qui produit un document HTML contenant la date et l'heure courantes. 
    Le code source est écrit en sh
  • Interface finger est un script CGI un peu plus compliqué qui prend un paramètre en entrée. Si aucun paramètre n'est fourni, le script affiche un champ ISINDEX pour que l'utilisateur saisisse un nom. Une fois que ce nom est saisi, le script s'appelle lui même à nouveau, mais cette fois, le nom saisi est transmis en argument. Dans ce cas, c'est à dire lorsque le script est appelé avec un argument, il appelle la commande UNIX finger et intègre le résultat de cette commande dans la document HTML qu'il produit. 
    Le code source est écrit en sh.

Mettre en place un serveur HTTP

Introduction

Un serveur HTTP est un logiciel qui, lorsqu'il est lancé sur une machine reliée à Internet, permet à tout utilisateur d'Internet de se connecter sur cette machine avec un client HTTP tel que Netscape Navigatoir ou NCSA Mosaic et d'obtenir des informations, en particulier des documents HTML.

On parle de serveur HTTP parce que leur rôle est de répondre à des requêtes et d'envoyer des pages d'information en utilisante le protocole HTTP (HyperText Transfer Protocol). Néanmoins, ces serveurs font souvent beaucoup plus que celà... à tel point qu'on pourrait se demander si l'appellation "serveur HTTP" n'est pas un peu réductrice. On parlera également de "Serveur WWW" ou de "HTTPd", le 'd' signifiant ici daemon, terme utilisé dans la terminologie UNIX pour désigner un programme qui attend en permanence des évènements (ici des requêtes HTTP) pour entreprendre des actions (ici envoyer des documents par HTTP). 

Bénéfices

Les bénéfices que vous tirerez de la mise en oeuvre de votre propre serveur HTTP sont multipes. Tout d'abord, si votre organisation ne dispose encore d'aucun serveur web, vous devez choisir entre faire héberger votre service web chez un prestataire ou alors installer votre propre serveur web.

Par ailleurs, même si votre organisation dispose déjà d'u ou plusieurs webs, il peut quand même être intéressant de disposer de votre propre serveur, par exemple pour avoir un contrôle direct sur vos programmes CGI ou sur les statistiques de connexions.

Dans tous les cas, les possibilités offertes à l'administrateur d'un serveur WWW sont bien plus larges que celles de la personne qui se contente d'écrire quelques pages HTML et de les placer sur un serveur géré par quelqu'un d'autre. Aussi, si vous en avez le temps et les moyens, vous devriez probablement commencer à envisager la possibilité d'administrer votre propre serveur...

 

Quel serveur choisir?

A ce jour, vous avez le choix entre plus de 40 serveurs HTTP dont un certain nombre sont gratuits. En voici une liste non exhaustive (mais assez complète quand même). En sélectionnant un nom dans la liste vous accéderez au service WWW dédié à ce serveur.

Plusieurs critères sont à prendre en compte lors du choix de votre serveur:

  • Exigences marérielles et logicielles

    • Disponibilité sur votre plate-forme serveur
    • Disponibilité pour votre système d'exploitation
  • Niveau de support Technique
  • Prix
  • Capacité à offirir des services Web différents pour des adresses IP différentes
  • Enregistrement de journal (Logs)

    • Compatibilité avec syslog (UNIX) ou EventLog (Windows NT)
    • Utilisation du format commun CERN/NCSA
    • Archivage/cyclage automatique des fichiers jounral
    • Posssibilité de personnalisé les enregistrements de hits
    • Possibilité de logguer dans plusieurs fichiers différents
    • Possibilité de générer des enregistrements spéciaux dans les fichier de log(commentaires...)
    • Possibilité pour les scripts CGI de créer leurs propres entrées de log
    • Logs de mesure de performances
  • Richesse du protocole

    • Réponse automatique à "If-Modified-Since"
    • Selection de fichiers basé sur le header "Accept"
    • Changer d'action basé sur le header "User-Agent"
    • Répondre avec des documents différents basé sur des headers clients tels que "Accept", "User-Agent" et "URL"
    • Inclusions faites par le serveur
    • Inclusions faites d'après commentaires HTML (sans utilisation de CGI)
    • Inclusion automatique de headers HTTP pour les documents non HTML (sans utilisation de CGI)
    • Accès au variables d'état du serveur depuis CGI
    • Possibility d'envoyer des documents ou images dynamiques (Server Push)
  • Sécurité

    • Possibilité d'exiger un mot de passe
    • Support de SSL
    • Support de S-HTTP
    • Restriction à certains noms de domaines
    • Restrictions à certaines adresses IP
    • Accès à certaines hierarchies selon l'adresse IP
    • Groupes d'utilisateurs configurables
    • Possibilité de changer la liste de contrôles d'accès sans redémarrer le serveur
    • Restrictions d'accès à certains fichiers
    • Encryptage et authentification par clé publique
  • Autres fonctions

    • Outils de configuration graphiques
    • Outils de maintenance graphiques
    • Maintenance à distance pendant que le serveur tourne
    • Outils de mesure de performances temps-réel
    • Implmente d'autres protocoles (ftp, gopher...)
    • Arborescence automatique
    • Gestion des répertoires utilisateurs
    • Inclue un moteur de recherche
    • Peut servir de serveur proxy
    • Peut servir de serveur proxy avec cache