Catégories: "Développement"

SOAP Tutorial

Industrialisation du web: un exemple

Pour bien fixer les esprits, je vais prendre un exemple proche de nos préoccupations quotidiennes de bloggeurs ;D : la vérification des referers.

Si vous enregistrez le referrer de chaque requête dans le but de l'afficher dans vos stats publiques, vous vous êtes sans nul doute déjà confronté au besoin de vérifier que le référant pointe bien vers votre site avant de le valider, ceci afin d'éviter le "referer spam". Il en est de même pour le comment spam.

Pour ce faire, vous devez déclencher une "contre requête" HTTP afin de récupérer et analyser la page référente. Cette opération est longue et ralentit d'autant le traitement de la requête d'affichage de votre page.

Certes, vous placerez judicieusement cette requête à la fin de votre page et déclencherez l'envoi de la page vers le client avant de commencer l'opération de vérification. Mais la connexion HTTP reste ouverte et le browser client indique qu'il continue de charger. A la limite, un utilisateur lambda pourra ne pas s'en rendre compte. En revanche, un robot d'indexation aura vite fait de classer votre site dans la catégorie des mammouths lents à la détente et donc à ne pas indexer trop fréquemment.

La chose se complique encore dans le cas d'un traitement plus évolué tel que l'enregistrement d'un nouvel article. Non seulement vous allez le stocker dans la base de données locale mais vous allez déclencher toute une série d'opérations en "cascade". Exemples:

  • Génération de pages statiques
  • Trackbakcs
  • Pingbacks
  • Pings de mise à jour d'annuaires
  • Envoi de mails aux abonnés
  • Syndication en mode PUSH

(Liste non exhaustive... :>>)

Avec une plateforme web basique (type PHP, ASP, etc...) vous laissez mouliner et vous partez boire un café (si vous êtes moins feignant, vous ouvrez une autre fenêtre). Bien évidemment, vous pouvez bidouiller. Qui a dit "pop-under"? Mais ce genre de solutions où l'on compte sur les capacités de scripting du client pour assurer la cohérence des traitements sur le serveur est vraiment tout sauf recommandable. >:XX Tout celà reste acceptable dans le cadre d'un site web perso (et à budget limité), pas dans un contexte professionnel, ni avec un minimum d'ambition.

Une plateforme telle que J2EE (à ne pas confondre avec un simple script Java) ou .NET (à ne pas confondre avec un simple script ASP) permet de traiter ce type de problème de manière tout à fait élégante.

Pour faire simple et parce que ce post commence à être long, tous les traitements énoncés ci-dessus vont être passés à une (ou plusieurs) file de messages. Cette "message queue" fera exécuter les traitements annexes et non "urgents dans la seconde afin de répondre à la reuqête" par un composant dédié à cette tâche et travaillant de manière asynchrone.

Un autre exemple est le déclenchement sans intervention de l'utilisateur de tâches telles que l'envoi d'emails de résumés quotidiens, la réindexation périodique ou encore la génération de snapshots statiques à intervalles réguliers.

Alors évidemment, les message queues et les traitements asynchrones peuvent parfaitement cohabiter à côté de technologies que j'ai qualifiées de "basiques" telles que PHP. Mais on est déjà là en train de construire une plateforme plus évoluée qui n'a plus rien à voir avec ce que l'on trouve chez un hébergeur low-cost par exemple. C'est le début d'une grosse machinerie... et on aura vite fait de préférer une machinerie standardisée, documentée et maitrisée par un certain nombre de personnes (J2EE, .NET) plutôt qu'une machinerie propriétaire, issue d'un individu isolé, aussi géniale soit-elle.

Java: merci IBM!

Tout comme pour Linux, je suis persuadé que si la plateforme Java a pris l'importance qu'elle a aujourd'hui, c'est grâce à IBM et non pas Sun.


Sun a formalisé un language largement inspiré de C++ pour la syntaxe et de Basic (n'ayons pas peur des mots! :>>) pour le principe d'interpréteur avec garbage collector. Un truc rigolo qui, une fois dôtés d'interpréteurs multiples (des JVM pour tous les OS) permettait de toucher du doigt le doux rêve de "Write once, run anywhere". Je dis toucher du doigt, parce que la réalité ressemblait plus à "Write once, debug everywhere", dans la mesure où les JVM n'étaient que vaguement uniformisées, tant au niveau de l'implémentation que des versions des specs auxquelles elles essayaient de se conformer.


IBM a repris le language et ses classes de base (J2SE) et lui a ajouté tout ce qu'il fallait pour devenir une véritable plateforme d'exécution d'applications d'entreprises distribuées (J2EE), même si officiellement, le "père" du système est Sun.


On peut trouver d'autres exemples, par exemple l'interface graphique. Après des débuts cahotiques, Sun a dôté Java d'un système d'interface graphique (multi plateforme évidemment) dénommé Swing. C'est ~`grâce à Swing'~ que la plupart des applications Java affiche aujourd'hui ce look à la Fisher Price qui irrite l'oeil avant même d'agacer par sa lenteur. IBM, à l'occasion du développement d'Eclipse, a dôté Java d'une interface graphique digne de ce nom: SWT (même si le nom SWT en lui même n'est pas forcément très explicite). Il suffit de jetez un coup d'oeil à Eclipse (l'appli, pas le site!) et l'on comprend tout de suite la différence, c'est sobre, réactif, efficace. Bref, c'est signé IBM et non pas Sun. :>>

Conception logicielle

Dans la série "Chers développeurs, bienvenue dans l'ère industrielle", j'aimerais citer Philippe Kruchten (Rational Software):

"La programmation est une activité plaisante, mais la production de logiciels de qualité est un exercice difficile. Des bonnes idées et des spécifications ou de la "vision" à la réalisation d'un logiciel fonctionnel, le chemin est long et dépasse de loin les questions de programmation."

About PHP template engines

This is interesting: A Word About Template Engines by Leendert Brouwer.

"if a designer doesn't get confused with PHP code, replace him/her with a real designer"