Catégorie: "Software engineering"

Pourquoi Google indexe les livres

Sur books.google.fr ou books.google.com on peut rechercher dans le contenu d'un nombre incroyable de livres réels, des livres en papier qui ont été scannés (ou fournis sous forme PDF/postscript par les éditeurs).

La grande presse :)) en a fait grand écho en criant au big brother qui veut indexer le monde réel et à la domination américaine sur l'information. L'Europe a riposté en annonçant un grand programme de numérisation des livres culturels de la vieille Europe pour que ce patrimoine ne se retrouve surtout pas noyé sous la masse de littérature amerloque dont le web allait sans nul doute être prochainement innondé...

Ouais, bien...

Ce que personne ne dit, c'est que Google n'en a que faire de la domination culturelle américaine. Au contraire Google va même indexer un maximum de livres dans toutes les langues qu'il supporte (une centaine aujourd'hui / sur quelques 5000 dialectes parlés dans le monde).

Et pourquoi me direz vous? Pas seulement pour fournir plus de supports de pubs! Si Google indexe des livres réels et non plus seulement des pages web, c'est pour une raison première très précise: récolter un maximum d'information sur les modèles linguistiques!

En effet, les livres réel sont une quasi garantie de non-spam! On peut considérer que 99% des livres réels ont un contenu non orienté vers un objectif marketing ou commercial unique. On peut considérer que 99% des livres réels sont écrits dans un style destiné à transmettre de l'information.

En analysant les formes linguistiques utilisées dans ces livres, Google peut, petit à petit, améliorer la manière dont il valorise les contenus trouvés sur le web. En d'autres termes: séparer le bon grain de l'ivraie. Et de l'ivraie... il y en a des tonnes sur le web!

Parce que, rappelons le, le but de Google c'est de fournir des résultats de recherche pertinents. Si vous voulez injecter de la pub/spam à bon compte, il faut passer la caisse Google.

Dans ce monde, tout n'est pas politique comme on dit. Tout est, avant tout, commercial.

There's more than the code...

Oh well... I think it's been too long since I last read some great wisdom like the one on Joel on Software.

I read this really insightful peace today about all the important things beyond just the actual software code.

Here's a funny quote:

Human emotions can be really, really superficial. In particular people ridiculously overvalue aesthetics and beauty when evaluating products. It's one of the reasons iPods, and, for that matter, Keanu Reeves, are so successful.

...but the whole article is definitely a must read!

Of course, this so much applies to b2evolution as well... :-/

Offshoring/outsourcing software development

This thread in Ask Joel is the most interesting discussion I've ever read abut offshoring/outsourcing software development!

It's getting incredibly long though, so it's really hard to read through. But the first 25 comments are definitely worth reading.

My personal take on the subject is roughly this: I believe software is art more than science. I think the best approach to make it look like engineering is something along the Unified Process - that's what the IT world has learned the hard way for the last 30 years! One golden rule of UP is to have the users and the coders communicating, to have them understand each other's constraints...

This doesn't mean I think nothing can be outsourced, but you certainly cannot carelessly offshore a whole IT department to a place with a radically different culture and expect that communicating with specs will "just work"! :|

If offshoring software development is ever going to succeed we'll need a whole new set of skills and tools (internet being one of them) to master it, and we're not even close! However, I think the experience of open source software projects developped by an international community are an interesting experience to this.

I would probably elaborate on this if I wasn't this busy reading the thread at Joel's right now! :>>

Le temps de l'Informatique Adulte

Dans la lignée de mon précédent post sur le sujet, je voudrais citer Gérard Philippot, Président d'Unilog:

La dernière idée à la mode dans nos métiers est que nous traverserions une crise identique à celle de 1993... Je crois que cette comparaison est erronée : l'atonie actuelle du marché est d'une nature différente ; en outre, si c'était vraiment le cas, il suffirait d'attendre pour que tout reparte. Mon avis est que notre marché prend conscience de certaines réalités : il ne suffit pas de concevoir des solutions ".com" pour qu'elles créent de la valeur. La qualité d'un système d'information résulte de trois facteurs bien plus essentiels : une fiabilité permanente, la disponibilité des infrastructures techniques et l'appropriation effective des nouveaux systèmes par les utilisateurs. Après l'euphorie du "tout-internet" vient le temps de l'Informatique Adulte, qui repose sur certains pré-requis.

[...]

Le second porte sur la nécessaire industrialisation partielle de notre activité. Partielle, parce qu'aucun ERP*, aucun logiciel spécialisé ne peut s'adapter suffisamment à un client donné, sauf à enfermer celui-ci dans un fonctionnement tellement standardisé qu'il en perdra toute originalité sur son propre marché.

Forcément, je suis d'accord. ;)