
Alors oui ce billet n’est officieusement qu’une fausse nouvelle car comme plusieurs dizaine de milliers d’afficionados du web, la plupart d’entre vous avaient plus ou moins entendu parler de ce principe de parsing du contenu texte des *.swf par les bots de Google via le moteur de recherche SDK. Mais (car en effet il y a un mais), si on en croit ce billet mis en ligne sur CNET Blogs, ça y est c’est officiel, Google lira les textes Flash, dès lors il s’agit pour tout le monde de les optimiser.
Cependant, à l’instar du billet cité précédemment, je reste assez sceptique pour l’instant quant à une lecture sémantique efficace. Flash s’optimise via la fameuse règle de “je ne charge que ce dont j’ai besoin” à savoir des swf externes loadés par un swf principal. On peut donc facilement en déduire que la lecture du site par un bot s’en trouve franchement compliquée. De même, le 2e axe majeur d’optimisation du Flash est le XML. Ce dernier permet de dynamiser les contenus multimédias appellés dans le SWF et ça à mon avis les bots vont littéralement passer au travers car ils sont difficilement interprétables correctement car rarement construits de manière à offrir du contenu sémantique.
Force est de constater que le rapprochement d’Adobe et Google autour de ce problème laisse présager de bonnes choses en terme de référencement voir d’accessibilité. Reste que dans un premier temps il va falloir choisir entre optimiser son Flash où offrir la possibilité à Google de lire le contenu.
Google “pourrait” lire les textes contenus dans les .swf, mais Google pourra-t-il naviguer dans ce même fichier via les “liens” qu’il comporte comme il le ferait sur un site HTML ?
Bah c’est la question posée dans l’article, les textes dynamiques et les swf addChildés vont compliquer voir anéantir les possibilités de lecture. Du moins pour le moment.
Dans ma boite, j’ai travaillé récement sur la problématique et fort de constater que ce changement ne fera pas grand chose pour nous aider, nous simples developpeurs flash que nous sommes.
Et comme toujours, la meilleur solution c’est d’avoir une version alternative au flash en HTML.
J’ai fait une petite demo pour essayer; Suffit de tapper l’un des mots suivant AlternativeDemoAccueil AlternativeDemoHowDoesItWork AlternativeDemoWhyThisDemo ou AlternativeDemoSources dans google et on tombe sur la bonne page sous flash. Ca marche à peut près bien sur Firefox mais ça reste à améliorer grandement pour les autres navigateurs.
Petite question, tes textes sont statiques dans ton flash ou externalisés ? Pour l’histoire des browsers je comprends pas vraiment, la lecture du contenu dépend des bots, le navigateur n’a pas de rôle à jouer hormis d’afficher le flash. Si tu pouvais nous en dire plus ça serait cool.
Les textes de la démo sont dans des fichiers XML, après pour l’histoire des browsers c’est juste que j’utilise actuellement SWFAddress 2 qui merde un peut pour tout ce qui est affichage de la bonne page dans flash et gestion des précédent-suivant.
Le chalenge est d’une part que le contenu soit référencé par un bot et d’une autre part, de permet de tomber sur la bonne “page” flash en fonction des urls via les résultats du moteur de recherche.
Pouvoir lire du contenu c’est une chose, pouvoir le traiter s’en est une autre. Aujourd’hui tous les sites Internet intègrent du HTML qui est le SEUL langage qui permette de hiérarchiser l’information. Grâce à cette notion de hierarchie il est possible d’indexer, traiter, évaluer les données. Sans cette notion le contenu brut n’est pas exploitable. Il faut donc que le flash intègre dans son développement une notion de hiérarchie de l’information similaire à la valeur sémantique des balises HTML. Un H1 pour le titre, des listes, des paragraphes etc.
Décomplier du code c’est presque facile à coté, pleins de décompilateurs flash le fond. Mais faire évoluer un langage là ça prend plus de temps.
Lorsque nous en serons arrivé là on pourra commencer à s’émanciper du sacro-sain HTML qui en définitive, ne sert qu’a ça, mais qui n’a pas d’équivalent !
Alors ca pour une nouvelle, c’est une TRES mauvaise nouvelle
Flash est enfermé dans un monde propriétaire là ou le XHTML est le fils de grands discours de grandes personnes visant à offir un web à tous et pour tous et ca change tout ! ( http://www.blogbangbang.com/post/2007/12/12/Flash-is-everywhere-or-not )
Mais bon malgré celà, flash reste presque indexable pour les raisons citées plus haut et les formats (et microformats) ont encore de beaux jours devant eux.
PS : Une alternative HTML au site flash, ca peut être une solution à condition que le contenu soit unique et accessible autrement (HTML, XML, Microformats…) et que flash ne soit qu’une surcouche de présentation.
PS2 : un autre billet qui à déchainé les CRMA l’an dernier :
http://www.blogbangbang.com/po.....coup-Flash