jeudi 12 juin 2008

IntellimiquE : Google PageRank

Le PageRank se fonde sur les découvertes des mathématiques statistiques d’Andrei Andreevic Markov qui analysa au début du XXème siècle, les phénomènes statistiques dans les systèmes fermés, c’est-à-dire les systèmes dans lesquels chaque élément est nécessairement ou la cause ou l’effet d’autres éléments du même système.


Sergey Brin et Larry Page, fondateurs de Google, ont ensuite repris cette base théorique pour l’améliorer et en faire le PageRank (que l’université de Stanford a ensuite déposé comme brevet). Page le teste en mars 1996 au moment du lancement de son spider, un programme pour explorer le Net : la révolution Google est en marche.

C’est en effet cet algorithme qui permet à Google d’assigner une valeur aux pages indexées du spider et qui a fait son immense succès. Le PageRank d’une page Internet est visible grâce à la Google Toolbar ou grâce à des sites comme www.pagerank.fr

Il est attribué sous la forme d’une note allant de 1 à 10. Il se calcule de la façon suivante

PR(A) = (1-d) + d(PR(t1)/C(t1) + … + PR(tn)/C(tn))

Concrètement il repose sur deux principes :

Tout d’abord, il repose sur la popularité d’une page Web, calculée à partir du nombre de liens qui pointent vers ce site. C’est donc un procédé quantitatif qui s’appuie sur la « démocratie » du Web, c’est-à-dire que la légitimité et l’importance des pages proviennent directement de ces liens, que Google considère en quelque sorte comme des votes en faveur des sites. Le résultat serait donc « un index de notation populaire ». La base philosophique reprise est celle qui anime les milieux scientifiques : plus un article est accueilli positivement plus il est jugé digne d’intérêt et fiable.

« PageRank relies on the uniquely democratic nature of the web by using its vast link structure as an indicator of an individual page’s value. In essence, Google interprets a link from page A to page B as a vote, by page A, for page B » Google

Néanmoins face à la multiplication du nombre de sites et l’explosion de la blogosphère, il est apparu nécessaire d’inclure une deuxième variable, cette fois qualitative.

« But, Google looks at considerably more than the sheer volume of votes, or links a page receives; for example, it also analyzes the page that casts the vote. Votes cast by pages that are themselves ‘important’ weigh more heavily and help to make other pages ‘important.’ Using these and other factors, Google provides its views on pages’ relative importance. » Google

Les sites disposent ainsi de plus ou moins d’influence aux yeux de Google en fonction de leurs contenus et de leurs portées : ainsi un lien trouvé sur un site pornographique sera considéré comme moins important qu’un lien provenant d’un grand quotidien national. Deux sites peuvent ainsi avoir le même nombre de liens pointant vers eux mais leur PageRank sera différent en fonction de ce critère qualitatif. Le TrustRank est également pris en compte : c’est un critère d’autorité attribué aux pages, en fonction des qualités de sérieux et de reconnaissance des auteurs ou des sites, pour éviter le spam et les fausses informations. Viennent s’ajouter à ces critères le trafic associé à la page, le nom de domaine et l’hébergement. Nous verrons par la suite comment augmenter son PageRank en s’appuyant sur ces critères.



N’étant qu’un algorithme, aussi développé et puissant qu’il soit, le PageRank connaît en effet des failles : certains programmes exploitent l’aspect invasif de la logique de connexions multiples et d’évaluation des noeuds pour faire augmenter virtuellement le PageRank d’un site comme nous l’explique le groupe de recherche Ippolita :

« Quelques programmes s’occupent de chercher les sites avec des statistiques d’accès publiques ; un nombre très élevé de demandes est donc effectué en simulant des visites. Ce mécanisme de bombardement fait littéralement exploser le nombre d’accès aux sites en question, de sorte que les statistiques affichent des accroissements notables, ce qui augmentera sensiblement le Google-ranking du site, et en dernière analyse celui du site dont vient le lien. »

Nous allons voir comment il est possible d’augmenter son PageRank. Les méthodes les plus efficaces visent à la gestion des liens, externes et internes, mais également à la gestion des noms de domaines.

Les liens externes constituent la principale source du PageRank, il faut donc valoriser au maximum le nombre de liens vers votre page, tout en les sélectionnant avec prudence : il faut choisir des pages ayant elles-mêmes un bon PageRank (qui peut varier d’une page à l’autre d’un même site !), possédant le moins de liens sortants possible (ce qui valorise votre lien) sauf dans le cas des annuaires comme Yahoo! qui a une grande importance aux yeux de Google. Les liens internes jouent également un rôle important mais à double tranchant : vous pouvez multiplier les liens vers par exemple votre page d’accueil pour faire monter son PageRank mais cela se fera au détriment de vos autres pages qui auront un PageRank moindre. De la même façon si vous faites un grand nombre de liens, la « valeur » transmise à vos autres pages diminuera.



Un autre paramètre important est celui des noms de domaines et des noms de fichiers : en effet, un spider ne reconnaît pas différentes urls qui désignent une même page. Le PageRank des pages va ainsi être divisé entre les différentes urls que le spider considère comme uniques, ne pouvant les associer à cause des noms différents. Il est donc nécessaire de standardiser les urls pour éviter ces pertes.

En conclusion, il est néanmoins important d’indiquer qu’un site disposant d’un PageRank très élevé ne sera pas nécessairement le premier résultat d’une recherche pour des termes particuliers sinon on retrouverait toujours les mêmes sites en tête. Bien souvent, le texte ou le nom du lien aura beaucoup plus d’importance qu’un haut PageRank…


Article également disponible sur Intellimique

mercredi 11 juin 2008

IntellimiquE : Réflexions sur l’économie des mondes virtuels et des jeux en ligne

Le marché des jeux vidéos connaît une croissance sans précédent depuis 8 ans au niveau mondial pour atteindre, en 2006, un chiffre d’affaires supérieur à 31 milliards de dollars. En 2007, la zone dominante était l’Asie Pacifique pesant 11,7 milliards de dollars, devant l’Europe avec 9,4 milliards et les Etats-Unis avec 9 milliards : les projections pour 2011 misent sur un chiffre d’affaires global de plus de 47 milliards de dollars.

En France le phénomène est de la même façon en pleine croissance.

Si au premier trimestre 2007 les produits culturels ont connu une baisse de 3%, les logiciels de loisirs ont connu dans le même temps une croissance de 15% pour atteindre un niveau comparable à celui du secteur musical. Les jeux vidéos sur ordinateur ne bénéficient pas de la même croissance que leurs homologues sur consoles nouvelle génération ou comme les jeux « casual friendly » que l’on retrouve de plus en plus et sous des formes diverses sur les téléphones portables et autres PDA. Néanmoins, grâce à l’explosion des mondes virtuels et des MMORPG (Massively Multiplayer Online Role-Playing Game), à l’image de Second Life, World of Warcraft ou bien encore du récent Age of Conan, le secteur est en progression : 28% des français déclarent jouer à des jeux vidéos et près d’un quart d’entre eux déclarent jouer sur Internet, générant ainsi une manne d’abonnement estimée à près de 75 millions d’euros. Au niveau mondial, on dénombre aux environs de 17 millions de joueurs actifs sur les MMOG (Massively Multiplayer Online Game.



Nous allons nous pencher sur l’économie de ces mondes virtuels et plus généralement des jeux vidéos en ligne, en laissant de côté contrairement à la plupart des analyses sur le sujet, le monde virtuel de Second Life, décortiqué à de très voire trop nombreuses occasions. Le but est ici de rechercher une autre approche, moins restrictive pour s’ouvrir sur les autres mondes virtuels. Le peu d’analyse sur le sujet peut s’expliquer par la difficulté d’appréhender des phénomènes souvent médiatiquement ou culturellement rejetés à cause d’une incompréhension des spectateurs extérieurs.

Si le poids économique des mondes virtuels n’est plus à démontrer, il existe un marché qui était il y a encore peu de temps, à peine exploité et qui est maintenant mal exploité. Prenons l’exemple du jeu phare développé par Blizzard, World of Warcraft. Regroupant plus de 10 millions d’abonnés de par le monde soit 10 fois plus que son plus proche concurrent Lineage, générant uniquement sur les abonnements une rentrée de 130 millions d’euros par mois pour ses créateurs, il est l’emblème des MMORPG : il est pourtant longtemps resté vierge de toute activité parallèle.



La sortie de la première expansion du jeu en janvier 2006, The Burning Crusade, a tardivement consacré l’apparition massive de phénomènes commerciaux qui existaient déjà dans certaines sphères des jeux massivement multi-joueurs. On distingue 3 principales façons d’appréhender le marché économique virtuel des MMORPG :

1. le powerleveling, c’est-à-dire que l’on paie pour que quelqu’un nous aide à progresser dans le jeu, à acquérir de nouveaux trésors ou que quelqu’un le fasse intégralement à la place du joueur. Les frais de powerleveling se chiffrent en centaines d’euros pour la plupart.
2. Le goldselling, c’est-à-dire le fait de vendre de l’argent dans le monde virtuel en échange de vrais fonds dans le monde réel ou en échange de services, de prestations voire de biens réels. On peut ranger l’itemselling dans cette catégorie, car consistant à vendre ou échanger des objets virtuels contre quelque chose de non virtuel.
3. La vente de compte et des personnages, objets qui leur sont associés à des prix parfois très élevés (de quelques centaines d’euros à plusieurs milliers d’euros pour des comptes très rares) et qui pose la question de la propriété des joueurs sur leurs « avatars » vis-à-vis de l’éditeur du jeu vidéo.

De très nombreux sites se sont spécialisés dans cette nouvelle économie et leur nombre croit de façon exponentielle pour répondre à une demande semble-t’il sans cesse plus grande. Les moyens, les motivations purement économiques ou les problèmes légaux de ces activités n’ont ici qu’un intérêt limité dans le cadre de cette analyse, le but étant ailleurs : tous ces sites se trompent de stratégie et reproduisent les erreurs des débuts de l’Internet tel que nous le connaissons aujourd’hui.

Ils privilégient une publicité ultra agressive basée exclusivement sur le spam sur tous les canaux de discussion des jeux onlines, inondant les boites aux lettres virtuelles de publicités approximativement traduites rappelant très fortement les innombrables spams reçus dans les boites mails réelles. Le marketing horizontal, d’attaque de masse de la population peuplant ces mondes virtuels est nécessairement lié à l’échec à terme si il ne réussit pas à s’adapter aux nouveaux enjeux et aux nouvelles aspirations des joueurs. Là où les annonceurs et les publicitaires ont réussi à passer au stade du marketing vertical au niveau « réel », ceux des mondes virtuels restent dans un modèle économique peu efficace qui a fait son temps.


Exemple de spam sur World of Warcraft

Le marché est pourtant immense, « ultra ciblé » et en pleine expansion : de phénomènes de société bien souvent décriés, les jeux vidéos et les jeux en ligne sont passés à un début de reconnaissance général, comme le montre la multiplication des évènements et des compétitions dans le monde et en France (Mondial du Gaming en juillet à Bercy). Les communautés sont en pleine explosion et ne pas suivre leurs évolutions pour s’y adapter au mieux est un choix plus que risqué. L’E-sport, c’est-à-dire les compétitions et la professionnalisation des joueurs de jeux vidéos, que certains considèrent comme de vagues utopies, semble apparaître de plus en plus comme une réalité. L’Asie et le Japon ont introduit cette notion bien avant les pensées européennes et américaines et montrent la voie. Outre le fait que les mondes virtuels révolutionnent la façon de penser des développeurs, le lien n’est plus à sens unique, les joueurs deviennent concepteurs en apportant leurs idées, en testant les phases alpha et béta des jeux, le joueur est plus que jamais actif.

Si le défi de cette mise à niveau semble si important, c’est qu’il s’explique par l’immense marché à conquérir : à l’heure de la course au marketing ciblé, s’appuyant sur les réseaux sociaux ou sur les préférences de l’utilisateur, des dizaines de millions de joueurs et sans doute bientôt beaucoup plus apparaissent comme une « cible » de choix. Les caractéristiques des joueurs se recoupent bien souvent sur de nombreux plans, quelque soit l’âge, le milieu social ou le niveau d’études pour poser les bases d’une possible analyse personnalisée. L’ère du spam et de la publicité agressive est révolue, elle n’a plus sa place, que ce soit dans les mondes virtuels ou sur Internet. Ne pas suivre les évolutions c’est risquer de passer à côté d’une nouvelle révolution digitale, d’une révolution des jeux vidéos, au delà des mondes virtuels. Sur les plans techniques et technologiques, les révolutions des jeux vidéos sont constantes, l’étape suivante qui consacrerait un véritable tournant est une révolution des mentalités qui semble peu à peu se profiler.

Pour conclure, nous sommes passé d’une phase où l’un individu jouait seul contre une intelligence artificielle, aussi poussée soit-elle, à celle où les mondes virtuels et les jeux en ligne ont proposé une alternative profondément différente : celle de jouer à plusieurs, au sein d’une communauté et non plus contre une intelligence assistée par ordinateur mais contre ou avec d’autres joueurs « humains », tout en leur permettant de tisser de nombreux liens sociaux. C’est dans ce sens que l’analyse de Clément Defossé O’Donnell pêche : il insiste sur la distinction nécessaire et obligatoire entre jeu massivement multijoueur et espace de socialisation virtuelle, en mettant en avant le fait que des jeux comme World of Warcraft n’ont pas été conçu dans un but de socialisation, qui est seule résultante d’une nécessité pour progresser dans le jeu. Cette analyse froide semble assez loin des réalités, reléguant un phénomène majeur (le jeu en ligne) à un simple rapport de cause à effet (la nécessité de progresser est conditionnée par le fait de jouer avec d’autres joueurs, donc de socialiser même à un stade précaire). Le phénomène est beaucoup plus complexe que ces simples constatations, et si l’origine première de ces jeux diffèrent des réseaux purement sociaux comme Facebook ou Myspace, ils s’en rapprochent fortement : communication vocale directement dans le jeu, réseau d’amis, système de boite aux lettres, d’association de joueurs dans des structures dédiées, messagerie instantanée… et de manière autonome par le biais de forums et de sites dédiés créés par les joueurs eux-mêmes. Plus que jamais le joueur est véritablement actif et participe à l’évolution du jeu, de ses règles, de ses mondes, de ses représentations virtuelles et sociales.

Comme l’illustre Clément Defossé O’Donnnell :
« [Les innovations] sont le fait des utilisateurs, et il ne faudra plus l’oublier, tant du côté producteur que récepteur, et cela autant pour le contenant que pour le produit du contenu ».


Article également disponible sur IntellimiquE

Back

Reprise d'activité après de longs mois de silence. En vrai j'ai la flemme de repartir sur un nouveau blog pour ma future année d'aixpat et j'aime bien les quelques billets postés ici.

Donc l'année prochaine direction Brighton à l'University of Sussex sur la côte anglaise pour les incultes. Le St-Tropez anglais à ce qu'il parait...la météo en moins, les bars, les concerts et le rock en plus. Plus de détails quand j'aurai la motivation pour faire un post plus complet...

Sinon je participe au projet intellimique qui vise à promouvoir l’intelligence économique via une communauté sur Internet : Intellimique

Je posterai ici à l'occasion les articles rédigés pour le site.