Machine à blogs vers Google Code... pour les vacances

J'ai un peu calé sur cette machine à blogs, j'ai repoussé à plus tard mes z'expériences diaboliques en cours.

Je dois encore sortir deux classements qui ne servent à lien, pardon, à rien.

(si vous les voulez officieusement, voici celui d'octobre et de novembre). Il n'y a quasiment que des copains en tête, ce n'est pas très sérieux, mais ça vient sans doute du fait que ma base de blogs se peuple de "blogs amis" en "blogs amis". D'ailleurs, une de mes expériences à venir, dans quelques mois, serait d'arriver à cerner des archipels de blogs, de voir des vraies sphères, par exemple en extrayant les liens "forts" :A linke B et C, B linke A et C, C linke B et A... comme les pros, le nom de code est Archipel, je trouve que ça pète, non ?)

Sinon, je vais déposer le code source de ma machine à blogs dans Google Code. Ce truc que je viens de découvrir est une sorte d'équivalent de "Sourceforge", un endroit pour partager les programmes Open Source dans la communauté. C'est google, c'est bien fait. Le système de version est SVN, il y a un système simple de report de bugs, de téléchargement du produit fini, etc. C'est Google, c'est bien, quoi...

Vous lecteurs, vous n'y connaissez que nibe en Java (à part Marc Vasseur), j'imagine, mais sait-on jamais ? Ca peut perpettre à d'autres de reprendre le flambeau si j'en ai marre ! (là je continue mon jeu de stratégie que je dois terminer depuis plus de quatre ans...)

Loading mentions Retweet

Comments [0]

A voir, ailleurs

Ma machine à blogs n'étant pas très active en ce moment, je n'ai pas l'occasion de faire des billets ici. J'effectue des ajustements sans fin qu'il serait fastidieux à décrire...

J'ai fait du gros ménage, grâce à des contrôles, notamment sur la reconnaissance des langues, que je dois toujours vous décrire, bande de petits veinards ! J'ai pu passer ainsi de 10.000 blogs flous, à 1.300 blogs plus pertinents ! Francophone, Chris d'Hostie !

J'ai, entre autre, ajouté une graduation dans les mises à jour. Avant, je devais mettre à jour tous les blogs, c'était long. Maintenant, quand un blog ne publie pas, j'augmente sa période de mise à jour, jusqu'à 10 jours au maximum.

***

A part ça, c'est l'hiver, il fait froid, et cette semaine, je vous balance un classement bidon d'octobre, avec deux trois trucs corrigés, plus un classement de novembre, avec les évolutions, c'était aussi rigolo à bidouiller.

Les classements c'est ce qu'il y a de plus facile à faire quand on archive des blogs, des billets et des liens, mais ce n'est pas non plus ce qu'il y a de plus sexy. Alors, je réfléchis à d'autres expériences, comme par exemple une cartographie des "groupes de blog", mais j'y reviendrai.

Alors pour patienter, je vous invite, chers deux ou trois lecteurs à découvrir trois blogs de geek qui sont mes z'amis.


Etant donné que vous, mes deux trois lecteurs, êtes évidemment les auteurs de ces trois blogs, je vous invite à vous découvrir entre vous, ce qui est déjà fait, ou comment terminer un billet de façon catastrophique...

Loading mentions Retweet

Comments [0]

Transfert

J'avais quand envie d'écrire que, ce matin, le mot "transfert" me rappelle fortement X-Or, le héros japonais avec un casque.

A un moment, il se transforme, et il crie "transfert !", je crois.

Et puis un monstre avec une tête en caoutchouc, puis il devient géant, et X-Or doit appeler un super grand robot pour le vaincre.
Loading mentions Retweet

Comments [0]

On analyse Jegpol...

Tenez, vite fait bien fait, une analyse du numéro un, moôossieur Jegpol...
J'ai parlé de 28 liens vers billets avant le 1er octobre 2008.

Voici dans ce PDF d'Allemagne de l'est le détail des liens !

(download)

Loading mentions Retweet

Comments [3]

Requête Google

j'ai douze ans et mon pénis fais 8 cm en érection c'est normal

Cher lecteur.

j'avais ce problème, avant, et ma vie était un enfer. Maintenant, j'ai trouvé la solution.
Loading mentions Retweet

Comments [2]

2001... en attendant

En attendant que je rédige ce billet sur 2001, l'Odysée de l'Espace : Google a remis en ligne son index de janvier 2001. On y fait des recherches, et on y retrouve des résultats d'il y a 7 ans.

C'est ici : http://www.google.com/search2001.html



Loading mentions Retweet

Comments [0]

A l'attaque des blogrolls

Rajouter des nouveaux blogs pertinents dans la Machine à blogs ? Utiliser juste les billets, ce n'est pas assez rapide. Tout le monde ne fait pas autant de lien que Gaël...

Donc, je prends tous les blogs dit "vérifiés" (500, à la louche), et je charge la page complète du blog. Je place tous les liens que je peux y trouver (blogrolls et autre cacas) dans la liste des blogs à tester.

On va bien voir !

Sinon, en plan :

  • Il faut que je détaille ici mon procédé de detection de langage (vous verrez, c'est... heu, comme le reste).
  • Les flux proposent des billets soit incomplets soit au corps carrément vide. Dans ce cas là, il faut faire face à son destin : charger le billet depuis le vrai blog. C'est un chantier.
Comme dirait Nicolas, au boulot !

Loading mentions Retweet

Comments [1]

Message de service pour Gaël

Cher Gaël detoutderien. Tu m'envoies ce message :

Otis Redding en laïve

http://newmusicalbums.blogspot.com/2008/09/otisredding-liveinlondonandparis-2008.html



C'est gentil. J'aime la musique. J'aime le cinéma aussi. J'aime la lecture, et la glace à la vanille.

Mais combien.

Combien de fois.

COMBIEN DE FOIS.

VAIS-JE DEVOIR.

TE REPETER

QUE JE N'AI PAS LE SON AU TRAVAIL !!!!!!!!!!







Loading mentions Retweet

Comments [9]

A picture for you...

Voici comment Gaël Detoutderien me harcèle...

Loading mentions Retweet

Comments [3]

Valider les blogs ?

Le principe de la machine à blogs : mettre à jour les billets des blogs, à partir des billets, trouver de nouveau blogs, et recommencer depuis le début.

Avec ce principe s'est rapidement - et plus rapidement que prévu - posé le problème d'une sélection. Remplir mon disque dur des blogs en anglais, en espagnol ou en italien, pour quoi faire ?

Il m'a fallu mettre en place un statut pour chaque blog :

  •  en attente.
  •  validé.
  •  rejeté.
Pour gagner du temps, je ne mets à jour que les blogs non rejetés.

Méthodes pour valider :

 A la main : j'ai au début fait une petite interface web pour valider / rejeter mes blogs. Une liste (100 blogs par page), des cases à cocher, et un bouton "valider". Moralité : c'est chiant.

J'ai ensuite mis en place une série de "validateurs". Ce sont des "petites briques" qui, empilées, cumulent les règles et autres bidouilles pour faire le tri tout seul. En voici deux, pour l'instant :

Règles sur les URLs des blogs : valide automatiquement certains blogs. Par exemple, s'il est hebergé chez "Canal Blog" ou "Haut et Fort" ou "Over-Blog", il y a de fortes chances que ça soit un blog en français. Validé ! Par contre, je jette tout ce qui est "tumblr", ou "skyblog" ou autre plateformes non pertinentes...

Validation par langage : un beau morceau ! Très interessant à mettre en place. Je reviendrai en détail là-dessus, mais j'ai un système qui detecte le langage d'un blog (français, anglais, italien, espagnol ou allemand). S'il est en français : validé, sinon, rejetté.

 

Loading mentions Retweet

Comments [0]

About

Les médias commencent des conversations, les blogs les terminent. Non..

les médias commentent des conservations, les blogs démarrent taux piqueur....

les médias classiques envoient des messages, les blogs permettent de trouver des bons salons de massages...

Les médias traditionnels parlent des métiers disparus dans la Creuse, les blogs sont tenus par des habitants de la Creuse désœuvrés d'avoir des métiers disparus.

mon vrai blog est là : http://balmeyer.blogspot.com