Hebergement

Commencant à réfléchir à la problématique de l’hebergement, et à me renseigner sur ce qui se fait de performant et pas trop cher, j’ai pensé à la dedibox de illiad (free).

Avez vous des feedbacks à son sujet ? Facilité de configuration, fiabilité, etc.

Indexation Fulltext MySQL

Pour gérer le moteur de recherche, après avoir essayé de développer mon propre système d’indexation, j’ai opté pour l’utilisation de l’indexation “fulltext” de MySQL.

Le résultat offre des performances correctes mais je me demande quels seraient les moyens de l’optimiser ? Pour que les performances restent acceptables quand le volume de données et le nombre de visites deviendront vraiment considérables, et que je n’ai pas à investir dans un serveur dédié trop monstrueux !

Deja 12 000 blogs indexés environ et 10 fois plus de notes !!

Et ce n’est que le début …

Mon robot fait bien son boulot ! Maintenant je suis face à un autre problème : modérer la masse de données récoltées pour virer tout ce qui est porno, spam, et blogs non francophones.

Un travail de fourmi qui va se faire à moyen terme (et avec un bouton “alerter un modérateur” sur l’interface publique !).

En parlant de l’interface publique, j’ai à peu près terminé son analyse fonctionnelle, il faut maintenant que je developpe tout ca et que j’intègre la charte graphique que ma très chère collaboratrice va réaliser.

Premier état des lieux du developpement

Finalement ca commence assez vite !!

Développement en PHP5 objet, avec une base MySQL ; Après y avoir passé un peu de temps, j’ai déjà un début de robot et de console d’administration.

Mon robot est capable de collecter des urls de flux RSS (pour ca j’utilise www.weblogues.com et quelques annuaires, si vous connaissez d’autres outils du même genre faciles à parser et permettant de collecter des urls de fils rss de blogs, je suis preneur …).

Il est capable de detecter leur format (plusieurs subtilités sont prises en charge …), de telecharger ces fichiers XML, de mettre à jour les informations concernant le blog, d’enregistrer et d’indexer les nouvelles notes.

A ce jour j’ai déjà environ 800 flux XML repertoriés !

J’espere que le système d’indexation va tenir la charge, c’est pas gagné mais c’est un bon défi …

Fonctionnalités

Quelles fonctionnalités attendez vous de ce type de site ?

J’en ai déjà un certain nombre en tête mais toutes les idées sont bonnes à prendre en compte.

Fonctionnalités déjà prévues :

  • Moteur de recherche avancé (recherche par categories, en fonction des votes, etc.)
  • Annuaire
  • Système de vote à la digg pour les notes et pour les blogs eux mêmes
  • Système de blogs favoris
  • … et quelques autres trucs en reflexion

Recherche flux xml !!

Afin de rendre bligg.fr compatible avec un maximum de formats de flux XML, je teste et améliore le moteur en prenant un maximum d’exemples.

J’aimerai donc que vous me donniez les URLs de vos feeds pour que je puisse avoir autant d’exemples à tester que possible.

N’hésitez donc pas à me donner l’url du flux XML de votre blog ou de ceux que vous lisez en commentaire de cette note :)

Présentation du projet

Bligg.fr est un projet personnel au format web 2.0

L’objectif est de réaliser un site combinant les avantages d’un digg like avec ceux d’un moteur de recherche et d’un annuaire, le tout en restant dans l’univers “blog”.

Son but est non lucratif, mais purement “pour le fun”, et qui sait, peut être créer un concept qui marche et qui ait un réèl intérêt !

Le developpement a déjà débuté, tout seul dans ma cave… Ca risque de prendre un certain temps mais j’éspère bien en arriver à bout.

Affaire à suivre !