[RESOLU] Interrogation sur la taille du dossier dir.root

cancel
Showing results for 
Search instead for 
Did you mean: 
tserando
Member II

[RESOLU] Interrogation sur la taille du dossier dir.root

Bonjour tout le monde,

Je rencontre quelques problèmes sur ma base de données PostgreSQL que j'utilise pour mon Alfresco en production. Rien de bien méchant, un petit problème d'indexations et de mauvaises configurations lors de l'installation à savoir l'absence d'AutoVacuum.

Mais pour définir d'où venait mon problème, j'ai du faire un petit audit de mon installation et je me suis rendu compte que mon système de fichiers d'Alfresco possède une taille démesurément plus grande que la taille totale des documents présents sur Alfresco. En effet, sur Alfresco, 21 Go de données sont disponibles contre un système de fichiers sur le serveur de 80 Go.

Ma première explication fut que l'indexation des fichiers prend beaucoup de place. Mais je me pose tout de même la question : Est-ce que ces chiffres sont normaux ???

Pourriez-vous me confirmer ces chiffres ? S'il s'avère que vous pensez que ces chiffres ne sont vraiment pas normaux, auriez-vous une petite idée d'où cela pourrait venir.

Merci par avance de vos réponses qui sont toujours les bienvenues et m'aide à stabiliser et comprendre de plus en plus le fonctionnement d'Alfresco.

Bonne journée.

Thibault
7 Replies
rguinot
Active Member

Re: [RESOLU] Interrogation sur la taille du dossier dir.root

Bonjour,

je ne comprends pas trop ce que vous entendez par
"21 Go de données sont disponibles contre un système de fichiers sur le serveur de 80 Go."
En revanche, le repository devrait prendre grosso modo la même place que la taille combinée de vos fichiers, avec un très léger overhead .

Pour ce qui est des indexes Lucene et de la base de données, cela dépend beaucoup de l'utilisation que vous en faites ( nombre de métadonnées, taille moyenne des métadonnées quant a la base, longueur textuelle moyenne de vos documents indexés…etc) . Donnez nous plus d'infos sur votre contexte d'utilisation, volumétrie globale, et décrivez les documents types que vous importez…
tserando
Member II

Re: [RESOLU] Interrogation sur la taille du dossier dir.root

Rguinot,

Ce que je voulais dire par 21 Go de données présentes sur Alfresco contre 80 Go dans le système de fichiers, c'est que le "dir.root" chez moi fait 80 Go.
J'ai poussé un peu plus loin et analyser l'intérieur du dir.root car vous m'avez mis la puce sur l'oreille Smiley Happy. En effet, grâce à vous, j'ai pu constater que le dossier contentstore fait à peu près la même taille que mes fichiers combinés sur Alfresco. Donc RAS à ce sujet là.
Pour les indexes, la taille du dossier lucene-index est d'environ 250 mo donc rien d'alarment non plus.

Par contre j'ai un dossier contentstore.deleted qui fait 60 Go. Avec le nom que ce dossier porte, j'en conclus qu'il s'agit des documents supprimés depuis Alfresco.
Comment se fait-il que ces derniers soient conservés ? Il ne devraient pas plutôt disparaître après leur suppression en utilisant le compte admin ?

Sinon, les documents que nous utilisons dans notre Alfresco sont des documents de bases : doc, xls, avi, pdf, jpeg, …
rguinot
Active Member

Re: [RESOLU] Interrogation sur la taille du dossier dir.root

De mémoire, les éléments supprimés dans Alfresco (peu importe l'interface) sont conservés pendant un délai configurable qui est par défaut de 14 jours si ma mémoire est bonne, puis définitivement supprimés. A vous de voir si cette politique de rétention vous convient.
tserando
Member II

Re: [RESOLU] Interrogation sur la taille du dossier dir.root

En effet, sur le wiki anglais, j'ai retrouvé ce que vous m'expliquez sur les 14 jours de protections pour permettre de restaurer les données :
In the above example, if a file is created and immediately deleted, it will not be cleaned from the contentStore for at least 14 days.
(http://wiki.alfresco.com/wiki/Content_Store_Configuration#Cleaning_up_Orphaned_Content_.28Purge.29)

Par contre, le wiki explique après que les fichiers sont déplacés dans le dossier "contentstore.Deleted" et qu'il est possible de les supprimer à l'aide d'un script ou d'un cron :
The files can be removed from the deletedContentStore via script or cron job once an appropriate backup has been performed.

Or, si je supprime à la main le dossier "contentstore.deleted", j'ai peur que la base de données ne soit pas d'accord et plante.

Connaissez-vous un moyen de supprimer définitivement les fichiers supprimés dans Alfresco qui sont présent dans le dossier "$dir.root/contentstore.deleted" de la Machine Host ?
rguinot
Active Member

Re: [RESOLU] Interrogation sur la taille du dossier dir.root

Je n'ai pas encore eu ce besoin, mais j'imagine qu'il est safe de rédéfinir le bean contentStoreCleaner alfresco.war/WEB-INF/classes/alfresco/content-services-context.xml dans votre répertoire d'extension, avec un protectDays à 1 par exemple, puis redémarrer le serveur. Vos contenus supprimés seront alors définitivement supprimés 1 jour après leur suppression si c'est ce que vous souhaitez.

Comme le wiki l'indique, vous devriez tout de même backuper ce repertoire deleted au cas ou ….
tserando
Member II

Re: [RESOLU] Interrogation sur la taille du dossier dir.root

Merci Rguinot pour toutes ses informations. J'ai pu apprendre qu'il y avait un délais de suppression permettant de restaurer de vieilles données tous les 14 jours.

Par contre, je ne suis pas tout à fait d'accord avec vous sur le fait que mes documents seront entièrement supprimé au bout de 1 jours (si je modifie le fichier en question) car je pense qu'il seront déplacer dans 'contentstore.deleted'.

J'ai donc fait une recherche Google car ni le wiki anglais, ni le wiki français ne répondaient entièrement à mon problème de "contentstore.deleted" et j'ai trouvé un topic sur le forum Français qui explique qu'on peut supprimer à l'arrache le dossier en question car dans ce dernier regroupe les fichiers ayant déjà été supprimé 14 jours avant sur Alfresco.

Ce topic se trouve à cette page internet :
http://forums.alfresco.com/fr/viewtopic.php?p=5456

Je vais donc tenter sur un serveur de test de supprimer complètement ce dossier :
rm -rf contentstore.deleted
et je constaterai ce qui se passera.

Je vous tiendrai bien sur au courant.

Encore merci.

Cordialement

Thibault
michaelh
Active Member

Re: [RESOLU] Interrogation sur la taille du dossier dir.root

Juste un détail pour être certain que ça se passe bien : il faut supprimer le CONTENU et non "contentstore.deleted" car la nuit suivante Alfresco va essayer d'y placer de nouveaux éléments et je ne suis pas certain que la création du dossier soit automatique.

Normalement si, mais dans le doute c'est une bonne habitude de ne pas supprimer le dossier racine.

Sinon le post que tu signales donnes en effet les bonnes infos, il n'y a aucun risque à user du "rm" à cet endroit c'est même fait pour Smiley Happy