Gestion des métadonnées WORD

cancel
Showing results for 
Search instead for 
Did you mean: 
sergio1024
Member II

Gestion des métadonnées WORD

Bonjour,

Je souhaite remonter des métadonnées personnalisées dans un document vers Alfresco.

Pour ce faire, j'ai créé un nouvel aspect "infos complémentaires" via un /opt/alfresco-4.2.c/tomcat/shared/classes/alfresco/extension/customModel.xml :


<aspects>
        <!– Definition of new Content Aspect: Customer Details –>
        <aspect name="custom:InfosComp">
                <title>Infos complementaires</title>
                <properties>
                        <property name="custom:CustomerPresta">
                                <title>Prestataire/Fournisseur</title>
                                <type>d:text</type>
                        </property>
                        <property name="custom:CustomerSite">
                                <title>Site</title>
                                <type>d:text</type>
                        </property>
                </properties>
        </aspect>
</aspects>



J'ai ensuite modifié web-client-config-custom.xml afin de faire apparaitre les métadonnées dans le détail du fichier et cela fonctionne.


L'étape suivante est de "matcher" la métadonnée de Word vers celle d'Alfresco et je rencontre des difficultés…

Pour l'instant j'ai créé un fichier /opt/alfresco-4.2.c/tomcat/shared/classes/alfresco/extension/custom-metadata-extrators-context.xml :


<bean id="extracter.Office" class="org.alfresco.repo.content.metadata.OfficeMetadataExtracter" parent="baseMetadataExtracter">
        <property name="inheritDefaultMapping">
            <value>true</value>
        </property>
        <property name="mappingProperties">
                <bean class="org.springframework.beans.factory.config.PropertiesFactoryBean">
                         <property name="location">
                                 <value>classpath:alfresco/extension/custom-office-extractor-mappings.properties</value>
                         </property>
                 </bean>
        </property>


et un fichier /opt/alfresco-4.2.c/tomcat/shared/classes/alfresco/extension/custom-office-extractor-mappings.properties :


namespace.prefix.custom=http://www.alfresco.org/model/content/1.0

CustomerSite=custom:CustomerSite
CustomerPresta=custom:CustomerPresta



Seulement le matching ne se réalise pas, ai-je manqué une étape ???


Alfresco 4.2.c sous debian7



4 Replies
cleseach
Active Member II

Re: Gestion des métadonnées WORD

Bonjour,

Pour votre bean <em>extracter.Office</em>, vous utilisez la classe <em>org.alfresco.repo.content.metadata.OfficeMetadataExtracter</em>.
Cette classe permet de traiter les documents Microsoft Office non XML (format avant Office 2007).

La Javadoc de cette classe indique :
<blockcode>
Office file format Metadata Extracter. This extracter uses the POI library to extract the following:
   author:             –      cm:author
   title:              –      cm:title
   subject:            –      cm:description
   createDateTime:     –      cm:created
   lastSaveDateTime:   –      cm:modified
   comments:
   editTime:
   format:
   keywords:
   lastAuthor:
   lastPrinted:
   osVersion:
   thumbnail:
   pageCount:
   wordCount:
</blockcode>
(et j'ai un doute sur les propriétés <em>osVersion</em> et <em>thumbnail</em>)

Il n'est pas fait mention de propriétés personnelles… je ne suis donc pas sûr qu'il s'agisse du meilleur extracter pour vos besoins.

Si vous avez besoin de traiter des fichiers Microsoft Office XML (OpenXML), vous pouvez regarder du côté de <em>PoiMetadataExtracter</em>.

Cordialement,
Charles Le Seac'h
sergio1024
Member II

Re: Gestion des métadonnées WORD

Bonjour,

Merci pour la réponse.

Je dois donc modifier la ligne :
<bean id="extracter.Office" class="org.alfresco.repo.content.metadata.OfficeMetadataExtracter" parent="baseMetadataExtracter">

par :
<bean id="extracter.Office" class="org.alfresco.repo.content.metadata.PoiMetadataExtracterr" parent="baseMetadataExtracter">


?

Cdlt.


sergio1024
Member II

Re: Gestion des métadonnées WORD

Bonjour,

Merci pour la réponse.

Je dois donc modifier la ligne :


<bean id="extracter.Office" class="org.alfresco.repo.content.metadata.OfficeMetadataExtracter" parent="baseMetadataExtracter">


par :

<bean id="extracter.Office" class="org.alfresco.repo.content.metadata.PoiMetadataExtracterr" parent="baseMetadataExtracter">


?

Cdlt.


sergio1024
Member II

Re: Gestion des métadonnées WORD

C'est bon le pb est résolu.

Le problème était le préfixe "custom:" également utilisé pour la metadata word.