manifoldcf-user mailing list archives

Site index · List index
Message view « Date » · « Thread »
Top « Date » · « Thread »
From Karl Wright <daddy...@gmail.com>
Subject Re: Error tossed: Multiple document primary component dispositions not allowed
Date Thu, 24 Mar 2016 17:26:21 GMT
Hi Victor,

The URLCOLUMN is mandatory because that is the document's output key.  I'm
surprised it didn't complain that it was needed; usually it will if it
isn't in the query.

Karl

On Thu, Mar 24, 2016 at 1:02 PM, Victor D'agostino <
victor.d.agostino@fiducial.net> wrote:

> Hi
>
> Thanks for your help but a primary key can't be duplicate and the request
> is simple.
>
> I solved this issue by adding a field AS $(URLCOLUMN) and an another field
> AS $(DATACOLUMN)
>
> Are $(URLCOLUMN) and $(DATACOLUMN) mandatory ? My data are not from a
> website so it is useless for me.
>
> Victor
>
>
> -------- Message original --------
> *Sujet: *Re: Error tossed: Multiple document primary component
> dispositions not allowed
> *De : *Karl Wright <daddywri@gmail.com> <daddywri@gmail.com>
> *Pour : *user@manifoldcf.apache.org <user@manifoldcf.apache.org>
> <user@manifoldcf.apache.org>
> *Date : *24/03/2016 16:12
>
> Hi Victor,
>
> This error usually means that the connector has a bug, but in the JDBC
> case it likely means only that you have multiple rows being returned for
> each document identifier.
>
> Thanks,
> Karl
>
>
>
> 2016-03-24 10:05 GMT-04:00 Victor D'agostino <
> victor.d.agostino@fiducial.net>:
>
>> Hi guys
>>
>> Do you know what this log entry means ?
>>
>> FATAL 2016-03-24 15:01:30,014 (Worker thread '30') - Error tossed:
>> Multiple document primary component dispositions not allowed: document
>> 'ea7dac8e-ab73-47ff-86f7-a0763ecd2f56'
>> java.lang.IllegalStateException: Multiple document primary component
>> dispositions not allowed: document 'ea7dac8e-ab73-47ff-86f7-a0763ecd2f56'
>>         at
>> org.apache.manifoldcf.crawler.system.WorkerThread$ProcessActivity.checkMultipleDispositions(WorkerThread.java:2246)
>>         at
>> org.apache.manifoldcf.crawler.system.WorkerThread$ProcessActivity.noDocument(WorkerThread.java:1731)
>>         at
>> org.apache.manifoldcf.crawler.system.WorkerThread$ProcessActivity.noDocument(WorkerThread.java:1712)
>>         at
>> org.apache.manifoldcf.crawler.connectors.jdbc.JDBCConnector.processDocuments(JDBCConnector.java:839)
>>         at
>> org.apache.manifoldcf.crawler.system.WorkerThread.run(WorkerThread.java:403)
>>
>> When I do a jdbc query from a postgresql database to index to a Solr
>> Cloud ensemble :
>> query 1 to get a list of document uuid to index : SELECT email_id AS
>> $(IDCOLUMN) FROM email_details WHERE date > '1970-01-01 12:00:00'
>> query 2 and 3 are empty
>> query 4 to select data to index : SELECT email_id AS $(IDCOLUMN), texte,
>> date FROM email_details WHERE email_id IN $(IDLIST)
>>
>> email_id is a uuid field (primary key).
>>
>> Regards
>> Victor
>>
>> 
>> ________________
>> Ce message et les éventuels documents joints peuvent contenir des
>> informations confidentielles. Au cas où il ne vous serait pas destiné, nous
>> vous remercions de bien vouloir le supprimer et en aviser immédiatement
>> l'expéditeur. Toute utilisation de ce message non conforme à sa
>> destination, toute diffusion ou publication, totale ou partielle et quel
>> qu'en soit le moyen est formellement interdite. Les communications sur
>> internet n'étant pas sécurisées, l'intégrité de ce message n'est pas
>> assurée et la société émettrice ne peut être tenue pour responsable de son
>> contenu.
>
>
>
>
> Ce message et les éventuels documents joints peuvent contenir des
> informations confidentielles. Au cas où il ne vous serait pas destiné, nous
> vous remercions de bien vouloir le supprimer et en aviser immédiatement
> l'expéditeur. Toute utilisation de ce message non conforme à sa
> destination, toute diffusion ou publication, totale ou partielle et quel
> qu'en soit le moyen est formellement interdite. Les communications sur
> internet n'étant pas sécurisées, l'intégrité de ce message n'est pas
> assurée et la société émettrice ne peut être tenue pour responsable de son
> contenu.
>
>

Mime
View raw message