lucene-solr-user mailing list archives

Site index · List index
Message view « Date » · « Thread »
Top « Date » · « Thread »
From Erick Erickson <erickerick...@gmail.com>
Subject Re: xml error when indexing
Date Wed, 17 Feb 2010 13:52:07 GMT
The file looks good to me, but as I remember, the xml must
be UTF-8 (but check). Is there a chance that somewhere in
the chain it's not?

HTH
Erick

2010/2/17 Jan Simon Winkelmann <winkelmann@newsfactory.de>

> Hi,
>
> I'm having a strange problem when indexing data through our application.
> Whenever I post something to the update resource, I get
>
> Unexpected character 'a' (code 97) in prolog; expected '<'  at [row,col
> {unknown-source}]: [1,1], <html>
> <head>
> <meta http-equiv="Content-Type" content="text/html; charset=ISO-8859-1"/>
> <title>Error 400 Unexpected character 'a' (code 97) in prolog; expected
> '&lt;'
>  at [row,col {unknown-source}]: [1,1]</title>
> </head>
> <body><h2>HTTP ERROR 400</h2>
> <p>Problem accessing /solr/update. Reason:
> <pre>    Unexpected character 'a' (code 97) in prolog; expected '&lt;'
>  at [row,col {unknown-source}]: [1,1]</pre></p><hr /><i><small>Powered
by
> Jetty://</small></i><br/>
>
>
> However, when I post the same data from an xml file using curl it works.
>
> The add command looks like this:
>
> <add allowDups="false" overwritePending="true"
> overwriteCommitted="true"><doc><field name="cms_module_id">145</field><field
> name="basic_module_id">4053294</field><field
> name="category">1170</field><field
> name="moddate">2010-02-16T15:30:02Z</field><field
> name="archive">0</field><field
> name="valid_from">2010-02-16T15:30:02Z</field><field
> name="valid_till">2019-12-31T00:00:00Z</field><field
> name="staging">0</field><field name="id">145-4053294</field><field
> name="name">«Positives Gespräch» zwischen Bielefeld und DFL</field><field
> name="description">«Positives Gespräch» zwischen Bielefeld und
> DFL</field><field name="editor_teaser_index">Bielefeld (dpa) - Der
> finanziell angeschlagene Zweitligist Arminia Bielefeld hat der Deutschen
> Fußball Liga in Frankfurt/Main einen Maßnahmen-Katalog präsentiert.
> </field><field name="editor_text_index">&lt;p&gt;Bielefeld (dpa)
- Der
> finanziell angeschlagene Zweitligist Arminia Bielefeld hat der Deutschen
> Fußball Liga in Frankfurt/Main einen Maßnahmen-Katalog präsentiert.
> &lt;/p&gt;&lt;p&gt;«Daran arbeiten wir derzeit mit Hochdruck», teilte
> Arminia-Geschäftsführer Heinz Anders mit. Die Arminia-Delegation, zu der
> noch Manager Detlev Dammeier, Aufsichtsratschef Norbert Leopoldseder und
> Finanz-Prokurist Henrik Wiehl gehörten, habe die Lage vor den DFL-Vertretern
> laut Anders «offen und transparent» analysiert. Es sei ein «sehr positives
> Gespräch gewesen». Die nicht näher erläuterten Maßnahmen müssten nun
> umgesetzt und bei der DFL entsprechend nachgewiesen
> werden.&lt;/p&gt;&lt;p&gt;Die DFL kommentierte das Zusammentreffen in
ihrer
> Frankfurter Zentrale nicht. «Zu solchen Dinge äußern wir uns nicht»,
> erklärte ein Sprecher auf Anfrage der Deutschen Presse-Agentur
> dpa.&lt;/p&gt;&lt;p&gt;Der frühere Erstligist Bielefeld hat
> Verbindlichkeiten und Schulden von rund 15,5 Millionen Euro. Im operativen
> Geschäft dieser Saison gibt es eine Finanzierungslücke von 2,5 Millionen
> Euro. Der Club hat sich vor allem mit dem Ausbau und der Modernisierung der
> SchücoArena übernommen. Zudem ist die Entwicklung bei den Zuschauer-Zahlen
> und den Sponsorzuwendungen nach dem Bundesliga-Abstieg unerfreulich. Allein
> für das Stadion sind noch 13 Millionen Euro zu tilgen. Der Verein denkt
> sogar an einen Verkauf der SchücoArena.&lt;/p&gt;</field></doc></add>
>
> The System we run on is Solr 1.4 with Jetty Hightide 7.0.1.
>
> Am I missing something here? Would be glad for any help.
>
> Best
> Jan
>

Mime
  • Unnamed multipart/alternative (inline, None, 0 bytes)
View raw message