axis-java-dev mailing list archives

Site index · List index
Message view « Date » · « Thread »
Top « Date » · « Thread »
From Aleksander Slominski <as...@cs.indiana.edu>
Subject Re: [Axis2] Notes on underlying MXparser of OM
Date Fri, 22 Apr 2005 17:09:49 GMT
jayachandra wrote:

>Alek!
>The problem is that of localization. Businesses which publish local
>language wsdl's can not be understood by Axis2.
>The following (attached) XML file written in chinese/japanese couldn't
>be parsed by the MXParser. Parsing threw a XMLStreamException saying
>"start tag unexpected character \ub9" the moment it encountered a
>foreign character.
>  
>
how did you do parsing? did you makes sure to pass Reader that is 
understanding UTF8 byte stream?

>Other than yahoo group is their some kind of mailing list for stAX
>community? 
>
yahoo group is the right place for this kind of questions.

>I've some problem using yahoogroups
>  
>
what problems do you have?

thanks,

alek

>On 4/21/05, Aleksander Slominski <aslom@cs.indiana.edu> wrote:
>  
>
>>jayachandra wrote:
>>
>>    
>>
>>>1. The MXParser doesn't seem to support the UTF-8 character set fully.
>>>Japanese XML files weren't parsed properly. In future, this could
>>>throw a serious problem. This can have it's effect on the SOAP message
>>>processing of foreign web services.
>>>
>>>
>>>      
>>>
>>what is the problem? makes ure to send email about problems to
>>http://groups.yahoo.com/group/stax_builders/
>>and file bug report(s) in bugzilla for StAX RI
>>(http://www.extreme.indiana.edu/bugzilla/buglist.cgi?product=STAX)
>>
>>    
>>
>>>2. The DTDParser inside MXParser was failing to understand the DTD
>>>declaration line(s) of several (complex?) DTDs. Though this might not
>>>seem as a problem if you look at the SOAP message processing part of
>>>it, but certainly with such a behaviour complete XML infoset support
>>>can not be given to our OM.
>>>
>>>
>>>      
>>>
>>are you actually testing validating or non-validating parser?
>>requirement for non-validating parser are different in regard to DTDs.
>>
>>moreover DTDs are to be rejected by SOAP processor anyway ...
>>
>>thanks,
>>
>>alek
>>
>>--
>>The best way to predict the future is to invent it - Alan Kay
>>
>>
>>    
>>
>
>
>  
>
>------------------------------------------------------------------------
>
><?xml version="1.0"?>
><!DOCTYPE é€±å ± SYSTEM "weekly-utf-8.dtd">
><!-- é€±å ±ã‚µãƒ³ãƒ—ãƒ« -->
><é€±å ±>
>  <年月週>
>    <年度>1997</年度>
>    <月度>1</月度>
>    <週>1</週>
>  </年月週>
>
>  <氏名>
>    <氏>山田</氏>
>    <名>太郎</名>
>  </氏名>
>
>  <æ¥­å‹™å ±å‘Šãƒªã‚¹ãƒˆ>
>    <æ¥­å‹™å ±å‘Š>
>      <業務名>XMLエディターの作成</業務名>
>      <業務コード>X3355-23</業務コード>
>      <工数管理>
>        <見積もり工数>1600</見積もり工数>
>        <実績工数>320</実績工数>
>        <当月見積もり工数>160</当月見積もり工数>
>        <当月実績工数>24</当月実績工数>
>      </工数管理>
>      <äºˆå®šé …ç›®ãƒªã‚¹ãƒˆ>
>        <äºˆå®šé …ç›®>
>          <P>XMLエディターの基本仕様の作成</P>
>        </äºˆå®šé …ç›®>
>      </äºˆå®šé …ç›®ãƒªã‚¹ãƒˆ>
>      <å®Ÿæ–½äº‹é …ãƒªã‚¹ãƒˆ>
>        <å®Ÿæ–½äº‹é …>
>          <P>XMLエディターの基本仕様の作成</P>
>        </å®Ÿæ–½äº‹é …>
>        <å®Ÿæ–½äº‹é …>
>          <P>競合他社製品の機能調査</P>
>        </å®Ÿæ–½äº‹é …>
>      </å®Ÿæ–½äº‹é …ãƒªã‚¹ãƒˆ>
>      <ä¸Šé•·ã¸ã®è¦è«‹äº‹é …ãƒªã‚¹ãƒˆ>
>        <ä¸Šé•·ã¸ã®è¦è«‹äº‹é …>
>          <P>特になし</P>
>        </ä¸Šé•·ã¸ã®è¦è«‹äº‹é …>
>      </ä¸Šé•·ã¸ã®è¦è«‹äº‹é …ãƒªã‚¹ãƒˆ>
>      <問題点対策>
>        <P>XMLとは何かわからない。</P>
>      </問題点対策>
>    </æ¥­å‹™å ±å‘Š>
>
>    <æ¥­å‹™å ±å‘Š>
>      <業務名>検索エンジンの開発</業務名>
>      <業務コード>S8821-76</業務コード>
>      <工数管理>
>        <見積もり工数>120</見積もり工数>
>        <実績工数>6</実績工数>
>        <当月見積もり工数>32</当月見積もり工数>
>        <当月実績工数>2</当月実績工数>
>      </工数管理>
>      <äºˆå®šé …ç›®ãƒªã‚¹ãƒˆ>
>        <äºˆå®šé …ç›®>
>          <P><A href="http://www.goo.ne.jp">goo</A>の機能を調べてみる</P>
>        </äºˆå®šé …ç›®>
>      </äºˆå®šé …ç›®ãƒªã‚¹ãƒˆ>
>      <å®Ÿæ–½äº‹é …ãƒªã‚¹ãƒˆ>
>        <å®Ÿæ–½äº‹é …>
>          <P>更に、どういう検索エンジンがあるか調査する</P>
>        </å®Ÿæ–½äº‹é …>
>      </å®Ÿæ–½äº‹é …ãƒªã‚¹ãƒˆ>
>      <ä¸Šé•·ã¸ã®è¦è«‹äº‹é …ãƒªã‚¹ãƒˆ>
>        <ä¸Šé•·ã¸ã®è¦è«‹äº‹é …>
>          <P>開発をするのはめんどうなので、Yahoo!を買収して下さい。</P>
>        </ä¸Šé•·ã¸ã®è¦è«‹äº‹é …>
>      </ä¸Šé•·ã¸ã®è¦è«‹äº‹é …ãƒªã‚¹ãƒˆ>
>      <問題点対策>
>        <P>検索エンジンで車を走らせることができない。(要調査)</P>
>      </問題点対策>
>    </æ¥­å‹™å ±å‘Š>
>  </æ¥­å‹™å ±å‘Šãƒªã‚¹ãƒˆ>
></é€±å ±>
>  
>
>------------------------------------------------------------------------
>
><!--
>*************************************************************************
>*                                                                       *
>*	DPSD PDGé€±å ±ç”¨DTD	  weekly.dtd                            *
>*                                                                       *
>*   Copyright 1997 Fuji Xerox Information Systems Co.,Ltd.              *
>*                                                                       *
>*************************************************************************
>-->
>
>
><!-- 変更履歴
>    Version 1.0 1997/10/29 作成   村田真
>-->
>
><!ELEMENT é€±å ±                    (年月週, 氏名, æ¥­å‹™å ±å‘Šãƒªã‚¹ãƒˆ)>
>
><!ELEMENT 年月週                  (年度, 月度, 週)>
><!ELEMENT 年度                    (#PCDATA)> <!-- 年度を表す数字 -->
><!ELEMENT 月度                    (#PCDATA)> <!-- 月度を表す数字 -->
><!ELEMENT 週                      (#PCDATA)> <!-- 何週目かを表す数字
-->
>
><!ELEMENT 氏名                    (氏, 名)>
><!ELEMENT 氏                      (#PCDATA)>
><!ELEMENT 名                      (#PCDATA)>
>
><!ELEMENT æ¥­å‹™å ±å‘Šãƒªã‚¹ãƒˆ          (æ¥­å‹™å ±å‘Š+)>
><!ELEMENT æ¥­å‹™å ±å‘Š                (業務名, 業務コード, 工数管理, 
>                                   äºˆå®šé …ç›®ãƒªã‚¹ãƒˆ, 
>                                   å®Ÿæ–½äº‹é …ãƒªã‚¹ãƒˆ, 
>                                   ä¸Šé•·ã¸ã®è¦è«‹äº‹é …ãƒªã‚¹ãƒˆ,
>                                   問題点対策?)>
><!ELEMENT 業務名                  (#PCDATA)>  <!-- 業務コード一覧を参照
-->
><!ELEMENT 業務コード              (#PCDATA)>  <!-- 業務コード一覧を参照
-->
>
><!ELEMENT 工数管理                (見積もり工数, 実績工数, 
>                                   当月見積もり工数, 当月実績工数)>
><!ELEMENT 見積もり工数            (#PCDATA)>  <!-- 単位は時間 -->
><!ELEMENT 実績工数                (#PCDATA)>  <!-- 単位は時間 -->
><!ELEMENT 当月見積もり工数        (#PCDATA)>  <!-- 単位は時間 -->
><!ELEMENT 当月実績工数            (#PCDATA)>  <!-- 単位は時間 -->
>
><!ELEMENT äºˆå®šé …ç›®ãƒªã‚¹ãƒˆ          (äºˆå®šé …ç›®*)>
><!ELEMENT äºˆå®šé …ç›®                ((P | OL | UL)+)>
><!ELEMENT å®Ÿæ–½äº‹é …ãƒªã‚¹ãƒˆ          (å®Ÿæ–½äº‹é …*)>
><!ELEMENT å®Ÿæ–½äº‹é …                ((P | OL | UL)+)>
><!ELEMENT 問題点対策              ((P | OL | UL)+)>
>
><!ELEMENT ä¸Šé•·ã¸ã®è¦è«‹äº‹é …ãƒªã‚¹ãƒˆ  (ä¸Šé•·ã¸ã®è¦è«‹äº‹é …*)>
><!ELEMENT ä¸Šé•·ã¸ã®è¦è«‹äº‹é …        ((P | OL | UL)+)>
>
>
><!-- XMLであらかじめ定義された実体 -->
><!ENTITY lt     "&#38;#60;"> 
><!ENTITY gt     "&#62;"> 
><!ENTITY amp    "&#38;#38;"> 
><!ENTITY apos   "&#39;"> 
><!ENTITY quot   "&#34;">
>
><!-- HTMLの汎用的なタグ -->
><!ELEMENT P      (#PCDATA | EM | STRONG | A)*>
><!ELEMENT OL     (LI)*>
><!ELEMENT UL     (LI)*>
><!ELEMENT LI     (#PCDATA | EM | STRONG | A)*>
><!ELEMENT EM     (#PCDATA | EM | STRONG | A)*>
><!ELEMENT STRONG (#PCDATA | EM | STRONG | A)*>
><!ELEMENT A      (#PCDATA | EM | STRONG)*>
><!ATTLIST A
>        name    CDATA   #IMPLIED
>        href    CDATA   #IMPLIED
>        >
>  
>


-- 
The best way to predict the future is to invent it - Alan Kay


Mime
View raw message