Diese Website existiert nur weil wir Werbung mit AdSense ausliefern.
Bitte den AdBlocker daher auf dieser Website ausschalten! Danke.

XML/GPX Parser

Papierloses Cachen.

Moderatoren: arbor95, pfeffer, MiK

greiol
Geoguru
Beiträge: 4905
Registriert: Di 22. Nov 2005, 10:26

Re: XML/GPX Parser

Beitrag von greiol »

MiK hat geschrieben:Solange keiner mit Sicherheit sagen kann, wie man Unicode-Text in XML speichert, ergibt die weitere Diskussion keinen Sinn.
korrekt gespeichert sind sie, wenn ihr speicherformat zu dem im header deklarierten charset passen

Beispiel:

Code: Alles auswählen

<?xml version="1.0" encoding="UTF-8"?>
im moment behaupten wir bei den gpx exporten utf-8 zu schreiben. die frage wäre ob das so auch stimmt. und die nächste spannende frage ist, ob der, der die daten liest mit dem charset überhaupt etwas anfangen kann. und da habe ich bei den garmin geräten ab und an doch leichte zweifel.

kann mal ein colorado / oregon besitzer nachsehen als was die files auf dem gerät in garmin/text kodiert sind?

vermutlich würden die geräte die beschreibungen überleben, wenn diese zeichen komplett als &#xxxx; kodiert wären. mag das jemand implementieren?

ich trau mich gar nicht zu erwähnen, das mit 30$ im jahr sich das ganze theater erledigt hat
Wer vom Ziel nicht weiß, kann den Weg nicht haben
(Christian Morgenstern)
TweetyHH
Geomaster
Beiträge: 603
Registriert: Do 8. Jun 2006, 11:37
Wohnort: 22529 Hamburg
Kontaktdaten:

Re: XML/GPX Parser

Beitrag von TweetyHH »

Ja, diese XML Parser sind meiner Meinung nach häufig schöner als der Weg, der im Cachewolf gegangen worden ist. Allerdings sind es, wie du schon sagst, XML-Parser für Java. Der CacheWolf basiert aber auf EWE, was leider kein vollständiges Java ist. Daher basiert der GPX-Importer soweit ich das sehe auf einer eigenen EWE Parser, der SAX ähnlich ist. Allerdings sehe ich keine besondere Behandlung des Encodings (oder täusche ich mich?).

Dieses nicht Java-Konform sein, war für mich der Grund einen Forks des CacheWolfs für den Desktop zu beginnen. Momentan bin ich neben einer Neuentwicklung eines Mail-Abhole und -Parse Features mit UncleOwen allerdings eher erstmal mit Refactoring von Basis-Diensten/Klassen beschäftigt. So ein Parser neu zu schreiben ist doch etwas Arbeit (vorallem langweilige Fleißarbeit ;-) ). Daher wollte ich diese erst einmal weitgehend unverändert lassen um etwa Verbesserungen aus dem CacheWolf übernehmen zu können. Wenn du allerdings Lust hättest den Parser oder Exporter mit "richtigem" Java neu zu schreiben kannst du dich gerne melden (ich denke da lässt sich das Encoding dann leichter welchseln).

P.S. Zu finden ist das Projekt CacheHound bisher unter http://code.google.com/p/cachehound/
greiol
Geoguru
Beiträge: 4905
Registriert: Di 22. Nov 2005, 10:26

Re: XML/GPX Parser

Beitrag von greiol »

TweetyHH hat geschrieben:Ja, diese XML Parser sind meiner Meinung nach häufig schöner als der Weg, der im Cachewolf gegangen worden ist.
es geht imho um den gpx parser der garmin geräte und nicht um den von cachewolf
Wer vom Ziel nicht weiß, kann den Weg nicht haben
(Christian Morgenstern)
Benutzeravatar
Romanese
Geocacher
Beiträge: 239
Registriert: Mi 28. Feb 2007, 15:12
Wohnort: Deutschland

Re: XML/GPX Parser

Beitrag von Romanese »

greiol hat geschrieben:es geht imho um den gpx parser der garmin geräte und nicht um den von cachewolf
Man sollte das Problem so nah wie möglich an der Wurzel packen. GC.com ändern geht nicht. Deshalb war meine Idee einen Parser für den Cachewolf zu erstellen und damit gleichzeitig das Problem beim GPX Export zu lösen. Es ist nicht nur Garmin, sondern GSAK, etc. die Probleme mit den Sonderzeichen haben.
Bild
Benutzeravatar
huzzel
Geowizard
Beiträge: 2787
Registriert: Mi 10. Okt 2007, 22:01
Kontaktdaten:

Re: XML/GPX Parser

Beitrag von huzzel »

greiol hat geschrieben:kann mal ein colorado / oregon besitzer nachsehen als was die files auf dem gerät in garmin/text kodiert sind?
Ich weiß nicht, ob das hier hilft, aber bei POIs, in denen &#xxxx; vorkommt, zerlegt die gesamte POI-XML, zumindest meckert der POILoader.
greiol
Geoguru
Beiträge: 4905
Registriert: Di 22. Nov 2005, 10:26

Re: XML/GPX Parser

Beitrag von greiol »

Romanese hat geschrieben:Deshalb war meine Idee einen Parser für den Cachewolf zu erstellen und damit gleichzeitig das Problem beim GPX Export zu lösen.
hast du das problem mit per pocket query eingelesenen caches? dann sollten wir uns den gpx parser von cachewolf tatsächlich ansehen. hast du das problem mit gespiderten caches? dann brauchen wir uns den gpx parser von cachewolf nicht anzusehen.

bisher kenne ich diese art fehlermeldungen nur von spider benutzern.
Wer vom Ziel nicht weiß, kann den Weg nicht haben
(Christian Morgenstern)
MiK
Geoguru
Beiträge: 5214
Registriert: Sa 25. Nov 2006, 01:11
Wohnort: 64293 Darmstadt / Kleinwallstadt
Kontaktdaten:

Re: XML/GPX Parser

Beitrag von MiK »

Es geht hier nicht um "Sonderzeichen", sondern um teilweise ganz normale Unicode-Schriftzeichen. Die einzige Möglichkeit wäre, diese optional komplett herauszulöschen. Das Ganze hat aber mit XML und dem Parsen des selben kaum etwas zu tun.
Benutzeravatar
Romanese
Geocacher
Beiträge: 239
Registriert: Mi 28. Feb 2007, 15:12
Wohnort: Deutschland

Re: XML/GPX Parser

Beitrag von Romanese »

greiol hat geschrieben:kann mal ein colorado / oregon besitzer nachsehen als was die files auf dem gerät in garmin/text kodiert sind?
<?xml version="1.0" encoding="UTF-8" ?>

Das sagt mein Oregon.
Bild
greiol
Geoguru
Beiträge: 4905
Registriert: Di 22. Nov 2005, 10:26

Re: XML/GPX Parser

Beitrag von greiol »

danke. jetzt ist die frage wie wir herausfinden was er nicht vertägt obwohl es utf-8 ist.

wir könnten natürlich 1000e einzelne gpx files mit allen möglichen zeichen erzeugen, aber ich bin mir nicht sicher ob das jemand für uns testen möchte.
Wer vom Ziel nicht weiß, kann den Weg nicht haben
(Christian Morgenstern)
Kalli
Geowizard
Beiträge: 1445
Registriert: Sa 19. Mär 2005, 18:56

Re: XML/GPX Parser

Beitrag von Kalli »

Ich habe mir jetzt mal das GPX sowohl von der Cache-Seite als auch von der PQ angeschaut. In dem GPX von der Cacheseite sehe ich überhaupt keinen Müll, bei der PQ ist aus dem Müll CRLF CRLF (also 0x0D 0x0A 0x0d 0x0A) geworden. Das Problem tritt also bei Caches auf, die gespidert und in XML abgespeichert wurden, hat also mit dem XML-Parser, wie vermutet, erst mal wenig zu tun.

Was einen wieder zu der Frage bringt: Wie erkenne ich Müll um ihn beim Speichern entsorgen zu können? Aus Müll richtig kodierten Müll zu machen, macht irgendwie keinen Sinn.
Antworten