jennergruhle hat geschrieben:ist eigentlich das Feld "Auch gelistet bei:" im XML-Inhalt vom OC-Download enthalten? Dann könnte man den äquivalenten GC-Cache ignorieren. Oder löschen, je nach Nutzerwunsch (schon wieder eine Konfig-Option mehr...).
Hm. Ich weiß nicht, wie das in Polen aussieht, aber hierzulande ist der GC-Cache in wohl über 99% der Fälle deutlich aktueller sowohl was Beschreibung als auch Logs angeht.
Den GC-Cache zu ignorieren halte ich daher für ungeschickt.
Im Gegenteil: Fast alle Logs auf OC gibt es auch auf GC. Der Anteil der OC-only-Cacher scheint(?) verschwindend gering.
Daher mache ich es so, daß ich unregelmäßig per Hand nach OC-only Cache suche und in den CW einpflege. (Und auch das ist teilweise vergebliche Liebesmüh, weil die Caches teilweise (noch) gar nicht (mehr) existertieren. :-(
Die theoretisch sinnvollste Lösung wäre wohl korrespondierende Caches zu identifizieren, wahlweise das eine oder andere Listing zu benutzen und und die Logs in einer Datei zusammenzuführen.
Probleme:
- Die Schreiber der Logs müssten verglichen werden um nicht alle Logs doppelt zu haben. Teilweise schreiben die Leute auch unterschiedliche Logs.
- Wer GCProp schonmal hat laufen lassen weiß: Sogar bei Tradis unterscheiden sich die Koordinaten der beiden Listings! Welche Koordinaten also nehmen? (Siehe auch Beschreibung.)
Die
praktisch sinnvollste Lösung (außer Handarbeit) ist IMHO:
Beim Spidern/Download wird kontrolliert, ob bereits ein Cache mit ähnlichen Koordinaten (aber anderer Quelle) existiert und es wird nachgefragt, ob die Caches a) identisch sind und b) wenn ja, welcher Datensatz benutzt werden soll.
Möglicherweise kann man dort ja eine Checkbox einbauen, ob die Logs zusammengeführt werden sollen auch wenn dadurch Dubletten entstehen könnten.
Aber dagegen könnte man ja einfach einen groben Datumsvergleich machen. Alte Logs interessieren im CW ja meistens nicht.
Es würden also z.B. nur Logs geladen die neuer sind als die bereits vorhandenen.
Diese Vergleichsabfrage könnte man auch gesammelt nach dem ersten Spider-/Download-Durchgang stellen, damit man beim Spidern nicht die ganze Zeit daneben sitzen muß. Das nervt bei OCProp etwas.
Robin(888)