-
Notifications
You must be signed in to change notification settings - Fork 21
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Unterschiedliche Dateien mit gleichem Namen #10
Comments
hier habe ich schon vor Monaten drüber nachgedacht, aber das ist zu kurz gedacht.. wenn man (vermeintlich) doppelte Dateien herunterlädt und immer das Datum+Zeitstempel des downloads anhängt... dann hätte man im obrigen Beispiel die Dateien: Beim nächsten Abgleich / Download der Dateien würde das Skript erkennen, dass 'xxxxx - jjjj-mm-dd - Ihre Geldprämie - application/pdf.pdf' schon einmal heruntergeladen wurde, es aber nicht überschreiben, sondern erneut herunterladen mit neuem Timestamp. und das für alle drei Dateien. und die drei alten neu heruntergeladen: Wenn die drei Geldprämien dann im Folgejahr auch noch am gleichen Tag kommen wächst der heruntergeladene Müllberg ziemlich an, der immer händisch auseinander sortiert werden müsste... Es wird sich ja nirgends "gemerkt", welche Dateien schon in der Vergangenheit heruntergeladen wurde, es wird ein einfacher Dateinamen-Abgleich durchgeführt. Lösungsansätze hierfür:
Der zweite Ansatz ist ggf. der einfachere, führt jedoch bei der "nicht Online-Archivierung-Nutzung" zu vielen doppelt heruntergeladenen Dokumenten.
Hier müsste sich dann nur noch die Zeit finden, das in eine Richtung tiefer zu folgen und anschließend umzusetzen. |
Betrifft halt nur sehr wenige Dokumente, die meisten haben ja unique Names. Ich lass das Issue offen, PRs gern gesehen, aber keine Prio für mich. |
Nur zufaellig zu diesem Issue gestolpert. Danke fuer das Tool, sehr hilfreich und spart jede Menge Zeit. Im Prinzip der 3. Ansatz nur anstatt DokumentId, waere es moeglich das Datum des Posteingangs anzuhaengen? In Kombination mit dem Namen und des Datums waere es quasi unique? |
@khamui : Das mit dem Datum reicht ja nicht aus, siehe erster Post. Wenn da das Datum schon unterschiedlich wäre, würden die Dokumente schon unterschiedlich ("unique") heißen.. da hilft es nicht nochmals zusätzlich das Datum in den Namen zu schreiben :) |
@retiredHero ja das hatte ich gelesen. Allerdings spreche ich nicht vom Downloadzeitstempel, sondern vom Postboxdatum. Wenn das überhaupt so einfach zu bekommen/ermitteln ist (kenne die API nicht). also wird dasselbe file neu heruntergeladen bleibt es trotzdem im naechsten jahr aber wie gesagt, ich stelle es mir vielleicht auch zu einfach vor mit dem postbox datum. |
Vielen Dank für das praktische Tool! Die documentId ist doch ein guter Ansatz, um Dokumente mit gleichem Namen zu unterscheiden. Da ich gerade mal alle Dokumente herunterladen wollte, habe ich das bei mir so eingebaut:
Mir persönlich gefällt es sogar noch besser, zusätzlich das Erzeugungsdatum des Dokuments vorne an den Dateinamen zu hängen. Das ging dann so (etwas umständlicher, damit Unterverzeichnisse kein Datum bekommen):
Vielleicht kann es ja noch jemand brauchen... |
Bin eben auf dasselbe Problem gestoßen, da ich zwei Sparpläne mit gleichen Aktien aktiv hatte. Dementsprechend wurde immer eins der beiden Dokumenten beim Download geskippt. Die Änderung mit der Dokument-ID hat das Problem gelöst :) |
Erstmal mal danke für dieses tolle Tool, hat prinzipiell super funktioniert.
Allerdings werden Dateien mit gleichem Namen nicht automatisch umbenannt, sondern nur die erste Datei heruntergeladen. Beispiel:
Vorschlag: Bei (vermeintlich) doppelten Dateien z.B. das Datum an den Dateinamen anhängen. Damit entsteht reproduzierbar (für Abgleich, ob bereits in Vergangenheit heruntergeladen wurde) ein eindeutiger Dateiname.
The text was updated successfully, but these errors were encountered: