Hallo zusammen,
ich habe gerade auf heise.de [1] gelesen, dass es in Berlin seit heute ein Datenportal [2] gibt.
Ich finde das im Prinzip super. Aber ja, die Datentypen. Da fällt mir insbesondere xls z.B. bei [3] auf.
Ich habe keinen finalen Überblick, was die da so raushauen, aber wenn xls, dann ist sicher auch doc nicht weit.
Kann jemand die Macher bitte auf freie Formate wie ODS oder ODT hinweisen?
Wie gesagt, die Idee finde ich super, nur in der Umsetzung sollten die Daten auch frei sein.
Viele Grüße
Christian
[1] http://www.heise.de/newsticker/meldung/Open-Data-Portal-Berlin-eroeffnet-134... [2] http://daten.berlin.de/ [3] http://daten.berlin.de/datensaetze/einb%C3%BCrgerung-2010
Christian Kalkhoff schrieb:
ich habe gerade auf heise.de [1] gelesen, dass es in Berlin seit heute ein Datenportal [2] gibt.
Vielen Dank für den Hinweis! Das war mir noch gar nicht aufgefallen.
Kann jemand die Macher bitte auf freie Formate wie ODS oder ODT hinweisen?
Wie gesagt, die Idee finde ich super, nur in der Umsetzung sollten die Daten auch frei sein.
Hier sollten wir vorsichtig sein mit dem was wir fordern. Einerseits wollen wir offene Formate, klar. Aber andererseits wollen wir auch Rohdaten.
Im Zweifel würde ich immer die Rohdaten vorziehen, weil das ein Arbeitssschritt weniger ist, der möglicherweise fehlerbehaftet ist oder gar zur Manipulation einlädt.
Wenn zum Beispiel die Forderung nach ODS-Dateien dazu führt, dass die XLS-Dateien vor der Veröffentlichung einfach nochmal durch OpenOffice gejagt werden, dann haben wir nichts gewonnen. Das können wir auch selbst. Und wenn beim Export was schief geht, haben wir am Ende sogar weniger als vorher.
Beispiele:
* Die Daten wurden direkt in Excel eingetippt. Wir erhalten also genau die Excel-Datei, die in der Verwaltung auch intern verwendet wird. In dem Fall hätte ich lieber genau diese XLS(X)-Datei anstelle irgendeinen Exportes.
* Die Daten kommen aus einer SQL-Datenbank (z.B. PostgreSQL oder Orcale). In dem Fall wäre natürlich ein SQL-Dump oder CSV-Export deutlich sinnvoller. Da könnte man den Leuten in der Tat sagen, dass sie uns nichts Gutes tun, wenn sie das alles extra nochmal durch Excel durchjagen.
* Die Daten kommen aus einer proprietären Applikation, die einen Excel-Export anbietet. In dem Fall kommen die Leute vielleicht kaum an die Rohdaten heran. Da könnte man höchstens fragen, ob die Applikation auch bessere Export-Formate anbietet. Falls nicht, wäre XLS immer noch die beste Option, da alles andere sowieso aus dieser XLS-Datei generiert werden würde.
Meiner Ansicht nach sollten wir grundsätzlich erst einmal in Erfahrung bringen, wie die Daten intern vorliegen. Erst dann können wir eine irgendeine Bewertung des Ausgabe-Formates vornehmen.
Ach ja, und das allerwichtigste ist erst einmal die Lizenz, unter der die Daten veröffentlicht sind (CC? gemeinfrei? OpenData? ...). Das Dateiformat halte ich für drittrangig. Meine Rangliste wäre also ganz klar:
* möglichst freie Lizenz * möglichst nah an den Rohdaten * möglichst freie Formate
YMMV. :-)
Gruß Volker
Am 14.09.2011 17:18, schrieb Volker Grabsch:
Christian Kalkhoff schrieb:
ich habe gerade auf heise.de [1] gelesen, dass es in Berlin seit heute ein Datenportal [2] gibt.
Vielen Dank für den Hinweis! Das war mir noch gar nicht aufgefallen.
Kann jemand die Macher bitte auf freie Formate wie ODS oder ODT hinweisen?
Wie gesagt, die Idee finde ich super, nur in der Umsetzung sollten die Daten auch frei sein.
Hier sollten wir vorsichtig sein mit dem was wir fordern. Einerseits wollen wir offene Formate, klar. Aber andererseits wollen wir auch Rohdaten.
Im Zweifel würde ich immer die Rohdaten vorziehen, weil das ein Arbeitssschritt weniger ist, der möglicherweise fehlerbehaftet ist oder gar zur Manipulation einlädt.
Wenn zum Beispiel die Forderung nach ODS-Dateien dazu führt, dass die XLS-Dateien vor der Veröffentlichung einfach nochmal durch OpenOffice gejagt werden, dann haben wir nichts gewonnen. Das können wir auch selbst. Und wenn beim Export was schief geht, haben wir am Ende sogar weniger als vorher.
Beispiele:
Die Daten wurden direkt in Excel eingetippt. Wir erhalten also genau die Excel-Datei, die in der Verwaltung auch intern verwendet wird. In dem Fall hätte ich lieber genau diese XLS(X)-Datei anstelle irgendeinen Exportes.
Die Daten kommen aus einer SQL-Datenbank (z.B. PostgreSQL oder Orcale). In dem Fall wäre natürlich ein SQL-Dump oder CSV-Export deutlich sinnvoller. Da könnte man den Leuten in der Tat sagen, dass sie uns nichts Gutes tun, wenn sie das alles extra nochmal durch Excel durchjagen.
Die Daten kommen aus einer proprietären Applikation, die einen Excel-Export anbietet. In dem Fall kommen die Leute vielleicht kaum an die Rohdaten heran. Da könnte man höchstens fragen, ob die Applikation auch bessere Export-Formate anbietet. Falls nicht, wäre XLS immer noch die beste Option, da alles andere sowieso aus dieser XLS-Datei generiert werden würde.
Meiner Ansicht nach sollten wir grundsätzlich erst einmal in Erfahrung bringen, wie die Daten intern vorliegen. Erst dann können wir eine irgendeine Bewertung des Ausgabe-Formates vornehmen.
Ach ja, und das allerwichtigste ist erst einmal die Lizenz, unter der die Daten veröffentlicht sind (CC? gemeinfrei? OpenData? ...). Das Dateiformat halte ich für drittrangig. Meine Rangliste wäre also ganz klar:
- möglichst freie Lizenz
- möglichst nah an den Rohdaten
- möglichst freie Formate
CSV sollte für die machbar sein. Das kann sogar E. (fast jedenfalls)
re, wh
walter harms schrieb:
Am 14.09.2011 17:18, schrieb Volker Grabsch:
Im Zweifel würde ich immer die Rohdaten vorziehen, weil das ein Arbeitssschritt weniger ist, der möglicherweise fehlerbehaftet ist oder gar zur Manipulation einlädt.
[...]
Meiner Ansicht nach sollten wir grundsätzlich erst einmal in Erfahrung bringen, wie die Daten intern vorliegen. Erst dann können wir eine irgendeine Bewertung des Ausgabe-Formates vornehmen.
[...]
CSV sollte für die machbar sein. Das kann sogar E. (fast jedenfalls)
Ich finde diesen Diskussionsstil unerträglich [1], versuche aber dennoch eine Antwort:
Was nützt mir ein CSV-Export einer XLS-Datei? Den kann ich mir auch selbst erstellen. Und wenn in der XLS-Datei irgendwelche Formeln drin standen? Oder bestimmte Eigenschaften nur in Form von farblichen Hervorhebungen vorhanden sind? Oder die XLS-Datei aus mehreren Worksheets bestand? Dann gehen durch den CSV-Export mit hoher Wahrscheinlichkeit sogar Informationen verloren!
Lieber hässliche Rohdaten als ein schöner aber verkrüppelter Export.
Gruß Volker
[1] Diskutieren macht keinen Spaß, wenn auf die Argumente nicht einmal ansatzweise eingegangen wird. Stattdessen wird mit pauschalisierten halbfertigen Gedankengängen "gekontert". Na super.
Am Thursday, 15. September 2011 00:30:01 schrieb Volker Grabsch:
CSV sollte für die machbar sein. Das kann sogar E. (fast jedenfalls)
Ich finde diesen Diskussionsstil unerträglich [1], versuche aber dennoch eine Antwort:
Freu Dich doch, dass sich jemand dafür interessiert. :)
Was nützt mir ein CSV-Export einer XLS-Datei? Den kann ich mir auch selbst erstellen. Und wenn in der XLS-Datei irgendwelche Formeln drin standen? Oder bestimmte Eigenschaften nur in Form von farblichen Hervorhebungen vorhanden sind? Oder die XLS-Datei aus mehreren Worksheets bestand? Dann gehen durch den CSV-Export mit hoher Wahrscheinlichkeit sogar Informationen verloren!
Lieber hässliche Rohdaten als ein schöner aber verkrüppelter Export.
Prinzipiell stimme ich Dir zu, in einfacher Verwendung ist .xls vermutlich auch schon fast ein halfoffenes Standardformat, was nicht weiter entwickelt wird. Vermutlich werden Deine Kriterien aber zu kompliziert sein, um sie einfach zu fordern. Insofern ist die Forderung nach wirklich offenen Formaten, welche sämtliche Informationen enthalten, aus meiner Sicht auch gut und wichtig.
Gruß, Bernhard
Hallo,
On Wed, Sep 14, 2011 at 05:18:26PM +0200, Volker Grabsch wrote:
Hier sollten wir vorsichtig sein mit dem was wir fordern. Einerseits wollen wir offene Formate, klar. Aber andererseits wollen wir auch Rohdaten.
Im Zweifel würde ich immer die Rohdaten vorziehen, weil das ein Arbeitssschritt weniger ist, der möglicherweise fehlerbehaftet ist oder gar zur Manipulation einlädt.
Wenn zum Beispiel die Forderung nach ODS-Dateien dazu führt, dass die XLS-Dateien vor der Veröffentlichung einfach nochmal durch OpenOffice gejagt werden, dann haben wir nichts gewonnen. Das können wir auch selbst. Und wenn beim Export was schief geht, haben wir am Ende sogar weniger als vorher.
Immer diese Techies... ;-)
Gerade *weil* beim Import von proprietären Formaten viel schief gehen kann, finde ich es wichtig, dass die Daten schon in freien Formaten angeboten werden, so dass sich die Anwender nicht mit diesen Problemen herumschlagen müssen.
Dabei spricht natürlich nichts dagegen -- falls tatsächlich eine Konvertierung vorgenommen wird -- *zusätzlich* die Daten im proprietären Ursprungsformat zur Verfügung zu stellen, damit Skeptiker wie Du sie nachprüfen können.
-antrik-