In jedem Computersystem wird zwischen ASCII- und Binärdateien unterschieden.
Im Grunde handelt es sich dabei um Dateitypen, wie z.B. eine Word- und eine
Exceldatei. Das ausschlaggebende ist hierbei die Lesbarkeit.
Binärdateien werden, wie der Name schon sagt, im Binärcode gespeichert.
Diese stellt eine Kombination von Einsen und Nullen dar. Diese Dateien
können normalerweise von einem Menschen nicht gelesen und verstanden werden,
da sie nur "wirre Zeichen" enthält. ASCII-Dateien hingegen
enthalten menschenlesbare Daten.
Diese können in einem Editor geöffnet und gelesen werden.
Es müssen sich allerdings nicht immer nur um lesbare Buchstaben handeln, auch
hier können sich Maschinenzeichen aufhalten. Allerdings liegen diese immer
im Rohformat vor. Es findet also eine Aufteilung nach Zeichen, Zeilen und
Absätzen statt.
Genau an diesem Punkt liegt das eigentliche Problem.
Damals, als die verschiedensten Betriebssysteme entwickelt wurden,
war man sich nicht so ganz einig, wie eine Textdatei auszusehen hat.
So wurden dann durch die Programmierer der verschiedenen Systemen
unterschiedliche Spezifikationen für Textdateien festgelegt.
Dass die Dateien infolge dessen nicht miteinander kompatibel sind,
ist dann ja wohl klar. Das größte Problem dabei ist der Zeilenumbruch.
Die Programmiersprachen kennen 3 verschiedene Arten dessen: CR, LF und NL.
Prinzipiell haben alle 3 Arten die gleiche Aufgabe. Der Cursor soll nach
Betätigen der Enter-Taste in die nächste Zeile springen.
Unter UNIX ist LF (linefeed, Zeilenvorschub) der Standard.
Sprich: alle Dateien die in der UNIX-Welt
(inbegriffen Linux) geschrieben wurden, sind miteinander kompatibel.
Unter Windows hingegen hat sich die Kombination LF und CR
(carriage return, Wagenrücklauf) durchgesetzt. Das hat zur Folge,
daß neben einer neuen Zeile auch noch ein neuer Absatz markiert wird.
Und um das Fass auch voll zu bekommen, ist man sich mit der Zeichenkette auch
nicht so ganz einig. Die Zeichen LF und NL sind gleich kodiert, haben jedoch
unter Umständen völlig unterschiedliche Bedeutungen.
Schlussfolgerung: Die Textdateien unterschiedlicher Betriebssysteme sind nicht
kompatibel. Kopieren sie Beispielsweise eine Textdatei von UNIX nach Windows,
können viele Windows-Texteditoren die Zeichen
nicht eindeutig verstehen und produzieren
eine falsche Darstellung. Sehr oft wird der Text in nur einer langen Zeile
dargestellt. Es ist zwar bei kurzen Texten möglich, dies manuell nachzuholen,
aber bei langen Texten wird das sehr schnell unübersichtlich
Bei diesen Problemen wird ein so genanntes Konvertierungsprogramm
verwendet.
Das ist eigentlich nicht weiter kompliziert, da lediglich die Zeichen
CR, LF und NL in das Zeichen des entsprechenden Betriebssystemes übertragen
wird.
Für den Datenaustausch wird meist ein FTP-Programm (File Transfer Protocol)
verwendet. Die neueren FTP-Programme haben eine Umschaltmöglichkeit zwischen
ASCII. und Binärmodus. Binärdateien werden hier unverändert übertragen,
wobei die ASCII-Dateien entsprechend konvertiert werden.
Allerdings wissen die FTP-Programme leider nicht, welche Ihrer Dateien in
welchem Format gespeichert sind. Das heißt, daß Sie bei jedem Transfer angeben
müssen, in welchen Format (ASCII oder Binär) die Datei vorliegt.
Sie können prinzipiell alle Dateien im Binär-Modus übertragen, nur bei
Textdateien müssen Sie auf den ASCII-Modus umschalten. Damit wird gewährleistet,
daß die Dateien auch konvertiert werden.
FTP dient primär dem Datenaustausch. Die Konvertierung der Zeilenenden
ist nur ein Nebeneffekt. Also, bitte darauf Acht geben ;-)
Sie können allerdings Dateien von einem UNIX-Server gerne auf einem Windows-PC
ablegen und Ihn zur späteren Weiterverarbeitung wieder aufrufen.
Allerdings darf dieser Text dann nur auf einem UNIX-System geändert werden.
Fazit: Wenn Dateien nur auf einem Windows-PC genutzt werden, dann spielt der
Speicherort überhaupt keine Rolle.
Denken Sie deshalb daran, unbedingt die Dateien zu konvertieren, wenn Sie eine
Textdatei auf einem anderen Computersystem nutzen wollen.
|