Hallo,
ich habe unter Linux ein tar Archiv erstellt. Etliche gepackte Dateien haben einen Umlaut im Dateinamen.
Gibt es nun unter Windows 10 eine Möglichkeit dieses tar Archiv zu entpacken, so dass auch die Umlaute in den Dateinamen nicht kaputt gehen?
Ich habe es erstmal mit 7zip versucht, Umlaute sind hier korrupt nach dem Entpacken
Danke
Seite 1 von 1
tar Datei (gepackt unter Linux UTF8) auf Windows entpacken (Umlaute)
Anzeige
#2
geschrieben 12. August 2015 - 15:47
Wenn das Zeichenformat UTF-8 ist, dann wird das auch unter Windows so klappen, wie gewünscht.
Wenn aber nicht... dann muß man zuerst herausfinden, was genau das Zeichenformat war, und dann mit entsprechenden Kommandozeilenoptionen hantieren. Notfalls über die Regionaleinstellungen die passende Zeichentabelle anstellen.
Windows-1252 und MS-ANSI wird auf deutschen Windowsen noch automatisch konvertiert, das kann Windows selber. Mit KOI-8 und Shift-JIS und so weiter sieht das aber natürlich anders aus und mit ISO-8859-nicht-1-oder-15 auch.
Wenn aber nicht... dann muß man zuerst herausfinden, was genau das Zeichenformat war, und dann mit entsprechenden Kommandozeilenoptionen hantieren. Notfalls über die Regionaleinstellungen die passende Zeichentabelle anstellen.
Windows-1252 und MS-ANSI wird auf deutschen Windowsen noch automatisch konvertiert, das kann Windows selber. Mit KOI-8 und Shift-JIS und so weiter sieht das aber natürlich anders aus und mit ISO-8859-nicht-1-oder-15 auch.
#3
geschrieben 12. August 2015 - 15:57
Wie gesagt, mein Linux ist definitiv UTF-8. Da habe ich die TAR file erstellt auf der Konsole.
Jetzt unter Windows 10 klappt das Entpacken (mit 7-Zip) eben nur mit kaputten Umlauten.
Wie würden unter Windows 10 die notwendigen Befehle/Optionen aussehen, um das zu prüfen?
Danke
Jetzt unter Windows 10 klappt das Entpacken (mit 7-Zip) eben nur mit kaputten Umlauten.
Wie würden unter Windows 10 die notwendigen Befehle/Optionen aussehen, um das zu prüfen?
Danke
#4
geschrieben 13. August 2015 - 10:08
Ich habe es dann über ein python Skript geschafft, die tar Datei mit korrekten UTF-8 Dateinamen zu entpacken
(weitere Schwierigkeit hierbei war, dass im tar Archiv auch Dateinamen mit ":" vorkamen -von wine- und dies unter Windows zum Abbruch führte)
Mein verwendetes Skript:
(weitere Schwierigkeit hierbei war, dass im tar Archiv auch Dateinamen mit ":" vorkamen -von wine- und dies unter Windows zum Abbruch führte)
Mein verwendetes Skript:
import tarfile archive_name = "backup_home.tar" tar = tarfile.open(name=archive_name, mode='r', bufsize=16*1024) intab = ":" outtab = "_" for m in tar.getmembers(): # : zu _ abändern m.name = m.name.translate({ord(x): y for (x, y) in zip(intab, outtab)}) tar.extractall('D:\\Backup') tar.close()
#5
geschrieben 13. August 2015 - 15:22
.... das hat dann aber nichts mit Unicode zu tun, sondern mit unter Windows nicht zulässigen Zeichen im Dateinamen.
Unixoiden lassen so ziemlich alles zu. Unter Windows gehen Zeilenumbrüche, Doppelpunkte, Fragezeichen, Slashes jeder Ausrichtung, kleiner- und größer-als-Zeichen sowie der Pipe-Character und doppelte Anführungszeichen nicht in den Dateinamen zu packen. Das müßtest Du immer beachten, wenn Du von Unixoiden nach Windows portieren willst.
Unixoiden lassen so ziemlich alles zu. Unter Windows gehen Zeilenumbrüche, Doppelpunkte, Fragezeichen, Slashes jeder Ausrichtung, kleiner- und größer-als-Zeichen sowie der Pipe-Character und doppelte Anführungszeichen nicht in den Dateinamen zu packen. Das müßtest Du immer beachten, wenn Du von Unixoiden nach Windows portieren willst.
Thema verteilen:
Seite 1 von 1