+filetype
Dateityp der Eingabedatei: CSV, TEXT, RECORD, oder HTML
Beschreibung
Legt das angenommene Dateiformat für das Lesen einer Eingabedatei fest.
Das Standardformat, wenn dieser Befehl nicht angegeben wird, ist CSV.
TEXT ist ein Textformat wie CSV, aber jede Zeile besteht aus der gleichen Anzahl von Feldern mit festen Feldlängen. Der Datensatz selbst hat daher auch eine feste Länge und endet mit einem oder zwei Zeilenumbruchzeichen (\r, \n).
Beim Lesen werden nachstehende Leerzeichen innerhalb der Datenfelder automatisch abgeschnitten.
Das Lesen einer TEXT Datei erfordert zusätzlich eine +fixed Anweisung, um die Feldlängen zu definieren.
RECORD hat feste Feldlängen wie TEXT, aber es gibt keinen Zeilenumbruch zwischen den Datensätzen. Jeder Datensatz hat ebenfalls die gleiche feste Länge, und die Datensätze folgen unmittelbar und aufeinander.
Beim Lesen werden nachstehende Leerzeichen innerhalb der Datenfelder automatisch abgeschnitten.
Das Lesen einer RECORD Datei erfordert zusätzlich eine +fixed Anweisung, um die Feldlängen zu definieren.
HTML findet eine HTML Tabelle auf einer Webseite oder in einer HTML Textdatei. Es extrahiert die Felddaten aus ihren <th> (Spaltennamen) und <td> (Spaltendaten) Feldern.
Vielleicht möchten Sie auch alle HTML Markierungen aus den Felddaten mit ±htmlstrip entfernen.
Muster
±filetype=Dateityp
Beispiele für die Verwendung
- csvfox infile.csv +filetype=csv (...)
- Geht davon aus, dass die zu lesende Datei CSV eine Datei CSV ist (Standard).
- csvfox infile.txt +filetype=text +fixed=2,35,35,35,35,10,4,18,8 +e=ASCII -e=UTF-8 outfile.csv
- Liest infile.txt in ASCII-Kodierung, als Datei mit festen Datensatz- und Feldlängen.
Schreibt alle Daten in outfile.csv als CSV Datei mit UTF-8 Kodierung.
Wichtig! +fixed definiert alle Feldgrößen und muss ebenfalls definiert werden!