CSV-Escape/Unescape bezeichnet den Vorgang der sicheren Formatierung oder Wiederherstellung von Text, sodass dieser korrekt in einer CSV-Datei (Comma-Separated Values) gespeichert oder aus dieser gelesen werden kann. Escapen bedeutet, Zeichen zu ändern, die das CSV-Format beschädigen könnten (wie Kommas, Anführungszeichen oder Zeilenumbrüche). Aufheben des Escapens bedeutet, sie beim Lesen der Daten wieder in ihre ursprüngliche Form zu konvertieren.
Um Fehler zu vermeiden, wenn Daten Kommas, doppelte Anführungszeichen oder Zeilenumbrüche enthalten, die in CSV eine Besonderheit darstellen.
Um die Kompatibilität mit Tabellenkalkulationsprogrammen (wie Excel) oder Parsern sicherzustellen, die den CSV-Standards entsprechen.
Um die Datenintegrität zu wahren – beispielsweise um sicherzustellen, dass „Doe, John“ als ein Feld und nicht als zwei Felder behandelt wird.
Escape beinhaltet üblicherweise:
Ein Feld wird in doppelte Anführungszeichen gesetzt, wenn es Sonderzeichen enthält.
Innere doppelte Anführungszeichen (" → "") werden innerhalb dieser Felder verdoppelt.
Unescape kehrt diesen Vorgang beim Lesen um: Äußere Anführungszeichen werden entfernt und doppelte Anführungszeichen durch einfache ersetzt.
CSV-Tools und -Bibliotheken in den meisten Programmiersprachen (z. B. Python, JavaScript, Excel) verarbeiten dies automatisch. Es ist jedoch wichtig zu verstehen, wie und warum dies geschieht.
Beim manuellen oder programmgesteuerten Erstellen von CSV-Dateien, insbesondere wenn die Daten Kommas, Anführungszeichen oder Zeilenumbrüche enthalten.
Beim Parsen von CSV-Rohdaten und der Extraktion genauer Feldwerte.
Bei der Gewährleistung der systemübergreifenden Kompatibilität zwischen verschiedenen Anwendungen oder Plattformen, die CSV unterschiedlich verarbeiten.