CSV Escape/Unescape si riferisce al processo di formattazione sicura o ripristino del testo in modo che possa essere correttamente memorizzato o letto da un file CSV (Comma-Separated Values). L'escape significa modificare i caratteri che potrebbero compromettere il formato CSV (come virgole, virgolette o caratteri di nuova riga), mentre l'unescaping significa riconvertirli nella loro forma originale durante la lettura dei dati.
Per prevenire errori quando i dati contengono virgole, virgolette doppie o interruzioni di riga, che sono speciali in CSV.
Per garantire la compatibilità con strumenti per fogli di calcolo (come Excel) o parser che seguono gli standard CSV.
Per preservare l'integrità dei dati, ad esempio assicurandosi che "Doe, John" venga trattato come un campo unico, non come due.
L'escape di solito comporta:
Raccogliere un campo tra virgolette doppie se contiene caratteri speciali.
Raddoppiare eventuali virgolette doppie interne (" → "") all'interno di tali campi.
L'unescape inverte questo processo durante la lettura: rimuove le virgolette esterne e sostituisce le virgolette doppie con un apice singolo.
Gli strumenti e le librerie CSV nella maggior parte dei linguaggi di programmazione (ad esempio Python, JavaScript, Excel) gestiscono questo problema automaticamente, ma è importante capire come e perché accade.
Quando si scrivono file CSV manualmente o tramite codice, soprattutto se i dati includono virgole, virgolette o interruzioni di riga.
Quando si analizzano dati CSV grezzi e si ha bisogno di estrarre valori di campo accurati.
Quando si garantisce la compatibilità tra sistemi tra diverse applicazioni o piattaforme che gestiscono CSV in modo diverso.