CSV escape/unescape odnosi się do procesu bezpiecznego formatowania lub przywracania tekstu, aby można go było poprawnie zapisać w pliku CSV (Comma-Separated Values) lub odczytać z niego. Ucieczka oznacza modyfikację znaków, które mogą uszkodzić format CSV (takich jak przecinki, cudzysłowy lub nowe linie), podczas gdy cofnięcie ucieczki oznacza konwersję ich z powrotem do ich oryginalnej formy podczas odczytu danych.
Aby zapobiec błędom, gdy dane zawierają przecinki, podwójne cudzysłowy lub podziały wiersza, które są specjalne w CSV.
Aby zapewnić zgodność z narzędziami arkuszy kalkulacyjnych (takimi jak Excel) lub parserami, które są zgodne ze standardami CSV.
Aby zachować integralność danych — na przykład zapewnić, że „Doe, John” jest traktowane jako jedno pole, a nie dwa.
Unikanie zwykle obejmuje:
Otoczenie pola cudzysłowami, jeśli zawiera znaki specjalne.
Podwojenie wszystkich wewnętrznych cudzysłowów (" → "") w tych polach.
Unikanie odwraca ten proces podczas odczytu: usuwa zewnętrzne cudzysłowy i zastępuje podwójne cudzysłowy pojedynczym cudzysłowem.
Narzędzia i biblioteki CSV w większości języków programowania (np. Python, JavaScript, Excel) obsługują to automatycznie, ale ważne jest, aby zrozumieć, jak i dlaczego tak się dzieje.
Podczas ręcznego lub programowego pisania plików CSV, zwłaszcza jeśli dane zawierają przecinki, cudzysłowy lub podziały wierszy.
Podczas analizowania surowych danych CSV i konieczności wyodrębnienia dokładnych wartości pól.
Podczas zapewniania kompatybilności międzysystemowej między różnymi aplikacjami lub platformami, które obsługują CSV w różny sposób.