jueves, 15 de mayo de 2008

El formato CSV

El formato CSV (del inglés comma-separated values) rfc4180, es un tipo de documento sencillo para representar datos en forma de tabla, en las que las columnas (campos) se separan por comas (o punto y coma en donde la coma es el separador decimal: España, Francia, Italia...) y las filas por saltos de línea.
Por ejemplo:

aaa,bbb,ccc CRLF
zzz,yyy,xxx CRLF
zzz1,yyy1,xxx1

La última fila puede no tener salto de linea. Los campos que contengan una coma, un salto de línea o una comilla doble deben ser encerrados entre comillas dobles.

"aaa","b CRLF
bb","ccc" CRLF
zzz,yyy,xxx

El formato CSV es muy sencillo y no indica un juego de caracteres concreto, ni cómo van situados los bytes, ni el formato para el salto de línea. Estos puntos deben indicarse muchas veces al abrir el archivo, por ejemplo, con una hoja de cálculo.