logo
 
?

базовую стратегию блекджека

Разбор файла Comma Separated Value (CSV) поначалу кажется достаточно простым.

Однако эта задача весьма быстро становится все более сложной по мере того, как проясняются болевые точки CSV-файлов.

Если вы не знакомы с этим форматом, то CSV-файлы хранят данные в виде чистого текста. В каждой записи есть поля, обычно отделяемые запятыми, отсюда и произошло название формата — значения, разделенные запятыми.

Сегодня разработчики используют стандартные форматы для обмена данными.

Формат CSV восходит к ранним временам программной индустрии еще до появления JSON и XML.

Хотя существует документ RFC (Request for Comments) для CSV-файлов (bit.ly/1Ns Qlvw), он не имеет официального статуса.

Кроме того, он был создан в 2005 году, десятилетия спустя после того, как CSV-файлы начали появляться еще в 1970-х.

В итоге существует довольно много вариаций CSV-файлов, и правила не совсем внятны.

Например, поля CSV-файла могут разделяться табуляторами, точками с запятой или любым символом.

На практике стандартом де-факто стала Excel-реализация импорта и экспорта CSV, и именно она чаще всего встречается в индустрии — даже за пределами экосистемы Microsoft.

Соответственно предположения, которые я допускаю в этой статье о «корректном» разборе и форматировании, будут базироваться на том, как Excel импортирует/экспортирует CSV-файлы.

Большинство CSV-файлов отвечают реализации в Excel, тем не менее, таковыми являются не все файлы.