«Как я случайно написал самый быстрый CSV-парсер на C#»
Традиционные ASCII-символы в UTF-8 сохраняют своё исходное однобайтовое представление.
Если сканировать эти значения напрямую, открывается окно для серьёзной оптимизации при обработке текста.
Серия экспериментов с таким побайтовым подсчётом привела к созданию кастомного CSV-парсера. По скорости работы он уверенно держится на уровне устоявшихся решений, а в ряде сценариев даже превосходит их.
Никакой алгоритмической магии, только предельно прагматичная эксплуатация стандартов.
Обсуждение 2
Обсуждение не доступно в веб-версии. Чтобы написать комментарий, перейдите в приложение Telegram.
Обсудить в Telegram