Этот международный стандарт определяет формат файла WARC:
——для хранения как содержимого полезной нагрузки, так и управляющей информации из основных протоколов уровня интернет-приложений, таких как HTTP, DNS и FTP;
——для хранения произвольных метаданных, связанных с другими хранимыми данными (например, классификатором предметов, обнаруженный язык, кодирование);
——для поддержки сжатия данных и поддержания целостности записи данных;
——для хранения всей управляющей информации из протокола сбора данных (например, заголовков запросов), а не только информации ответа;
——для хранения результатов преобразований данных, связанных с другими сохраненными данные;
——для хранения события обнаружения дубликата, связанного с другими сохраненными данными (чтобы уменьшить объем хранения в памяти).