Если не ошибаюсь, время выполнения команды составляет 3 такта. Это означает, что можно вычислять CRC32 еще в 1.78 раза быстрее. Но есть несколько минусов:
SSE 4.2 реализован далеко не в каждом процессоре.
Выбранный Intel многочлен великолепен с математической точки зрения, но архиваторы используют другой многочлен. У программиста же возможность изменить запаянный в процессор многочлен отсутствует.
Для программиста, на мой взгляд, более актуальна реализация в железе CRC64.
Инструкция CRC32 в SSE 4.2
Если не ошибаюсь, время выполнения команды составляет 3 такта. Это означает, что можно вычислять CRC32 еще в 1.78 раза быстрее. Но есть несколько минусов: