🧮 DEC64：不归一化的64位十进制浮点引发性能与标准之争

23 184 天前 crockford.com

🧮DEC64：不归一化的64位十进制浮点引发性能与标准之争

把不归一化的 DEC64 当作唯一数值类型，明智吗？

🎯 讨论背景

这是对一篇介绍 DEC64（文章提出的一种 64 位十进制浮点表示）的 Hacker News 讨论的汇总。评论回顾了历史上的十进制实现（如 Atari/6502 的 BCD 模式）、现存标准（IEEE 754 对 decimal32/64/128 的 BID/DPD 编码）以及主流语言和库的做法（例如 C# 的 96+32 结构、Python 的可变整数元组和已有的 Decimal128 实现）。讨论建立在对浮点设计权衡的先验认知上——归一化对比较的重要性、整数路径的特判会如何影响非整数性能、以及硬件特性（如 SIMD 和运行时整数优化）如何改变实际可用性。总体争论集中在兼顾标准兼容、性能（特别是非整数场景）和实际应用需求（如金融计算、内存/带宽约束）上的设计取舍。

📌 讨论焦点

设计缺陷与比较复杂性

评论强烈指出 DEC64 不做数值归一化（normalization），这会让比较操作变得复杂且低效，因为比较通常需要把两个数规范到相同的指数后再比大小。实现者对整数参数做了特判以优化常见整数量级路径，但评论认为这只是掩盖问题：一旦遇到非整数，额外分支与复杂逻辑会显著降低性能。有人补充运行时（如 JavaScript 引擎）通过将小整数表示为原生整数来优化整数路径，但这并不能消除 DEC64 在非整数场景中的慢速和可观察性差异。整体观点是：若要把 DEC64 当作“唯一数值类型”，必须在归一化和非整数性能上做出更充分的设计权衡。

[来源1] [来源2] [来源3] [来源4]

标准与已有十进制浮点格式比较

有评论指出已有标准化的十进制浮点实现：IEEE 754 为 decimal32/decimal64/decimal128 规定了两种编码（BID 与 DPD），而文章中的表示并非这两者之一。许多语言库采用显式的 significand+exponent 设计，表现更接近可变指数的定点（fixed-point）表示：比如 C# 使用 96+32 位结构，Python 使用可变长整数元组来表示小数。因此 DEC64 并非唯一或标准的方案，文章提出的表示是对实现复杂度、空间效率的一个折中，适合“多数为定点数据”的场景但并非通用标准替代品。还有人直接指出已存在的 Decimal128 等实现可以满足需要，不必从零开始设计新格式。

[来源1] [来源2]

历史实现与 BCD 硬件先例

评论中提到早期家用机和 CPU 已有类似的十进制实现：Atari 8-bit BASIC 使用过类似结构，带有归一化并使用 BCD（Binary-Coded Decimal）表示十进制位。Atari 的实现只有 10 个 BCD 位（5 字节）和 2 位指数（1 字节），更像是一个 DEC48 风格的表示；这种设计受限于当时内存并借助 6502 的 BCD 算术模式（ADC、SBC 等指令）来保持进位与标志位。还有评论者一开始误以为文章要讨论 DEC（Digital Equipment Corporation）旧机的浮点格式，显示出对历史上下文的不同期待。总体来看，十进制与 BCD 在嵌入式与历史平台上确有先例，但现代实现面临不同的性能与标准化要求。

[来源1] [来源2]

应用场景与硬件折衷（内存、SIMD、金融）

有人强调使用更窄的十进制或二进制浮点（如 16/32 位）带来的内存和带宽优势并非徒然，在大量数据或向量计算中能显著提升吞吐量。评论特别指出没有 SIMD 支持时，DEC64 很难在许多高性能应用中替代现有表示；而在有向量化支持的情况下，窄类型可以翻倍提升 SIMD 吞吐。因此 DEC64 或类似十进制格式在金融计算等要求十进制精确性的领域更有吸引力，但它是否适合作为通用“唯一数值类型”还需考虑硬件向量化和实际工作负载的平衡。少数评论表现出对在语言里直接采纳此类类型的期待，但被性能和标准兼容性问题所制约。

[来源1] [来源2] [来源3]

📚 术语解释

DEC64: 本文讨论的一种 64 位十进制浮点表示提案，强调空间效率与整数路径优化，但与 IEEE 754 的 decimal64 标准不同，并且实现上不做常规的归一化处理。

BID / DPD: IEEE 754 对十进制浮点规定的两种编码方式：BID（Binary Integer Decimal）和 DPD（Densely Packed Decimal），用于 standard decimal32/decimal64/decimal128 的位级表示。

significand + exponent: 一种常见的十进制数表示法：用一个整数 significand（有效数字）和一个可变指数（exponent）表示值，许多语言库用此模型实现可变精度十进制，行为更接近可变小数点（variable fixed-point）。

BCD（Binary-Coded Decimal）: 二进制编码十进制的一种方式，用若干二进制位表示每个十进制数位；历史上在 6502 等 CPU 的十进制模式和 Atari 8-bit BASIC 中常见，可用在无需二进制浮点的精确十进制计算场景。

SIMD: Single Instruction Multiple Data，一类向量化指令集，可以并行处理多条数据通道；数值类型的宽窄直接影响 SIMD 吞吐和内存带宽利用率。

原文链接 Hacker News 讨论

Programming Systems DEC64 Decimal Floating Point Douglas Crockford JavaScript Decimal128

News Hacker｜极客洞察