4位浮点数FP4
2.0文章回顾了浮点数位宽从32位到64位的演变历史,并探讨了当前AI硬件中使用的4位浮点数FP4格式。这种极低位宽的浮点格式在保持一定精度的同时,显著提升了计算效率和内存利用率。
30 条来自 johndcook-com 的内容
文章回顾了浮点数位宽从32位到64位的演变历史,并探讨了当前AI硬件中使用的4位浮点数FP4格式。这种极低位宽的浮点格式在保持一定精度的同时,显著提升了计算效率和内存利用率。
本文探讨了NF4等4位浮点格式及其更高精度变体,这些是bitsandbytes库中常见的4位数据类型。当从Hugging Face下载量化到4位的LLM权重时,它们可能采用NF4或FP4格式。
本文进一步探讨牛顿直径定理,该定理描述了n次多项式曲线与平行线相交的性质,并计算这些交点中点的轨迹。作者通过具体例子展示了如何应用这一定理来分析五次曲线。
本文讨论了嵌入式正则表达式修饰符如何通过在正则表达式内部放置标志来解决环境复杂性,而不是在外部设置。作者认为使用正则表达式最困难的部分不是编写表达式本身,而是不同实现之间的语法差异和环境配置问题。
本文介绍了如何使用comm工具在命令行中执行集合运算,包括交集和差集操作,同时指出了该工具需要输入文件排序且语法难记的局限性。
门捷列夫除了创立元素周期表外,还发现了一个有趣的数学定理。他从插值问题出发,推导出关于多项式及其导数的定理,这一成果后来被Boas等学者引用和推广。
本文探讨了由门捷列夫发现、马尔可夫推广的不等式:若P(x)是n次实多项式且在[-1,1]上满足|P(x)|≤1,则|P'(x)|≤n²。对于三角多项式,伯恩斯坦证明该界可从n²降至n。
理查德·费曼曾说,几乎所有事物深入探究都会变得有趣。查表看似枯燥,但当你深入探究如何填补数值间隙时,它便变得有趣起来。本文探讨了如何通过插值方法从有限精度的表格中提取更高精度的函数值。
勒贝格常数是插值误差界中的关键常数,它依赖于被插值函数f和插值点的分布。在n阶插值中,误差界的形式为c(h+δ),其中h是插值点间距,δ是表格值误差。
本文探讨当计算器或数学库仅支持实变元时,如何利用实函数计算复变元三角函数,如sin(3+4i)。通过欧拉公式和双曲函数,可将复变元三角函数分解为实部与虚部的实函数组合。
作者在电商平台购物时遇到产品相关问题,尝试使用AI购物助手寻求解答,却未能获得预期答案。这反映了当前AI工具在处理特定、复杂查询时的局限性。
彼得·沃格尔在X上分享了一幅莫尔斯电码解码决策树图像,其独特的紧凑形状引人注目,与通常分散布局的决策树形成鲜明对比。
作者对量子计算的实用性持怀疑态度,但警告说如果量子计算在人类未做好准备前实现,可能导致全球金融系统崩溃。尽管量子计算机已存在,但何时能实用仍是未知数。
五边形数实际上是截断的三角形数。通过将第n个五边形数的图示变形,可以得到第(2n-1)个三角形数图示的底部部分。如果在右侧图像底部添加第(n-1)个三角形数的图示,就能完整展示这种数学关系。
Artemis II任务昨日发射,其目标与1968年的阿波罗8号相似:绕月飞行,为未来的登月任务做准备。与阿波罗13号类似,该任务将绕月飞行而不进入月球轨道。
作者在一本旧几何书中发现了球面三角学纳皮尔记忆法的双曲类比。虽然双曲几何中确实存在各种类比,但作者此前从未想过这一点,因此感到惊讶。球面版本因其广泛应用而著名,而双曲版本则相对鲜为人知。
文章探讨了"perilune"(近月点)和"periselene"这两个术语的起源,前者源自拉丁语,后者源自希腊语,均用于描述航天器最接近月球的位置。
本文通过更新平均成绩这一简单问题,探讨了贝叶斯统计与卡尔曼滤波的基本原理。假设已知前n次测试的平均分,当获得第n+1次成绩时,如何更新总体平均值的估计。
保持HIPAA合规性的最佳方式是在本地硬件上运行AI,而不是将受保护的健康信息传输到远程服务器。虽然存在符合HIPAA的云选项,但它们既限制多又昂贵。
兰道尔原理给出了擦除一比特信息所需能量的下限:E ≥ log(2) kB T,其中kB是玻尔兹曼常数,T是环境温度(开尔文)。该下限适用于比特的任何物理存储方式,而Toffoli门作为可逆逻辑门,理论上可以实现无能量损耗的计算。
本文对比了Artemis I与Artemis II的轨道差异:Artemis I作为无人任务,在太空中停留了25天,其轨道路径比仅需10天的Artemis II更为复杂有趣,涉及多体引力问题。
安德利卡猜想指出:连续素数的平方根之差小于1。该猜想已在高达2×10¹⁹的素数范围内得到经验验证,若成立则意味着相邻素数之间的最大间隔存在上界。
本文介绍了一种生成随机分形的过程:首先在六边形内随机选择一个点c,然后在每一步随机选择六边形的一条边,构造该边与点c形成的三角形,并将c更新为新三角形的中心,如此迭代生成分形图案。
吉萨金字塔所在的纬度29.9792458°N恰好与真空中的光速299,792,458米/秒的数字序列相同,这一巧合引发了关于古代文明是否掌握先进知识的讨论,但更可能只是数字上的偶然对应。
本文探讨了分数十进制表示中数字的分布规律,展示了即使是数学基础领域也存在鲜为人知的数学现象,例如当分母p>5时分数小数展开中数字出现的统计特性。
东正教复活节与西方复活节日期不同,因为东正教使用儒略历计算,而西方使用格里高利历。复活节是春分后第一个满月后的第一个星期日,两种历法差异导致日期可能相差最多五周。
复活节日期的确定依据春分后的第一个满月后的第一个星期日,这涉及到罗马历法与犹太阴阳历的转换。文章探讨了月球周期近似值在历法计算中的应用。
Andrzej Odrzywolek最近在arXiv上发表文章表明,仅需函数和常数1即可获得所有初等函数。论文展示了如何从eml函数引导出加法、减法、乘法和除法运算。
本文探讨了如何找到一条通过两个给定点且在这些点处具有指定斜率的抛物线,这一概念与三角形几何中的Artzt抛物线相关。文章从圆锥曲线的一般形式出发,推导出满足特定条件的抛物线方程。
通过测量到卫星的距离,可以计算出经过你当前位置的圆形轨迹。这是因为你处于地球表面和以卫星为中心、半径为d的球体这两个球体的交点上,而两个球体的相交形成一个圆。