TAG · #NVIDIA

#nvidia

30 条相关内容

HOTNESS

AI创新者采用Nvidia Vera——规模化下最大单线程CPU为何重要
4.0
Nvidia推出Vera CPU，以其强大的单线程性能在AI大规模计算场景中脱颖而出。文章探讨了为何在AI工作负载日益增长的背景下，高单线程性能的CPU对于数据中心的效率、吞吐量和低延迟至关重要。Vera的设计旨在满足下一代AI创新者对计算能力的需求。
hn2026年7月8日#科技
让AI燃烧吧
2.0
作者邀请读者订阅其付费通讯，年费70美元或月费7美元，每周可获得5000至18000字的深度分析内容，包括对英伟达、Anthropic等公司的详细研究报告。
wheresyoured-at2026年7月7日#科技
Blackwell上的矩阵乘法
4.0
本文为系列文章的第一部分，介绍了NVIDIA Blackwell架构上矩阵乘法的基本原理与实现方法。文章详细阐述了矩阵乘法在GPU计算中的核心地位，以及Blackwell架构如何针对该计算任务进行优化，为后续深入探讨性能调优技术奠定基础。
hn2026年7月3日#科技
NVCF：大规模部署和路由GPU加速的AI工作负载
4.0
NVCF 是 NVIDIA 推出的一个框架，用于大规模部署和路由 GPU 加速的 AI 工作负载。它提供了企业级的基础设施，帮助开发者高效管理计算资源，自动将任务调度到合适的 GPU 节点上，从而优化性能和资源利用率。
hn2026年7月3日#科技
Nvidia B300 vs H200：GPU规格与性能分析
2.0
本文对Nvidia B300与H200两款GPU的规格和性能进行了全面对比分析。文章详细比较了芯片架构、核心数量、显存配置、带宽等关键技术参数，并结合实际应用场景评估了训练和推理性能差异，帮助读者了解两款产品在不同工作负载下的表现优劣。
hn2026年7月3日#科技
DGX工作站与“前沿”模型，我的答案探寻之旅
3.0
本文探讨了NVIDIA DGX工作站如何赋能本地化前沿AI大模型的部署与运行。作者通过亲身实践，追寻关于本地AI推理能力、模型性能边界以及企业级AI基础设施的答案，揭示了DGX在多模态和内存密集型AI工作负载中的关键作用。
hn2026年7月3日#科技
130万美元盗窃案暴露AI的盲点
4.0
一起价值130万美元的货运盗窃案揭示出人工智能基础设施中存在的安全盲点。尽管AI系统在数字领域拥有强大的监控和分析能力，但在物理供应链安全方面仍存在明显漏洞。此事件凸显了企业在部署AI技术时，必须同时关注实体资产保护的脆弱环节。
hn2026年7月2日#科技
Blackwell 上的矩阵乘法
4.0
本文是系列文章的第一部分，介绍 NVIDIA Blackwell 架构上矩阵乘法的实现与优化。文章深入探讨了 Blackwell 的计算能力、内存层次结构以及如何利用这些特性高效执行矩阵乘法运算，为后续更详细的技术讨论奠定基础。
hn2026年7月2日#科技
英伟达自嘲糟糕产品发布（2003年）
3.0
这是一段英伟达在2003年制作的自嘲视频，以幽默方式调侃了一次失败的显卡产品发布。视频中Nvidia以夸张的戏剧化手法，讽刺了产品发布时可能出现的各种尴尬状况，展现了这家科技巨头难得的自黑精神和对自身失误的坦然态度。
hn2026年7月2日#科技
新加坡因英伟达芯片走私案没收价值4200万豪宅
6.0
新加坡当局在一起涉及英伟达芯片走私的案件中，没收了一栋价值4200万美元的豪宅。该案件与试图向受制裁国家非法出口尖端半导体有关，新加坡正加大力度打击利用其金融中心地位进行的违禁芯片贸易。
hn2026年7月2日#科技
英伟达向初创客户提供用算力置换收入分成的机会
4.5
英伟达（Nvidia）正在为其初创公司客户提供一种新的合作模式：用计算能力换取收入分成。这一举措旨在降低AI初创企业的前期成本门槛，同时让英伟达能够从其投资的生态系统中获得长期回报。通过这种收入共享协议，初创公司可以在不立即支付高昂算力费用的前提下，获得所需的GPU计算资源。
hn2026年7月2日#科技
基于单目视频的生成式动态高斯重建
5.0
本文提出一种从单目视频中重建动态3D场景的新方法，通过生成式动态高斯表示（Generative Dynamic Gaussian Representation）结合运动先验，实现高保真的动态场景重建与新视角合成。该方法能够有效处理大范围运动和复杂变形，在多个基准测试上优于现有技术。
hn2026年7月2日#科技
矿工眼中的英伟达
1.0
本文从加密货币矿工的视角，深入分析了英伟达（Nvidia）在挖矿浪潮中的角色与影响。作者结合自身经历，探讨了GPU供需失衡、矿工与游戏玩家的矛盾，以及英伟达在应对市场需求时的策略转变。文章揭示了加密货币热潮如何重塑硬件市场格局，并为关注科技产业链的读者提供了独特的观察角度。
hn2026年7月2日#科技
过去100年最佳投资？几乎全是科技公司。
4.0
一项对过去一个世纪股市表现的分析显示，长期回报最高的公司几乎全部来自科技行业，包括苹果、英伟达、特斯拉和SpaceX等。这些企业的成功不仅推动了市场增长，也改变了全球经济和投资者格局。
hn2026年7月1日#商业
使用 NVIDIA GQE 设计 GPU 加速的查询引擎
4.0
NVIDIA GQE（GPU 查询引擎）是一个开源 C++ 库，旨在帮助开发者构建 GPU 加速的查询引擎。它提供了一套高效的数据处理原语和操作符，能够充分利用 GPU 的并行计算能力来加速 SQL 查询和大规模数据分析任务。本文介绍了 GQE 的核心架构、关键特性以及如何将其集成到现有查询引擎中，从而实现显著的性能提升。
hn2026年7月1日#科技
Nvidia复活旧款显卡，内存需求推高技术价格
3.0
面对日益增长的内存需求对硬件价格的影响，Nvidia重新推出多款旧版显卡，包括RTX 3060等型号。这一"内存末日"式的策略反映出市场对高性价比GPU的迫切需求，同时也揭示了内存价格波动如何持续塑造整个科技行业的定价格局。
hn2026年6月30日#科技
DGX Spark 对比 Mac Studio 与 Halo
0.5
本文对比了 NVIDIA DGX Spark、Apple Mac Studio 和 Halo 三款高性能计算设备，从性能、价格、生态系统和适用场景等方面进行分析，帮助用户根据自身需求做出选择。DGX Spark 专注于 AI 和深度学习任务，Mac Studio 则在创意工作流中表现出色，而 Halo 作为新兴竞争者提供了独特的性价比优势。
hn2026年6月30日#科技
台湾扩大英伟达芯片走私调查，超微电脑办公室遭搜查
6.5
继美国对中国出口管制升级后，台湾当局近期扩大了对英伟达（Nvidia）高端芯片走私的调查范围。超微电脑（Super Micro）在台湾的办公室遭到搜查，突显半导体供应链在地缘政治紧张局势下的敏感性。此举表明台湾正在加强执行芯片出口限制措施，防止受管制的先进芯片通过非法渠道流入中国大陆。
hn2026年6月30日#科技
华尔街押注美光科技是下一个英伟达AI赢家
3.0
华尔街分析师认为，美光科技（Micron）有望成为人工智能芯片领域的下一个英伟达（Nvidia）。随着AI对高带宽存储器（HBM）需求的激增，美光凭借其先进存储技术，正成为AI硬件产业链中的关键受益者。投资者开始将目光从GPU制造商转向存储芯片巨头，期待美光在AI浪潮中复制英伟达的增长奇迹。
hn2026年6月29日#科技
贝莱德、英伟达与淡马锡为何斥资数十亿美元押注量子计算
7.5
贝莱德、英伟达与淡马锡等全球顶尖投资与科技巨头正投入数十亿美元，押注量子计算的商业化前景。量子计算因其在药物研发、密码学和材料科学等领域的颠覆性潜力而备受瞩目。文章分析了这一巨额投资的背后逻辑及其对科技竞争格局的深远影响。
hn2026年6月29日#科技
英伟达CEO黄仁勋称Fireworks为AI工厂中的台积电
3.0
英伟达CEO黄仁勋将AI推理初创公司Fireworks比喻为AI工厂中的台积电，强调其在AI模型部署和推理优化方面的关键作用。他认为Fireworks就像台积电在芯片制造领域的地位一样，为AI行业提供了高效的基础设施服务。这一比喻凸显了AI生态系统中专业化服务提供商的重要性。
hn2026年6月29日#科技
运行 CUDA 内核时会发生什么？
2.0
本文深入探讨了运行 CUDA 内核时 GPU 内部发生的底层细节，从主机端调用到线程在流式多处理器（SM）上的调度与执行。文章解释了网格、线程块与 warp 的概念，以及内存层次结构（全局内存、共享内存、寄存器）如何协同工作。作者通过逐步拆解，帮助读者理解 GPU 并行计算的真实运作机制。
hn2026年6月29日#科技
英伟达合作伙伴计划将价值15万美元的AI数据中心放在你家院子里
3.0
英伟达的一家合作伙伴企业正计划推出一款名为"Project Sparks"的微型AI数据中心，售价约15万美元，可安装在住宅庭院中。该设备旨在为家庭或小型企业提供本地化AI计算能力，减少对云端服务的依赖。这款紧凑型数据中心将搭载英伟达的GPU，能够处理推理、模型微调等AI任务，为边缘计算场景提供高性能解决方案。
hn2026年6月28日#科技
关于2026年英伟达费曼架构，我们了解多少？
4.0
英伟达下一代的GPU架构代号为“费曼”（Feynman），预计将在2026年发布。该架构以著名物理学家理查德·费曼命名，据传将在AI计算性能、能效比和内存带宽方面实现重大突破。目前已知的信息包括：可能采用全新的SM（流式多处理器）设计、更先进的制程工艺，以及针对大语言模型训练和推理的专用硬件优化。社区正在密切关注相关泄露信息和官方预告。
hn2026年6月28日#科技
微型LLM基准测试：Jetson Orin Nano Super 8GB
4.0
本文对搭载8GB内存的Jetson Orin Nano Super开发板进行了非推理场景下的微型语言模型基准测试。通过在不同参数规模和任务上评估模型性能，展示了这款边缘计算设备在运行轻量级LLM时的实际吞吐量和延迟表现，为嵌入式AI应用提供了重要参考数据。
hn2026年6月28日#科技
多GPU节点配置工具
0.0
该工具用于配置和设置NVIDIA NVSwitch多GPU节点，简化了在集群环境中管理GPU互联的流程。通过该工具，用户可以更高效地初始化、验证和调试多GPU系统的拓扑连接。
hn2026年6月27日#科技
过去100年最佳投资？几乎全是科技公司
3.0
一项分析显示，在过去一个世纪中，表现最好的投资标的几乎全部来自科技行业，包括苹果、英伟达、特斯拉和SpaceX等公司。这些企业的股价回报远超其他传统行业，反映了科技创新在推动经济增长和财富创造中的核心作用。研究指出，长期持有科技龙头股的投资者获得了惊人的复利回报。
hn2026年6月26日#科技
异步GPU中计算与内存的解耦
3.5
这是一个优秀的开源项目，为支持异步内存操作的NVIDIA GPU（如Hopper架构）引入了一种新的编程模型，实现了计算与内存的解耦。相比当前最先进方案，性能提升12%，内核代码减少67%。相关论文《VDCores: Resource Decoupled Programming and Execution for Asynchronous GPU》发表于arXiv:2605.03190。
hn2026年6月25日#科技
英特尔正在给预算有限的玩家提供Nvidia和AMD不愿给的东西
3.0
在Nvidia和AMD专注于高端显卡市场时，英特尔正瞄准预算有限的游戏玩家，提供他们真正需要的性价比产品。这篇文章探讨了英特尔如何通过其Arc系列入门级显卡，填补了中低端市场的空白，为预算有限的玩家带来了更具竞争力的选择。
hn2026年6月24日#科技
Nvidia的45°C冷却设计将数据中心用水量降至接近零
6.0
英伟达推出创新的45°C液冷设计方案，旨在将AI工厂数据中心的用水量降低到接近零。与传统冷却系统不同，该方案利用更高温度的冷却液，大幅减少甚至消除对水的依赖，同时提升散热效率。这一突破对于推进可持续AI基础设施建设具有重要意义，既降低了运营成本，也减轻了对环境的影响。
hn2026年6月24日#科技

加载下一批 30 条更新于 —