Open links in new tab
  1. DeepSeek 绕开 CUDA 垄断,针对英伟达 PTX 进行优化实现最大性能, …

    Feb 2, 2025 · 你以为的:DeepSeek 绕过 CUDA 使用 PTX。 实际上的:DeepSeek 通过在 CUDA 代码里塞入一堆 PTX 代码来优化 CUDA 性能,然后和其他现成 CUDA 工具链结合,在可接收的开发时 …

  2. GPU国产化了还能用CUDA吗或者有类似的库吗? - 知乎

    国产GPU厂商非常清楚,当今的AI和高性能计算(HPC)世界是建立在CUDA之上的。 如果要求所有开发者抛弃数十年积累的CUDA代码,去学习一个全新的编程语言,那将是“生态自杀”。 因此,“国产 …

  3. 英伟达的cuda是什么东西? - 知乎

    你平时看到的 __global__ 、 threadIdx 、 cudaMalloc,只是整个 CUDA 平台最底层的一部分,随着时间推移, CUDA 平台 的范围不断膨胀, 原先首字母缩略词所代表的字面含义,已经很难再准确描述如 …

  4. 如何评价华为昇腾的 AscendC 编程语言,和 CUDA 相比有那些优劣? …

    一三二、Ascend C与CUDA C使用的比较 上周五去北京,拜访华为的金融军团,讨论如何把我在Nvidia GPU上开发的金融高速模拟代码,移植到华为的升腾AI芯片上运行。刚好这就是题主邀我回答的问 …

  5. 如何系统地学习CUDA? - 知乎

    于是,我决定将自己先前整理的CUDA-Learn-Notes笔记,继续扩展,经过将近一年的业余时间的努力,终于达到了我认为可以开写CUDA基础系列笔记的状态。 材料准备好了,25年继续更新笔记,保 …

  6. NVIDIA-SMI 显示的cuda version 是指当前版本还是最大可以支持的 …

    显卡驱动和CUDA的关系 [1] 很多人可能会疑惑,nvidia-smi中有一个CUDA版本,而nvcc也显示一个CUDA版本,而且这2个CUDA版本有时候还不一致,这是为什么呢? 上面这张图对这个问题进行了 …

  7. 5070 Ti 会成为 50 系显卡中性价比最高的吗,抛开 DLSS 能和 4080S 打 …

    Feb 20, 2025 · 所以RTX5070Ti称得上是RTX50系显卡里面性价比最高的一款产品的概率非常大: RTX5080贵了2000块的基础上,首次打不过上代RTX4090,对于5070Ti的帧率优势也很有限 …

  8. CUDA 11.4 有什么新功能? - 知乎

    CUDA 11.4此版本包括 GPU – 加速库、调试和优化工具、编程语言增强功能,以及一个运行库,用于跨 CPU 主要体系结构( x86 、 Arm 和 POWER )在 GPU 上构建和部署应用程序。 CUDA 11 . 4 专注 …

  9. 如何评价 Sakana AI 推出的 AI CUDA Engineer? - 知乎

    Feb 21, 2025 · 技术报告里有这么一个被优化后比compile speedup 一百多倍的下三角矩阵乘法的算子,我给看官们解析一下笑点在哪里: 在kernel里面,使用的是二维block config,分别表示矩阵的row …

  10. 为什么常见的深度学习软件都只支持CUDA,难道AMD显卡不值得用AI …

    Nvidia在深度学习领域的投入较早,一些常见的深度学习框架如TensorFlow、PyTorch等最初开发时选择了支持CUDA,因此这些框架的生态系统中的大部分资源和库也是基于CUDA进行优化和开发的。 所 …