【新智元导读】用英伟达的GPU,但可以不用CUDA?PyTorch官宣,借助OpenAI开发的Triton语言编写内核来加速LLM推理,可以实现和CUDA类似甚至更佳的性能。 试问,有多少机器学习小白曾被深度学习框架和CUDA的兼容问题所困扰? 又有多少开发者曾因为频频闪烁的警报「 ...
点击上方“Deephub Imba”,关注公众号,好文章不错过 !模型有 2 亿个参数,fp32 精度下理论上只需 800 MB。为什么 24 GB 的 GPU 却满了?原因在于模型参数只是训练期间占用 GPU ...
PyTorch 大牛 Horace He 突然官宣,加盟 Thinking Machines。 「在 Meta,离职时发布一张工牌照片是一种传统。遗憾的是,我找不到我的正式工牌了,所以只能用临时工牌代替」 毕业后,在 Meta 的 PyTorch 工作 4 年后,Horace He 终于决定换一种职业,探索一些新的事物。
PyTorch公开2024 H2发展路线图,增透明度。 【导读】最近,PyTorch团队首次公布了开发路线图,由内部技术文档直接修改而来,披露了这个经典开源库下一步的发展方向。 如果你在AI领域用Python开发,想必PyTorch一定是你的老朋友之一。2017年,Meta AI发布了这个机器 ...
AMD宣布ROCm和PyTorch支持已经开放给同是RDNA 3架构的RX 7900 XT显卡,涵盖了RDNA 3架构的所有顶级产品。 AMD上个月已经放出了Ubuntu Linux的ROCm 5.7.1驱动更新,为Radeon Pro W7900和Radeon RX 7900 XTX显卡带来了ROCm和PyTorch支持。而在12月初的AMD Advancing ...
管理委员会成员包括Meta、AMD、AWS、谷歌云、微软和英伟达。 最新消息,PyTorch现在已经从Meta“独立”出来了。 扎克伯格亲自宣布,PyTorch基金会已新鲜成立,并归入Linux基金会旗下。 其管理委员会成员,包括Meta、AMD、AWS、谷歌云、微软和英伟达。 Meta表示 ...
PyTorch,这一广受欢迎的开源机器学习框架,近期正式推出了其最新版本——2.8版。此次版本更新聚焦于提升量化大语言模型(LLM)在Intel CPU上的推理性能,吸引了众多开发者和研究人员的目光。 在PyTorch 2.8中,开发者团队通过算法优化和技术革新,显著提高了 ...
英特尔近日宣布将AI加速开源项目BigDL列入终止清单,该项目专注于在英特尔全系XPU上低延迟运行AI大语言模型。本周初,该项目仓库已标记为“不再由英特尔维护”,最终归档日期定为2026年6月30日,为用户提供约半个月迁移时间。BigDL曾集成TensorFlow、PyTorch等主流框架,支持CPU和GPU加速,并利用英特尔SGX和TDX技术保障大数据与AI安全。此举是英特尔收缩开源项目的持续行 ...
把此图的内容交给AI,结论就是:根据职位描述,该公司正在招聘一位深度参与芯片级硬件适配的PyTorch工程师,其核心工作是开发UMD交互接口。这表明公司的芯片项目已从概念或流片阶段,进入了软件栈深度集成与生态构建的关键时期,正全力打通“芯片-框架-应用”的全链路。 核心工作内容 框架架构与流程 深入理解PyTorch内部架构、计算图、算子调度等核心机制,确保框架在新硬件上高效运行。 硬件适配与UM ...
Hexagon‑MLIR是高通技术公司提供的开源AI编译器软件栈,确保用户能够在Hexagon NPU(为高性能、高效AI和生成式AI载荷构建的一款专用AI加速器)上轻松编译和运行Triton内核与PyTorch模型。 此项举措通过探索基于开源MLIR的编译软件栈来补充本公司的商业工具链,为 ...
在硅谷的科技版图上,一场引人瞩目的人才流动刚刚落下帷幕。曾经主导开发PyTorch框架的Soumith Chintala,在正式卸下“PyTorch之父”的头衔后,仅隔24小时便以惊人速度加入了一家名为Thinking Machines Lab(TML)的初创公司。这一举动不仅让行业震动,更被视为技术 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果