该芯片在求解大规模MIMO信号检测等关键科学问题时,计算吞吐量与能效较当前顶级数字处理器(GPU)提升百倍至千倍。
这一成果标志着我国突破模拟计算世纪难题,在后摩尔时代计算范式变革中取得重大突破,为应对人工智能与6G通信等领域的算力挑战开辟了全新路径。
研究方法
据了解,我们熟悉的通信基站信号处理、AI大模型训练参数优化等,本质都是在解复杂的矩阵方程。采用数字方法实现高精度矩阵求逆的计算开销极大,耗时长、能耗高。
于是,模拟计算进入研究视野,它直接利用物理定律实现并行运算,延时低、功耗低,在算力瓶颈背景下,具有先天优势。
但如何让模拟计算兼具高精度与可扩展性,从而在现代计算任务中发挥其先天优势,一直是困扰全球科学界的世纪难题。
孙仲团队选择了一条融合创新的道路,通过新型信息器件、原创电路和经典算法的协同设计,构建了一个基于阻变存储器阵列的高精度、可拓展的全模拟矩阵方程求解器,首次将模拟计算的精度提升至24位定点精度。
高精度全模拟矩阵计算求解矩阵方程
实验结果
孙仲介绍,研究团队基于迭代算法,结合了模拟低精度矩阵求逆和模拟高精度矩阵-向量乘法运算,开发了一种基于全模拟矩阵运算的高精度矩阵方程求解方案,先快速算出矩阵方程的“近似解”,再用“位切片”方法,实现迭代细化。
在计算精度方面,团队在实验上成功实现16×16矩阵的24比特定点数精度求逆,矩阵方程求解经过10次迭代后,相对误差可低至10⁻⁷量级。在计算性能方面,在求解32×32矩阵求逆问题时,其算力已超越高端GPU的单核性能;当问题规模扩大至128×128时,计算吞吐量更达到顶级数字处理器的1000倍以上,传统GPU干一天的活,这款芯片一分钟就能搞定。同时,该方案在相同精度下能效比传统数字处理器提升超100倍,为高能效计算中心提供了关键技术支撑。
团队将它应用到了“大规模MIMO(多输入多输出)信号检测”中——仅用3次迭代,恢复的图像就和原始图像高度一致,误码率和32位数字计算效果相当,凸显其在实时信号处理中的潜力。
基于块矩阵方法求解高精度、
可拓展矩阵方程的实验结果
高精度矩阵方程求解在大规模多输入多输出(MIMO)迫零检测信号处理过程中的应用
模拟矩阵计算求解的性能比较(计算精度均为FP32精度)
成果意义与应用前景
“这项突破的意义远不止于一篇顶刊论文,它的应用前景广阔,可赋能多元计算场景,有望重塑算力格局。”孙仲研究员表示,在未来的6G通信领域,它能让基站实时、且低能耗方式处理海量天线信号,提升网络容量和能效。对于正在高速发展中的人工智能技术,这项研究有望加速大模型训练中计算密集的二阶优化算法,从而显著提升训练效率。“更重要的是,低功耗特性也将强力支持复杂信号处理和AI训推一体在终端设备上的直接运行,大大降低对云端的依赖,进而推动边缘计算迈向新阶段。”
“这项工作的最大价值在于,它用事实证明,模拟计算能以极高效率和精度解决现代科学和工程中的核心计算问题。可以说,我们为算力提升探索出一条极具潜力的路径,有望打破数字计算的长期垄断,开启一个算力无处不在且绿色高效的新时代。”孙仲透露。
论文链接:
https://www.nature.com/articles/s41928-025-01477-0
北京大学人工智能研究院官网
展源
何发
2025-09-28
2025-10-14
2025-09-29
2025-09-02
2025-09-22
2025-10-13
2025-09-28
谈及2024年安捷伦大中华区的业绩表现,杨挺表示,尽管在2023年和2024年全球经济增速放缓,安捷伦中国的业绩仍稳步增长,尤其在制药、食品、环境等行业展现出强劲的市场需求。未来,随着中国科技创新和绿色发展政策的持续推进,安捷伦将继续深化在中国的布局,进一步推动本土化创新。 总结 2024年安捷伦媒体沟通会不仅展示了安捷伦在液相色谱领域的创新成果,也体现了公司在中国市场的深耕与战略部署。
作者:张明
评论
加载更多