标签导航:

字节跳动研发并开源了基于gpu加速的大规模量子化学计算工具集byteqc,显著提升了量子化学计算效率。该工具集针对真实化学体系中大量微观粒子的精确计算难题,利用gpu强大的算力,大幅加速了常用量子化学算法,并结合量子嵌入方法,在“黄金标准”精度下模拟大规模量子化学体系。

图片

ByteQC的核心优势在于其高效的GPU实现和创新的算法策略。在硬件层面,它巧妙地利用了NVIDIA的cuTENSR/cuTENSORMG张量计算库,在最小化显存占用下高效处理张量缩并。在算法层面,它采用动态warp特例化实现高效的生产者-消费者模型,并利用warp内的shuffle指令解决线程竞态求和问题,最终实现了显著的性能提升。

图片

图片

ByteQC的优化策略还包括缓存分析和原位操作,最大限度地减少了显存需求。 基准测试结果显示,ByteQC在单A100 GPU上可实现最高60倍的加速,多卡扩展也接近线性加速。 其可处理的体系规模也大幅提升,例如:耦合簇单、双激发(CCSD)可达1610轨道,周期性边界条件下的平均场计算甚至超过10万轨道。

图片

图片

图片

更重要的是,结合量子嵌入功能,ByteQC成功在大型水团簇和氮化硼表面水吸附问题上实现了CCSD(T)水平的“黄金标准”精度计算。

图片

ByteQC的开源发布为量子化学领域的研究提供了强大的工具,有望推动该领域的发展。 论文和代码已公开:论文链接:https://www.php.cn/link/f0a94cc746c82ccf258040d541a2e15e,代码链接:https://www.php.cn/link/f0a94cc746c82ccf258040d541a2e15e。