首页/分类

机器学习 (ML)

2026年3月20日星期五 · 共 7 篇论文

7 篇论文
机器学习 (ML)2603.18274

sbml4md: A computational platform for System-Bath Modeling via Molecular Dynamics powered by Machine Learning

Kwanghee Park, Seiji Ueno, Yoshitaka Tanimura

Chemical Physics (physics.chem-ph)
AI 摘要

我们介绍了一个新算法 **sbml4md**,被开发为软件包,能够从分子动力学(MD)轨迹中提取多模态非谐布朗模型(MAB)参数,用于模拟分子液体中分子内模式的非线性振动光谱。通过结合机器学习(ML)技术,该工具可捕获振动非谐性、分子间耦合以及每种模式的浴关联函数,从而免去了经验拟合,能够建模具有空间和时间异质性的环境。此方法为 "分层运动方程"(HEOM)框架提供专门参数,以实现非线性振动光谱的数值“精确”模拟。相比之前针对分子内振动模式的实现(Park等人,2025),该算法进一步优化了对分子间振动贡献的处理效率,使其可以更广泛地应用于基于HEOM的动力学建模,并轻松结合经典MD方法。最终提供了一种灵活且可扩展的框架,能以最少的经验输入在真实条件下模拟线性和非线性光谱。同时,该ML代码使用Python编写,已作为支持材料提供。

机器学习 (ML)2603.18276

Isotope Effects in 2D correlation infrared Spectra of Water: HEOM Analysis of Molecular Dynamics-Based Machine Learning Models

Kwanghee Park, Ryotaro Hoshino, Yoshitaka Tanimura

Chemical Physics (physics.chem-ph)
AI 摘要

这篇摘要研究了液态水(H2O)和重水(D2O)分子内振动模式的动力学,通过模拟和分析来揭示能量激发、弛豫以及振动去相干在非谐性模式耦合中的相互作用。关键创新点在于采用二维(2D)相关光谱,这是非线性红外振动光谱中的代表性观察参数。为了准确再现这些光谱,需要不仅对分子内振动进行精确的动力学描述,还必须对分子与周围环境的强相互作用(热浴效应)进行适当处理。研究表明,这些交互需要非Markov、非微扰以及非线性的方法进行分析。为此,采用了一种分层运动方程(HEOM)框架来计算2D光谱。通过比较H2O和D2O的光谱,研究进一步揭示了它们在复杂能量和相位弛豫动力学中的机制。这为理解水分子的振动和环境作用提供了新的理论框架和计算方法。

机器学习 (ML)2603.18983

Machine learning reconstruction of digit bone Raman spectra enables noninvasive transcutaneous detection of systemic osteoporosis

Mohammad Hosseini, Sadia Afrin, Anthony Yosick, Hani Awad, Andrew J. Berger

Medical Physics (physics.med-ph)Optics (physics.optics)
AI 摘要

这篇摘要介绍了一种创新的无电离辐射骨质疏松检测方法。研究团队提出利用“经皮偏移拉曼光谱 (SORS)”结合机器学习技术,从覆盖的软组织中提取骨骼光谱信息。关键数据包括:通过人类尸体研究,他们在正常、骨量减少和骨质疏松的捐赠者中采集了双重测量数据,开发的机器学习模型能够从0、3和6毫米的偏移位置获取经皮指骨拉曼光谱,并成功预测暴露的骨骼光谱。预测光谱的特征指标在区分正常与骨质疏松组性能显著(p < 0.05)。此外,预测光谱与DXA T分数呈现较好的相关性(r = 0.73, 预测误差RMSECV = 1.4),接近直接测量暴露骨骼的表现(r = 0.9, RMSECV = 0.8)。初步的活体数据测试也与尸体数据一致,显示了该方法在临床应用方面的可行性。这项研究首次证明了通过无辐射经皮拉曼光谱技术可以有效评估骨骼健康,为筛查骨质疏松提供了重要的潜在替代工具。

机器学习 (ML)2603.19046

D$_4$CNN$\times$AnaCal: Physics-Informed Machine Learning for Accurate and Precise Weak Lensing Shear Estimation

Shurui Lin, Xiangchong Li, Ji Li, Shengcao Cao, Xin Liu, Yu-Xiong Wang

Instrumentation and Methods for Astrophysics (astro-ph.IM)Cosmology and Nongalactic Astrophysics (astro-ph.CO)
AI 摘要

本文介绍了一种用于弱引力透镜剪切测量的新方法,采用完全D$_4$等变的深度神经网络,确保对90°旋转和镜像变换具有对称性。通过使用解析校准框架(AnaCal),利用反向传播梯度对模型进行校准。在LSST类似的单波段模拟中,该方法在高噪声条件下,相较传统的基于矩的傅里叶幂函数形状子方法,形状噪声降低约10%,相当于有效星系数密度提升约20%。此外,该方法在较宽的噪声水平、点扩散函数(PSF)大小和椭率范围,以及星等选择条件下,均实现了乘性偏差接近于零(满足LSST要求$|m| {<} 10^{-3}$,多数情况下在${\sim}10^{-4}$水平)。这种框架为未来扩展到多波段观测和混合源的剪切估计提供了物理化、可校准的基石。所有代码和数据将在论文接受后公开。

机器学习 (ML)2603.18478

Robust Near-Critical Dynamics in Heavy-Tailed Neural Networks

Ryota Kojima

Biological Physics (physics.bio-ph)Disordered Systems and Neural Networks (cond-mat.dis-nn)
AI 摘要

该研究探讨了生物神经网络如何稳定地运行在临近临界态的区域,提出了重尾分布的突触连接作为比传统高斯均值场理论更稳健的机制。作者通过发展针对柯西分布连接的动态均值场理论,将宏观动力学简化为仅一个维度的梯度流,并引入全局Lyapunov势。研究发现,该理论展现出连续相变,集体活动随接近临界点的平方根增加,静态易感性仅以平方根发散(而非高斯理论中的线性发散)。这种结构引发了一种新颖的自动增益控制机制:活动相关的噪声波动在活动水平高时抑制有效增益,同时在临界点附近保留高的易感性。研究进一步将此机制扩展到一般对称$\alpha$稳定分布,发现重尾突触是无序神经电路中稳健临近临界动力学的关键微观来源。

机器学习 (ML)2603.18126

A Survey of Neural Network Variational Monte Carlo from a Computing Workload Characterization Perspective

Zhengze Xiao, Xuanzhe Ding, Yuyang Lou, Lixue Cheng, Chaojian Li

Hardware Architecture (cs.AR)Chemical Physics (physics.chem-ph)
AI 摘要

神经网络变分蒙特卡洛(NNVMC)技术通过结合变分蒙特卡洛方法与强大的神经网络波函数构造,成为解决量子多体问题的潜力方案。然而,该方法在实际应用中受到现代GPU运行时间长和内存开销大的限制。与语言和视觉任务不同,NNVMC的执行包含物理特定阶段,如马尔科夫链蒙特卡洛采样、波函数构建以及导数/拉普拉斯评估,这些阶段表现出异质的计算内核行为及复杂的瓶颈。本研究对四种代表性波函数结构(PauliNet、FermiNet、Psiformer和Orbformer)进行了基于GPU的测评,分析了模型级运行时间和内存使用趋势,以及内核行为的划分、算术强度、屋顶线定位和硬件利用率。结果表明,端到端性能通常受制于低强度的元素操作和数据移动内核,而计算与内存的平衡在不同结构和阶段之间差异显著。基于这些结果,文章提出了针对可扩展NNVMC系统的算法与硬件协同设计建议,包括阶段感知的调度、面向内存的优化及异质加速策略。

机器学习 (ML)2603.18814

Jet flavor tagging with Particle Transformer for Higgs factories

Taikan Suehara, Takahiro Kawahara, Tomohiko Tanabe, Risako Tagami

Data Analysis, Statistics and Probability (physics.data-an)High Energy Physics - Experiment (hep-ex)High Energy Physics - Phenomenology (hep-ph)
AI 摘要

研究使用粒子变压器(Particle Transformer,ParT)进行喷注味道标记,通过ILD完全模拟(1百万喷注)及快速模拟样本(1千万和1百万喷注)进行实验。进行了3类别($b/c/d$)、6类别($b/c/d/u/s/g$)以及11类别(包括夸克-反夸克分离)的训练,整合了来自$dE/dx$和飞行时间(time-of-flight)测量的多变量强子粒子识别信息。在$b/c$标记中,相比之前基于BDT的标记器性能提高了5至10倍,并在奇异标记和夸克/反夸克分离中获得了合理的表现。通过1千万喷注的快速模拟研究发现,增加训练样本统计量可能进一步提升性能。