近日,澳门新葡萄新京譚慶收教授與廣州工業技術研究院量子精密測量研究中心、中國科學院精密測量科學與技術創新研究院、鄭州大學等研究機構合作, 在《自然》雜志的子刊《通訊-物理》(Communications Physics)上發表題為“Single-atom exploration of optimized nonequilibrium quantum thermodynamics by reinforcement learning”的學術論文。譚慶收教授為該論文的第一通訊作者。
實際的量子過程會不可避免地與外部環境耦合,因而量子信息處理及其相應的熱力學過程都會受到耗散和退相幹等破壞性因素的影響。在該實驗中,研究人員基于超冷40Ca+離子實驗平台,利用機器學習中的強化學習技術,實驗展示了強化學習對量子熱力學過程的優化效果, 實驗方法和步驟如圖一所示。
圖一、實驗方法與步驟。(a)強化學習(RL)方法的示意圖,代理(即網絡)通過反複的動作和獎勵與環境(即量子比特)進行交互。(b) 40Ca+離子的能級方案圖,其中雙箭頭和波浪箭頭分别代表激光照射和耗散,從三能級配置中近似了一個可控制的驅動和衰減的有效兩能級系統(TLS)。通過開啟854nm激光實現耗散量子比特。(c)量子比特與離子振動度量自由度之間的Jaynes-Cummings(JC)相互作用,描述了量子比特與量子庫的耦合。(d) RL控制的實驗步驟,包括TLS 和 JC 模型。
實驗顯示:無論是在封閉的量子體系還是存在經典環境或量子環境的幹擾,在強化學習的輔助下,量子體系的非平衡熱力學過程都具有更高的保真度以及更低的相對熵消耗和功消耗。這項研究是首次在離子阱量子實驗中展示了強化學習技術對于量子非平衡熱力學的優化效果。該研究的技術和結果有望應用于更大量子體系的非平衡熱力學過程,研究量子熱機的效率提升以及探索量子信息技術帶來的新的熱力學問題。
澳门新葡萄新京譚慶收教授是這項工作的共同通訊作者(理論部分),第一作者為廣州工業技術研究院量子精密測量研究中心博士後章嘉偉。該研究得到國家自然科學基金和湖南省自然科學基金的資助。
據悉,《Communications Physics》是Nature Research 的一本開放獲取期刊,發表物理科學所有領域的高質量研究成果和評論。該期刊發表的研究論文代表了重大進展,為物理學的專業研究領域帶來了新的見解。該期刊為中科院一區期刊。
論文鍊接:https://www.nature.com/articles/s42005-023-01408-5.pdf
(責編/熊勝男 初審/李宏民 終審/周暢)