IBM新研究登上Nature封面：兩種量子演算法解決分類問題

資料探勘演算法 · 發表 2019-03-14 14:16:44

摘要：機器學習和量子計算在技術炒作方面都達到了驚人的程度，除此之外，二者數學基礎的某些方面也有著驚人的相似性。今天 Nature 發表了一篇論文《Supervised learning with quantum-enhanced feature spaces》（Havlíček 等人），...

機器學習和量子計算在技術炒作方面都達到了驚人的程度，除此之外，二者數學基礎的某些方面也有著驚人的相似性。今天 Nature 發表了一篇論文《Supervised learning with quantum-enhanced feature spaces》（Havlíček 等人），研究者探索了二者的聯絡，展示瞭如今的量子計算機理論上可以怎樣的方式從資料中學習。他們給出的方法是：將資料對映到只存在量子態的空間裡。

量子計算機很難在臺式電腦等經典計算機上進行模擬，這是人們對量子計算機的初步認識之一。換句話說，經典計算機無法用於獲取量子計算結果，因為這一過程需要大量數字來描述計算的每個內部步驟。回憶一下我們在學校學的大數除法的多個步驟。如果這是在經典計算機上模擬的量子計算，那麼每個中間步驟都需要更多的數字來描述它，這個數字比宇宙中已知的原子數還要大。

用一組數字描述的量子系統狀態被稱為量子態。如果一個量子態與許多值相關，我們就說其「生活在」一個很大的空間中。對於基於連續變數的量子計算機來說，這些空間甚至可能無限大。

相比較而言，機器學習分析的資料所處的空間要小得多，也就是說，描述資料的值要少得多。例如，一張 100 萬畫素的影象只需要 300 萬個數字來描述所有畫素點裡的紅、綠、藍值。機器學習的一個典型任務是判斷影象裡的內容，或生成相似的影象。然而，機器學習中一個叫作「核方法」（kernel method）的成熟理論處理資料的方式與量子理論處理資料的方式類似。

簡而言之，核方法通過定義哪些資料點彼此相似、哪些不相似來開展機器學習。從數學上來講，相似性就是資料空間中的一段距離，即資料點數字表徵之間的距離。相似的影象被認為擁有相似的內容，機器學習中資料點之間的距離非常重要。但定義相似性並沒有聽上去那麼簡單。例如，如果根據每張影象裡的紅色值來判斷，那麼兩張影象在資料空間中的距離是什麼？

核理論表明，許多關於資料空間相似性的定義在數學上等價於一個更大、可能是無限大的空間中對相似性的簡單度量（見圖 1）。因此，每次比較兩張影象的時候，都要將影象隱式地對映到一個大空間的表徵，然後簡單地計算相似性。普通計算機無法顯式地計算這種大型表徵，但也許量子計算機存在這種可能性？量子計算機可以在極大的空間中展開計算，如果將資料對映到只存在量子態的空間中會怎麼樣呢？

圖 1：量子增強機器學習。Havlíček 等人展示了量子計算機如何提升機器學習演算法的效能。在這個簡單的圖示中，常規（經典）計算機將機器學習用於動物影象分類。影象的畫素顏色相似，則在資料空間中彼此靠近。經典計算機將這些資料傳送至量子計算機，後者將每一幅影象對映到量子空間中的特定量子態。資料空間中彼此靠近但內容不同的影象由量子空間中相距甚遠的量子態來表示。量子計算機將量子態之間的距離傳送至經典計算機，以提升影象分類效果。

幾乎是在同一時間，Havlíček 等人和 Maria Schuld 的研究團隊意識到機器學習和量子計算之間可能存在密切聯絡。值得注意的是，兩個團隊提出了本質相同的兩種策略，即設計用於機器學習的量子演算法。第一種策略僅能實現量子計算機的最小使用，將其作為常規機器學習系統的硬體補充：當給定兩個資料點時，量子裝置返回相似性。第二種策略是在量子計算機上執行實際學習，經典計算機作為輔助。

Havlíček 等人的一項關鍵貢獻是，他們在原理驗證試驗中基於真實的量子計算機（IBM的量子計算機）實現了這兩種策略。儘管一些新聞報道有些誇張，但任何嘗試過量子計算的人都知道從這些裝置中收集有意義的資料是非常困難的，因為量子計算中存在大量實驗噪聲。這可能也是他們在實驗中僅使用了量子裸機的原因，在一些人看來這已經足夠多了。量子空間僅有四個維度，因為該設定使用了IBM最小的 5 量子位元計算機的兩個量子位元（qubit），而目前IBM雲服務已經能夠提供 20 量子位元裝置。資料集也經過類似的手工處理，使其在四維量子空間中易於分析。

然而，Havlíček 及其同事的研究展示了一種有趣的原理驗證試驗——使用量子計算機進行機器學習，這說不定是一種變革性方法。現在已有很多研究進行了大量嘗試，試圖將更流行的人工神經網路與量子計算結合起來，核方法為機器學習和量子理論提供了一座很自然的橋樑。但是，意識到這座橋的存在還只是開始。

例如，Havlíček 等人在量子空間中表示資料的方式是否可用於現實世界的機器學習應用，這仍待觀察。也就是說，我們不知道這種方法是否與有意義的相似性方法相關，比如在動物影象分類時，將貓的影象放得近一些，而不是將貓影象放在狗影象旁邊。此外，我們不清楚是否存在其他更好的策略。這些技術是否已經足夠好，可以打敗有將近 30 年曆史的經典方法？如果答案是肯定的，那麼尋找量子計算機「殺手級應用」的行動可以告一段落了。然而，這個問題的答案可能要複雜得多。

論文：Supervised learning with quantum-enhanced feature spaces

文章連結：https://www.nature.com/articles/s41586-019-0980-2

摘要：機器學習和量子計算這兩種技術均具備改變計算方式的潛力，以解決之前的難題。機器學習核方法在模式識別中廣泛使用，例如支援向量機（SVM）是處理分類問題的最著名方法。然而，這一成功解決方案也存在侷限，當特徵空間變大時，SVM核函式計算成本高昂，難以估計。量子演算法中計算加速的核心元素是通過可控的糾纏和干預利用巨大的量子態空間。本研究中，我們提出了兩種基於超導處理器的量子演算法，並進行了大量實驗。這兩種方法的核心要素是將量子態空間作為特徵空間來使用。使用經過量子增強的特徵空間（僅能夠在量子計算機上高效獲取）提供了一種可能的路徑，導向量子優勢。這兩種演算法可解決監督學習問題：分類器的構建。其中一種方法是量子變分分類器，它使用變分量子電路（variational quantum circuit）對資料進行分類，運作方式與常規 SVM 很類似。另一種方法是量子核估計（quantum kernel estimator），它使用量子計算機估計核函式，並優化經典 SVM。這兩種方法為探索將帶噪聲的中間尺度量子計算機應用到機器學習提供了工具。