新東方AI研究院院長瞿煒：AI要在教育場景落地必須克服20個挑戰 | 全球AI+智適應教育峰會

新東方創業 · 發表 2018-11-15 23:14:00

摘要： 11月15日，“全球AI+智適應教育峰會”在北京嘉裡中心大酒店盛大開幕，峰會由雷鋒網聯合乂學教育松鼠AI，以及IEEE（美國電氣電子工程師學會）教育工程和自適應教育標準工作組共同舉辦，匯聚國內外頂尖陣容。 AI智適應學習是目前產學研三界關注度最高的話題之一。此次峰會，主辦方邀請了美國三院院...

11月15日，“全球AI+智適應教育峰會”在北京嘉裡中心大酒店盛大開幕，峰會由雷鋒網聯合乂學教育松鼠AI，以及IEEE（美國電氣電子工程師學會）教育工程和自適應教育標準工作組共同舉辦，匯聚國內外頂尖陣容。

AI智適應學習是目前產學研三界關注度最高的話題之一。此次峰會，主辦方邀請了美國三院院士、機器學習泰斗Michael Jordan，全球公認機器學習之父Tom Mitchell，斯坦福國際研究院（SRI）副總裁Robert Pearlstein、美國大學入學考試機構ACT學習方案組高階研究科學家Michael Yudelson等頂尖學者。

圖為：新東方AI研究院院長瞿煒博士

在大會下午主論壇上，新東方AI研究院院長瞿煒博士發表了精彩演講。瞿煒博士在人工智慧領域有近20年的豐富研究經歷，此前在西門子公司有過工作經歷。新東方作為中國最早在美上市的教育公司，在全球已經有超過2000萬的學生使用他們的平臺。翟煒博士在現場的演講正是新東方在AI時代的最新思考。

翟煒博士認為，通用AI已經走向瓶頸，場景AI將迎來新的蓬勃發展。而對於AI+教育來說，儘管是極具潛力的市場，但是依然面臨著諸多挑戰，比如語音識別、人臉識別、文字識別、視訊分析等。新東方AI研究院雖然剛剛成立，但會在整體戰略上走向“開放”，並將以N-Brain聯盟為基點，在資料、場景、資源層面做更多與業界、學界的合作。

以下大部分為翟煒的演講原文，雷鋒網做了不改變原意的編輯與整理。

作為一個接觸AI接近20年的老兵，根本就沒有想到AI能成為一個行業，甚至在2016年左右的時候，隨著AlphaGo為公眾所熟悉，AI幾乎是指數級地變成了一個行業，所有的網際網路公司都在擁抱AI，所有的行業也越來越多地去touch AI。

但是新東方很冷靜，俞老師（雷鋒網 (公眾號：雷鋒網) 注：俞敏洪）很冷靜，並沒有著急，給大家的感覺是新東方在做什麼？其實我們一直在做AI，各個BU一直在應用AI，但是我們很冷靜地在思考教育+AI到底應該怎麼做？什麼才是最好的時機來擁抱AI？

AI的冬天來了，但春天也不遠

事實上，AI在兩年的火熱之後，冬天已經來臨了，就像外面北京的冬天來到了一樣。

語音識別其實已經很成熟，但是機器學習、NLP、計算機視覺這幾個技術（佔到AI最重要部分的分支）其實已經過了它的頂峰。以深度學習為例，經過幾年大規模的應用，其實越來越多的研究者已經發現，它已經到達了一個瓶頸。我們發現AI並不是像我們想像的那樣真的能去替代人。

中國有一句固話叫“冬天來了，春天還遠嗎”？AI的一個冬天來了，它的下一個春天是什麼呢？其實，很多AI行業中的人也意識到了是場景化的AI。

通用化的AI在過去的兩年中得到了極大的普及，為公眾所接受，很多創業公司如雨後春筍般地興起，獲得了大量的投資，這兩年大家都感受到了，甚至融資的速度超越了前幾年網際網路的速度。

但是，它的冬天來了，因為很多AI的公司並沒有商業化變現，當他們落地的時候發現，變現是如此地困難。尤其是在ToC領域。這是為什麼呢？

實際上是因為AI和行業的結合非常非常困難，不是那麼容易的。所以我們看到通用的AI的發展將會變成這樣一個趨勢，但是場景化的AI在AI和行業的結合領域會產生無窮無盡的機會。

AI+教育將會是對整個教育科技的重構

AI+汽車已經形成了垂直的平臺，百度的阿波羅、谷歌的Waymo都產生了這樣的平臺，AI+生活催生了Facebook的出現，AI+教育會出現什麼呢？我們非常期待。這也新東方對AI+教育這件事深度的思考。

我們認為AI+教育並不一定就是通用AI技術直接嫁接到教育領域，像出現了很多產品級的應用一樣，更多的AI+教育將會是對整個教育科技的重構。很多資料都已經準備好，比如說大資料、雲端計算，但在AI+教育領域必將出現一個新的大腦，我們姑且稱之為教育大腦，也必將會出現新的作業系統，這種作業系統可能是在雲，也可能在端，因為所有的AI系統肯定是一個軟硬結合的系統。

個性化的學習平臺將會雨後春筍地湧現

個性化的學習平臺將會雨後春筍地湧現。我們認為它一定是開放的，為什麼？因為個性化的學習太難了，很難一個公司把它實現。因為這麼多的國家，這麼多的人群，不同的年齡段、不同的學科，這個問題對研究界而言，幾乎是沒有唯一解的，所以不可能由一家公司來完成。

新東方AI研究院在“新東方AI+教育戰略”基本的步驟，大家可以關注教育大腦的具體應用。

這張圖很多在座的朋友們可能都已經看到很多次了，不光是在教育領域，其實很多的領域都可以用這張圖來表示，但我們關心的這8個領域，最關注的是他們在這個教育上有什麼樣的不一樣，而不僅僅是這8個詞。所以我藉此機會介紹一下我們關注的20個挑戰。

“AI+教育”的20個挑戰

語音識別的挑戰：中英混合、專有名詞識別難、強噪聲

通用的語音引擎真正應用到教育這個場景下的時候，其實並不像在很多場景下那麼有效，比如說通用的新聞，其實我們很多的雲引擎，無論是谷歌、訊飛、百度的都可以做到接近人或者是超越人的水平，97%以上是沒有任何問題的，99%在特定的場景下也是可實現的。但當進入到教育這個場景下的時候，卻發現它們並不產生作用。比如我們應用到中英混合識別問題，新東方的很多課程都是在拿中文教英語，所以當你看這個波形的時候，中英之間的切換幾乎是糅在一起的，這對語音識別是一個挑戰的問題。

另外進入到教育領域，其實它的場景是非常非常零碎的。你去分科施教的時候，會發現在數理化有很多的公式和名詞是要分別的，現有的中英文的引擎，我們發現原有的識別率在現有的場景下會下降到70%左右。還有一個是很多朋友即將面對的，中國人學英語的時候，我們的發音（尤其是孩子們的發音），我們稱之為“chinglish”，用中文引擎用英文引擎識別都不是有效的，所以我們認為是第三種引擎。

還有我們的線下教室是強噪聲、強混響的語音問題，這個問題解決起來非常困難。亞馬遜的Echo之所以能被大規模地應用起來，其實關鍵是解決了一個工程的問題，就是語音識別的問題，當語音識別應用到教育場景下的時候，這樣一個語音增強的工程問題必須要面對，否則我們基本上很難去實現線下場景下真實的語音識別。

還有多人混合下的聲文識別問題，教育場景下無論是線上還是線下，尤其是一對多的情況，經常會出現多個孩子同時回答一個問題，多個孩子同時討論一個問題，這種情況下做語音識別，不得不面臨如何去把這個聲音分開的問題，這些問題都非常挑戰。

人臉識別的挑戰：超低解析度、強畸變角度、遮擋

進入到人臉識別，這是這一撥AI炒得最熱的，但進入到教育這個場景下的時候很多人臉識別公司也不見了。我們在和幾乎大家能看到的所有國內、國外最牛的人臉公司進行合作。這三個是我們列舉的很實際的問題。

第一個是超低解析度下的人臉識別的問題，右邊這張圖是一個真實的線下課堂場景，就用一個簡單的監控攝像頭試圖來覆蓋整個教室，你會發現問題出現了，當你能看清楚第一排的學生的時候，你就無法看清楚最遠這一排的學生，你試圖要看清楚兩邊的孩子的時候，必須要用一個廣角鏡頭，而這導致了很大的畸變，所以在教育的場景下是非常非常現實的，很難像普通的人臉識別問題一樣給你一個大頭照這麼簡單。畸變的角度下的人臉識別問題就出現了。

孩子們是非常活躍的，這也是教育的本質所在，這就導致了人臉識別不是一個靜態的，而是老老實實地等著你去識別，你如何在動態的情況下、大遮擋的情況下而不是僅僅是區域性遮擋的情況下能夠實現人臉的識別？這是必須要解決的一個問題，不解決表情怎麼識別，怎麼時時刻刻知道孩子在幹什麼，所以說起來容易，理想很美好，現實其實是很骨感的。

文字識別挑戰：數理化的公式、手寫體難識別

進入文字識別領域，我們面臨的問題是數理化的公式、圖形、影象識別問題，還有包括手寫體的識別問題，這都是我們必須要解決的。

NLP的挑戰：多輪對話難以實現、智慧批改有侷限

還有NLP（自然語言處理）的挑戰，最經典的是多輪對話，這個多輪對話還不是普通意義上的客服機器人，我們希望答疑甚至是替代老師，一定是基於內容的。當基於內容領域的時候，這個多輪對答更困難，號稱能做到二十七輪對話的話是非常非常困難的，我不認為在未來的一兩年內能發生這樣一件事，但也許我們能解決三輪、五輪、七輪。

線上線下課堂自動提煉的問題，新東方也是很多教育公司可能的剛需，我們有這麼多的課堂，這麼多的老師，如何能用AI的手段自動地提煉課堂的內容是解決教學一體化的非常重要的手段。

中英作文的智慧批改閱卷，其實已經有成熟的產品了，但我們的實踐發現，要做到真正意義上的批改，必須要進入語義層面，這是非常非常有挑戰的。

視訊分析的挑戰：線下的情況太複雜

其實有很多公司也在向這個方向努力。我們完整的教學過程既包括了老師的分析，也包括了學生的分析。對於老師，我們希望對他所有的教學過程進行評價，對於學生，我們希望對他的微表情進行分析。可是在現在的場景下，線上簡單一些，尤其是英語的教學，因為我們幾乎可以正對著他，有一個大頭照；但線下的情況太複雜了。

圖譜的挑戰：高精知識地圖缺乏

我們幾乎沒有看到任何一張基於學科的高精知識地圖。當AI進入到無人駕駛領域，高精地圖已經成為了一個必然的選項，但我們講了半天的AI+教育，卻很難看到一張基於學科的知識地圖，所以這是一個非常非常基礎的工作。

AR·VR的挑戰：AI合成教師需要互動

最近一個星期最火的事情就是新華社和搜狗一起做了一個AI合成主播。主播技術簡單，因為它是一個單向的，但當我們把這件事放在教育領域談的時候，就是個挑戰，因為AI合成教師不僅僅是一個單向的講，而是需要互動。

機器學習的挑戰：自動標註難、場景零碎、個性化難

自動標註的問題。所有的AI都牽扯到標註，因為我們現在接觸到的絕大部分是監督式的。AI如何做自動的標註，小資料量的情況不是問題，但像新東方這樣擁有海量的公司做這樣的事情的時候，我們發現自動標註是我們必須要面對的問題。

教育場景是如此地零碎和複雜。其實具體到每一個小的場景下的時候，我們發現，小樣本級的訓練問題是如此地突出，這次大會有一個主題就是自適應學習，你會發現專注到每一個孩子的時候，其實它的樣本資料並不多，尤其是冷啟動階段。

個性化學習問題。這可能是我們繞不開的問題，因為一開始的時候不可能對所有的孩子都有一個模型來進行推理，如何把一個模型個性化到一個孩子的身上是一個難題。

新東方的開放戰略：以N-Brain聯盟為基點，資料、場景、資源全部開放

上面這20個問題每一個都如此具有挑戰性，把它做成了，也許能成為一家偉大的公司，至少能對這個行業產生很大的影響。我們面臨這20個，可能還不止20個，新東方怎麼辦？我們的思考其實很簡單，就是開放。

新東方願意把資料拿出來，把場景拿出來，把資源拿出來，因為我們知道我們的起步很晚，我們不可能在所有上述領域再去重新來過，新東方AI研究員也不可能以一己之力跟那麼多的公司PK，所以我們能做到的就是“開放”。

我們兩個星期之前成立了N-Brain聯盟。“N”，首先它代表了N種教育場景，也代表了N種可能，更代表了N個model。N在自然數集裡其實代表了無窮的概念，也代表了力，也代表了氮元素佔到了大氣層78%的比例，我們希望以這種形態，能和在座的各位朋友合作，共同做好AI+教育這件事情。

目前，我們已經和美國的伊利諾伊大學、中國自動化科學研究所這樣頂尖的AI研究機構合作，我們也和北京師範大學、斯坦福大學這樣頂級的教育領域、心理學領域、認知科學領域、腦科學領域的研究機構合作，以及與GSV（雷鋒網注：全球矽谷投資公司）等一起合作，我們一起團結資本的力量，還有像騰訊、網易這樣網際網路的公司，甚至包括很多很多的創業公司，我們正在合作，越來越多的公司加入進我們這個聯盟。新東方可以把資料貢獻出來，我們也願意把所有的場景貢獻出來，我們也願意把資源貢獻出來。

新東方AI研究院不僅僅是一個研究的機構（雷鋒網注：2018年7月成立），同時我們也願意做一個橋，連線內部的資源和外部所有的資源，一起把“AI+教育”這件事情做好，我們的目的不是為了新東方自己用，而是希望向所有的機構和所有的公立學校開放。

雷鋒網原創文章，未經授權禁止轉載。詳情見 ofollow,noindex" target="_blank">轉載須知。