趨勢分析之自然語言處理
我們目前已釋出了12期分析內容,具體如下:
自然語言處理(NaturalLanguage Processing)是一門融語言學、電腦科學、數學於一體的科學,是指用計算機對自然語言的形、音、義等資訊進行處理,即對字、詞、句、篇章的輸入、輸出、識別、分析、理解、生成等的操作和加工。實現人機間的資訊交流,是人工智慧界、電腦科學和語言學界所共同關注的重要問題。
自然語言處理的具體表現形式包括機器翻譯、文字摘要、文字分類、文字校對、資訊抽取、語音合成、語音識別等。可以說,自然語言處理就是要計算機理解自然語言,自然語言處理機制涉及兩個流程,包括自然語言理解和自然語言生成。
下面我們將用Trend analysis分析自然語言處理領域的研究熱點。
下圖是當前該領域的熱點技術趨勢分析,通過Trend analysis分析挖掘可以發現當前該領域的熱點研究話題Top10有:
-
natural language processing
-
artificial intelligence
-
information extraction
-
machine learning
-
machine translation
-
information retrieval
-
computational linguistics
-
knowledge base
-
computer science
-
text mining
根據Trendanalysis的分析我們可以發現,資訊抽取、資訊檢索是自然語言處理領域比較熱門的話題。其中,20世紀90年代起資訊抽取的研究熱度開始逐漸上升,在此後的十年期間一直處於穩定增長的狀態,儘管近幾年熱度有所降低但綜合來看,其話題熱度仍然位於自然語言處理領域TOP3之列。
資訊抽取主要是指從文字中抽取出特定的事實資訊,這些被抽取出來的資訊通常以結構化的形式直接存入資料庫,可以供使用者查詢及進一步分析使用,為之後構建知識庫、智慧問答等提供資料支撐。
哥倫比亞大學計算機系教授MichaelCollins是自然語言處理領域的專家,擔任谷歌NYC研究科學家,曾在MIT擔任副教授。
MichaelCollins的研究興趣是自然語言處理和機器翻譯,曾經多次在國際頂級會議上發表文章,例如在EMNLP2010,CoNLL 2008,UAL2055等會議上都獲得最佳論文獎,同時還是ACL的研究員,獲NSF生涯獎。
他在統計句法分析(statisticalparsing)和統計機器學習方面做出了重要貢獻,開發了著名的句法分析器CollinsParser。
隨著自然語言處理研究的不斷深入和發展,應用領域越來越廣。文字方面的應用主要有基於自然語言理解的智慧搜尋引擎和智慧檢索、智慧機器翻譯等,語音方面的主要有機器同聲傳譯、智慧遠端教學與答疑、語音控制等。