主題模型

自然語言處理之 LDA 主題模型

話題模型 話題模型是為發現文件集合中的 話題 而開發出來的一種統計方法。常見的話題模型有LSA、PLSA、LDA,其中LDA(Latent Dirichlet Allocation)是表現最

MNLP2018:騰訊AI Lab深度解讀互動文字理解相關論文

人的社會屬性決定了人與人之間的互動已經滲透到日常生活的方方面面,無論是在工作中與同事協作完成既定專案,亦或是到線上平臺上參與公眾討論以實現個人向社會的發聲,互動文字作為互動行為發生的基本載體可謂無處不在。如何

李飛飛團隊新作:一種補全視覺資訊庫的半監督方法

視覺資訊庫,例如 Visual Genome 資料庫,在計算機視覺方面驅動了著大量的應用發展,包括視覺問答和影象標註等。但同時,視覺知識庫也具有稀疏、欠完備等缺點。使用人工標註是非常昂貴的,而基於紋理知識的補

向 OpenAI 喊話:語言模型啥時候開源?

在剛剛過去的情人節這天,OpenAI 曝光了兩個重磅訊息:一是提出了一種全新的代表當前最高水平的語言模型;二是終結了其與開源社群的愛情。 在被稱為“自然語言處理的 Imagenet 時代”,研究人員一直在訓

騰訊內部全鏈路追蹤系統 “天機閣” 的設計與實現

小時光茶社 傳說中天機閣裡有一臺掌控世間一切的機器,萬物執行由此產生。本文的“天機閣”是一個基於鏈路跟蹤的監控系統,後臺開發人員能夠通過“天機閣”洞察“天機”,快速解決問題。 為了支撐日益增

機器學習A-Z~評估迴歸模型的表現

本文開始講解關於如何評估迴歸模型的表現的幾個方式。 R平方 首先來講一下前面也有提到的R平方的概念。來看下面這個例子。下面紅色的是資料對應的點,黑色的直線是我們擬合出來的一條簡單線性線性迴歸。

理解粒子濾波

一、前言 狀態空間模型分為兩大類,一類是隱馬爾科夫模型,另一類是線性動態系統。兩者都可以用下圖來表示,其中z代表潛變數(未知),x代表觀測變數(已知),關於什麼是潛變數,可以參考我之前一篇文章的第

FP 視角下的領域驅動設計

這周在學習 union type 時偶然學到一個很有衝擊的軟體工程思想 -- 領域驅動設計。 在瞭解了這個思想後,我意識到最近很困擾我的 JS 防禦式程式設計的問題有更深的缺陷,那就是領域模型一開始就沒定義

1715135085.8095