Deezer成功開發出能識別歌曲音樂情緒的AI系統
首先他們將音訊訊號輸入神經網路中,並重建語言語境模型。然後團隊為了的教它如何確認歌曲的情緒,使用一組超過100萬主流歌曲元資料的Million Song Dataset (MSD)。其中特別指出的是,團隊使用了Last.fm的資料集,這些音軌被標記了超過50萬個標籤。這些標籤中很多都是和情緒相關的,此外人工智慧對這些標籤中的14000個英文單給與了正面和負面的刻度登記,從而標記這個歌曲的強度。
MSD僅僅包含歌曲的元資料,並不包含歌曲本身。然後團隊使用歌曲標題,藝術家姓名和專輯標題等識別符號將所有這些資訊與Deezer的目錄配對。其中大約60%的結果資料集(18,644個音軌)用於訓練AI,其餘用於驗證和進一步測試系統。
最終測試結果顯示人工智慧可以很好的檢測出歌曲的強弱程度,研究人員寫道:“這種效能提升似乎是我們的模型能夠揭示並使用音訊和歌詞之間的中級相關性的結果,特別是在預測效價方面。” “詳細研究和優化用於音樂情緒檢測的ConvNets提供了暫時定位負責軌道效價和喚醒的區域的機會。”