時間:2018-07-26 來源:互聯網 瀏覽量:
7月26日消息 今天在微軟小冰第六代發布會上,微軟宣布小冰以三維影像的方式首次出現在舞台上,小冰的定性是情商EQ上的發展,此前擔當了東方衛視等主持人。
微軟小冰的目的是無處不在,采用了情感基礎的框架,做了生成模型,並且實現了全雙工語音技術。曾報道,之前小冰的演唱深度學習模型完成第四次重大升級,並一起發布了新模型生成的最新單曲【我知我新】,這首歌曲在現場也重新以3D方式演示。
《我知我新》首次采用第四次迭代版本的小冰演唱DNN模型。在歌詞創作方麵,基於LSTM的seq2seq模型,小冰先利用深度神經網絡學習超過1000萬行的歌詞語料,並在此基礎上訓練,再通過多感官誘發創作靈感,生成歌詞。
采用DNN模型的新增優勢包含:首次加入換氣聲自動合成能力,通過歌聲與氣息的融合,使人工智能生成的歌聲更富有感染力;通過在深度學習建模中增加控製的方式,字與字、音符與音符之間的過渡更加連貫順暢;通過進一步優化的深度神經網絡結構,以及大幅度補充的訓練數據,使小冰並行學習來自不同人類歌手的演唱風格,並脫離手工參數輸入,自行完成演繹等。