去年Google DeepMind團隊利用貼近人腦思考模式打造名為WaveNet的人工智慧系統,並且推出第一代合成語音模型Tacotron,稍早更宣布推出第二代版本Tacotron 2,能以更簡單方式訓練系統自動產生貼近自然的合成語音。 分享 facebook Google Brain團隊說明,Tacotron 2的特性在於結合WaveNet自動生成語音內容,並且藉由Tacotron學習語調、音律合成貼近自然人聲的說話內容,讓系統能直接透過文字與資料自動生成電腦合成語音,無需事先準備龐大的語言相關數據。 #div-gpt-ad-1503996040247-0 iframe { margin:auto; display: block; }
#div-gpt-ad-1503996040247-0 > div { margin: auto; display: block !important; }不過,雖然能以相對簡單方式生成模擬語音內容,但對於不同語言所使用文字可能仍有發音問題,例如在並非美式英語的特殊詞彙便會產生奇怪發音結果。除此之外,即便目前已經可以藉由深度學習等人工智慧技術讓合成語音更貼近自然人聲,但現階段仍無法讓系統自動藉由聲調變化詮釋語音中所應涵蓋「情緒」,例如緊張或興奮所反應的音頻、語調等變化。但以Tacotron 2更容易建立合成語音內容優勢來看,未來將更有利於製作各類語言的語音資料,藉此讓電腦系統更能因此學習人類口語內容所代表含意,藉此提昇人工智慧的人機互動表現。
48A5DA01699FEBFB
-
#LIST_START#
- 娛樂城 #LIST_END#
#div-gpt-ad-1503996040247-0 > div { margin: auto; display: block !important; }不過,雖然能以相對簡單方式生成模擬語音內容,但對於不同語言所使用文字可能仍有發音問題,例如在並非美式英語的特殊詞彙便會產生奇怪發音結果。除此之外,即便目前已經可以藉由深度學習等人工智慧技術讓合成語音更貼近自然人聲,但現階段仍無法讓系統自動藉由聲調變化詮釋語音中所應涵蓋「情緒」,例如緊張或興奮所反應的音頻、語調等變化。但以Tacotron 2更容易建立合成語音內容優勢來看,未來將更有利於製作各類語言的語音資料,藉此讓電腦系統更能因此學習人類口語內容所代表含意,藉此提昇人工智慧的人機互動表現。
-
#LIST_START#
- #LIST_START#
- 通博娛樂城 #LIST_END#
- 8591 LG V30+台灣首度亮相 雙廣角相機再進化 8591@E@
- 通博娛樂城 Mavic Pro初雪白限量套裝 Apple獨賣 通博娛樂城
- 娛樂城 反彈行情沙盤推演 外資調節電子轉進金融 娛樂城
- 娛樂城 「暗蟬AI海東鳴天下」拿金獎 紅到日本學校 娛樂城@E@
- 娛樂城 國中畢業就到工地 盼更多弱勢少年「知道自己的厲害」 娛樂城
48A5DA01699FEBFB
文章標籤
全站熱搜
留言列表