人工智能技術持續在音頻領域發力。喜馬拉雅陸續出現了由AI寫作、AI演播的有聲小說。面對科技在人類社會的狂飙突進,你能想象後幾十年的生活會是什麼樣嗎?
近日,AI續寫應用彩雲小夢以喜馬拉雅旗下網文創作平台——奇迹文學的寫手身份,入駐喜馬拉雅。其創作的作品由AI主播“喜小道”有聲化後,發布在喜馬拉雅平台。從推出的幾部成品來看,“AI寫手”仍需不斷成長,但随着技術的發展和進步,一個藝術化的音頻作品從文本到有聲化的創作,或許在不久的将來,均可以由AI實現。
在音頻領域,将文本轉換為語音的技術統稱為TTS技術(Text-to-speech,語音合成),除AI主播“喜小道”,利用這項技術,喜馬拉雅在相聲評書、電子書、新聞等領域實現了突破,去年九月甚至讓已故評書大家單田芳先生“聲音重現”。單田芳先生之子單瑞林評價,“聽到TTS聲音,心魂間猛然一陣,仿佛父親又回到這個世界。”
一代評書大師單田芳的書迷遍布大江南北,上至老人,下至孩童。去年,在北京單田芳藝術傳播有限責任公司授權下,喜馬拉雅用TTS技術還原單田芳先生的聲音,并首次将單田芳的AI合成音應用于六部風格各異的書籍,用單式評書腔調,全新演繹聽衆耳熟能詳的經典之作。
目前,“單田芳聲音 AI 重現系列專輯”擁有14.2萬粉絲,既有直擊淚點、奇人異事道盡人生悲歡的武俠小說——趙晨光的《江湖消亡史:北平暗夜》;也有傳達時代脈動的紀實文學——陳廷一的《毛氏三兄弟:三兄弟與共和國奠基》;還有時下流行、故事情節曲折奇特的推理小說——紫金陳的《無證之罪》;更有延續單老生前未完成的的評書經典——宮白羽的《十二金錢镖》……
為了重現單老的聲音,向傳統藝術緻敬,喜馬拉雅智能語音實驗室不僅複現了單老蒼勁、沙啞的“雲遮月”式獨特嗓音,同時保留了他那情感充沛、起伏跌宕的腔調。
據悉,喜馬拉雅音頻算法團隊自研的TTS框架目前已處于行業領先水平,其TTS前端文本處理分析模塊已經能夠高精度、全自動地對文本進行多音字識别、韻律預測和風格分類,并已開發出可以實現多情感、多風格、多語種聲音的TTS技術模型,不僅可以演繹不同情緒的文字,還可以自動區分旁白、對白,并支持英文,極大地豐富了TTS能表達的情感和韻律。喜馬拉雅已申請了三項TTS語音合成相關專利,其中就包括可以使沒有任何英語原始數據的TTS聲音能夠說英語的技術框架。
作者:童薇菁
編輯:姜方
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!