【編者按】
建設粵港澳大灣區,提升科技創新水平可謂是重中之重。作為全球科創領域的“當紅炸子雞”——人工智能(AI)産業在粵港澳大灣區的發展也備受重視。為此,近日,南方日報、南方産業智庫就聯合廣州市社科院、廣州市人工智能産業發展促進會等專業機構啟動了“粵港澳大灣區AI産業深調研”。
根據計劃,調研團隊将深入一線、實地走訪過百家粵港澳大灣區的人工智能相關企業,從出行、零售、金融、教育、醫療、互聯網等諸多應用場景切入,對粵港澳大灣區AI産業的機遇與挑戰進行深度探訪。
調研的第二站,我們來看看生活中無處不在的互聯網如何借助AI變得更智慧吧!
有沒有一個旋律,存在在你深深的腦海裡,但你卻怎麼也記不起歌名?現在,除了繼續絞盡腦汁拼命回憶,你還有70%的幾率可以通過“哼唱”旋律的方式找到它,即使是方言歌曲也沒什麼問題。
目前,依托于音頻指紋技術,部分用戶可以通過音樂軟件中的“智能識曲”功能找回“被遺忘”的歌曲,“在普通辦公環境中,隻要對着手機哼唱4秒左右就能找到歌曲,正确識别率最高99.4%。”酷狗音樂智能技術負責人告訴記者,當下音樂軟件中的“智能識曲”功能已基本成熟,未來AI 音樂還能幫助音樂公司提高曲庫管理效率,降低用戶的創作成本和門檻,“讓人人都有機會成為周傑倫、方文山。”
音頻也有“指紋”密碼,識曲最快隻需0.8秒
伴随着互聯網、大數據、雲計算等領域的飛速發展,近年來人工智能在數字音樂應用方面開始了頻繁的探索,許多優質功能也被逐一開發了出來。在這之中,“聽歌識曲”及“哼唱識曲”就是AI 音樂所打造出來的最具代表的功能之一。
“目前,音頻指紋技術已經較為成熟,聽歌識曲在實際使用時準确率約有85%。”據酷狗音樂智能技術負責人譚建文介紹,用戶打開APP的“識曲”功能,讓手機盡量靠近正在播放的音源,後台就會迅速将該歌曲中的音頻特征跟曲庫中的歌曲進行匹配,平均識别時長約6.9秒,無噪音或其他幹擾的情況下最快0.8秒就能完成識别。
而在“哼唱識曲”方面,正常辦公室環境下用戶隻要“哼”約4秒就能完成識别并導出結果。然而,為保證結果足夠準确,酷狗音樂App建議用戶哼唱12秒以上,“并且整體音準最好有70%左右。”該負責人表示,哼唱時後台處理器會迅速将所唱曲調與3500萬首曲庫中的歌曲做匹配,識别準确度最高可達99.4%,即使是方言歌曲也不在話下。
據了解,酷狗音樂會借助拾取技術對所收錄的歌曲中包含的音頻信息進行壓縮處理,提取出其中最關鍵、最具區分度的信息點。如此一來,每當用戶使用“識曲”功能時,App能夠憑最少的信息量完成音頻匹配。“每首歌的音頻信息都有獨特的‘指紋’密碼,我們要做的就是快速篩選這些音頻‘指紋’信息及歌詞信息,并完成匹配和識别。”
然而,音頻指紋技術也有一個天然的“敵人”,那就是噪音。由于用戶開啟“哼唱識曲”或“聽歌識曲”功能的環境多種多樣,因此在設備識曲時很難避免噪聲對識别準确率帶來的消極影響。目前,酷狗音樂自行開發的“智能去噪”技術已能對部分現實環境中的噪音做平滑處理,但“淨化”效率和效果仍待提升。對此,酷狗音樂正計劃開發AI智能環境識别等功能,未來根據環境的不同,為用戶在識曲時提供不同的去噪方案:“比如在汽車站識曲,就能智能去除車流的噪音;在浴室識曲,能夠智能去除回聲等。”
根據喜好推薦歌單,音樂軟件也有“最強大腦”
除“智能識曲”外,“AI智能推歌”也是AI 音樂的核心應用之一。據介紹,基于音頻特征分析技術以及音頻特征推薦模型,酷狗音樂可通過用戶收藏的歌曲和平時的聽歌喜好為用戶智能推薦“每日歌單”:“一首歌裡往往包括情感、曲風、聲學特征三類信息,把這個信息彙總成信息庫,我們就能找到用戶的喜好,并為他們智能推薦歌單。”
記者在使用時發現,酷狗音樂的“每日歌曲推薦”功能每天會為用戶推薦30首歌曲,并根據他們的喜好差異智能篩選出古風、歡快、搖滾、懸疑等不同曲風的歌曲,“用戶使用這個功能的頻率越高、時長越長,推薦也會越準确。”
然而,由于AI 音樂仍處于發展的初級階段,各個音樂平台研發的智能推薦技術“百花齊放”,行業内對于音頻信息的分類方法等仍然缺乏一套統一的标準。“但不可否認的是,推薦算法是AI 音樂重要的應用方向之一,今後随着行業的進步,規範也會逐步建立起來。”
未來“AI 音樂”讓人人都是周傑倫、方文山?
盡管目前AI 音樂正處于快速發展的階段,但AI目前在音樂産業的應用仍然要基于統計和深度學習技術,“逃不開模仿和統計模型”。譚建文表示,當下AI缺乏“常識性”思維,在音樂創作能力和邏輯思考能力方面與人類仍有一定距離。未來,随着技術的發展、成熟,AI不僅要高效完成“識曲”和“精準推薦”,還應當具備“智能創作”的能力,輔助用戶以更低的門檻及成本完成音樂創作,真正實現“人人都能做原創”。
“‘AI智能作曲’是用戶可以期待的功能。未來用戶随機輸入一段旋律或歌詞,人工智能就可以根據詞曲風格智能補足整首作品,或給用戶提供修改建議,幫助他們學習創作技巧。”該負責人表示,今後在AI的加持下,音樂平台将不僅僅具備“最佳聽力”,能夠快速識别音頻信息并給予用戶反饋,還有可能搭載上“最強大腦”,創作出全新的音樂風格和形式;許多因音樂學習、制作門檻過高而打消創作念頭的用戶也将獲得新的機遇。“AI 音樂是一種趨勢,盡管還處于發展初期,但今後它的發展潛力确實不可小觑。”
【出品】南方産業智庫
【策劃】陳韓晖 盧轶
【統籌】程鵬 李劼 郜小平
【新媒體運營】劉靜
【采寫/視頻】許隽
【作者】 許隽
【來源】 南方報業傳媒集團南方 客戶端 南方号~深度~南方産業智庫
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!