tft每日頭條

 > 科技

 > 語音識别 人工智能

語音識别 人工智能

科技 更新时间:2024-09-16 09:35:24

作者:李子月

編輯:石亞瓊

**

Nomad AI由法國人Vivien Seguy于2018年創立,運營着三個App:和弦自動識别 Chord AI、圖片識别詞典Yomiwa(日語)和HanYou(中文)。公司注冊于愛沙尼亞,得益于其e-residency政策(無論你實際居住在哪裡,都可以在愛沙尼亞創建一家公司,并在線管理),Vivien可以一邊工作一邊旅行。現由于疫情原因回到家鄉法國中部的克萊蒙費朗Clermont-Ferrand,辦公室設在聯合辦公空間Turing 22。

Vivien 擁有法國巴黎綜合理工學院(École Polytechnique)數學與計算機科學學士學位、英國帝國理工學院應用數學碩士學位,日本京都大學機器學習博士學位。Chord AI、Yomiwa和HanYou的iOS版屬于Vivien的公司Nomad AI,他現在全職運營這三個App。Guillaume Bellec現任洛桑聯邦理工學院(École Polytechnique Fédérale de Lausanne EPFL)博士後研究員,Chord AI的Android版在他注冊的公司Bellec Research名下;Antoine Rolet目前在東京做自由軟件工程師,Yomiwa和HanYou的Android版由他注冊的公司管理。

進入博士項目前,Vivien已開始着手制作一個日語OCR(光學字符識别)應用。後于博士期間結識Antoine Rolet,正式開始開發日語詞典Yomiwa,并進一步将其改編成中文詞典HanYou。兩個App分别發布于2013年和2014年,是最早的幾款具有OCR功能的應用之一,甚至早于谷歌翻譯。在Apple Store和Play store上有很多日語和中文詞典的應用,以Pleco為代表,Pleco内容更加豐富,得益于其多年來與專業詞典編輯的合作關系。Vivien表示,Yomiwa和HanYou是唯一具有光學識别、形态文字分析、手寫識别、自動從新聞中獲取詞表等獨特功能的詞典應用,并計劃進一步充實詞典内容。Yomiwa和HanYou可以免費下載使用,一些特殊功能,如相機OCR或全自動每日單詞列表,需要通過購買 "專業版 "來解鎖。模式為單次付費,而非會員制。

語音識别 人工智能(專注人工智能音頻識别)1

(Yomiwa 和 HanYou 圖片來源:采訪提供)

音頻識别是Vivien更感興趣的領域。博士期間Vivien和Antoine Rolet一起做了一個關于盲源分離的研究項目(論文鍊接:Blind source separation with optimal transport non-negative matrix factorization),目的是将混合的聲音從單一的錄音中分離出來。同時,Vivien的合夥人又發表了一篇名為 "Spectral Optimal Transport "的論文,利用Vivien的研究課題--最優傳輸來建立一個鋼琴音符識别算法。後來,Vivien在ICLR2018會議上認識了另一位博士生Guillaume Bellec,他也是一位業餘音樂人,他們開始一起讨論如何實現這個想法,Chord AI項目由此才正式開始。

Chord AI利用機器學習算法自動識别音樂中的和弦、調性、節拍等,可以從本地文件、麥克風、甚至在同一設備中播放的YouTube上來獲取音頻。Vivien強調了大量準确标注數據的重要性。幾個創始人最開始在公開的注釋數據集(如Isophonics、JAAH和Billboard )訓練算法,數據在數量和質量上非常有限,無法達到目标精度,Vivien希望能夠實現在和弦識别方面遠超最新研究論文中的最先進結果。因此他們很快就開始建立自己的數據庫,并自己對音頻進行标注,還對音樂進行程序化合成。他們還專門做了一個私人的iOS應用,專門用來簡化用和弦和節拍注釋歌曲的過程。因此,Vivien表示Chord AI在識别和弦精度上高于同類公司,如Chord Tracker和Chordify;Yamaha的應用 "Chord Tracker "似乎比Chordify或MyChord精度更高,但它隻能從本地文件中獲取音頻。Chord AI現可以免費下載和使用大部分功能。一些特殊的功能,如高級和弦識别或音高轉換,需要解鎖 "專業版"才能使用。費用為10美元/次(截至2021年1月),并不是會員模式。

(Chord AI 視頻來源:采訪提供)

Chord AI的iOS和Android版本共有約15萬活躍用戶,日下載增量1000次(大約50%在美國,30%在亞洲,20%在歐洲)。每天在這1000個新用戶中,約有5%的用戶最終購買了 “專業版”。Vivien表示,Chord AI在法國約有200-300萬潛在用戶,世界範圍内潛在用戶超過1億。Yomiwa的iOS和Android版本共有約30萬活躍用戶,日下載增量300次,約有2%的新用戶最終購買了“專業版”。 HanYou的iOS和Android版本擁有約3萬活躍用戶,日下載增量50次,約有3%的新用戶最終購買了“專業版”。2020年,Chord AI、Yomiwa和HanYou的營業總額約為10萬美金。Vivien預計三個App的總營業額在2021年至少能翻三倍。

Vivien正在籌劃與Guillaume一起圍繞Chord AI成立一個初創公司,并開發另一個不僅限于音樂,而是适用于更廣泛音頻的應用。總部将位于歐洲,但沒有确定具體的城市。目前Nomad AI還沒有融過資,前期費用都由創始人承擔。現計劃為新初創公司籌集100萬歐元,用于團隊建設,增添一名COO、一名CMO、兩到三名機器學習工程師。

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关科技资讯推荐

热门科技资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved