法國流媒體平臺Deezer發(fā)布了一個(gè)名為Spleeter的AI工具,該工具可以快速隔離人聲和樂器音軌,并將一首歌分為兩個(gè),四個(gè)或五個(gè)獨(dú)立的音軌。該軟件最初是為研究目的而開發(fā)的,但于11月4日星期一作為GitHub上的開源軟件包發(fā)布。
盡管存在許多從混合音頻文件中分離人聲軌道(也稱為“詞干”)的技術(shù),但大多數(shù)技術(shù)都很困難,耗時(shí),質(zhì)量低下或這三者的某種組合。Spleeter是基于Python和機(jī)器學(xué)習(xí)平臺TensorFlow構(gòu)建的音頻分離庫,它可以以原始音頻的許多倍速度運(yùn)行。博主Andy Baio通過選擇歌曲來對該軟件進(jìn)行了采樣,并將其與錄音室以及PhonicMind和Open-Unmix之類的其他音頻拆分工具進(jìn)行了比較。
發(fā)布后,該軟件缺少圖形用戶界面,因此用戶需要熟悉命令行提示符。但是,由于該軟件是開源的,所以沒有什么能阻止勇敢的程序員開發(fā)精簡的用戶界面,這使有抱負(fù)的混音器,采樣器和卡拉OK愛好者的技術(shù)民主化。經(jīng)驗(yàn)豐富的生產(chǎn)商已經(jīng)在引用該軟件的潛力。