QQ音樂(lè)領(lǐng)先科技打造品質(zhì)音樂(lè)生活,做更有溫度的音樂(lè)平臺(tái)
“生命,宇宙以及一切的終極答案是什么?”
1979年,道格拉斯·亞當(dāng)斯發(fā)表了讓他日后名垂青史的科幻小說(shuō)《銀河系漫游指南》。在這本小說(shuō)中,他描繪了一臺(tái)名為“深思”的超級(jí)人工智能——它的使命,便是解答上面的問(wèn)題。
經(jīng)過(guò)整整750萬(wàn)年的運(yùn)算,這臺(tái)遠(yuǎn)超一切造物的人工智能給出了結(jié)果:“答案就是42。”
無(wú)法解釋的荒謬答案,既反映著整個(gè)宇宙不會(huì)被人賦予意義的本質(zhì),也在一定程度上代表著世人對(duì)科技的看法:人工打造的科技,可不一定具備真正的“智能”。 今年一過(guò),這位老先生就已駕鶴西去20年,但相較于“深思”,科技正在改變著我們的日常生活體驗(yàn),甚至在某些領(lǐng)域,讓我們甘拜下風(fēng)。
不過(guò),今天要講的并不是人類如何再次被科技“擊敗”,而是一個(gè)有關(guān)于“欣賞”和“辨別”的故事。
緣起:科技遇見(jiàn)音樂(lè)
光聽(tīng)“人工智能”這四個(gè)字,冷冰冰的感覺(jué)就涌上心頭。它不像你隔壁工位坐著的Steven Liu,在我們的認(rèn)知中,它無(wú)法動(dòng)用情感,更別提去鑒別,欣賞一幅畫(huà),一首歌的美。
真是這樣嗎?
幾年前,身處新加坡科技設(shè)計(jì)大學(xué)從事音樂(lè)研究的一位熱愛(ài)音樂(lè)的科研工作者Dr. Simon,已經(jīng)開(kāi)始思索這個(gè)問(wèn)題:AI究竟能不能與音樂(lè)領(lǐng)域進(jìn)行結(jié)合,碰撞出絢爛的火花?在研究的過(guò)程中,他也發(fā)現(xiàn)自己缺乏機(jī)遇:“沒(méi)有太多人做這個(gè)領(lǐng)域,而我的研究成果,也很難切實(shí)地幫助音樂(lè)人。”
在2600公里外的深圳,一群人也正在對(duì)相同的想法大搖其頭。Ben曾在偶然間發(fā)現(xiàn)“以往唱片公司通過(guò)人工聽(tīng)Demo,來(lái)決定哪首歌值得推,但Demo的數(shù)量遠(yuǎn)遠(yuǎn)超過(guò)人工能聽(tīng)的數(shù)量,導(dǎo)致很多歌從來(lái)沒(méi)有被聽(tīng)過(guò)而被埋沒(méi),十分可惜。”這一現(xiàn)象激發(fā)了他的思考,如果用不知疲倦的AI算法去評(píng)價(jià)歌曲,效果會(huì)怎樣?但Ben身邊的同行都不看好:“音樂(lè)是藝術(shù),難以用科學(xué)或是算法去衡量它的質(zhì)量。”
除了選擇音樂(lè),在Ethan眼中,通過(guò)科技讓聽(tīng)者獲得更好的音樂(lè)體驗(yàn)也變得越發(fā)重要:“經(jīng)過(guò)多年的技術(shù)發(fā)展,音樂(lè)技術(shù)已經(jīng)從純信號(hào)處理向AI轉(zhuǎn)變。”這就意味著,科技將是改變每一位聽(tīng)眾日常聽(tīng)音體驗(yàn)的關(guān)鍵要素,“但在國(guó)內(nèi)音頻行業(yè)還是存在空白。”
三個(gè)人的問(wèn)題其實(shí)異曲同工:如何用AI算法,鑒別、推送更為“動(dòng)聽(tīng)”的歌?如何借助科技,全方位讓聽(tīng)者及音樂(lè)人的音樂(lè)生活變得更美好?
或許是緣分,亦或是因?yàn)樾闹芯镁脫]之不去的“執(zhí)念”,念念不忘終有回響,2018年,三個(gè)人的軌跡開(kāi)始串聯(lián)在了一起。當(dāng)年,騰訊音樂(lè)娛樂(lè)集團(tuán)CEO彭迦信去新加坡開(kāi)會(huì),遇到了雷教授,兩人互相交流了自己對(duì)音樂(lè)的見(jiàn)解。雷教授發(fā)現(xiàn),彭迦信的想法和自己不謀而合:“他跟我說(shuō),騰訊音樂(lè)的夢(mèng)想,不只是做音樂(lè)播放器,更是要打造一個(gè)豐富、良性的音樂(lè)生態(tài),讓音樂(lè)進(jìn)入生活的每個(gè)場(chǎng)景,讓音樂(lè)人擁有體面的收入和生活,這一點(diǎn)深深打動(dòng)了我。”相比于教授的身份,雷教授本身也是一位音樂(lè)人,“我在大學(xué)時(shí)期,曾在餐廳做過(guò)駐場(chǎng)的小提琴手,深知音樂(lè)人的不易。”
面對(duì)TME拋來(lái)的橄欖枝,雷教授并沒(méi)有顧慮太多,他加入了TME,從成為QQ音樂(lè)多媒體研發(fā)中心負(fù)責(zé)人的那一刻起,如何用科技改變音樂(lè)人及億萬(wàn)用戶的方方面面……太多想做的事情縈繞在他腦海,他充滿興奮和期待,甚至讓他在入職的第一天就把行李落在了出租車(chē)上。
同年,曾在王者榮耀項(xiàng)目上率領(lǐng)AI擊敗人類冠軍戰(zhàn)隊(duì)的Ben,也如約加入到團(tuán)隊(duì)之中,擔(dān)任多媒體研發(fā)中心創(chuàng)新組負(fù)責(zé)人。也正是在這里,他們遇到愛(ài)朗聲說(shuō)笑話的基礎(chǔ)開(kāi)發(fā)組負(fù)責(zé)人Ethan——上文提到的三位“現(xiàn)代工匠”和他們所率領(lǐng)的團(tuán)隊(duì),從此將共同致力于用科技逐步改變每一位聽(tīng)眾的音樂(lè)生活。
匠心:讓AI學(xué)會(huì)“聽(tīng)”歌
一首歌,是怎樣送到聽(tīng)眾耳邊的?
除了人工篩選,隨著流媒體平臺(tái)普及和技術(shù)進(jìn)步,大家開(kāi)始習(xí)慣通過(guò)播放量來(lái)選聽(tīng)歌曲。“這種方式會(huì)造成鮮明的馬太效應(yīng),熱歌只會(huì)越來(lái)越熱,但0播放量的歌,可能永遠(yuǎn)是0。”雷教授認(rèn)為業(yè)界此前通用的技術(shù),并沒(méi)有解決音樂(lè)人的難題。
想來(lái)想去,方法其實(shí)也很簡(jiǎn)單:為AI注入溫度,讓AI學(xué)會(huì)鑒賞歌曲,利用其對(duì)海量數(shù)據(jù)的高速處理能力,輔助人工篩選,讓有才華的作品不被埋沒(méi)。
和世間的道理一樣,都是說(shuō)來(lái)容易,做起來(lái)難。AI的數(shù)據(jù)處理能力,要建立在對(duì)歌曲細(xì)顆粒度“標(biāo)記”上,在這個(gè)層面有兩個(gè)難題,如何對(duì)一首歌曲進(jìn)行評(píng)價(jià),維度該如何定?作為一項(xiàng)“藝術(shù)”,音樂(lè)的喜好沒(méi)有恒定標(biāo)準(zhǔn),AI的篩選,是否能說(shuō)服眾人?
在想法落地的過(guò)程中,Ben拉上了他的同事Moyan, 從曲風(fēng)、歌詞、音色、演唱者唱腔、到后期制作與編排等,為AI制定了詳細(xì)的評(píng)判維度——QQ音樂(lè)科技團(tuán)隊(duì)雖然大多出身技術(shù),但大家都同樣愛(ài)好音樂(lè)且具備一定的專業(yè)音樂(lè)素養(yǎng)。再加上QQ音樂(lè)數(shù)以億計(jì)的海量大數(shù)據(jù),讓AI學(xué)習(xí)有了最重要的數(shù)據(jù)參考。
“當(dāng)時(shí)我們都不知道要花多久,但它一定得做出來(lái),讓優(yōu)秀但暫時(shí)沒(méi)名氣的音樂(lè)作品和音樂(lè)人不再被埋沒(méi),就是懷著這樣的信念堅(jiān)持著。”靠著過(guò)硬的技術(shù),與對(duì)音樂(lè)的深度了解,再加上多版本的迭代和打磨,Ben的團(tuán)隊(duì)推出了一項(xiàng)名為Predictive Model的自研技術(shù)。
通過(guò)PDM,即使是0播放量的冷啟動(dòng)音樂(lè)作品,AI也能根據(jù)音頻和歌詞內(nèi)容給予充分且匹配的受眾識(shí)別與推送曝光,讓歌曲得以更高效、精準(zhǔn)地覆蓋到適合的目標(biāo)人群。換句話說(shuō),就是AI能夠辨別“欣賞”歌曲,并將符合用戶喜好的歌送到億萬(wàn)樂(lè)迷耳邊。AI就相當(dāng)于一位慧耳識(shí)音的“伯樂(lè)”,找到好內(nèi)容的“千里馬”,并且把“千里馬”精準(zhǔn)地送到會(huì)喜歡它、欣賞它的人身邊。
雖然對(duì)于技術(shù)的細(xì)節(jié)不是特別了解,但資深樂(lè)迷王小毛就對(duì)PDM感觸頗深:“最近在QQ音樂(lè)上,聽(tīng)到不少新歌手的新歌,而且這些歌質(zhì)量都非常高。像是此前火爆全網(wǎng)的《微微》,聽(tīng)說(shuō)就是由AI技術(shù)選出來(lái)的,著實(shí)讓我感嘆了一下科技的力量。”
其實(shí)在PDM落地后,已經(jīng)有數(shù)十首歌曲借其“獨(dú)具慧眼”的挖掘?qū)崿F(xiàn)“爆紅”。 不僅是《微微》,《收斂》《厚顏無(wú)恥》《忘川彼岸》以及近期悄然走紅的《失控》等“國(guó)民級(jí)”歌曲,都得益于PDM技術(shù)的“鑒賞”,才步步“刷屏”全網(wǎng)。當(dāng)然,億萬(wàn)像王小毛一樣的樂(lè)迷,也在這個(gè)過(guò)程中發(fā)現(xiàn)了自己喜歡的更多類型的新歌。
得益于QQ音樂(lè)PDM技術(shù)的多首熱歌
除了用AI“欣賞”歌曲,科技也在Ethan團(tuán)隊(duì)的手上,化為了找尋陌生好歌的“必備神器”。2013年上線的QQ音樂(lè)聽(tīng)歌識(shí)曲技術(shù),就一直以“穩(wěn)準(zhǔn)狠”著稱。“在看一段廣告時(shí),可能吸引我們的并不是廣告產(chǎn)品本身,而是它的配樂(lè)。又或者我們非常想要知道電影背后的歌曲是什么。”Ethan回憶起當(dāng)時(shí)建立聽(tīng)歌識(shí)曲團(tuán)隊(duì)的初衷。
但在2019年初,聽(tīng)歌識(shí)曲團(tuán)隊(duì)也迎來(lái)了新挑戰(zhàn)。團(tuán)隊(duì)成員Lester收到用戶們的反饋,稱原唱版本的歌曲都是秒速找到,但翻唱版本的歌曲卻難以識(shí)別。這在當(dāng)時(shí)是一個(gè)全新的命題,由于音樂(lè)模式的逐步豐富,越來(lái)越多的歌曲有了各色翻唱版本,用戶們除了找原唱,對(duì)找翻唱、改編版本的歌曲也有很大的需求。
聽(tīng)歌識(shí)曲1.0版本的識(shí)別原理,主要是“聲紋識(shí)別”,就像每個(gè)人都有自己的指紋一樣,歌曲和聲音同樣也擁有自己專屬特征的“聲音指紋”,聽(tīng)歌識(shí)曲可以通過(guò)識(shí)別一小段音頻的聲紋,就能找出對(duì)應(yīng)的歌曲,這對(duì)于尋找原版歌曲可謂無(wú)往而不利;但對(duì)于翻唱版、現(xiàn)場(chǎng)Live版等版本,由于聲紋的變化,確實(shí)難以識(shí)別。
針對(duì)這一問(wèn)題,Ethan和隊(duì)友開(kāi)始計(jì)劃將原有的聽(tīng)歌識(shí)曲技術(shù)拓展到2.0版本,并成功實(shí)現(xiàn)“模糊識(shí)別”,目的是為了讓在看劇、看綜藝、刷短視頻或者身處在一些小型Live現(xiàn)場(chǎng)時(shí),卻苦于找不到當(dāng)時(shí)入耳的那首歌的樂(lè)迷,能輕松找到自己心儀的歌曲。“至今還記得,其中有一首歌叫《一曲相思》,就花了很多努力才實(shí)現(xiàn)可測(cè)。”Ethan團(tuán)隊(duì)對(duì)于當(dāng)時(shí)的“攻堅(jiān)經(jīng)歷”記憶猶新。
功夫不負(fù)有心人,經(jīng)過(guò)一年艱苦的研發(fā)攻堅(jiān),業(yè)界首創(chuàng)的聽(tīng)歌識(shí)曲2.0“翻唱識(shí)別”橫空出世,領(lǐng)先行業(yè),一騎絕塵。通過(guò)智能AI,它不僅能識(shí)別短視頻、綜藝?yán)锏亩噍喎枨€能識(shí)別Live、直播等諸多場(chǎng)景,精準(zhǔn)匹配度大幅提升。
值得一提的是,團(tuán)隊(duì)還制作了“離線系統(tǒng)”的小彩蛋,在歌曲第一次未能成功識(shí)別后,系統(tǒng)會(huì)在一周之內(nèi)自動(dòng)向全曲庫(kù)發(fā)起請(qǐng)求,識(shí)別成功后,用戶會(huì)收到聽(tīng)歌識(shí)曲小助手的反饋提醒。匠心換得真心,“他們的反饋特別好玩,收到私信后會(huì)驚訝地問(wèn),聽(tīng)歌識(shí)曲后臺(tái)是不是有人工一直守著,是不是員工偷偷識(shí)別出來(lái)的。”團(tuán)隊(duì)成員Jerry笑著說(shuō)。
有好幾次,Jerry在看電影時(shí)發(fā)現(xiàn)前排觀眾的手機(jī)屏幕亮了,界面顯示的正是在使用QQ音樂(lè)聽(tīng)歌識(shí)曲,“那時(shí)候的感覺(jué),可能就是標(biāo)準(zhǔn)的幕后英雄。”聽(tīng)得出Jerry的自豪感。
QQ音樂(lè)聽(tīng)歌識(shí)曲功能
讓AI學(xué)會(huì)欣賞、辨別每一首歌,對(duì)樂(lè)迷的好處顯而易見(jiàn):聽(tīng)見(jiàn)更多好歌,不會(huì)錯(cuò)過(guò)任何一首喜歡的歌。但在音樂(lè)創(chuàng)作層面,技術(shù)的革新,還將帶來(lái)更加深遠(yuǎn)的影響。
改變:當(dāng)技術(shù)服務(wù)于藝術(shù)
“在PDM誕生之初,我們也曾請(qǐng)新生代歌手帶著音樂(lè)作品來(lái)做內(nèi)部測(cè)試,發(fā)生了一些很有意思的事情。”Ben介紹。
“參與測(cè)試歌手”就有應(yīng)嘉俐,不少聽(tīng)眾都聽(tīng)過(guò)應(yīng)嘉俐的《涼茶》《那又如何》:“當(dāng)時(shí)正好是國(guó)際Discovery頻道團(tuán)隊(duì)來(lái)對(duì)QQ音樂(lè)‘黑科技’進(jìn)行訪問(wèn),我和我的新作品體驗(yàn)PDM系統(tǒng)的經(jīng)歷也有幸被拍攝見(jiàn)證。”在這次PDM的打分測(cè)試時(shí),應(yīng)嘉俐帶來(lái)了兩首全新作品《神游星期天》和《上山來(lái)》。
“我一開(kāi)始覺(jué)得,《神游星期天》的分?jǐn)?shù)不會(huì)比《上山來(lái)》更高,因?yàn)榍罢邘е腋嗟膫€(gè)人印記,而《上山來(lái)》是一首命題作文,是為電影創(chuàng)作的插曲,編曲配樂(lè)都更加偏向流行。”應(yīng)嘉俐告訴刺猬公社。
但PDM判定的結(jié)果卻出人意料:認(rèn)為《神游星期天》的旋律更朗朗上口,更適合向受眾推廣。她對(duì)此感到十分驚訝,“打動(dòng)我的也是打動(dòng)PDM的一個(gè)因素,但是這個(gè)想法我并沒(méi)有告訴過(guò)PDM團(tuán)隊(duì)”。
原來(lái),《神游星期天》的旋律雖然安靜平緩,卻讓她傾注了非常深厚的感情,而《上山來(lái)》對(duì)她來(lái)說(shuō),更像是一篇“命題作文”。“超出我想象的是,PDM好像特別了解歌手創(chuàng)作時(shí)的情緒和微妙的思考似的,PDM在對(duì)歌曲情感的判定上,《神游星期天》的分?jǐn)?shù)也要高很多,這跟我自己的情感感受很一致。”
這次打分,也讓?xiě)?yīng)嘉俐開(kāi)始重新審視技術(shù)。作為專業(yè)音樂(lè)人,她在打分之前對(duì)技術(shù)總是抱有疑問(wèn):“單從音樂(lè)技術(shù)上而言,就有非常多細(xì)化的標(biāo)準(zhǔn),AI能夠做到專業(yè)嗎?”在看到QQ音樂(lè)的后臺(tái)系統(tǒng)后,她的想法大為改觀:“評(píng)價(jià)一首歌的所有細(xì)分門(mén)類和專業(yè)技術(shù),都有完整的體系了。”
但讓?xiě)?yīng)嘉俐感觸最深的,還是經(jīng)過(guò)PDM的打分,讓她更明白在創(chuàng)作上,要保持自己的初心,延續(xù)自己的風(fēng)格,這才是創(chuàng)作的本質(zhì)。
讓音樂(lè)人能夠不受限制地表達(dá)內(nèi)心,同時(shí)又讓這些表達(dá)能夠走進(jìn)億萬(wàn)樂(lè)迷耳邊,“有了這些好的案例,這讓我們對(duì)技術(shù)有了更大的信心。通過(guò)PDM技術(shù)去找出滄海遺珠,酒香也怕巷子深,我們要找到懷才不遇的好音樂(lè)和音樂(lè)人,給他們更好的機(jī)會(huì)。”雷教授說(shuō)。
其實(shí),經(jīng)過(guò)多年深耕,QQ音樂(lè)已走出了一條深受認(rèn)可的“科技匠心”之路。2019與2020連續(xù)兩年,在國(guó)際音樂(lè)學(xué)術(shù)界公認(rèn)的最權(quán)威比賽——國(guó)際音頻檢索評(píng)測(cè)大賽上,QQ音樂(lè)(PDM) 技術(shù)團(tuán)隊(duì)不僅在“預(yù)測(cè)識(shí)別”中取得突破性結(jié)果,一舉打破世界紀(jì)錄。同時(shí),QQ音樂(lè)的“聽(tīng)歌識(shí)曲”等音頻技術(shù)也奪得兩項(xiàng)世界冠軍,三項(xiàng)成績(jī)打破世界紀(jì)錄。當(dāng)時(shí)連小馬哥都在朋友圈為產(chǎn)品獲獎(jiǎng)成果點(diǎn)贊,這在內(nèi)部相當(dāng)罕見(jiàn)。
除了在國(guó)際頂級(jí)技術(shù)舞臺(tái)上拋頭露面,QQ音樂(lè)還推出了“銀河音效”,將用戶“聽(tīng)”的體驗(yàn)全面升級(jí),同時(shí)上線了全新黑科技“定制音效”——通過(guò)用戶耳形特征和聽(tīng)覺(jué)特征的智能化分析,打造“私人訂制”體驗(yàn)。最近,銀河音效又“上新”了針對(duì)揚(yáng)聲器聽(tīng)音的“外放環(huán)繞音效”和“車(chē)載定制音效”。編輯部的黃湘就絲毫不吝惜對(duì)音效體驗(yàn)的贊美,“前者能夠省下一個(gè)小音箱的錢(qián),而后者則是駕車(chē)出游聽(tīng)歌必備。”
QQ音樂(lè)“銀河音效”上的“定制音效”
不僅在音樂(lè)實(shí)用技術(shù)上,QQ音樂(lè)多媒體技術(shù)團(tuán)隊(duì)更是在科技向善的“科技+溫度”這條路上一路狂奔,基于當(dāng)下年輕人對(duì)聽(tīng)書(shū)這一“耳朵經(jīng)濟(jì)”的進(jìn)階需求,QQ音樂(lè)已獨(dú)家研發(fā)并最新上線行業(yè)首個(gè)“AI有聲書(shū)”功能,尤其是語(yǔ)音合成AI主播“Q音電臺(tái)bot”,是業(yè)界首個(gè)可以朗讀出極具情感表現(xiàn)力的嗓音,第一個(gè)成功用“黑科技”表達(dá)“聲音中的細(xì)微情緒”,為用戶提供更加聲臨其境的有聲書(shū)體驗(yàn)。
13世紀(jì),意大利畫(huà)家借用更加巧妙的化學(xué),大幅改良了一種名為“濕壁畫(huà)”的繪畫(huà)方法,讓墻壁上的繪畫(huà)能夠保存得更久,色彩更靚麗。得益于新興的技術(shù),當(dāng)時(shí)的畫(huà)家們可以用更加新穎的主題,在大面積墻壁上繪出栩栩如生的人物。近200年以后,米開(kāi)朗基羅、達(dá)芬奇相繼用同樣的技術(shù),繪下了他們的傳世名作,成為文藝復(fù)興運(yùn)動(dòng)的“最高瑰寶”。
這個(gè)例子看似和音樂(lè)界沒(méi)有關(guān)系,但科技和藝術(shù)創(chuàng)作從未分開(kāi),隨著科技的革新,堅(jiān)持科技向善,憑借“科技+溫度”的藝術(shù)創(chuàng)作將可以用全新的方式釋放美——或許可以想象一下,在QQ音樂(lè)科技的步步“升溫”之后,會(huì)不會(huì)讓音樂(lè)創(chuàng)作,乃至我們每個(gè)人的音樂(lè)生活產(chǎn)生翻天覆地的變化?
將要發(fā)生的一切改變,值得拭目以待。
文章來(lái)源于“刺猬公社”,作者:刺猬君
相關(guān)資訊
評(píng)論
- 評(píng)論加載中...