2015年2月23日 星期一

欲解繁音促節

很久以前就對自動轉譜有興趣。設計一個機器能夠把音樂轉成樂譜,是一件再有趣不過的事。多年前,我就曾經嘗試從音樂的頻譜成份看出旋律和伴奏的每個音;換句話說,至少要找出每個時間點共有那些音被演奏。

固然這是相當困難的問題。畢竟對人而言,能把各種音樂轉成樂譜,仍是高度專業的技能。音樂奇才如莫札特等所流傳之種種傳奇故事中,所強調的除了高超的演奏能力以外,就是轉譜或背譜的能力。

以上所指的高超與困難,當然是那種旋律、和聲、節奏以至於配器等等都很龐雜的曲子。至於兒歌之類的小曲,編以基本和聲者,就簡單得多,只要有些經驗,花點時間,皆當能正確轉譜。

但諷刺的是,就因為這樣,我發現,自動轉譜問題的難度反而常常被許多具備相當音樂知識的人所嚴重低估。這主要是因為許多我們非常熟悉的音形,在信號層次上並沒有那麼好分析。

最經典的例子大概就是單音和八度雙音的問題。一個完全八度音程中的兩個音,頻率比為二比一,造成雙音之頻譜完全重疊,各泛音之相位更是不一定,重疊的泛音可能同相,可能反相,疊加之信號強度自無法預期,頻譜本身也就難以展現任何可循的法則。

今天用鋼琴彈一個Do,或者張開手掌,同時彈下低音Do和高音Do,這兩種聲音,很難用目前的信號分析工具有效分辨。我跟很多學過音樂的人提過這件事,得到的回應大概都是「這很簡單啊,怎麼會難」。是的,聽覺上很簡單,但在信號、物理層面就是不容易。至於為什麼很容易用人耳聽出來?這大概又是另一個研究題目了。

今年設計了一個處理多聲部音高的演算法,初次參加MIREX,跑了四十餘首從單聲部到五聲部的音樂,只抓對了48.8%的音符(連一半都不到),但這樣的準確率,在2007年MIREX開始這個比賽項目以來,上百份參加的code中,竟也名列第19,且前20強大部分準確率都相差不大。

另一方面也有看到突破。KTH的Anders Elowsson等今年突破70%之準確率,為歷年之最高。但很明顯的,這與真人的轉譜能力、與任何可能的實際應用,都還有一些距離。我則認為,觀諸近十年來之相關研究,其實可以發現還有很多切入點,還有太多的信號處理或機器學習的工具可望發揮奇效卻仍未被深入探討,想法繁多,唯日不暇給,力有未逮。

大家若對自動轉譜技術與未來可能的應用感興趣或有任何想法,非常歡迎與我討論。2014年MIREX Multi-F0 Estimation之結果與相關數據如下:

http://www.music-ir.org/mirex/wiki/2014:Multiple_Fundamental_Frequency_Estimation_%26_Tracking_Results

2013年2月19日 星期二

黃昏之後

我在研究室裡度過了黃昏,然後緩步來到街上,看無數車輛在綠燈發亮的瞬間一齊狂奔。引擎的聲響極有氣勢,廢氣一瞬間迸發擴散。其中有無窮的生命力,驅動著有機物的燃燒,產生二氧化碳、熱能、種種難題、以及龐大的意志力。公車裡裝滿了人,車頂上一盞燈勾勒出人群的輪廓,自我眼前一閃而過。沒有人告訴我晚餐的內容。我沿著人行道走著,從容地構思一個人的晚餐計劃,而後排定購買順序,行走動線,然後附諸實行。日復一日如此,時間久了以後,偶爾會出現強迫的感覺,那是一種對晚餐的倦怠,是對規劃晚餐內容的行為著迷過度的一種結果。我並無法免疫於這種症狀,也不覺得我會因此變得不健康。這件事畢竟也是需要思考,也需要嘗試的,就像工作,就像設計一個電路一樣。感覺起來天差地遠,但是在某些時候,這些事情對我並沒有什麼不同。

有人對這種近乎自閉的孤獨狀態嗤之以鼻。他們認為我們既有所屬的群體,不總是身在其中,乃是一種生活的浪費。然而許多人與我卻與他們不同。我享受那種無雜訊的行走,沒有太多話是說過就忘了的,也沒有太多聽聽還得勉力強記的談論。那時候就能看見鳳凰樹的細葉點綴空無一物的天空,就能看見隱藏在巷弄內不起眼的招牌,就能看見路一直往前方遠去逐漸隱沒的樣子。那時候就可以看見在過去或未來發生的事。與愛人朝朝暮暮,在肢體的溫存中暫時忘卻自己,實為一種絕美的,至上的境界,但那種狀態幾乎不曾出現,因為人總是看得見自己,總是在什麼瞬間,視線移到自己模糊的鼻尖,一個意識突然闖入了原本的狀態,什麼都中斷了,其他的什麼都開始了。有了快樂就想知道快樂的源頭,快樂引導人不滿足於現狀。所謂滿足,有兩層的意義,第一是滿足這件事本身的定義,第二是在該定義下劃出滿足的極限,知此二者,方能知足。知足於人何其難矣哉。

觥籌交錯,熱鬧的飯局結束後,意猶未盡,但大家仍互相道別,各自走散,因為有人得處理家裡雜務,有人為了明天的工作得早點休息,也有人其實無所事事,只是順從了大家的決定。回到住處的路上,內心往往會湧起一股沉重的孤獨感,形諸於路燈昏雜的光,與行道樹間偶來的夜風。但,在那種情境中,我更能想通一些困擾自己的難題,更能看清一些朦朧的生態。那種孤獨固然是痛苦的,但那卻是一個內心清明的人樂於忍受,也樂於享受的。宴起,宴散,就像是一個美妙的旅程。一群人在共同的目的地盡興玩樂,在歸途中也就在搖晃的車廂中放心睡去,在惺忪中將那些發生過的美好回憶一一倒帶播映。對,就是倒帶,一種在數位生活中已經快要消失的動作。回憶是一種特殊的訊號,倒帶需要時間,需要經驗,把過往的材料構築成完美的畫面和語言。懂得回憶的人,會讓每則回憶都成為表現力無窮的藝術作品。

適量的孤獨與適量的熱鬧,可以藉由黃昏之後離開研究室獨自的行走而一次達成。工作終究不應該夜以繼日,那樣並無法得到滿足。事實上,我常常在無眠的深夜裡,精神正好,索性起床來打開模擬軟體,做些電路設計的事,也不會覺得無聊。那是因為自己的內心已經澄澈過,處於一種欣然接受各種生活面向的狀態。是故,每天花一點時間在人群之外感受一種淡淡的哀傷,是我無可救藥的愛好。就像茶或咖啡,苦與甘混為一體,但就是有感覺的生活。

(2011.08.02)

南港山素描


〈南港山素描〉

         1. 象山

讓我們暫且放棄交通規則
與蟾蜍一起過馬路
測速照相只需瞄準
榕樹葉背後的蛹

爬上一千層階梯
終於懂得漂浮
在巨石的脊背上
我們對整座城市
收訊滿格

涼風接著熱風
把我們載往工作佇列的
二號出口

2. 虎山溪

只有蜘蛛曉得
在急流上方居住
看清晨如何梳洗苔蘚
落葉在壺穴裡旋轉

解說員教導幼童面對幼蟲
溪底的每顆石頭
都比課本還輕

被復育的螢火蟲
交配而後死去
看不到一年只五分鐘的
跨年煙火

3. 九五峰

當時,峭壁有話要說:
「山頂
只是詩中的兩個字」
所有的樹都默默點頭

於是我們繼續與烏雲野餐
用吸管緩慢啜飲
後半杯的旅程

直到陣雨過後的黃昏
城市的邊緣有叫賣聲
公車尾隨著公車
紅燈  等待綠燈

(第十屆台大文學獎新詩組首獎作品)