10.07.2015 Aufrufe

24-以旋律辨識轉換簡譜之應用系統 - 長榮大學資訊管理學系

24-以旋律辨識轉換簡譜之應用系統 - 長榮大學資訊管理學系

24-以旋律辨識轉換簡譜之應用系統 - 長榮大學資訊管理學系

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

長 榮 大 學 資 訊 管 理 學 系 畢 業 專 案 實 作 成 果 報 告※※※※※※※※※※※※※※※※※※※※※※※※※※※ ※※ 以 旋 律 辨 識 轉 換 簡 譜 之 應 用 系 統 ※※ ※※※※※※※※※※※※※※※※※※※※※※※※※※※專 案 編 號 : CJU-IM-PRJ-096-0<strong>24</strong>執 行 期 間 : 95 年 2 月 13 日 至 96 年 1 月 20 日專 案 成 員 : 邱 顯 勳 、 黃 郁 雅 、 李 西 純 、 柯 博 盛 、 黃 昊 行 、 吳 宗 霖指 導 老 師 : 林 金 鋒中 華 民 國 九 十 五 年 十 一 月 十 七 日


在 開 啟 舊 檔 後 按 下 顯 示 簡 譜 即 進 行 旋 律 判斷 。 如 圖 七 所 示 。圖 八 完 成 進 度 圖圖 六 錄 音 畫 面圖 九 簡 譜 顯 示( 四 ) Play MIDI在 計 算 完 音 高 和 顯 示 簡 譜 後 , 就 可 按下 MIDI PLAY 來 試 聽 所 計 算 出 的 音 高 旋律 , 本 系 統 還 提 供 不 同 的 MIDI 音 色 來 增 加旋 律 效 果 , 如 圖 十 所 示 。圖 六 開 啟 舊 檔( 二 ) Display & Play WAVE在 錄 完 音 後 , 可 按 顯 示 音 波 來 觀 看 所錄 的 音 波 形 狀 為 何 、 錄 的 聲 音 有 無 對 到 節拍 、 錄 的 聲 音 會 不 會 太 小 聲 等 , 在 音 波 的顯 示 都 可 看 的 出 來 , 還 可 反 覆 試 聽 所 錄 的聲 音 , 看 是 不 是 使 用 者 所 要 的 旋 律 。 顯 示音 波 圖 如 圖 七 所 示 。圖 七 音 波 顯 示 圖( 三 ) Numberd Musical Notation在 錄 完 音 後 , 按 下 顯 示 簡 譜 , 即 可 開始 計 算 音 高 , 如 果 歌 曲 過 長 則 計 算 時 間 較久 , 使 用 者 可 看 完 成 進 度 的 狀 態 , 得 知 該歌 曲 的 計 算 進 度 , 計 算 完 後 , 即 顯 示 出 簡譜 , 如 圖 八 、 圖 九 所 示 。五 、 實 驗 結 果 與 分 析圖 十 MIDI 音 色在 實 驗 結 果 分 析 方 面 , 我 們 以 小 蜜 蜂 為 我們 實 驗 歌 曲 , 由 於 計 算 時 間 的 關 係 , 我 們只 取 全 曲 1/4。 以 不 同 的 取 樣 率 和 音 框 取 樣數 以 及 不 同 的 step 數 來 做 實 驗 分 析 。 以 下 圖表 T 代 表 時 間 ;P 代 表 正 確 率 , 正 確 率 的 計算 方 式 如 公 式 (5) 所 示 。N cP = × 100%(5)N其 中 N c 為 計 算 出 正 確 的 音 符 數 , 而 N 為 該歌 曲 正 確 音 符 數 。由 下 面 三 個 表 格 可 以 發 現 , 取 樣 頻 率越 高 計 算 時 間 會 越 長 、 取 樣 數 越 多 計 算 正確 率 會 越 高 。 取 樣 頻 率 、 取 樣 數 與 比 對 出來 的 正 確 率 成 正 比 , 所 花 的 相 對 時 間 也 較長 。 所 以 根 據 下 表 可 知 , 以 step2、11k 取 樣率 以 及 360 音 框 取 樣 數 是 為 最 有 效 率 也 最精 準 的 判 斷 。6


取 樣 數360512360512360512取 樣 率表 一 取 step1 做 計 算8kT = 61 secP = 64 %T = 83 secP = 72%表 二 取 step2 做 計 算取 樣 率取 樣 數8k取 樣 率取 樣 數T = 92 secP = 72%T=117 secP=72%表 三 取 step3 做 計 算8kT = 84 secP = 68%T = 101 secP = 60.5%11kT = 74 secP = 86%T = 106 secP = 100%11kT = 96 secP = 100%T = 115 secP = 100%11kT = 84 secP = 78%T = 93 secP = 66%根 據 以 上 資 料 得 知 「 小 蜜 蜂 」 播 放 時間 長 度 為 7 秒 , 音 高 即 音 長 判 斷 正 確 率 為100%, 計 算 最 佳 時 間 約 為 30 秒 。 實 驗 另外 又 判 斷 另 一 首 流 行 歌 曲 「 倒 帶 」 來 分 析 ,播 放 時 間 為 32 秒 , 音 高 判 斷 正 確 率 為100%, 音 長 判 斷 正 確 率 為 84%, 計 算 時 間為 120 秒 。WAVE 檔 的 產 生 , 就 是 將 所 要 紀 錄 的聲 音 , 忠 實 的 刻 畫 下 來 , 而 WAVE 是 以 取樣 的 方 式 記 錄 , 所 謂 取 樣 是 把 聲 音 分 割 為數 個 小 段 , 再 把 各 小 段 的 聲 波 儲 存 為 小 型的 聲 音 數 位 樣 本 。 而 取 樣 率 就 是 每 秒 鐘 記取 的 樣 本 數 量 , 每 秒 鐘 取 樣 的 數 量 愈 多 ,電 腦 所 能 呈 現 的 波 型 就 愈 精 確 愈 完 整 , 當然 播 放 時 也 就 越 能 達 到 原 音 重 現 的 水 準 。若 希 望 所 錄 的 聲 音 能 呈 現 較 為 精 確 , 每 秒鐘 必 須 取 樣 數 千 個 樣 本 才 能 達 到 原 音 重 現的 效 果 , 但 是 所 佔 的 檔 案 空 間 也 變 大 。 愈高 的 取 樣 率 所 記 錄 結 果 愈 佳 , 而 人 類 一 般說 話 聲 音 頻 率 在 4KHz 內 , 約 可 達 清 晰 的效 果 。 因 此 本 系 統 為 了 達 到 精 準 的 判 斷 而檔 案 又 不 至 於 過 大 所 以 採 用 11KHz 為 取樣 頻 率 。六 、 結 論 與 未 來 展 望在 這 個 系 統 最 常 出 現 的 問 題 是 音 高 偵 測 部分 , 而 通 常 有 許 多 的 因 素 , 其 中 有 使 用 者本 身 音 準 問 題 與 是 否 有 對 準 到 節 奏 等 , 這些 都 會 造 成 電 腦 錯 誤 判 斷 。 雖 然 我 們 結 合了 AMDF 與 ACF 這 兩 種 演 算 法 , 已 經 將錯 誤 降 低 , 但 發 現 還 是 無 法 非 常 精 確 , 因此 我 們 將 取 樣 頻 率 增 加 , 使 音 高 判 斷 更 精準 。 要 音 高 判 斷 精 準 , 速 度 亦 快 , 是 無 法兩 全 其 美 , 為 了 兼 顧 兩 者 , 我 們 在 音 高 判斷 與 計 算 速 度 間 取 一 個 平 衡 點 , 但 由 於 音高 判 斷 是 本 系 統 重 點 , 故 偏 重 於 音 高 準 確度 , 而 判 斷 時 間 則 較 冗 長 。在 未 來 展 望 方 面 , 我 們 希 望 在 音 高 判斷 上 能 夠 更 精 準 與 人 性 化 , 判 斷 速 度 也 能加 快 , 此 系 統 才 能 更 有 效 率 , 更 符 合 使 用者 需 求 。七 、 參 考 文 獻[1] Caiani, E.G., Porta, A., Baselli, G., Turiel, M.,Muzzupappa, S., Pieruzzi, F., Crema, C.,Malliani, A. & Cerutti, S., "Warped-averagetemplate technique to track on a cycle-by-cyclebasis the cardiac filling phases on leftventricular volume," 1998.[2] 李 俊 毅 , " 語 音 評 分 ," 中 山 大 學 碩 士 論 文 ,2002.[3] Patricio de la Cuadra, Aaron Master, "CraigSapp, Efficient Pitch Detection, Techniques forInteractive Music," Center for ComputerResearch in Music and Acoustics, StanfordUniversity, 2002.[4] Kavita Kasi, B.Eng, "Yet Another Algorithm forPitch Tracking," Andhra University, India, June1999.[5] Gareth Middleton, "Pitch DetectionAlgorithms," produced by The ConnexionsProject and licensed under the CreativeCommons Attribution License, 2003.[6] 任 蓉 , " 美 聲 法 與 藝 術 的 歌 唱 ," 樂 韻 出 版 社 , 台北 , 1995.[7] 劉 大 仁 , " 加 速 時 間 序 列 資 料 比 對 演 算 法 設 計及 其 在 內 容 導 向 語 言 檢 索 系 統 之 製 作 ," 國 立高 雄 第 一 科 技 大 學 電 腦 與 通 訊 工 程 系 .[8] 王 儀 蓁 , 李 宏 儒 , 張 智 星 , " 旋 律 辨 識 的 加 速 與比 較 ," 清 華 大 學 資 訊 工 程 所 .[9] 劉 致 瑋 , " 體 貼 式 人 機 介 面 - 聲 音 訊 號 分 析 ," 國立 政 治 大 學 資 訊 科 學 系 .[10] 李 宏 儒 , 許 肇 凌 , 王 儀 蓁 , 張 智 星 , " 多 模 式 音7


樂 檢 索 系 統 ," 國 立 清 華 大 學 資 訊 工 程 學 系 .[11] Shih Hsuan-Huei; Narayanan, S.S.; Kuo, C.-C.J,"An HMM-based approach to hummingtranscription," Proceedings IEEE InternationalConference on ICME 2002, Vol. 1, Aug. 2002,pp. 337-340.[12] 盧 育 聖 , " 具 有 漸 進 學 習 性 之 中 文 相 連 音 辨 認系 統 ," 成 大 電 機 研 究 所 碩 士 論 文 , 1991 年 .[13] Pollastri, E., "A pitch tracking system dedicatedto process singing voice for music retrieval,"Proceedings IEEE International Conference onICME 2002, Vol. 1, Aug. 2002, pp. 341-344.[14] 羅 有 隆 ," 在 音 樂 資 料 中 有 效 率 的 發 現 非 不 重要 重 覆 片 段 ," 朝 楊 科 技 大 學 資 管 所 碩 士 論 文 ,2002.8

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!