顯示具有 科技產業- 新產品 標籤的文章。 顯示所有文章
顯示具有 科技產業- 新產品 標籤的文章。 顯示所有文章

2025年7月23日 星期三

Y社的AI鋼琴

譯自:音遊人


為了能讓更多人能使用而持續進化的AI鋼琴


[前言]


要與誰呼吸一致來演奏的「合奏」,絕對是只有一人無法品嘗到的一種音樂上之喜悅。不過近年來發展出了能夠分析.判斷出人類演奏節奏、聲音強弱或各種變化傾向,而加以配合的AI技術,使得「就算是只有獨自一人,也能和無人鋼琴一起合奏」這件事逐漸變成了現實。這次我們就想請教Yamaha公司的前澤陽先生,請他來談談這樣的夢幻技術的開發與進展。


使用AI來預測人的演奏並且一起合奏的理想


前澤先生是從大學與研究所時代,就開始進行讓機器理解音樂的研究。在進入Yamaha之後,也參與過可以分析出樂曲節奏與和聲進行的App、也就是讓機器取代人耳來「抓譜(複製音樂)」的系統。在這之後,開始對機器能參加人類之間的合奏技術感到興趣。


前澤先生說:「我自己雖然也拉小提琴,但進入職場工作後非常忙碌,變得很少有時間能和之前合作過的演奏夥伴合奏。遇到這樣的狀況,好比說就算到了下班後的深夜可以自己一人來演奏時,也還是會覺得此際剛好有個樂團成員在旁邊一起合奏的話,該有多好啊?這就是我一直在思考的事情」。


而這樣的新課題,其實等於就在前澤先生以往研究的延長線上。換句話說,只要能讓機器聽了人類的演奏而進行學習,並且能讓機器推定出人類的演奏是怎麼回事,就是這個技術的關鍵概念。如果機器能理解出人類現在演奏的是多快多慢的速度、多強多弱的音量,並且在下一段樂句開始前預測出該要怎麼配合人類演奏,就能讓機器和人類一起演奏了。而這樣的發想,就成為了AI鋼琴的基本概念。


實現讓AI鋼琴進行超越時空共演的理想


前澤先生首先辦到的是2016年和東京藝術大學合作開發的「人工智能演奏系統」專案,而應用這個專案所生成的AI鋼琴,成功地和柏林愛樂夏隆重奏團(Berlin Philharmonic Scharoun Ensemble)之弦樂團員們完成了舒伯特的鋼琴五重奏「鱒魚」(第四與第五樂章)的現場合奏。(參照底下連結)


https://youtu.be/40IRfETlvSs?si=vbUoFXHHc1ao31rb


這個「人工智能演奏系統」是使用麥克風與錄影相機來捕捉弦樂演奏者的演奏與動作,而能掌握住正確的時機來成功完成鋼琴和弦樂的合奏。而且,這個AI鋼琴的演奏資料(學習資料)是模仿俄羅斯鋼琴大師李希特生前的演奏來製作的,等於是讓柏林愛樂夏隆重奏團和李希特大師「跨越時空共演」呢。


到了2019年,加拿大的鋼琴怪傑顧爾德的演奏,也是透過AI學習的方式「復活」了。在前面的專案(「人工智能演奏系統」)中,其主軸是去偵測人類演奏的時機,而讓AI配合人類合奏;而這個顧爾德重現專案,則是讓AI學習顧爾德過去的演奏超過一百小時以上,而完成了能夠重現顧爾德的觸鍵與速度感等等演奏風格的新課題。前澤先生說:「至此為止前,要讓AI演奏的資料,必須事先學習製作出來才行,而這次的顧爾德重現計畫,則是可以讓AI看過樂譜後自行『思考』,再配合時機產生出適當的演奏」。

 

除了像這樣可以達成超越時空的豪華共演、或是成功高度重現歷史大師的演奏以外,前澤先生說:「其實AI鋼琴的真正目標是讓更多人來使用它」。這樣讓更多人來使用的嘗試,則是有2018年舉辦的「Duet with YOO」體驗活動、或是2021年公開的「Project Sekai(世界) Piano」體驗活動等等,正在一步一步朝向實現目標前進。「Duet with YOO」這個系統,是當你彈奏「小星星」的旋律後,AI鋼琴可以掌握住彈奏時的強弱與氣氛,產生出符合前面演奏的改編伴奏以進行合奏。至於「Project Sekai Piano」,則是配合彈奏的鋼琴聲,產生出各種不同虛擬歌手的歌聲加入演奏的系統。


有了這樣的系統後,可以期待未來在現場音樂會等演出舞台上出現更多活用AI鋼琴的實例。


前澤先生說:「例如,或許可以配合浮現於舞台上的虛擬全像影像之動作,一起進行合奏」。另外,以往在現場演出中樂團搭配播放事先預錄好的音樂來合奏時,鼓手必須一面聽著節拍器來抓住預錄錄音的節奏來敲擊,但前澤先生認為:「只要能活用可以捕捉人類演奏特色的AI系統,應該就可以將演奏時機主導權回歸到人類手上(是AI配合人類,而不是人類配合錄音)」。


AI鋼琴和當紅鋼琴演奏家在舞台上共演


而這個可以親眼目睹在舞台上活用AI的機會也實際出現了。就是2022年6月、7月間和當紅鋼琴家、也是YouTuber的Yomii(よみぃ)合作舉辦的「Yomii Zepp Tour」巡迴演出。


同時Yomii也在自己的YouTube頻道中上傳了和前澤先生開發的AI鋼琴進行比較的影片。這影片除了檢視了AI鋼琴的可能性以及提升樂趣的方式,另一方面也「吐槽」了AI系統的弱點,而讓前澤先生跳腳。前澤先生說:「我也會跟著一起參加巡迴演出,親自享受活用AI技術的樂趣。越是參與更多的嚴酷現場演出,越能獲得貼近演奏家的感觸,對於製作更接近實際音樂家表現的系統有很大的助益,讓我很期待這個可以實際驗證的機會」。


===


2025年2月24日 星期一

尖銳社的AI健身教練

譯自:夏普官方部落格


跟三天打魚兩天曬網說再見,想在客廳進行健身訓練的話,就交給「AI健康管理訓練師」吧!


[前言]


不知道大家怎麼處理自己每天的健康管理?


因為運動不足而很在意體型的我,往往看了健檢報告或與健康有關的電視節目後,就會擔心自己的身體,而臨時起意開始鍛鍊身體。不過,不知道哪種運動該做多久比較適當、是不是有效果也讓人半信半疑,所以想要運動的動機就慢慢越來越低,以致到最後完全放棄。然後這樣的流程就一而再、再而三地反覆不斷...。

2024年12月19日 星期四

Grok-2實測


前幾天,本教主進行例行性視察某中正區速食店(自稱「人間觀察」)時,除了意外欣賞到了一如連體嬰的年輕情侶精彩恩愛畫面(保護級,勿大驚小怪)以外,還聽到了隔壁桌貌似討論天下國家大事的高中生們在討論Grok的圖像生成功能,這莫名其妙地點燃了本教主的好奇心。


老實說,Grok這東西是啥,倒也不是第一次聽說。畢竟為了收集有的沒的情報(不要問是甚麼情報,粉口怕!!!),本教主經常會在原名推特的X社群中潛水。所以當它們推出了Grok這個付費AI生成工具時,我當然也在我的帳號中看到了。只不過當時覺得現在AI生成式服務很多,Grok能做的事情應該也差不多,而且要付費的話,我使用O社的ChatGPT或M社的Copilot就好,沒必要多此一舉。

2024年10月9日 星期三

開箱文(197)-7 夥計來了 ClariMate使用感想總結(完)

玩了整整一個禮拜,除了MIDI外行人的部分沒辦法太深入以外,大致上都玩過一輪了。所以,想來整理一下自己的使用經驗與心得,給大家參考。

2024年10月8日 星期二

開箱文(197)-6 夥計來了 禁斷的ClariMate MIDI功能


以上就是ClariMate基本的設定部分,接下來就要進入禁斷(?)的MIDI功能部份了。


不過,我對於MIDI I/O以及相關設定也完全是門外漢,所以就算進入了MIDI控制器的部分,如下圖,也不知道各個設定參數的意義....

2024年10月7日 星期一

開箱文(197)-5 夥計來了 ClariMate的訓練設定

以上簡單把如何進入USB模式與藍芽模式中進行簡單設定的內容大致說明過一遍,大致上就夠想要在家「靜悄悄」「偷練」的人開始使用了。接下來要則是要說明可以把ClariMate設定得更像真正的單簧管的「訓練設定」了---因為事前做了太多功課,感覺這個設定有點複雜、很容易失敗而不敢大膽設定下去。不過,說真的,既然自助餐社已經幫大家準備好了「恢復原廠設定」這個大絕招,一買來就直接進行「訓練設定」也不用害怕才對。反正出了問題,就恢復原廠設定就好啦!

2024年10月6日 星期日

開箱文(197)-4 夥計來了 ClariMate的藍芽模式

再來則是藍芽模式,如果想跟手機上的其他App搭配起來使用的話,這個模式就很重要。不過,只要藍芽成功配對的話,後面使用的部分,和USB模式幾乎相同。


要使用藍芽模式之前,要做一些準備動作,特別是要在手機上使用藍芽模式的話,首先當然是先下載並安裝ClariMate手機專用App才行。這個App可以簡單在說明手冊提供的QR Code上查到,當然直接在手機的App Market(例如Google Play)中搜尋到。安裝上也還算單純,這裡就省略說明了。

2024年10月5日 星期六

開箱文(197)-3 夥計來了 ClariMate USB模式與各項初步設定


進入USB模式(請記得按下左上按鍵三秒+右上電源鍵一秒>放開電源鍵>直到紅色燈號亮起再放開左上USB鍵)後,打開ClariMate的專用程式(如下圖,重揭):



打開這個程式後,應該就會看到以下這個畫面:

2024年10月3日 星期四

開箱文(197)-1 夥計來了 ClariMate各部介紹篇

颱風假要幹甚麼?當然是來開箱囉(無誤)。


如之前一系列介紹文所述,自助餐社的電子消音器ClariMate在日本正式上市這件事的葉佩雯,讓我很感興趣。


剛好有教徒C要去日本放風(?),問我有沒有甚麼好買的東西?和他討論了一下,發覺他好像為了平常找不到地方練習所苦,因此也建議他這個東西可以列入採購清單之一。

2024年9月24日 星期二

Clarimate介紹與使用效果(04) 完 實戰練習


以上花了很長的篇幅介紹設定,主要這東西和一般的電子吹管樂器不太一樣,不是手指亂按(沒禮貌)就好的東西、也不是隨便吹就有聲音,一樣是要擺嘴型和要有足夠支撐的氣息的。


那麼,實際把這東西拿來練習,功效如何?是否能達到在不吵人的情形下練樂器的需求、而不只是個電子玩具?

2024年9月23日 星期一

Clarimate介紹與使用效果(03) 關鍵的訓練設定


接下來就要介紹最重要的「訓練設定(Training Set)」。


根據官方的說法,這個「訓練設定」,可以說是ClariMate內建的聲音辨識技術的重要元素之一。


其原理是將使用真正的單簧管發出聲音時同樣的指法進行「訓練設定」,存入ClariMate之中;在實際使用ClariMate時,就會根據操作時使用的指法和「訓練設定」儲存的指法進行比對,來判斷輸出甚麼音到耳機去。

2024年9月21日 星期六

Clarimate介紹與使用效果(02) 各種操作模式與設定


在介紹ClariMate設定之前,有必要先說明一下這個產品到底有甚麼功能。以下這段文字,是直接從官網上抄過來的,給大家參考。

2024年9月20日 星期五

Clarimate介紹與使用效果(01) 各部分介紹與組裝方法

自助餐社在2022年年末推出了新的電子產品,稱為「ClariMate」,直譯的話,大約就是「單簧夥計(霹靂遊俠風XD)」。一開始,我以為這不過是個噱頭,沒有很注意其實際介紹內容,只說:大概不會買。


不過慢慢看到網路上有人開箱,慢慢覺得它其實正是許多苦於找不到地方練習的人所追求的「電子消音器」功能,開始就感興趣了。換句話說,過去許許多多人嘗試的各種「弱音器」、「消音器」通通可以丟到垃圾桶中了。(悲劇參考:弱音器研究前篇弱音器研究後篇


最致命(?)的還是江湖上人稱尼神的大神尼可拉斯也替這東西拍了一部展示片,相信應該會打動許多人才對,而且發現這東西可以當作一種電子吹管樂器來使用,製造出各種電子音樂。

2024年8月24日 星期六

Clarimate官方試吹報告

譯自:布菲日本分公司官網


大阪愛樂交響樂團團員.大阪音樂大學講師田本攝理ClariMet試吹感想


[前言]


2024年7月在日本正式公開販賣的數位消音樂器「ClariMate」。在產品正式出貨前,我們邀請了希望參與試吹的單簧管演奏家田本攝理先生(大阪愛樂交響樂團團員.大阪音樂大學講師)來請教他的試用感想。

2024年4月11日 星期四

Raptor

譯自:Monoist


合體!變身!還能變形?!新開發的移動載具「Raptor」顛覆乘用物的概念


文:朴尚洙


千葉工業大學未來機器人技術研究中心(fuRo)與研究開發型企業RDS公司,兩者透過合作設立的ROIDZ TECH公司在2024年4月3日於東京召開記者會,發表其新開發之平台型移動載具「Raptor」。此產品的最大的特徵,就是具有整合了前二輪/後一輪之三輪構造以提供行走功能、稱為「基座單元(Basement Unit)」的下部模組;並且可以這個下部模組作為構造平台,然後和可以自由自在設計成各種外觀與不同用途、功能的上部模組「設計單元(Design Unit)」組合起來,實現出可做成包含自動搬運機器人在內等等不局限於乘用功能的各種移動載具。現在正在進行為了上市銷售的開發工作,快的話ROIDZ TECH公司可能會在2024年底前正式開賣。雖然賣價一開始設定為和高級機車同一水準,但為了普及推廣,也正在檢討低成本版本的可能性。目前也正在和不少外觀設計師與企業合作開發,目標是在開賣三年內能賣出100輛。

2024年1月25日 星期四

日本使用生成式AI現狀問卷調查

譯自:ITMedia


1400人問卷調查


生成式AI是年收越高者使用越多?職業類別上是「技術」、「顧問」類人員最常使用


約有兩成的人在自身工作上「正在使用」生成式AI。這是經營轉職網站的「英才日本公司(en Japan)」所得到的問卷調查結果。而且從這份問卷報告得知,根據年收的不同,生成式AI的使用率也大不相同。

2024年1月12日 星期五

P社導入ChatGPT實例(02) 使用的重點與課題

分析資料的時間縮短到1/90


ChatGPT可以應用到很廣泛的工作範圍上。試想如果是使用在整理資料或是寫作提案書上,只要讓ChatGPT來收集或整理資料、寫出報告書草稿,就能縮短工作的時間。節省下來的時間,可以讓人們專心在更需要創造性的工作上,也能期待工作品質更高。

2024年1月11日 星期四

P社導入ChatGPT實例(01) 導入背景

譯自:Monoist


不僅是為了提升生產性,Panasonic Connect公司全體導入ChatGPT的理由


[前言]


ChatGPT是目前全世界引起最多話題的AI。Panasonic Connect公司是在日本企業中少數先期全體導入ChatGPT的公司之一。本文就是實際採訪該公司導入ChatGPT的背景與應用的可能性。


現在還沒聽過「ChatGPT」這個名詞的人,恐怕是不存在了吧?這是美國OpenAI公司推出的對話型AI,在2022年11月公開之後,立刻在全世界造成震撼。因為只要是使用自然語言詢問這個AI,它就能快速地以流暢的文字回答。雖然要注意其回答不能保證正確,但其能精確地解讀詢問文義、回答的能力也十分高強,這是不論是誰都會相當驚訝的事實。

2023年12月18日 星期一

號稱世界最長後座螢幕登場


譯自:Monoist


使用種種手法實現號稱「世界最大車用螢幕」的LCD螢幕登場


~豐田汽車的雷克薩斯(Lexus,凌志)「LM」車型正式採用松下車用系統公司(Panasonic Automotive Systems)的後座48吋螢幕顯示系統。


*過去夏普、拜騰汽車、賓士汽車也都發表過大於48吋的車用螢幕,但都尚未能進入量產。


松下車用系統公司於2023年12月13日宣布豐田汽車的雷克薩斯品牌車型「LM」正式採用了該公司開發的48吋車用顯示系統。除了可以收看電視、收聽廣播、或是透過藍芽與USB連接的方式來欣賞音樂,也可以透過HDMI端子或Wi-Fi無線網路來連接電腦或手機等移動裝置來進行工作或娛樂活動。


松下公司投入車載後座顯示系統事業是在1997年,當時也是導入於豐田汽車的箱型車型「Granvia」。至今為止,也陸續完成螢幕大型化、採用懸掛於車頂下等等的新搭載方法、播放光碟片、連接無線網路的種種進化。這次搭載於新型LM車型的48吋螢幕,根據松下的說法是「世界最大車用螢幕」(松下公司的調查結果)。


這個48吋螢幕目前雖然還沒有擴大搭載於更多車種的計畫,但正在檢討提供給經銷商或後裝市場零售的計畫。此外,也會推銷給具有MaaS服務的車種使用。


圖:48吋後座螢幕發表



用於接送車(chauffeur)的後座來招待貴客


LM這個車型,就是用來專門接送貴客的多功能休旅車(MVP)。其開發目的就是提供後座的乘客有安心舒適的休息空間,並且在2023年4月進行大改款。而新型的LM為了接送貴客導向而特別產生的四座車型規格,考慮過後座的乘客(最多兩位)的種種使用情境,於是搭載了此次公開的48吋大螢幕。


圖:Lexus LM



這個48吋螢幕的長寬比為32:9,利用這樣相當狹長型的設計,可以表示出中央一個畫面(Full HD)、左右兩畫面(也皆為Full HD)、狹長全畫面等等不同的顯示模式。而且當處於左右兩畫面模式時,只要觸碰一下,就能將左右的畫面進行切換。而HMDI端子也有兩個系統,因此在車內也能順暢工作。


為了能將畫面尺寸最大化,松下公司特地和液晶螢幕廠商一起合作,一面考慮汽車電子產品需求的強度,一面追求邊框做得更窄。以往液晶面板都是固定四周邊緣,這次改用背面固定方式而且邊框縮小了42%的寬度。此外藉由液晶面板與顯示系統一體化而確保車用電子產品需要的剛性。因此就能在不損害外觀設計美感,卻能將畫面擴大到以往的液晶面板兩片的尺寸大小。


在開發過程中,松下集合了公司內曾經開發過液晶螢幕的經驗人員組成團隊,一面調整內部構造、一面領導液晶開發廠商同步開發新的面板。


也推想了側面衝撞的對策設計


48吋大尺寸顯示螢幕,已經是到了貼到車子兩側支撐柱的尺寸。所以車子遇到側面衝撞時,面板很容易會直接受到衝擊力,而且不難想像一旦破損時,會讓乘客受傷。因此松下車用系統公司還特別和豐田的車體設計小組,而成功完成了側面衝撞時不會破損的結構設計。豐田車體設計小組提供了車輛端遭受衝擊時的傳遞路徑資料,而松下公司則是提供各元件的材料特性與衝撞模擬下的元件分析行為,雙方共同進行研究。


原本開始時新型LM的後座螢幕是規劃成26吋的大小,但在接收到希望將螢幕尺寸更加大型化的要求後,才決定開發新型的大型螢幕模組。由於規格確定的延後,大尺寸面板的開發或必須克服車輛端的系統限制而調整相關元件設計,就必須要讓開發時間比以往要更短才行。


就在不僅是要確保品、還要縮短開發時間的條件下,這次松下公司嘗試導入以前檢討過的「Critical Chain Project Management(CCPM)」管理手法。所謂的CCPM就是將專案分解成各個不同的任務、並且將每個任務對整體日成的影響明確地排出優先順訊的一種手法。因此當初評估這個專案在功能設計完成與測試上總共要花費14.5個月,但在導入CCPM後,能夠全力專注在優先事務上、並且達成整體工作的最佳化下,最後將開發時間成功縮短了2個半月。


===


2023年8月4日 星期五

也算是一種股市評論

說到AI,圍棋界的捧油應該最銘心刻骨,因為簡直是被公開處刑的狀態(苦笑)。


不過在蒙地卡羅法剛出來的幾年內,AI下的棋譜一打開就能感受到滿滿的AI味,那種感覺就很像現在打開ChatGPT所回答問題的風格一樣。


在蒙地卡羅法出來,到阿發夠打敗李石頭,前後也有十年左右的時間。直到阿發夠打敗樊麾為止,蒙地卡羅法的程式修理一般業餘棋友是綽綽有餘,但問題很多、AI味很重卻也是一般棋友也能看的出來的現象。


其實這也是我對ChatGPT的預期:初看很驚艷,但還有一段路要走。(所以故意貼了很多測試文出來)


最近還測試了M$社的AI錄音轉文字服務,沒用之前也是萬分期待。真正測試下去,才發覺正確率恐怕還不到五成。讓我覺得還是不如回去自己聽寫打稿比較順手。但這將來一定會是很棒的應用,就像翻譯功能一樣,只是時間還沒到就是了~


只能說現在有點太瘋狂了。扣除掉最上游的領導廠商,其他的都是投資人的過度想像,仔細去看,很多都是垃圾。


說穿了,這也是這個時代的悲哀,資訊固然多,卻不知怎麼求證,有的時候可能比沒有資訊還糟糕。


共勉之&望周知


===


喔,你問那個錄音轉文字服務是怎麼回事?


其實還滿簡單的。如果有你M$社的W軟體,打開來點選底下這個指令



然後選擇上傳音訊或開始錄音即可。



理論上它((偉大的AI))會幫你斷句、加上標點符號,標記說話時間、辨別說話者。


但是其實正確率並不高,可能是中文比較困難(前後文接不起來)?很多名詞它還聽不懂吧(專業名詞幾乎都錯)?也可能是它對聲紋的掌握還不到位(明明只有兩個說話者,卻可能被辨認出八九個聲音)?總之,雖然這個功能推出也有段時間了,但離實用還有距離。


有興趣的捧油可以自己試試看。