新聞
介紹 Sonilo v1.1
我們最強大的影片轉音樂模型
- 作者
- Sonilo 團隊
- 發布於
Sonilo v1.0 證明了一個簡單的理念:為影片配樂所需的資訊,早已存在於影片之中。v1.1 在這個基礎上更進一步,為您承擔更多工作。它更緊密地對齊您的影片畫面,保留影片中既有的人聲,並在您需要創意指導時,讓您逐場景塑造配樂。您不必再生成一段音樂後祈禱它合適,而是可以將一段保留完整對白與結構的剪輯交給 Sonilo,信任它交付出能精準落在每一個剪切點上的配樂。
在與 v1.0 的並排評估中,v1.1 在真實影片創作最艱難的環節中勝出。在我們為影片轉音樂標註的四個維度——節奏對齊、情感契合、提示遵循與音樂性——當中,評估者在 70 至 78% 的比較 中偏好 v1.1 或認為兩者相當,並且在表達偏好時選擇 v1.1 而非 v1.0 的頻率約為相反情況的 1.6 倍。
- 70–78%
- 在全部四個影片轉音樂維度中,比較裡偏好 v1.1 或認為其與 v1.0 相當的比例
- 1.6×
- 當評估者表達偏好時,選擇 v1.1 而非 v1.0 的頻率倍數
- 50 vs 30
- 提示遵循的偏好,v1.1 對 v1.0,是我們測得的最大差距
聆聽這次升級
同一段片段,兩個版本
相同的影片畫面,分別由 v1.0 和 v1.1 配樂。按下播放可同步播放兩者,然後點按其中一側,逐一比較各版本的音樂。
功能 01
更精準的音訊對齊
對齊一直是 Sonilo 的核心,而在 v1.1 中它變得明顯更加緊密。模型比 v1.0 更精確地將節拍、鋪墊和轉場鎖定在您影片的節奏上,沿著整條時間軸跟隨每一個剪切點與能量變化,讓音樂感覺像是為那段剪輯量身而寫,而非疊加上去。它依然以自然的音樂收尾作結,而不是生硬的剪斷或循環。
這些提升直接反映在評估中。上方的示範正是同一項改進——用聆聽而非測量去感受。
標註者在最能決定配樂是否鎖定於影片的兩個維度上偏好 v1.1 或認為其與 v1.0 相當:節奏對齊佔比較的 78%,以及 情感契合佔 70%。
功能 02 · v1.1 全新功能
保留人聲的生成
v1.1 全新推出,Sonilo 能夠分離影片中的原始語音,並在全新生成的音樂之上完整保留它。旁白、對白和鏡頭前的人聲保持清晰、置於中心,新的音樂則在底下填補,無需手動壓低音量、重新錄製或清理音訊。
它專為原始人聲必須保留的格式而打造:vlog、訪談、廣告、教學以及短影片社群內容。

功能 03 · v1.1 全新功能
分段層級的控制
對於想要精準指導的創作者,v1.1 讓您切分時間軸,並為每個分段指派各自的提示,逐場景生成音樂。可按段落調整風格、情緒和配器,並用前奏、主歌、副歌、橋段等標籤直接塑造音樂結構。需要速度時可自動配樂,需要表達意圖時可精細控制,而始終以影片作為起點。
這正是 v1.1 提升最大的地方。在 提示遵循上,標註者在 50% 的比較中偏好 v1.1,而 v1.0 為 30%,是我們測得所有維度中最大的差距,也是全新分段控制的直接成果。

正當地構建
建立於專業授權音樂之上
與 v1.0 一樣,v1.1 生成的每一段配樂都是原創、可直接用於製作、並已獲商業使用授權,無論用於社群內容、品牌影片、遊戲或廣播,皆無需額外授權。
大多數 AI 音樂工具將授權視為事後考量,未經許可便以受版權保護的內容進行訓練。Sonilo 的構建方式截然不同。透過諸如與 Shutterstock 的協議等合作關係,v1.1 以藝術家已同意並獲得報酬的內容進行訓練,且每次生成在送達您手中之前都會經過內容識別與審核檢查。我們相信業界無需在創新與誠信之間二選一,而 v1.1 正是為了證明這一點而打造。


推出情況
現正陸續推出
sonilo.com
直接從您的影片生成配樂。
Sonilo API
為開發者和平台提供的影片轉音樂與文字轉音樂端點,支援長達 600 秒的影片。
合作夥伴平台
現已在 Scenario 和 ComfyUI 上提供,並計劃在今年餘下時間推出更多整合。