ニュース

Sonilo v1.1 のご紹介

最も高性能な動画から音楽モデル

執筆者
Sonilo チーム
公開日

Sonilo v1.0 は、あるシンプルな考えを証明しました。動画にスコアを付けるために必要な情報は、すでに動画の中に存在しているということです。v1.1 はその基盤を維持しながら、より多くの作業を肩代わりします。映像により緊密に整合し、動画内にすでにある声を保持し、クリエイティブな方向性が必要なときにはシーンごとにスコアを形作ることができます。1つのトラックを生成して合うことを願う代わりに、セリフと構成をそのまま保った完全な編集を Sonilo に渡し、すべてのカットに着地するサウンドトラックを任せることができます。

v1.0 との並列評価において、v1.1 は実際の動画制作が最も難しい場面で勝ります。動画から音楽について私たちが注釈を付ける4つの次元、すなわちリズムの整合、感情的な適合、プロンプトへの忠実さ、音楽性のすべてにわたって、評価者は 比較の70〜78% で v1.1 を好むか両者を同等と評価し、選好を示した場合には v1.1 を v1.0 より約 1.6倍 の頻度で選びました。

70–78%
4つの動画から音楽の次元すべてにわたって、比較のうち v1.1 を好むか v1.0 と同等と評価した割合
1.6×
評価者が選好を示したとき、v1.0 より v1.1 を選んだ頻度の倍率
50 vs 30
プロンプト忠実度の選好、v1.1 対 v1.0、私たちが測定した中で最も大きな差

アップグレードを聴く

同じクリップ、2つのバージョン

同一の映像を v1.0 と v1.1 でスコア付けしています。再生を押すと両方が同期して再生され、片側をタップすると一度に1つのバージョンの音楽を比較できます。

v1.0
v1.1
両方ともミュートで始まります。片側のミュートを解除すると、もう片側がミュートされます。

機能 01

より鋭いオーディオアライメント

アライメントは常に Sonilo の中核であり、v1.1 ではそれが目に見えて緊密になります。モデルはビート、ビルド、トランジションを v1.0 よりも正確に映像のペースに固定し、タイムライン全体にわたってすべてのカットとエネルギーの変化を追従するため、音楽は上に重ねられたものではなく、まさにその編集のために書かれたように感じられます。ハードカットやループではなく、自然な音楽的エンディングで解決する点も変わりません。

この向上は評価に直接現れます。上のデモは、測定するのではなく聴いて感じられる同じ改善です。

注釈者は、スコアが動画に固定されていると感じられるかを最も左右する2つの次元、すなわち リズムの整合では比較の78%感情的な適合では70% で、v1.1 を好むか v1.0 と同等と評価しました。

機能 02 · v1.1 の新機能

ボーカルを保持した生成

v1.1 の新機能として、Sonilo は動画内の元の音声を分離し、新しく生成されたトラックの上にそのまま保持できます。ナレーション、セリフ、カメラ前の声は明瞭で中心に保たれ、その下を新しい音楽が埋めます。手動のダッキング、録り直し、オーディオのクリーンアップは不要です。

元の声を残す必要があるフォーマット、すなわち vlog、インタビュー、広告、チュートリアル、ショートフォームのソーシャルコンテンツ向けに作られています。

声を保持しながら既存の音楽を除去するために「音声とボーカルを保持」オプションを有効にした Sonilo の作成パネル。

機能 03 · v1.1 の新機能

セグメント単位の制御

精密な方向付けを求めるクリエイターのために、v1.1 ではタイムラインを分割し、各セグメントに個別のプロンプトを割り当てて、シーンごとに音楽を生成できます。セクションごとにスタイル、ムード、楽器編成を操作し、イントロ、バース、コーラス、ブリッジといったラベルで音楽の構造を直接形作れます。スピードが欲しいときは自動スコアリング、意図を込めたいときはきめ細かな制御を、動画を出発点としたまま行えます。

ここが v1.1 で最も改善した点です。プロンプトへの忠実さでは、注釈者は比較の50%で v1.1 を好み、v1.0 は30% でした。これは私たちが測定したどの次元よりも大きな差であり、新しいセグメント単位の制御の直接的な成果です。

00:00 から 00:30 のイントロセグメントを「ブラシドラムを伴うジャズピアノ」とプロンプト指定した Sonilo のセグメント別プロンプトパネル。

正しく構築

プロフェッショナルにライセンスされた音楽の上に構築

v1.0 と同様に、v1.1 が生成するすべてのサウンドトラックはオリジナルで、本番対応済みであり、商用利用が許諾されています。ソーシャルコンテンツ、ブランド動画、ゲーム、放送のいずれであっても、追加のライセンスは不要です。

ほとんどの AI 音楽ツールはライセンスを後回しにし、許諾なく著作権で保護されたコンテンツで学習しています。Sonilo は違う形で構築されました。Shutterstock との契約のようなパートナーシップを通じて、v1.1 はアーティストが同意し、対価を受け取ったコンテンツで学習されており、すべての生成はあなたに届く前にコンテンツ ID とモデレーションのチェックを通過します。業界はイノベーションと誠実さのどちらかを選ぶ必要はないと私たちは信じており、v1.1 はそれを証明するために作られています。

Shutterstock
ComfyUI
fal
WaveSpeed
Scenario

提供状況

現在展開中

Sonilo v1.1 のご紹介 | Sonilo