Actualités

Présentation de Sonilo v1.1

Notre modèle vidéo-vers-musique le plus performant

Rédigé par
Équipe Sonilo
Publié le

Sonilo v1.0 a démontré une idée simple : les informations nécessaires pour mettre une vidéo en musique se trouvent déjà à l'intérieur de la vidéo. v1.1 conserve cette base et prend en charge une plus grande partie du travail à votre place. Il s'aligne plus étroitement sur vos images, préserve les voix déjà présentes dans votre vidéo et, lorsque vous souhaitez une direction créative, vous permet de façonner la bande-son scène par scène. Au lieu de générer une seule piste en espérant qu'elle convienne, vous pouvez confier à Sonilo un montage complet, avec les dialogues et la structure intacts, et lui faire confiance pour livrer une bande-son qui tombe juste sur chaque coupe.

Lors d'une évaluation comparative face à v1.0, v1.1 l'emporte là où le travail vidéo réel est le plus difficile. Sur les quatre dimensions que nous annotons pour le vidéo-vers-musique — l'alignement rythmique, l'adéquation émotionnelle, le respect de l'invite et la musicalité — les évaluateurs ont préféré v1.1 ou jugé les deux équivalents dans 70 à 78 % des comparaisons, et ont choisi v1.1 plutôt que v1.0 environ 1,6 fois plus souvent que l'inverse.

70–78%
des comparaisons ont préféré v1.1, ou l'ont jugé équivalent à v1.0, sur les quatre dimensions du vidéo-vers-musique
1.6×
plus souvent, les évaluateurs ont choisi v1.1 plutôt que v1.0 lorsqu'ils exprimaient une préférence
50 vs 30
de préférence sur le respect de l'invite, v1.1 face à v1.0, le plus grand écart que nous ayons mesuré

Écoutez l'évolution

Le même clip, deux versions

Des images identiques, mises en musique par v1.0 et par v1.1. Appuyez sur lecture pour lancer les deux en synchronisation, puis touchez un côté pour comparer la musique une version à la fois.

v1.0
v1.1
Les deux démarrent en sourdine. Réactiver le son d'un côté coupe l'autre.

Capacité 01

Un alignement audio plus précis

L'alignement a toujours été au cœur de Sonilo, et dans v1.1 il devient nettement plus serré. Le modèle cale les temps, les montées et les transitions sur le rythme de vos visuels avec plus de précision que v1.0, suivant chaque coupe et chaque changement d'énergie sur toute la timeline, si bien que la musique semble écrite pour ce montage précis plutôt que posée par-dessus. Elle se résout toujours par une fin musicale naturelle plutôt que par une coupe nette ou une boucle.

Les progrès se traduisent directement dans l'évaluation. La démo ci-dessus illustre cette même amélioration, entendue plutôt que mesurée.

Les annotateurs ont préféré v1.1, ou l'ont jugé équivalent à v1.0, sur l'alignement rythmique dans 78 % des comparaisons et sur l'adéquation émotionnelle dans 70 %, les deux dimensions qui déterminent le plus si une bande-son semble verrouillée sur la vidéo.

Capacité 02 · Nouveau dans v1.1

Génération avec préservation des voix

Nouveauté de v1.1, Sonilo peut isoler la parole originale de votre vidéo et la conserver intacte sur une piste nouvellement générée. La narration, les dialogues et la voix à l'écran restent clairs et au premier plan tandis qu'une nouvelle musique vient se déployer en dessous, sans ducking manuel, ré-enregistrement ni nettoyage audio.

C'est pensé pour les formats où la voix originale doit être conservée : vlogs, interviews, publicités, tutoriels et contenu social court format.

Panneau de création Sonilo avec l'option « Conserver la parole et les voix » activée pour supprimer la musique existante tout en préservant les voix.

Capacité 03 · Nouveau dans v1.1

Contrôle au niveau du segment

Pour les créateurs qui souhaitent une direction précise, v1.1 vous permet de découper la timeline et d'attribuer une invite distincte à chaque segment, générant la musique scène par scène. Orientez le style, l'ambiance et l'instrumentation par section, et façonnez directement la structure musicale à l'aide d'étiquettes comme intro, couplet, refrain et pont. Une mise en musique automatique quand vous voulez de la rapidité, un contrôle granulaire quand vous voulez de l'intention, sans jamais avoir à quitter la vidéo comme point de départ.

C'est là que v1.1 a le plus progressé. Sur le respect de l'invite, les annotateurs ont préféré v1.1 dans 50 % des comparaisons contre 30 % pour v1.0, le plus grand écart de toutes les dimensions que nous avons mesurées, et un résultat direct du nouveau contrôle par segment.

Panneau d'invites segmentées de Sonilo avec un segment d'intro de 00:00 à 00:30 décrit comme « piano jazz avec batterie aux balais ».

Conçu comme il se doit

Bâti sur de la musique sous licence professionnelle

Comme v1.0, chaque bande-son issue de v1.1 est originale, prête pour la production et libérée pour un usage commercial, sans licence supplémentaire requise, que ce soit pour du contenu social, de la vidéo de marque, des jeux ou de la diffusion.

La plupart des outils de musique IA traitent les licences comme une réflexion après coup, en s'entraînant sur du contenu protégé par le droit d'auteur sans autorisation. Sonilo a été conçu différemment. Grâce à des partenariats comme notre accord avec Shutterstock, v1.1 est entraîné sur du contenu auquel les artistes ont consenti et pour lequel ils ont été rémunérés, et chaque génération passe par des contrôles de content-ID et de modération avant de vous parvenir. Nous croyons que l'industrie n'a pas à choisir entre innovation et intégrité, et v1.1 est conçu pour le prouver.

Shutterstock
ComfyUI
fal
WaveSpeed
Scenario

Disponibilité

Déploiement en cours

Présentation de Sonilo v1.1 | Sonilo