Tehnologie

Stability AI anunță lansarea Stable Audio 2.0: Tehnologia AI în muzică

Stability AI tocmai a dezvăluit Stable Audio 2.0, o versiune actualizată a platformei sale de generare a muzicii. Acest sistem permite utilizatorilor să creeze până la trei minute de audio printr-un prompt text. Acest lucru reprezintă aproximativ lungimea unei piese reale, astfel că va genera și o introducere, o progresie completă de acorduri și un final.

Tehnologia AI în muzică

În primul rând, veștile bune. Trei minute este enorm. Versiunea anterioară a software-ului avea maximum 90 de secunde. Imaginează-ți doar cântecul de ziua de naștere fals pe care l-aț putea face în stilul acelui track Rob Thomas/Santana. Un alt avantaj? Instrumentul este gratuit și disponibil publicului prin intermediul site-ului companiei, așa că profită de el.

Introducing Stable Audio 2.0 – a new model capable of producing high-quality, full tracks with coherent musical structure up to three minutes long at 44.1 kHz stereo from a single prompt.

Explore the model and start creating for free at: https://t.co/E9ZIGagmPf

Read the… pic.twitter.com/rFGb0KpdeX

— Stability AI (@StabilityAI) April 3, 2024

Funcționează, în principal, printr-un prompt text, dar există și opțiunea de a încărca un clip audio. Sistemul va analiza clipul și va produce ceva similar.

Cum funcționează

Toate clipurile audio încărcate trebuie să fie libere de drepturi de autor, așa că acest lucru nu este pentru a imita ceva care deja există. Mai degrabă, ar putea fi util, de exemplu, pentru fredonarea unei părți de tobe sau pentru prelungirea unui clip de 20 de secunde în ceva mai lung.

Created this with the new Stable Audio 2.0 from @StabilityAI! pic.twitter.com/kmN0eubJSK

— Chris McKay (@cmcky) April 3, 2024

Acum, veștile proaste. Aceasta este muzică generată de AI. Este interesantă ca un obiect de conversație și ca emblemă a unui viitor posibil, excelent pentru cei dornici să experimenteze și rău pentru muzicieni, dar atât. Melodiile pot suna chiar interesant la început.

Stable Audio 2.0 face aceleași mici greșeli ciudate pe care le fac toate aceste sisteme. Spre exemplu, anumite părți pot dispărea în neant, înlocuite cu altceva. Uneori, elemente melodice vor apărea din senin, ca o versiune audio a acelor degete în plus din imaginile generate de AI.

Așadar, această tehnologie este un dar absolut pentru cei care fac videoclipuri amuzante de ziua de naștere sau muzică de așteptare la bancă. Pentru toți ceilalți? Nu este mare lucru.