Waarom klinken de meeste AI voices zo slecht?

krautrock1958

Gepokt en gemazeld
Lid sinds
22 september 2016
Berichten
7.413
Locatie
Apeldoorn
Ik zie de laatste tijd veel van die AI voices in programmaatjes on line, dan kan je je eigen zanglijn uploaden en dan betaal je een fee per maand of zoiets, handig als je tekst en melodie kan maken maar geen goede zanger bent.
Wat me opvalt is dat het zo'n beetje allemaal stemmen zijn die je ook in de hits op de radio hoort, sommige zijn van die autotuned voices enz.
Als ze al die voices met AI kunnen aanmaken waarom horen we dan geen goede stemmen, met goed bedoel ik karaktervol, denken ze dat dit niet populair is en dat het zo moet klinken als op de radio?
Een paar voorbeelden van wat ik bedoel als karaktervol maar je kan er zoveel bedenken natuurlijk You've made me so very happy I'm every woman Hungry Times
 
Ik heb er niet veel gehoord maar kunstmatige intelligentie is afhankelijk van het bronmateriaal. Als het programma wordt opgedragen om shit te leren, dan komt er ook shit uit. Een kwestie van de verkeerde instructies dus, althans vanuit ons perspectief.
 
Het is waarschijnlijk ook lastig om het goed te krijgen. En dan vervalt AI in gemakkelijker Autotuned shit, waarvan het een boel als input krijgt.

Klein zijstraatje, afbeeldingen van mensen gaat AI soms best redelijk af, maar handen lijken soms nergens naar. Dat is ook moeilijk. We weten dat ook van menselijke schilders, niet voor niets zegt men wel 'ns dat je kunt zien hoe goed een schilder is door te kijken hoe de handen op een schilderij eruit zien. Grappig dat dit voor AI kennelijk hetzelfde is.
 
Ik stel me ook heel kritisch op maar soms denk ik ook: zou men in de tijd vd rock n roll ook zo gezeurd hebben op de jeugd hun muziek en zijn wij die oude ballen? Zwijgen we nog over “ketelmuziek” woordgebruik wat ergens 30 jaar geleden voor t eerst door mij werd gehoord qua term.

Merol hoorde in vandaag heel even op een afrekening playlist op spotify met autotune rape intro. Snel geskipt. Oef zeg
 
zou men in de tijd vd rock n roll ook zo gezeurd hebben op de jeugd hun muziek en zijn wij die oude ballen?
Nou, reken maar! Niet alleen was de muziek afgrijselijke herrie voor de ouderen in die tijd (met wortels in de zwarte muziek nota bene, welk een gruwel!), de bijbehorende losbandigheid zou de jeugd tot op het bot bederven. Zelfde verhaal met jazz overigens. Er waren zelfs petities om elektronisch versterkte muziek te verbieden, want dat zou orkesten overbodig kunnen maken. Klinkt bekend?


En laten we niet vergeten dat de muziek waar wij zo'n 30 jaar geleden op stuiterden ook door onze ouders werd afgedaan als zielloos monotoon computergestamp dat weinig met muziek te maken had. Of dat deze zelfs geïnspireerd was door de Satan, en dat de club Jezusbrengers die onze zieltjes wilden redden (door te posten bij de ingang van housefeesten) nog steeds bestaat: Landelijke Evangelisatie Stichting Naar House
 
Laatst gewijzigd:
Nou, reken maar! Niet alleen was de muziek afgrijselijke herrie voor de ouderen in die tijd (met wortels in de zwarte muziek nota bene, welk een gruwel!), de bijbehorende losbandigheid zou de jeugd tot op het bot bederven. Zelfde verhaal met jazz overigens. Er waren zelfs petities om elektronisch versterkte muziek te verbieden, want dat zou orkesten overbodig kunnen maken. Klinkt bekend?


En laten we niet vergeten dat de muziek waar wij zo'n 30 jaar geleden op stuiterden ook door onze ouders werd afgedaan als zielloos monotoon computergestamp dat weinig met muziek te maken had. Of dat deze zelfs geïnspireerd was door de Satan, en dat de club Jezusbrengers die onze zieltjes wilden redden (door te posten bij de ingang van housefeesten) nog steeds bestaat: Landelijke Evangelisatie Stichting Naar House
Grappig, ik herinner me idd nog uit jaren 90 dat men bang was voor "Trance" muziek :D

Ik vind overigens dat AI -wat het in potentie kan veroorzaken- toch van een andere orde is, dan wat nostalgie t.a.v. protesten tegen nieuwe vormen van muziek, de voortbrenging en/of versterking.
Dit AI fenomeen, in ieder geval op gebied van Audio, raakt imho meer aspecten met een ander soort impact.

Vroegah, met de ontwikkelingen zoals die jij noemt, stond "Identiteit en Authenticiteit" noch het slinks "stelen" op het spel bij die ontwikkelingen.. althans, ik kan me niet herinneren, noch kan ik zo snel vinden, dat dàt de klacht / angst was.

Met "stelen" bedoel ik het door AI laten analyseren van muziek, met het doel de "kern" eruit te vissen, en daar met variaties op te komen die binnen de Copyright randen vallen om er geld mee te verdienen (lees: besparen op echte muzikanten). Wil me niet te vroeg, te negatief over AI uitlaten, tuurlijk zie ik ook mooie kansen.
 
"Identiteit en Authenticiteit" noch het slinks "stelen" op het spel bij die ontwikkelingen.. althans, ik kan me niet herinneren, noch kan ik zo snel vinden, dat dàt de klacht / angst was.
Nou, ik herinner me anders ook wel erg veel klachten van boomers en de generatie erna over het gebruik van melodieën en vooral samples uit "hun" muziek voor de hits van een generatie later. Dat je een nieuwe ontdekking liet horen aan je ouders die verontwaardigd uitroepen "dit is geját!" en dan bleek dat coole riffje waar je zo op aansloeg uit een of andere 70s hit te komen. Kwalificaties als "jatwerk", "eenheidsworst" en "creatieve armoede" waren niet van de lucht.
 
Nou gaan een aantal posts over het zeuren van vroeger maar zullen we weer on topic gaan?

Nog even een aanvulling op het topic; ik kwam vanochtend Audimee tegen en dat viel me mee, er zaten vind ik wel verschillende bruikbare stemmen tussen.
 
Laatst gewijzigd:
AI zal de (on)mogelijkheden van de menselijke stem evenmin (nog) niet begrijpen, kennelijk.
Ik denk dat AI gewoonweg niets begrijpt.
N.m.i. is het met AI altijd zoeken naar iets, reeds aanwezig in data, wat de opgegeven commando's benadert. Mogelijk een beetje mixen van gevonden resultaten, maar of het verder gaat dan dat, betwijfel ik...
 
Dat kan je niet zomaar generaliserend zeggen. Er zijn LLMs en dergelijke die pure statistiek zonder begrip zijn, er zijn systemen die zichzelf een model aanleren dat waarnemingen matcht en waarvan je dus kan stellen dat ze een stuk intelligenter zijn/begrip hebben...Er zijn er ook die zelfs heel expliciet rond regels werken, zo kan je stellen dat Deep Blue een perfect begrip van schaken had. Men noemt het allemaal AI maar er zijn veel methodes.
 
Als AI toch zo slecht -of zo goed nog niet- klinkt, kan je het net zo goed zelf inzingen en vervormen/auto-Tunen tot het net zo "goed" klinkt als AI :P

Andere vraag, als de AI Voices wel goed zouden klinken, wat zou dat veranderen voor jou? Wat zou je ermee doen?
 
Andere vraag, als de AI Voices wel goed zouden klinken, wat zou dat veranderen voor jou? Wat zou je ermee doen?
Dan zou ik bijv mijn tekst en melodie zo goed als mogelijk inzingen en dan zou het door een betere stem op een niveau komen dat het klinkt als een pro zanger of zangeres want ik hoor ook graag zangeressen maar dat kan ik zelf niet natuurlijk.
Soms maak ik funky tracks bijv en dan is een wat donkere vrouwenstem wel datgene wat de song compleet maakt vind ik.

Ik kwam gistermiddag later nog het programma audimee tegen; Convert Vocals | Audimee en als je dan bij Mark klikt dan krijg je een hele sloot aan verschillende stemmen en kan je stijlen kiezen en als je dan bijv jazz en funk aanklikt en dan op sommige stemmen klikt dan klinkt dat toch wel goed vind ik, bijv Mary, June, Sierra of Arabella dat is echt niet slecht en ik heb melodyne dus ik kan dan achteraf de zanglijn aanpassen door noten hier en daar aan te passen tot het helemaal goed klinkt en daarmee kan ik ook harmonies maken.

Luister maar 'ns voor de gein naar de stemmen die ik aangaf, het valt erg mee en omdat ik dan zelf het nummer schrijf, de melodie inzing met eigen tekst en die dan upload vind ik zoiets een goed hulpmiddel, ik loop dan niet te jatten of iets dergelijks, je huurt dan eigenlijk gewoon een stem in zoals je ook met een zanger(es) zou doen
 
Dit raaktje me wel een beetje moet ik zeggen..


 
Back
Top