
Opinie
De kunstgreep van de kunst: hoe AI de kunstmarkt opschudt
van Michelle Brändle
Er zijn nu verschillende AI-generators die een afbeelding maken van een tekst. Geduld is altijd vereist als je ze gebruikt, want het duurt vaak enkele minuten voordat je een resultaat hebt. Stability AI brengt daar verandering in.
Stability AI is een bedrijf dat tekst-, beeld- en videogeneratoren maakt op basis van deep learning-modellen. Ze noemen hun tekst-naar-beeld generator Stable Diffusion. Deze spuugt een afbeelding uit op basis van een beschrijvende tekst, een prompt genoemd. De eerste versie bestaat al meer dan een jaar, met een verbeterde opvolger, de Stable Diffusion XL.
Maar zowel de eerste versie als de opvolger hebben enkele minuten nodig van tekstinvoer tot resultaat. Stability AI heeft nu een nieuwe versie van zijn afbeeldingengenerator uitgebracht als demo. De zogenaamde Stable Diffusion XL Turbo (SDXL-Turbo) is gebaseerd op het Stable Diffusion XL-model en levert, in tegenstelling tot zijn grotere broer, binnen enkele seconden resultaten.
In eerdere artikelen heb ik al meer in detail besproken hoe de generatoren werken. Het principe als gebruiker is eenvoudig: je voert een tekst in, een zogenaamde prompt, en het programma spuugt één of meer afbeeldingen uit op basis van deze beschrijving. Dit is geweldig ter inspiratie voor bijvoorbeeld creatieve professionals.
Doordat zo'n programma een vrij grote database moet benaderen om een resultaat te produceren, heeft het enorme rekenkracht nodig. En het kost veel tijd. Als het resultaat je achteraf niet bevalt, moet je je tekst aanpassen, veranderen of zelfs herschrijven. Het proces begint helemaal opnieuw. Dat kan vervelend zijn.
Met de SDXL-Turbo heeft Stability AI een programma gemaakt dat zo snel beelden levert van de prompts dat ze het zelf een real-time resultaat noemen. De resulterende afbeeldingen zijn niet zo gedetailleerd als de langzamere versie, maar nog steeds van behoorlijk goede kwaliteit. Alleen al de snelheid waarmee ze worden gemaakt maakt ze indrukwekkend.
Normaal omvat het proces van een beeldgenerator 20 tot 50 stappen. De innovatie van de SDXL-Turbo is dat het programma slechts vier stappen nodig heeft voor de uitvoer. Stability AI noemt deze procedure "Adversarial Diffusion Distillation". Het is behoorlijk complex, en het is niet voor niets dat Stability AI de theorie erachter in detail heeft uitgelegd.
Het spannende is dat het resultaat niet alleen tijd bespaart, het proces vereist volgens Stability AI ook minder rekenkracht. Dus zelfs mijn Macbook Air met M1-chip heeft genoeg kracht voor wat grappige resultaten. Je kunt de demoversie op deze website vinden. Na ongeveer 10 zinnen en resultaten is de gratis versie echter op. De afbeeldingen kunnen nog verder bewerkt worden met een editor knop. Zo kun je bijvoorbeeld met één druk op de knop de achtergrond verwijderen of nog drie soortgelijke resultaten weergeven. Ook deze bewerkingen duren iets langer.
In mijn wereld achtervolgt Super Mario Stormtroopers met een eenhoorn en mixt Harley Quinn cocktails voor Eddie en Peter in de strandbar. Overal waar ik mijn creativiteit kan uitleven, tintelen mijn vingers. Of misschien komt het omdat er niets anders door mijn aderen stroomt dan chocolade, glitter en koffie.