Varázsló vagy kreativitás?

A ‘kreativitás’ pozitívan csengő szó, míg az ‘automatizálhatóság’… fúj, le vele. Emiatt szoktuk utálni is az informatikában a varázslókat. Igazi férfi beparaméterezi a szkriptet, puszta kézzel.

Persze ez valójában nem így van, de a bennünk lakó majom megsértődik, ha kiderül, hogy egy gép is képes arra, amiről azt hittük, hogy csak az emberi kreativitás.

Én inkább egy másik aspektust emelnék ki. Ha személyesen csinálom, akkor az értékes figyelmemből, időmből áldozok, megtisztelve a témát, a címzettet. Ezért tartom értékesebbnek.
De nem biztos, hogy ami így születik, az jobb is. Ugyanis ha erősen mélyen leásunk egy-egy kreatív folyamat mélységeibe, könnyen lehet, hogy az elemi lépések már algoritmizálhatóak. Ha emellé pontosan meg tudjuk fogalmazni az elvárásainkat (célfüggvény), akkor emberi kreativitás ide, vagy oda, sértődős majom meg amoda, az egész simán rábízható a számítógépre is.

Leírok egy konkrét példát. Hosszú lesz, de ráérek.

Slideshow. Van ennél egyszerűbb dolog? Kevés. Egymás után meg kell jeleníteni képeket, mögéjük tenni valami zenét, oszt jól van.

2001-2009 között a Memories on TV nevű csodát használtam erre a célra. Borzalmasan rossz szoftver volt. Betoltam a képeket, betoltam a zenét, aztán variálhattam a sorrendeket. De ha meg akartam nézni, mit csináltam, mindig a legelejéről kezdte a lejátszást. Azaz ha felcseréltem két képet olyan 30 perc környékén, végig kellett néznem 30 percet. Gyorscsévélő nem volt.
Az akkoriban készült anyagok ráadásul mai szemmel irtózatosan fapadosak. Az algoritmus igen egyszerűen működött: egy képre durván két másodpercet számoltam, és ezzel az időzítéssel a zenék 80%-át le lehetett fedni. Mozart requiemje, vagy az LGT gyeregyerekiahegyoldalba című száma nem fért bele, de a többség igen. Azaz egy kétszáz képes albumhoz keresni kellett egy kábé 6 perc 40 másodperces zenét, összehajigálni az alapanyagokat, akár automatikusan, akár manuálisan elrendezgetni a képeket, notesszel a kézben lejátszani egyszer-kétszer, kötegelve elvégezni az átrendezéseket, még egyszer megnézni az egészet, majd videóként elmenteni.

Ezt nagyjából 2009 áprilisában untam meg, onnantól egészen 2013 elejéig nem készítettem képbemutató filmeket. (Slideshow… van rá magyar szó?) Akkor kezdtem el játszani a Movie Maker-rel, és bár kiderült, hogy videóvágásra csak erősen korlátozottan használható, de slideshow-t gyártani vele ezerszer könnyebb, mint az addigi szoftverrel. Például bárhol bele lehetett tekinteni a felvételbe.
Az eleje ugyanúgy ment, mint korábban: bedobtam a képeket. Utána elrendezgettem, tettem elé/mögé szöveges blokkokat, feliratoztam(!), bejelöltem az összes képet, beállítottam két másodpercre a megjelenítést, beálítottam az összes képre ráhúzandó tranzíciós animációt(!), majd alápakoltam a zenét. Pusztán ennyi ráfordítással nagyságrendekkel jobb lett az eredmény. Naná, hogy megjött az étvágy. Jó lett volna, ha a képváltások illeszkednek a ritmushoz. Pontosabban nem is a ritmushoz, hanem a ritmusbéli kiemelésekhez, nyomatékokhoz. (Jut eszembe, van a beat kifejezésre magyar szó? A beütés nem játszik.) Na, itt jött be az, amit én kreativitásnak hittem. Ment a fejemben a zene (segített a zenesávban a hangrezgés megjelenítése), én pedig addig pakolászgattam a képeket, amíg meglehetősen sok váltást sikerült eltalálnom. Gigászi munka volt, de azért videónként 5-10 jó váltás összejött. Meg tudtam volna ölni a családtagjaimat, amikor levetítéskor nem koncentráltak a váltásokra, neadjisten beszélgetni kezdtek. (Ennyit a közönség megtiszteléséről.)
Tulajdonképpen ezzel meg is elégedhettem volna. 2009-ig visszamenőleg legyártottam az összes említésre méltó megmozdulásunk anyagait, öröm, boldogság.

Utána történtek a dolgok. Beleborultam a videóvágásba, kipróbáltam egy csomó szoftvert, végül letettem a voksomat a Powerdirector12 mellé. Átrágtam magam egy csomó doksin és az egyikben volt egy fejezet a slideshow gyártásról is. Úgy kezdődött, hogy ‘varázsló’… én pedig elhúztam a számat. De ha már megvettem, kifizettem, akkor dolgozzon is.
Hát, mit modjak. Beleizzadtam, mire kiismertem.
Ott kezdődik, hogy – minő meglepetés – behajigáljuk a képeket és a zenét. Utána viszont egy algoritmus (beat detection) végigmegy a zenén és bejelöli, hol van a zenében nyomaték, hangsúlyozás. Aztán ezekhez a vonalakhoz illeszti a képváltást.
Az eljárásnak kétségkívül van egy nagy előnye: a képek és a zene együtt élnek. Mindig tökéletes pillanatban váltanak a képek. Nem 5-10 alkalommal, hanem mindig. Viszont van egy nagy hátránya is: képtelenség összefuttatni, hogy a zenének akkor legyen vége, amikor a képsorozatnak is. 200 kép az egyik zenénél lehet, hogy 5 perc alatt pörög le, egy másiknál lehet, hogy 7 perc kell neki. Minden a beat-ek számától függ. Hogy még cifrább legyen a mutatvány, a varázslón belül vagy 12 különböző algoritmus található, ezek között akad kifejezetten pörgős (a csempésnél 200 kép simán lemegy 3 percen belül, de ez lehet akár 1 perc is), és akad lassabb. Kész idegbaj. Van egy elképzelésed, melyik zene illene a képekhez… aztán nem jó, mert vagy túl gyors hozzá a képmegjelenítés, vagy elviselhetetlenül lassú. Vagy a zene ér véget a felénél, vagy a képek pörögnek végig kétszer-háromszor. Viszont, ha hosszas keresgélések és preview kukucskálások után megtalálod a megfelelő átmeneteket és a megfelelő zenét, akkor olyan lesz az eredmény, amilyenről korábban álmodni sem mertél. Te ugyanis nem fogod tudni olyan pontosan hozzáigazítani a képváltásokat a zenei váltásokhoz, ahogy egy jó szoftver. No way. Ez nem kreativitás kérdése. (Arról nem is beszélve, hogy ez a csempés cucc, ahogy fényorgonaként játszik a képmegjelenítéssel, önállóan is igen kreatív: anélkül sugározza a képek mögötti hangulatot, hogy részletesen is áttanulmányozhatnád a képeket.)

Szóval a vége az, hogy akár megtisztelem a témát, akár nem, akár zokon veszem, hogy már megint legyözte az alkotó zsenimet a gép, akár nem, a helyzet az, hogy a gép izgalmasabb, jobb anyagot készít ugyanabból a nyersanyagból, mint amilyet én képes lennék. A kreativitásom pusztán néhány bemeneti adattal való játszadozásra szorul, na meg a zene kiválasztására. Legyen a gépnek halleluja.

A továbbiakat már csak a kifejezetten vájtszemű olvasók számára ajánlom. A kijevi csavargásunkon készített képeinkkel gyakorlatoztam és a fent leírtakat illusztrálni is tudom velük.

  • Az első videó hagyományosan, Movie Maker-rel készült. Mindent kézzel csináltam, mint az állatok. Klasszikus kétmásodpercenkénti váltás (melyet az animáció 1,5 másodpercre rövidített), a zene ehhez illően egy, az átlagosnál éppencsak kicsivel pörgősebb anyag. Az illesztés egészen jól sikerült, a képek és a zene ritmusa nagyjából együtt lüktet.
     

     
  • A második videó a PD12-vel készült. A varázsló készletéből a zoom in/crossfade animációkkal operáló megoldást választottam. Itt már rögtön belefutottam egy kellemetlen problémába: az animáció olyan lassú, hogy pörgősebb zenét (pl. ez előzőt) nem tudtam alátenni: a beat-ek gyorsabban váltották egymást, mint ahogy az animáció kifutotta volna magát. Így lett egy lassabb szám, ebből kifolyólag persze majdnem kétszeresére nyúlt a lejátszási idő. (Melyet egyébként nem bántam, a képanyagnak jól áll a méltóságteljesen lassú megjelenítés.)
     

     
  • Végül jött a kedvenc, a csempés verzió. Itt pont fordított problémába ütköztem: habár a zene meglehetősen pörgős, nem is túl hosszú, de még így is kétszer körbemennek a képek. Ami persze nem baj, mert szerencsére az algoritmus variál: ami az első alkalommal kicsi kép volt, az a második körben nagy kép is lehet, szóval nem unalmas az összhatás. (Azóta így is kalkulálok: a csempés verziónál akkor jó az időzítés, ha a képanyag 1,5-2 kört megy a zene alatt.)