Sztuczna inteligencja i muzyka religijna. Czy to może się udać?

Sztuczna inteligencja i muzyka sakralna - czy to może się udać?

Przekazując darowiznę, pomagasz Aletei kontynuować jej misję. Dzięki Tobie możemy wspólnie budować przyszłość tego wyjątkowego projektu.

Wesprzyj nasPrzekaż darowiznę za pomocą zaledwie 3 kliknięć

Artysta AI?

Od kilkunastu miesięcy świat przeżywa rewolucję technologiczną wywołaną przez udostępnienie narzędzi generatywnej sztucznej inteligencji. Międzynarodowy szał rozpoczął się od publicznej prezentacji narzędzia językowego ChatGPT umożliwiającego generowanie tekstów na podstawie promptów w naturalnym języku i „rozumiejącego” kontekst konwersacji. Równolegle rozwijane były inne modele. W publicznej świadomości zaistniały głównie umożliwiające generowanie grafiki (Dall-E, Midjourney, Stable Diffusion), głównie z powodu nieporozumień związanych z rzekomym naruszaniem praw autorskich twórców. Pojawiają się również nieśmiało modele umożliwiające generowanie muzyki. Pierwszym godnym uwagi wydaje się Suno, za pomocą którego można stworzyć zgrabne piosenki i utwory instrumentalne w zadanym stylu.
Posłuchaj, jak Suno tworzy muzykę, czy jest to lepsze, czy gorsze od oryginału?
"Będę śpiewał na cześć Pana" - TroubleTimes by suno.

Jak to właściwie działa?

Powstaje więc pytanie o możliwość zastosowania sztucznej inteligencji w sferze religijnej, zwłaszcza w dziedzinie sztuki sakralnej. Najpierw jednak zastanówmy się, jak działają modele generatywne i czym one nie są.
Najważniejszym elementem sztucznej inteligencji jest sieć neuronowa, czyli matematyczny „model mózgu” (w cudzysłowie, bo jest to wielkie uproszczenie), zawierający odwzorowanie neuronów, połączeń między nimi oraz siły poszczególnych połączeń. Uczenie się takiej sieci działa podobnie jak uczenie się człowieka i innych żywych organizmów - przez podawanie przykładów w taki sposób, aby pożądane połączenia pomiędzy neuronami były wzmacniane, a niepożądane osłabiane.
Modele językowe uczą się generować tekst w odpowiedzi na tekst. Modele graficzne są uczone generowania obrazu na podstawie tekstu lub wzorca z innego obrazu. Modele muzyczne generują dźwięk na podstawie tekstu lub innego dźwięku.
Ważne jest to, że większość modeli sztucznej inteligencji potrafi generować informacje out of the box, czyli „z pudełka”. Jeśli nauczymy model graficzny, jak wygląda kot i jak wygląda mężczyzna w smokingu, to z dużym prawdopodobieństwem uda się wygenerować za jego pomocą obrazek przedstawiający kota w smokingu, chociaż nie był on tego uczony wprost. Ta cecha jest jednak okupiona tak zwanymi halucynacjami, czyli możliwością generowania informacji błędnych lub absurdalnych. Modele sztucznej inteligencji są w różny sposób dostrajane, aby zrównoważyć ich kreatywność (okupioną halucynacjami) z rzetelnością (okupioną sztywnością i dosłownością).

Czytaj także :Papieski organista: Kiedy gram, to mnie nie widać

Modele AI a prawa autorskie

Modele sztucznej inteligencji nie przechowują kopii informacji, na których są uczone, a tylko „wrażenia” przez nią wywołane w postaci wzmocnień określonych ścieżek neuronalnych. Stąd też oskarżenia modeli graficznych o plagiatowanie artystów i żerowanie na nich poprzez trenowanie modeli za pomocą ich dzieł bez uiszczania tantiem można porównać do oskarżania studentów ASP o uczenie się na podstawie dzieł mistrzów. Aczkolwiek trzeba przyznać, że niektóre połączenia neuronalne w dostępnych modelach są tak mocne, że na przykład trudno jest za pomocą Stable Diffusion wygenerować obrazek zawierający słowo kluczowe „wielka fala” nie wywołującego skojarzeń z wklejką ze słynnego drzeworytu Hokusaia.

Czytaj także :Sztuczna Inteligencja „Ojciec Justyn” zdymisjonowana po dwóch dniach

Narzędzie ewangelizacji?

Dotychczasowe eksperymenty ze sztuczną inteligencją wykonane zarówno przeze mnie, jak i moich znajomych, wykazały, że modele językowe radzą sobie bardzo dobrze z tworzeniem homilii, interpretacją tekstów biblijnych, wychwytywaniem powiązań między nimi oraz tworzeniem modlitw i litanii. Udało się nawet napisanie na zadany temat tekstu w stylu Sumy Teologicznej świętego Tomasza z Akwinu. Co więcej, model językowy napisał to poprawną łaciną.
Próby wykorzystania modeli graficznych do generowania motywów religijnych wielokrotnie już przebijały się wiralowo do mediów społecznościowych. Trzeba przyznać, że część z nich można spokojnie uznać za dzieła sztuki urzekające kompozycją, wykorzystaniem światłociena, doborem kolorów i techniki. Aczkolwiek maszyny na razie nie zastąpią człowieka w pełni, większość obrazów generowanych przeze mnie wymagało korekt (najczęściej poprawek oczu, ust i zębów oraz usunięcia nadmiarowych bądź dorysowania brakujących palców).
A jak radzi sobie zw skomplikowanymi utworami muzycznymi? Posłuchaj kolejnej kompozycji: "Christus vincit" Aleteia by suno

Sztuczna inteligencja i muzyka sakralna?

Od niedawna media społecznościowe zalewane są muzyką generowaną przez Suno. Jest to model, który potrafi wygenerować tekst piosenki na zadany temat, skomponować to w stylistyce podanej przez użytkownika oraz wygenerować muzykę wraz z wokalem. Można również wpisać dowolny tekst i cieszyć się piosenką Kolorowe kredki w stylistyce death metalowej, albo Smoke on the water zagraną przez zespół disco-polo.
Suno w porównaniu kilkoma innymi modelami muzycznymi, które sprawdziłem, radzi sobie bardzo dobrze. Sprawnie operuje językiem polskim, aczkolwiek nie zawsze zgrywa akcent tekstu z rytmem muzyki i czasem ma drobne problemy z wymową niektórych wyrazów. Kompozycje nie są może wybitne, ale poprawne i dobrze zharmonizowane, średnio zaawansowany zespół muzyczny potrzebujący paru utworów na wypełniacz debiutanckiej płyty mógłby spokojnie je dołożyć do swoich dzieł i nikt by nie zauważył. Niektóre motywy muzyczne są lepszej jakości (metal, disco, muzyka filmowa), natomiast folk, country i opera są narowiste i dość trudno uzyskać czysty styl bez domieszek.
Powstaje więc naturalna pokusa o wykorzystanie Suno i innych modeli do tworzenia muzyki religijnej. System świetnie poradził sobie ze skomponowaniem operowego Magnificat z chórem i smyczkowym akompaniamentem, nieźle wyszła również rock-opera do fragmentu Pieśni nad Pieśniami w historycznym przekładzie ks. Jakuba Wujka. Zważywszy na to, że można z łatwością wygenerować dowolny tekst religijny za pomocą ulubionego modelu językowego, w parę sekund przekształcić go w kilka tracków w zadanym stylu, uzyskując efekt poprawny kompozycyjnie i podobający się większości słuchaczy — nie ma technicznych przeszkód.
Posłuchaj "Magnificat"

Czytaj także :Czy sztuczna inteligencja może być etyczna? Zasady prosto z Watykanu [wywiad]

Wyzwolenie od kiczu w Kościele?

Czy jednak wypada chwalić Boga tekstami i melodiami wygenerowanymi przez maszynę? Zanim odpowiemy na to pytanie, zastanówmy się, gdzie jesteśmy. Kościół, który przez 2000 lat pełnił rolę kulturotwórczą i był zaczynem do powstania wielu arcydzieł muzycznych, zapomniał o własnym dziedzictwie. Chorał gregoriański, który według Soboru Watykańskiego II jest „śpiewem własnym liturgii rzymskiej”, jest darzony takim szacunkiem, że prawie nikt nie ośmiela się go używać. Polifonia wymaga do wykonania profesjonalistów bądź zaawansowanych amatorów, a poza tym użyta w zreformowanej liturgii straszliwie ją przedłuża, więc bywa wykonywana jeszcze rzadziej niż chorał. Tradycyjne pieśni nabożne ulegają stopniowemu zapomnieniu i zastępowaniu przez nowe kompozycje o banalnych melodiach i miałkim tekście, nierzadko pełnym błędów gramatycznych i teologicznych.
Stąd powstaje pytanie, czy jednak zastąpienie takich źle skomponowanych i niepoprawnych językowo piosenek dziełami sztucznej inteligencji, które przy odrobinie pracy nad samym skryptem generującym utwory (odpowiednie, precyzyjne prompty) oraz selekcją i korektą rezultatu ich pracy, mogłoby wyjść wszystkim na dobre?

Czytaj także :Muzyka elektroniczna i… chrześcijańska medytacja? „Bóg daje wolność!”

Czy sztuczna inteligencja może śpiewem chwalić Boga?