- Back to menu
- Back to menuMga presyo
- Back to menuPananaliksik
- Back to menuPinagkasunduan
- Back to menu
- Back to menu
- Back to menu
- Back to menu
- Back to menuMga Webinars at Events
Ang Machine Learning Powering Generative Art NFTs
Ang generative art ay ONE sa mga pangunahing kaso ng paggamit sa machine-learning, ngunit kamakailan lamang ay nakamit ng espasyo ang pangunahing katanyagan.
Ang artificial intelligence (AI) sa non-fungible token (NFT) space ay nagiging mas nauugnay. Ang generative art (iyon ay, sining na nilikha ng isang autonomous system) ay mabilis na lumabas sa ONE sa mga pangunahing kategorya ng NFT market, na nagtutulak ng mga makabagong proyekto at mga kahanga-hangang koleksyon. Mula sa mga gawa ng AI art legend gaya ni Refik Anadol o Sofia Crespo hanggang Ang bagong proyekto ng QQL ni Tyler Hobbs, ang mga NFT ay naging ONE sa mga pangunahing sasakyan upang ma-access ang sining na pinapagana ng AI.
Ang generative art ay ONE sa mga pangunahing kaso ng paggamit sa machine-learning, ngunit kamakailan lamang ay nakamit ng espasyo ang pangunahing katanyagan. Ang paglukso ay kadalasang pinapagana ng mga computational gains at isang bagong henerasyon ng mga diskarte na makakatulong sa mga modelo Learn nang hindi nangangailangan ng maraming naka-label na mga dataset, na hindi kapani-paniwalang limitado at mahal sa paggawa. Kahit na ang agwat sa pagitan ng generative art community at AI research ay nagsasara na sa nakalipas na ilang taon, marami sa mga bagong generative art technique ay T pa rin malawak na pinagtibay ng mga kilalang artist, dahil tumatagal ng ilang sandali upang mag-eksperimento sa mga bagong pamamaraang ito.
Si Jesus Rodriguez ay ang CEO ng IntoTheBlock.
Ang generative art catalyzers
Ang pagtaas ng generative AI ay naging isang sorpresa kahit na sa marami sa mga naunang AI pioneer na karamihan ay nakita ang disiplina na ito bilang isang medyo malabo na lugar ng machine learning. Ang kahanga-hangang pag-unlad sa generative AI ay maaaring masubaybayan pabalik sa tatlong pangunahing mga kadahilanan:
- Multimodal AI: Sa nakalipas na limang taon, nakakita kami ng isang pagsabog ng mga pamamaraan ng AI na maaaring gumana sa iba't ibang domain gaya ng wika, larawan, video o tunog. Pinapagana nito ang paglikha ng mga modelo tulad ng DALL-E o Stable Diffusion, na bumubuo ng mga larawan o video mula sa natural na wika.
- Pretrained na mga modelo ng wika: Ang paglitaw ng multimodal AI ay sinamahan ng kahanga-hangang pag-unlad sa mga modelo ng wika na may mga pamamaraan tulad ng GPT-3. Pinapagana nito ang paggamit ng wika bilang mekanismo ng pag-input upang makagawa ng mga masining na output gaya ng mga imahe, tunog o video. Ginampanan ng wika ang pinakamahalagang papel sa bagong yugtong ito ng generative AI dahil pinababa nito ang hadlang para sa mga tao na makipag-ugnayan sa mga generative AI models.
- Mga pamamaraan ng pagsasabog: Karamihan sa mga photo-realistic na sining na ginawa ng mga pamamaraan ng AI na nakikita natin ngayon ay batay sa isang pamamaraan na tinatawag na mga modelo ng pagsasabog. Bago ang mga diffusion model na dumating sa eksena, ang generative AI space ay pinangungunahan ng mga pamamaraan tulad ng generative adversarial networks (GAN) o variational auto-encoders (VAE), na may problema sa pag-scale at dumaranas ng kakulangan ng pagkakaiba-iba ng mga nabuong output. Tinutugunan ng mga modelo ng pagsasabog ang mga limitasyong iyon sa pamamagitan ng pagsunod sa isang hindi kinaugalian na paraan ng pagsira sa mga larawan ng data ng pagsasanay hanggang sa makumpleto ang ingay at muling itayo ang mga ito. Ang pangangatwiran ay kung ang isang modelo ay magagawang buuin ang isang imahe mula sa isang bagay na, ayon sa teorya, ingay, kung gayon ay dapat itong gawin mula sa halos anumang representasyon, kabilang ang iba pang mga domain tulad ng wika. Hindi nakakagulat, ang mga pamamaraan ng pagsasabog ay naging pundasyon ng mga modelo ng pagbuo ng text-to-image tulad ng DALL-E at Stable Diffusion.
Ang impluwensya ng mga pamamaraang ito sa generative art ay kasabay ng paglitaw ng isa pang trend ng Technology : Ang mga NFT, na nagbukas ng hindi kapani-paniwalang mahahalagang kakayahan para sa digital art tulad ng digital na pagmamay-ari, mga programmable na insentibo at higit pang mga democratized distribution models.
Tingnan din ang: Bakit T Dapat Asahan ng Mga Artist ng NFT ang 'Royalties' | Opinyon
Ang mga pamamaraan na nagpapagana ng generative art sa mga NFT
Teksto sa larawan: Ang text-to-image (TTI) synthesis ay ang pinakasikat na lugar ng generative AI sa loob ng komunidad ng NFT. Ang TTI space ay gumawa ng ilang AI models na literal na lumalampas sa pop culture. Mga OpenAI DALL-E ay masasabing naging pinakakilalang halimbawa ng TTI na ginamit upang makabuo ng mga masining na larawan. GLIDE ay isa pang modelo ng TTI na nilikha ng OpenAI, na pinagtibay sa maraming mga setting ng generative art. Nakikipagsiksikan ang Google sa generative art space, nag-eeksperimento sa iba't ibang diskarte gaya ng Imagen, na batay sa mga modelo ng pagsasabog, o Parti, na batay sa ibang pamamaraan na tinatawag na mga autoregressive na modelo. Nililinang din ng Meta ang generative art community na may mga modelo tulad ng Make-A-Scene. Ang mga startup ng AI ay sumusulong sa espasyo ng TTI pati na rin sa mga modelong tulad nito Midjourney pagkakaroon ng masiglang komunidad sa pamamagitan ng Discord distribution nito at Katatagan AI nakakabigla sa komunidad ng AI sa pamamagitan ng open sourcing Stable Diffusion.
Mula sa pananaw ng NFT, nakita ng mga modelong TTI ang pinakamalawak na paggamit dahil ang isang hindi katimbang na porsyento ng mga digital art collectible ngayon ay kinakatawan bilang mga static na larawan.
Text-to-video: Ang Text-to-video(TTV) ay isang mas mapaghamong aspeto ng generative art ngunit ONE kung saan nakikita natin ang malaking pag-unlad. Ang Meta at Google ay nag-publish kamakailan ng mga modelo ng TTV tulad ng Gumawa-A-Video at Video ng Larawan, na maaaring makabuo ng mga high-frame-fidelity na video clip batay sa natural na wika. Ang video ay ONE sa mga pinakaaktibong bahagi ng pananaliksik para sa pagbuo ng sining, at dapat nating asahan na ang karamihan sa mga modelo ng pagbuo ng larawan ay may mga katumbas na video. Ang mga video ay hindi pa rin gaanong kapansin-pansin sa espasyo ng NFT gaya ng mga larawan, ngunit ito ay malamang na magbago habang ang mga modelo ng TTV ay nagiging mas malawak na pinagtibay ng mga generative artist. Ang video ay ONE sa mga lugar na nag-iiba ng digital art sa tradisyonal na sining.
Read More: Ang mga NFT ay Maaari at Magiging Higit Pa | Opinyon
Larawan-sa-larawan: Ang pagbuo ng imahe sa pamamagitan ng mga textual input ay parang natural ngunit may mga limitasyon pagdating sa pagkuha ng mga aspeto tulad ng mga posisyon sa pagitan ng iba't ibang bagay, oryentasyon o kahit na napakaespesipikong mga detalye ng tanawin. Ang mga sketch o iba pang mga imahe ay isang mas mahusay na mekanismo upang maihatid ang impormasyong ito. Ilan sa mga nangungunang modelo ng pagsasabog tulad ng DALL-E, Matatag na Pagsasabog at Imagen lahat ay nagsasama ng mga mekanismo para sa pagbuo ng mga larawan mula sa mga sketcher. Katulad nito, ang mga modelong ito ay nagsasama ng mga diskarte tulad ng in-painting o out-painting, na nagbibigay-daan para sa pagpapalawak ng mga larawan sa loob o lampas sa kanilang orihinal na mga hangganan.
Karamihan sa mga pinakamahusay na naitatag na mga kasanayan sa pagbuo ng sining ay nakatuon sa paglikha ng mga larawan mula sa iba pang mga larawan. Hindi nakakagulat na maraming sikat na generative art na koleksyon ng NFT ay nakabatay sa mga variation ng image-to-image na pamamaraan.
henerasyon ng musika: Ang awtomatikong pagbuo ng musika ay isa pang karaniwang kaso ng paggamit sa generative AI na naging tanyag sa nakalipas na ilang taon. Ang OpenAI ay nangunguna rin sa rebolusyong ito kasama ang mga modelo MuseNet at, mas kitang-kita, Jukebox, na nakakagawa ng musika sa iba't ibang istilo at genre. Kamakailan, pumasok ang Google sa espasyo kasama ang AudioLM, isang modelong lumilikha ng makatotohanang pagsasalita at musika ng piano sa pamamagitan lamang ng pakikinig sa mga sound snippet. Stability AI-backed Harmonai nagsimulang itulak ang mga hangganan ng AI music generation space sa paglabas ng Pagsasabog ng Sayaw, isang hanay ng mga algorithm at tool na maaaring makabuo ng mga orihinal na clip ng musika.
Ang musikang binuo ng AI ay ONE sa pinakamalaking lugar kung saan makakapaghatid ang mga NFT ng natatanging halaga. Naiiba sa ibang mga anyo ng sining, ang musika ay ipinamamahagi sa digital form. Ang Generative AI ay maaaring maging natural na pandagdag para sa mga producer ng musika, at ang mga NFT ay nag-aalok sa mga creator ng mga natatanging paraan upang ipahayag ang pagmamay-ari sa mga music clip o kanta.
Isang nakakainggit na tugma: NFT at generative art
Sa buong kasaysayan ng Technology mayroong ilang mga pagkakataon kung saan ang medyo magkakaibang mga uso ay nakakaimpluwensya sa isa't isa upang makakuha ng hindi kapani-paniwalang bahagi sa merkado. Ang pinakahuling halimbawa ay ang social-mobile-cloud revolution kung saan pinalawak ng bawat ONE sa mga trend na iyon ang market ng dalawa pa. Ang mga Generative AI at NFT ay nagsisimula nang magpakita ng katulad na dinamika. Ang parehong mga uso ay nakapagdala ng isang kumplikadong merkado ng Technology sa pangunahing kultura. Ang mga NFT ay umaakma sa generative AI na may digital na pagmamay-ari at mga modelo ng pamamahagi na halos imposibleng ipatupad kung hindi man. Katulad nito, ang generative AI ay malamang na maging ONE sa pinakamahalagang mapagkukunan ng paglikha ng NFT.
Note: The views expressed in this column are those of the author and do not necessarily reflect those of CoinDesk, Inc. or its owners and affiliates.
Jesus Rodriguez
Si Jesus Rodriguez ay ang CEO at co-founder ng IntoTheBlock, isang platform na nakatuon sa pagpapagana ng market intelligence at mga institutional na DeFi solution para sa mga Crypto Markets. Siya rin ang co-founder at Presidente ng Faktory, isang generative AI platform para sa negosyo at consumer app. Itinatag din ni Jesus ang The Sequence, ONE sa pinakasikat Newsletters ng AI sa mundo. Bilang karagdagan sa kanyang gawain sa pagpapatakbo, si Jesus ay isang panauhing lektor sa Columbia University at Wharton Business School at isang napakaaktibong manunulat at tagapagsalita.
