Шта је стабилна дифузија? Поглед на то како један модел вештачке интелигенције преобликује слике које видите

Стабилна дифузија је ан вештачка интелигенција (АИ) модел који креира слике. Ради слично као и други генеративни АИ модели попут ЦхатГПТ. Када добијете текстуални упит, Стабле Диффусион креира слике на основу својих података о обуци.

Шта је стабилна дифузија?

Стабле Диффусион је рачунарски програм који креира слике када се добију текстуални упити. На пример, промпт „јабука“ би произвео слику јабуке. Такође могу бити потребне компликованије упуте као што је стварање слике јабуке у одређеном уметничком стилу.

Поред генерисања слика, може заменити делове постојеће слике и проширити слике како би их повећао. Додавање или замена елемената унутар слике назива се усликавање, а проширење слике да би се повећала назива се пресликавање. Ови процеси могу да промене било коју слику, без обзира да ли је оригинална слика направљена помоћу вештачке интелигенције или не.

Модел стабилне дифузије је отвореног кода, тако да свако може да га користи.

Како АИ може да генерише слике?

АИ може да генерише слике на неколико различитих начина, али Стабле Диффусион користи нешто што је познато као модел латентне дифузије (ЛДМ). Почиње насумичним шумом који подсећа на статику аналогне телевизије. Од те почетне статике, пролази кроз многе кораке да уклони шум са слике док се не поклопи са текстуалним упитом. Ово је могуће јер је модел обучен додавањем шума постојећим сликама, тако да је у суштини само преокренути тај процес.

Стабле Диффусион је обучен на многим сликама са интернета, првенствено са веб локација попут Пинтерест, ДевиантАрт и Флицкр. Свака слика је била насловљена текстом, што је начин на који модел зна како различите ствари изгледају, може да репродукује различите уметничке стилове и може да узме текстуални упит и претвори га у слику. Модел се такође може фино подесити коришћењем других скупова слика да би се произвели другачији резултати.

За шта је стабилна дифузија?

Стабилна дифузија се користи за генерисање слика на основу текстуалних упита и за измену постојећих слика коришћењем процеса усликавања и пресликавања. На пример, може да креира целу слику на основу живописног текстуалног описа или може да замени мали део постојеће слике.

Можете ли рећи када се слика генерише АИ?

Стабилна дифузија може да креира фотореалистичне слике које је тешко разликовати од стварних и слике које је тешко разликовати од ручно нацртаних или осликаних уметничких дела. Такође може да испадне слике које су очигледно лажне у зависности од захтева и других фактора.

Један од начина да уочите уметност генерисану вештачком интелигенцијом је да погледате руке, јер Стабле Диффусион и други модели имају много проблема у тој области. Ако субјект слике упадљиво скрива своје руке, то је савет да је неко користио неки паметан брзи инжењеринг да заобиђе недостатке АИ модела. Имајте на уму, међутим, да се АИ модели мењају невероватно брзо, тако да ће ови недостаци вероватно бити краткотрајни.

Контроверзе и проблеми са стабилном дифузијом

Слике које генерише Стабле Диффусион се теоретски могу користити у било коју сврху, али постоји низ замки у вези са садржајем генерисаним вештачком интелигенцијом.

Пошто генерисање АИ слика мора однекуд да учи о објектима, његови програмери су прегледали интернет за уметност са метаподацима. Они су то урадили без дозволе креатора изворне уметности, што покреће питања ауторских права.

Ово питање је посебно нејасно јер Стабле Диффусион не ствара своје слике од нуле; спаја их од оних које проучава. Дакле, и од учења и од стварања, користи рад других уметника без обзира да ли су они дали дозволу или не. Сајтови попут ДевиантАрт-а су само избегли масовне изласке дозвољавајући корисницима да одустану од тога да АИ системима користе њихову уметност за обуку.

Тема дела заштићених ауторским правима која је делимично створила АИ је такође нејасна, пошто су одбијене пријаве за ауторска права за дела која укључују елементе генерисане вештачком интелигенцијом. Упркос томе, како генерисање слика вођено вештачком интелигенцијом постаје све заступљеније, то угрожава егзистенцију традиционалних уметника, који ће изгубити посао због ове јефтиније, „лакше“ методе.

ФАК

  • Шта је АИ уметност?

    „АИ уметност“ је општи термин за Стабилну дифузију, Мидјоурнеи, ДАЛЛ-Е и друге генераторе слика на природном језику. Свака верзија може да користи различите начине за обуку и креирање слика, али све оне потпадају под опис "аи арт".

  • Зашто АИ уметност не може да ради рукама?

    АИ уметност има проблема са обема рукама и зубима. Разлог је тај што иако генератори „знају“, генерално, шта су ови делови тела, они не разумеју типичан број прстију или зуба које људска бића имају.