AI 시스템이 인간의 창의성을 모방하는 방법

December 02, 2021
에뉴스 소프트웨어 및 앱

주요 내용

DALL·E는 텍스트를 기반으로 이미지를 그릴 수 있는 새로운 신경망입니다.
네트워크는 인간의 창의적 결과물을 모방할 수 있는 AI 프로젝트의 증가 중 하나입니다.
전문가들은 AI가 그린 이미지는 독창적인 작품이 아니라고 말한다.

2019년 사라반데 재단의 AI-Da 로봇. 팀 말로 인터뷰 및 작품 전시. — 아이다

움직여, 피카소. 새로운 신경망은 텍스트를 기반으로 이미지를 그릴 수 있습니다.

달·이, 아티스트 Salvador Dalí와 Pixar의 WALL·E의 합성어로, 어떤 텍스트도 가져와서 이미지를 만들 수 있습니다. 이 시스템은 수십억 개의 그림과 텍스트 예제에 대해 훈련된 신경망을 사용합니다. 인간의 창조적인 결과물을 모방할 수는 있지만 복제할 수는 없는 AI 프로젝트의 증가 중 하나입니다.

"자연어는 끊임없이 진화하고 문맥상의 뉘앙스에 매우 의존하기 때문에 기계가 그림을 그릴 수 있을 정도로 언어를 잘 이해하도록 가르치는 것은 매우 중요한 성과입니다." 타마라 슈워츠, 펜실베니아 요크 대학의 사이버 보안 교수는 이메일 인터뷰에서 이렇게 말했습니다. "경찰의 스케치 아티스트를 상상해 보세요. 목격자의 설명에 따라 그림을 그릴 수 있는 드문 재능이 있습니다."

빅 데이터를 사용하여 이미지 생성

DALL-E는 AI 연구 기업 OpenAI 인터넷에서 방대한 양의 데이터를 축적하여 작동합니다. 그런 다음 데이터는 자연어 모델에 의해 처리되고 텍스트에서 이미지를 생성하도록 훈련됩니다. DALL-E는 다음과 유사하게 작동합니다. 최근 출시된 GPT-3, 원본 텍스트 구절을 생성하라는 메시지를 표시할 수 있는 OpenAI에서 만든 언어 모델입니다. GPT-3는 5조 단어의 인터넷 텍스트를 사용하여 훈련되었으며 놀라울 정도로 생생한 텍스트를 생성할 수 있습니다.

"그림을 그릴 수 있을 정도로 언어를 이해하도록 기계를 가르치는 것은 매우 중요한 성과입니다."

의 설립자이자 CTO인 Michael Yurushkin은 데이터 사이언스 기업 BroutonLab, 이메일 인터뷰에서 DALL-E는 "우리의 창의성과 상상력을 모방하는 데 있어 인류가 성공한 몇 안 되는 잽 중 하나"라고 말했습니다. 그는 "그 방법을 깨닫기가 더 쉽다. AI는 관련 데이터를 통해 무언가를 예측하지만 이전에는 '듣도보도 못한' 것에서 그림을 생성할 수 있는 방법을 이해하는 것이 더 중요합니다. 어려운."

Schwartz는 AI가 정보를 생성하는 것이 아니라 언어 데이터를 가져와 이미지로 변환한다는 점에 주의합니다.

Schwartz는 "초기 창의성은 작업을 구성한 사람에게서 나옵니다."라고 말했습니다. "AI는 다양한 데이터 조합을 실험한 다음 여러 잠재적 출력 중에서 선택하기 때문에 '창의성'이 있습니다. 그러나 인간은 출력을 검토하고 AI에게 많은 조합 중에서 선택하는 방법을 가르치고 있습니다."

로봇 탐정 작업?

기계는 인간 예술가보다 훨씬 빠르게 이 데이터와 개체 조합을 실험할 수 있습니다. Schwartz는 DALL-E가 목격자의 증언을 기반으로 스케치를 통해 범죄 현장을 재구성하려는 형사와 언젠가 파트너가 될 수 있다고 언급했습니다.

그녀는 "증인들이 진술을 하면 컴퓨터가 그 자연어 정보를 가져와 장면의 그림이나 장면의 많은 그림을 만들 수 있다"고 말했다. "이러한 시각화는 손실된 증거에 대한 보다 정확한 이미지를 생성하기 위해 통합될 수 있습니다. 이 시각화는 범죄 이전 위치의 이전 이미지를 통합하여 풍부해질 수 있습니다."

다른 여러 AI 기반 프로그램으로 예술 작품을 제작할 수 있습니다. 예를 들어, 아이다 인공 지능과 결합된 로봇 팔 시스템과 얼굴 인식 기술을 사용하여 예술을 만듭니다. 시스템은 로봇의 팔 움직임을 생성하는 알고리즘에 입력되는 기계 앞에 놓인 이미지를 분석할 수 있습니다.

그러나 인간 예술가들은 로봇 군주가 그들을 대체할 것이라고 걱정해서는 안 된다고 Rutgers 대학의 예술 및 인공 지능 연구소 소장인 Ahmed Elgamal은 주장했습니다. 뉴욕 타임즈에서 작년.

그는 "예술의 정의는 끊임없이 진화하고 있지만 그 핵심은 인간 간의 의사 소통의 한 형태"라고 썼다. "기계 뒤에 인간 예술가가 없으면 AI는 화면의 픽셀을 조작하든 음악 원장의 메모를 조작하든 형식을 가지고 노는 것 이상을 할 수 없습니다. 이러한 활동은 매력적이고 지각적으로 흥미로울 수 있지만 아티스트와 관객 간의 상호 작용 없이는 의미가 없습니다."

DALL-E의 작업을 보고 나니 AI가 만든 이미지가 예술이 아니라는 엘감말의 요지가 이해가 갑니다. 다른 한편으로, 그것들은 내가 만들 수 있는 어떤 예술 작품보다 낫습니다. 그래서, 정말, 차이점은 무엇입니까?