Kaip AI padeda iššifruoti senovinius užrašus

March 14, 2022
ĮProtingas Ir Sujungtas Gyvenimas Žinios

Key Takeaways

Naujas AI varomas įrankis galėtų padėti istorikams iššifruoti senovinius tekstus.
Ithaca yra pirmasis gilusis neuroninis tinklas, galintis atkurti trūkstamą pažeistų užrašų tekstą, nustatyti jų pradinę vietą ir padėti nustatyti jų sukūrimo datą.
Dirbtinis intelektas yra naudingas norint užpildyti trūkstamus duomenis, pvz., teksto vietą ir datą, nes analizuojant duomenis galima išmokti labai sudėtingų modelių.

Ranka liečianti monitoriaus ekrano sienelę — Oscar Wong / Getty Images

Naujausi dirbtinio intelekto (AI) pasiekimai skatina pastangas suprasti praeitį.

Ithaca, mašininio mokymosi modelis, kurį sukūrė AI tyrėjai DeepMind, pagal naują dokumentą gali atspėti trūkstamus žodžius ir rašytinės kalbos vietą bei datą. Šios pastangos galėtų padėti istorikams iššifruoti senovinius rankraščius.

„Itaka yra gilus neuroninis tinklas, todėl jis neįtikėtinai gali rasti paslėptus modelius didžiuliame duomenų kiekyje“, – sako istorikas. Thea Sommerschield, neseniai paskelbto dokumento bendraautorius, sakė Lifewire interviu el. paštu. „Tokie modeliai gali būti tekstiniai (gramatinės, sintaksės arba susieti su pasikartojančia „formule“ daugelyje tekstų) arba kontekstiniai (tam tikri žodžiai nuosekliai pasirodo tam tikrų žanrų tekstuose: pvz., klasikinio Atėnų politiniame dekrete, kuriame minimi žodžiai „sąjunga, taryba, surinkimas...“).

Praeities atskleidimas

Ithaca yra pirmasis gilusis neuroninis tinklas, galintis atkurti trūkstamą pažeistų užrašų tekstą, nustatyti jų pradinę vietą ir padėti nustatyti jų sukūrimo datą, sakė Sommerschieldas.

Ithaka pavadinta Graikijos salos vardu Homero Odisėjoje. Tyrėjai išsiaiškino, kad Ithaka pasiekia 62 % tikslumą atkurdama pažeistus tekstus, 71 % tikslumą nustatydama jų pradinę vietą ir gali datuoti tekstus 30 metų nuo jų atsiradimo datos.

Ithaca vizualizavimo priemonės skirtos tam, kad tyrėjams būtų lengviau interpretuoti rezultatus. Straipsnio autoriai rašė, kad istorikai pasiekė 25% tikslumą, kai vieni dirbo atkurti senovės tekstus. Tačiau naudojant Ithaca istoriko našumas padidėja iki 72%, o tai pranoksta modelio našumą ir parodo žmogaus ir mašinos bendradarbiavimo potencialą.

„Itaka siūlo interpretuojamus rezultatus, parodančius didėjančią žmonių ekspertų bendradarbiavimo ir mašininio mokymosi svarbą bei kaip suderinti žmonių ekspertus su giliu Architektūrų mokymasis, skirtas užduotims spręsti bendradarbiaujant, gali pranokti tiek individualų (nepadedant) žmonių atlikimą, tiek modeliuoti tas pačias užduotis“, – „Lifewire“ pasakojo Sommerschieldas.

Pavyzdžiui, istorikai šiuo metu nesutaria dėl daugelio svarbių Atėnų dekretų, priimtų tuo metu, kai gyveno tokie žymūs veikėjai kaip Sokratas ir Periklis, datos, rašė Sommerschieldas. tinklaraščio straipsnis. Ilgą laiką buvo manoma, kad potvarkiai buvo parašyti anksčiau nei 446/445 m. pr. m. e., nors nauji įrodymai rodo, kad data yra 420 m. „Nors tai gali atrodyti nedidelis skirtumas, šie dekretai yra esminiai mūsų supratimui apie klasikinių Atėnų politinę istoriją“, – rašė ji.

Artimiausias Itakai darbas yra ankstesnis mašininio mokymosi įrankis, vadinamas Pythia kad Sommerschield ir jos bendradarbiai išleido 2019 m. Pythia buvo pirmasis senovinis teksto atkūrimo modelis, naudojęs giluminius neuroninius tinklus.

„Šiandien Ithaca yra pirmasis modelis, kuris visapusiškai sprendžia tris pagrindines epigrafo darbo eigos užduotis“, – elektroniniame laiške sakė Sommerschieldas. „Tai ne tik patobulina ankstesnį naujausią Pythia rinkinį, bet ir naudoja gilų mokymąsi geografiniam ir chronologiniam priskyrimui pirmą kartą ir precedento neturinčiu mastu.

AI pagalbos istorikams

Asmuo, nešiojantis kaklaraištį, naudojant planšetinį kompiuterį, ant kurio yra tinklinė iliustracija. — Weiquan Lin / Getty Images

Dirbtinis intelektas naudingas norint užpildyti trūkstamus duomenis, pvz., teksto vietą ir datą, nes jis gerai išmoksta labai sudėtingus modelius analizuojant duomenis, Bradas Quintonas„Lifewire“ el. paštu sakė dirbtinio intelekto įmonės „Singulos Research“ generalinis direktorius.

„Naudodamas mašininio mokymosi metodus, AI gali peržiūrėti daugybę „žinomų gerų“ pavyzdžių Raskite modelius tarp, pavyzdžiui, tam tikro teksto ir jo sukūrimo datos bei vietos“, – Quintonas pridėta. „Dažnai šie modeliai yra tokie sudėtingi, kad žmogaus ekspertui jie nebūtų akivaizdūs.

Trūkstamų duomenų numatymas yra įprasta mašininiu mokymusi pagrįsto AI užduotis. Pavyzdžiui, GPT-3 iš OpenAI gali nuspėti trūkstamus žodžius sakinyje ar net trūkstamus sakinius pastraipoje. Be to, daugelis dirbtiniu intelektu pagrįstų vaizdo apdorojimo sistemų buvo naudojamos atkurti vaizdo įrašus ir vaizdus išmaniai nuspėjant, kas buvo prarasta iš originalo.

„Konceptualiai tyrėjai galėtų naudoti panašius metodus, kad nustatytų meno ar įrankių ar kitų istorinių žmogaus sukurtų kūrinių datą ir kilmę. artefaktai, kai tikimasi, kad laikui bėgant ir pagal kilmės vietą pasikeis pagrindinis stilius ir technika“, – sako Kvintonas. sakė.