AIが古代の碑文の解読にどのように役立つか
重要なポイント
- 新しいAIを利用したツールは、歴史家が古代のテキストを解読するのに役立つ可能性があります。
- Ithacaは、破損した碑文の欠落したテキストを復元し、元の場所を特定し、作成された日付を確立するのに役立つ最初のディープニューラルネットワークです。
- AIは、データを分析して非常に複雑なパターンを学習するのに適しているため、テキストの場所や日付などの欠落データを入力するのに役立ちます。
人工知能(AI)の最近の進歩は、過去を理解するための取り組みに力を与えています。
Ithaca、AI研究者によって構築された機械学習モデル DeepMind、新しい論文によると、不足している単語と書かれた言語の場所と日付を推測することができます。 この努力は、歴史家が古代の写本を解読するのに役立つ可能性があります。
「イサカは深いニューラルネットワークであるため、膨大な量のデータから隠れたパターンを見つけることができます」と歴史家 テア・ゾンマーシェールド最近の論文の共著者である、は電子メールのインタビューでLifewireに語った。 「このようなパターンは、テキスト(文法的、構文的、または多くのテキストにわたって繰り返される「式」にリンクされている)またはコンテキスト(特定の単語)である可能性があります。 特定のジャンルのテキストに一貫して表示されます:たとえば、「同盟、評議会、 組み立て...')。"
過去を明らかにする
イサカは、損傷した碑文の欠落したテキストを復元し、元の場所を特定し、作成された日付を確立するのに役立つ最初のディープニューラルネットワークであるとSommerschield氏は述べています。
イサカは、ホメロスのオデッセイにあるギリシャの島にちなんで名付けられました。 研究者は、イサカが破損したテキストを復元する際に62%の精度を達成し、元の場所を特定する際に71%の精度を達成し、テキストを元の日付から30年以内に日付を付けることができることを発見しました。
Ithacaの視覚化支援機能は、研究者が結果を簡単に解釈できるようにすることを目的としています。 論文の著者は、歴史家が一人で古代のテキストを復元するために働いたときに25%の精度を達成したと書いています。 しかし、イサカを使用すると、歴史家のパフォーマンスは72%に向上し、モデルのパフォーマンスを上回り、人間と機械の協力の可能性を示しています。
「Ithacaは解釈可能な出力を提供し、人間の専門家と機械学習の間の協力の重要性が高まっていることを示し、人間の専門家と深い関係をどのように一致させるかを示しています タスクに共同で取り組むためのアーキテクチャを学習することで、人間と同じタスクのモデルの両方の個々の(支援されていない)パフォーマンスを超えることができます」とSommerschieldはLifewireに語りました。
たとえば、歴史家は現在、ソクラテスやペリクレスなどの著名な人物が住んでいたときに作成された一連の重要なアテナイの法令の日付に同意していません、Sommerschieldは次のように書いています ブログ投稿. 法令は紀元前446/445年以前に書かれたと長い間考えられてきましたが、新しい証拠は紀元前420年代の日付を示唆しています。 「小さな違いのように見えるかもしれませんが、これらの法令は、古典的なアテネの政治史を理解するための基本です」と彼女は書いています。
イサカに最も近い作品は以前のものです Pythiaと呼ばれる機械学習ツール Sommerschieldと彼女の協力者は2019年にリリースしました。 Pythiaは、ディープニューラルネットワークを使用した最初の古代のテキスト復元モデルでした。
「今日、イサカは、碑文者のワークフローの3つの中心的なタスクに総合的に取り組む最初のモデルです」とSommerschieldは電子メールで述べています。 「これは、Pythiaによって設定された以前の最先端技術を進歩させるだけでなく、ディープラーニングも使用します。 地理的および時系列的な帰属を初めて、かつてない規模で実現しました。」
歴史家を支援するAI
AIは、データを分析して非常に複雑なパターンを学習するのに優れているため、テキストの場所や日付などの欠落データを入力するのに役立ちます。 ブラッド・クイントンAI企業SingulosResearchのCEOである、はLifewireに電子メールで語った。
「機械学習技術を使用して、AIは多数の「既知の良い」例を調べて たとえば、特定のテキストとその作成日および作成場所の間のパターンを見つけます」とQuinton氏は述べています。 追加した。 「多くの場合、これらのパターンは非常に複雑であるため、人間の専門家にはわかりません。」
欠落データの予測は、機械学習ベースのAIの一般的なタスクです。 例えば、 OpenAIのGPT-3 文中の欠落した単語、または段落内の欠落した文を予測できます。 また、多くのAIベースの画像処理システムは、元の画像から何が失われたかをインテリジェントに予測することにより、ビデオや画像を復元するために使用されてきました。
「概念的には、研究者は同様の手法を使用して、芸術や道具、またはその他の歴史的な人工物の日付と起源を特定することができます。 時間の経過とともに、原産地によって、基礎となるスタイルや技術に変化が見込まれるアーティファクト」とクイントン 言った。