ハッカーはAIの改善に地獄に屈している

January 25, 2022
にスマートでコネクテッドライフニュース

重要なポイント

開発者の新しい集団は、オープンソースのAIモデルを構築しています。
このグループは、オープンライセンスの下でリリースされる大規模な言語トレーニングモデルを使用しています。
オープンソースAIは、新しいテクノロジーの潜在的にゲームを変える力を、偏見やエラーの影響を受けにくくするのに役立つ可能性があります。

タブレットコンピューターでデジタル製品に取り組んでいるエンジニア。 — Westend61 /ゲッティイメージズ

大企業（AI）による人工知能に関する研究はたくさんありますが、あるオンライングループはプロセスを民主化したいと考えています。

EleutherAIは最近結成された集団ですオープンソースのAI研究に焦点を当てたボランティアの研究者、エンジニア、開発者の組織は、GPT-NeoおよびGPT-NeoXコードベースを使用して、オープンライセンスでリリースする予定の大規模な言語モデルをトレーニングします。

「科学者はモデルのトレーニングと研究の完了に使用できるより多くの無料リソースを持っているため、オープンソースデータは研究者に利益をもたらします。」エドワード・クイ、AI企業GravitiのCEOは、電子メールのインタビューでLifewireに語った。彼の会社はEueutherAIに関与していません。「AIプロジェクトのスコアは、実際のユースケースからの高品質のデータが一般的に不足しているために妨げられていたことを私たちは知っています。したがって、参加者の助けを借りて、データ品質を保証するガイダンスを確立することが重要です。コミュニティ。"

これが方法です

EleutherAIの始まりは謙虚でした。昨年、独立したAI研究者がコナー・リーヒー Discordサーバーに次のメッセージを投稿しました。

そして、グループが結成されました。今では何百人もの貢献者が彼らのコードをに投稿していますオンラインソフトウェアリポジトリGitHub.

オープンソーシングAIの取り組みは新しいものではありません。実際、AirbnbのAirflowワークフロー管理プラットフォームとLyftのデータ検出エンジンは、オープンソースツールを使用してデータチームがデータをより適切に処理できるようにした結果であると指摘されています。アリー・レーマン、Lifewireとの電子メールインタビューでのソフトウェア会社CloudiTwinsのプロジェクトマネージャー。

「オープンソース革命がソフトウェア開発の変革をもたらしたように、それも同様です。データサイエンスと人工知能の開発と民主化を推進してきました」とRehman氏は述べています。言った。「オープンソースは、エンタープライズデータサイエンスソリューションの重要なイネーブラーになり、データサイエンティストの大多数はオープンソースツールを使用しています。」

ドアを開ける

オープンソースAIを開発することで、新技術の潜在的にゲームを変える力を偏見やエラーの影響を受けにくくすることができると、一部のオブザーバーは主張しています。

AIの研究は現在、主にオープンで行われており、ほぼすべての企業、研究所、大学が学術出版物で結果をすぐに発表しています。クッシュバーシュニー、IBMのAI研究者は、電子メールのインタビューでLifewireに語った。

「このオープンコミュニティは、AIが責任を持って調査、作成、展開、適用されることを保証するために、強化されたレベルのチェックとバランスを提供するため、不可欠です」とVarshney氏は付け加えました。「これは、これらのシステムが社会の最も脆弱なメンバーの生活に影響を与える可能性がある状況では特に重要です。このオープン性は、一般的な機械学習とディープラーニングのアルゴリズムだけでなく、信頼できるAIの要素にも当てはまります。」

レーマン氏によると、プロプライエタリソフトウェアとオープンソースソフトウェアの重要な違いの1つは、柔軟性とカスタマイズです。独自のAI研究には、セキュリティ、更新、最適化に関する問題があります。

ラップトップコンピューターでコードを入力している人。 — ルイスアルバレス/ゲッティイメージズ

「これは、オープンソースのコミュニティベースのアプローチが何千もの業界から貴重な情報を得ているためです。潜在的なセキュリティの脆弱性を特定し、それをより迅速に修正する専門家」と語った。追加した。「コミュニティのコンセンサスは、品質が保証され、新しい機会がより簡単に特定されることを意味します。」

もう1つの問題は、独自のAI研究が相互運用できないことです。つまり、さまざまなデータ形式やベンダーロックインが発生する可能性があります。これにより、企業はソリューションに取り組む前にソフトウェアをテストして試すことができなくなります、Rehman 言った。

しかし、AI研究のすべての側面がオープンソースである必要はありません。クリスケント医療AI企業RevealSurgicalのCEOは、電子メールのインタビューでLifewireに語った。「AIの主要なアプリケーションの商業的開発を推進する経済的インセンティブを保護することが重要です」と彼は言いました。

ただし、AIの研究には、堅牢なオープンソースコンポーネントが必要だとケント氏は述べています。彼は、オープンソースは信頼を構築し、単一の機関や企業によって制御されていない、または制御されるべきではないデータセットを使用するために機能すると付け加えました。

「オープンソースアプローチは、存在する可能性のある根本的なバイアスを特定して補償するための最良の方法です。トレーニングセットで、AIのより全体的で創造的で信頼性の高いアプリケーションにつながるでしょう」と、ケント氏は述べています。