アンドロイド

Dendiに勝ったopenai botのパワー

目次:

Anonim

先週、歴史は土田2とAIの分野で作成されました。 The Internationalでは、このゲームで最高の選手の1人であるDendiが、1v1でボットにより、2回続けて容赦なく倒されました。 問題のボットは、Elon Muskのスタートアップである OpenAI によって作られました。

今、あなたはいくつか質問があるかもしれません。 土田とは何ですか? OpenAIとは何ですか? そしてなぜこれがさらに重要なのでしょうか。 まず第一に、土田はあなたが 英雄 を制御し、あなたの目的は相手の 古代 を破壊することである自由にプレイできるMOBAゲームです。 多くのDotaファンは、Dotaにはそれほど多くあるので最後の文を怒らせるかもしれません、それから私は要約しました。

ゲームはそれに非常に急な学習曲線で非常に複雑です。 私はしばらく前に土田を学ぶという使命に乗り出しました、そしてそれは彼らがゲームの戦略、武器、呪文、英雄たちがすることとクリープを採掘する方法を説明する基本的な ハウツー ビデオ を 通過するだけで私に1週間かかりました。 そしてこれは、AIとMLの進化がどれほど高度になったかを示しているため、 AI対Dendiの 戦い全体が重要になります。 それで、そのボットを動かしているものを見てみましょう、そして私たちはAIの蜂起について怖くなる必要がありますか。

AIの惑星の台頭

SkynetになるAIは議論の余地のある問題です。 Elon Muskは、抑制されなければ Skynetの ようなシナリオが起こる可能性が高いと考えています。 一方、 Mark Zuckerberg は、AIは無害であり、Doomsday Scenarioを引き起こさないと述べています。 Elon Muskはこの目的でOpenAIを始めました。

AIの誤用や、私たちに反しないAIの研究を防ぐため。 そして私は彼の側にいます。

しかし、それは私たちが議論するためにここにいるものではありません。 主なトピックは、OpenAIによって作られたボットを動かしているものを知ることです。 それを理解するために、私はこの問題についてのいくつかの研究論文とブログを読み、そしてまたAIとMLの研究者である私の友人 Anmol Sharmaに 連絡しました。

強化学習

これはOpenAIのDotaボットの背後にある技術の名前です。 しかし、それを詳しく調べる前に、一般的なAI、具体的にはビデオゲームのAIがどのように機能するのかを理解する必要があります。 AIは非常に重要な用語で、機械学習、ディープラーニング、ニューラルネットワークなどのトピックがいくつか含まれています。 AIを大まかに定義すると、情報から学び、それに基づいて決定を下すことがコンピュータの能力であると言えます。 学ぶほど、意思決定の正確さは増します。

通常のボットとどう違うのですか?

一般的なビデオゲームのボットはインテリジェントであるように見えるかもしれませんが、それはAIの本当の形ではありません。 ゲーム内のこれらのボットのほとんどすべてがset If..This..Then..That ステートメントに基づいてプログラムされています。 彼らはただ文をたどり、文に書かれた条件に基づいて行動を起こします。

上記の私は非常に単純な例を示しました。 実際のゲームのステートメントは、条件内の条件でははるかに複雑です。 これらのステートメントがより明確に定義され詳細になればなるほど、ボットはインテリジェントなものになるでしょう。

報酬と罰

AIの専門用語では、ボットと呼ぶものをエージェントと呼びます。 目標は、エージェントに学習させたいものは何でも学習させることです。 エージェントはあなたの犬が学んだのと同じ方法で、報酬と罰を通して学びます。 エージェントがミスを犯すと必ずペナルティが科せられ、エージェントが正しい推測をしたり、正しい答えを出したりすると、報酬が与えられます。 このシステムを通して、エージェントはペナルティを避けるためにすべきではない行動を関連付けることを学び、報酬を与える行動(または同様の行動)を実行します。

よく考えてみれば、それはアルゴリズムが行うのと同じように、特定の条件に基づいて決定を下すようなものです。 私が上に示したように、爆発的な銃身に乗ってくるゲームボットは、アルゴリズムに従って行動を取ります。 AIのアルゴリズムは、明らかにこれより非常に複雑で、システム全体が インテリジェントになり ます。

私たちのOpenAIボットに来て、開発者によると、それは2週間の時間でゲーム全体を学びました。 2週間の間、それは24時間365日オンラインであり、自分自身のコピーと対戦していました。 これは、ゲームの複雑さと、それが Dendiに 勝る可能性があるという事実を考えると、画期的な出来事です。

なぜドライバーレス車はまだここにないのですか?

これは私がこの出来事全体について聞いたときに頭に浮かんだ最初の質問の一つです。 ボットがそのようなゲームを習得し、トッププレイヤーを殴打するように自分自身を訓練することができるならば、なぜ我々はまだ車輪を準備しているのですか。 これは私の友人で あるAnmol Sharma氏 にも聞かれたのと同じ質問でした。 これは彼が言わなければならなかったことです。

人間が開発したゲームでは、変数の数は少なくなります。 さらに、もしエージェント(ボット)がミスをした場合、最悪のペナルティはラウンドロスです。 現実の世界では、1つの間違いは死です。

土田は複雑なゲームであっても、動き、呪文、戦術の可能な組み合わせは、いまだに途方もないほど大きいものの、まだ限られています。 そして間違いは本当のペナルティなしに許されます。 しかし、運転手のいない自動車エージェントの場合、間違いは危険な事故やさらには死亡につながる可能性があります。

現実の世界では、エージェントが監視しなければならない変数の数は無限であり、他の車が急に車線を変更する、歩行者が車の前でジャンプするなど、これらの変数によって発生する状況も無限です。 さらに、ジェレミー・クラークソンが述べているように、彼らは緊急事故の危機に瀕しているときには道徳的かつ倫理的な決定をしなければならないだろう(彼の理論は有効ではないが)。

未来

私達は既に内的手術を行う人間制御ロボットを知っています。 次の飛躍はそれを実行するAI制御ロボットです。 そしてこれはまさに医療分野です。 AIは、今後10年間で多くの分野で最も有力な新技術となるでしょう。 しかし、AIはDDoS攻撃、Ransomware Bots、他のPCや企業のシステムをハッキングするなどの悪質な目的にも悪用される可能性があります。

土田や他のゲームに関しては、そのような知的なボットが他のゲームのためにも作られていることが期待できます。 そして、私はOpenAIが来年のInternationalで5v5をやると言いましたか? だから私は最低でも内臓のdumberボットを倒すために私のDotaスキルを磨くことにしています。 ここで私は 神聖なる猛スピード !