차 테크2017. 8. 4. 08:28

귀농귀촌 정보를 검색해보세요!
반응형

Google DeepMind, '스타 크래프트 II'


구글의 딥 마인드 (DeepMind)는 금요일에 발표 된 "스타 크래프트 II"게임에 인공 지능을 훈련시킬 예정 이다.


스타 크래프트 2 득시글 득시글하다


DeepMind는 지능을 이해하는 임무를 가진 인공 지능 회사입니다. 그것의 AlphaGo 프로그램   작년 봄에 유명한 게임을 치고, 오랫동안실시간 전략 비디오 게임 시리즈를 따라갈 것이라고 암시했다 .

블리자드 엔터테인먼트 (Blizzard Entertainment)가 제작 한 "스타 크래프트 (StarCraft)"는 2000 년대 한국 최초의 주요 스포츠 게임 중 하나 였고 실질적으로 한국의 스포츠였다. 그것은 인공 지능 연구원 이 목표로 삼는 것은 복잡한 계층 구조이기 때문에 플레이어는 수백 개의 단위를 제어하면서 수없이 빠른 의사 결정을 내리고 높은 수준의 전략적 결정을 내려야합니다. 그것은 블리자드가 게임을 이길 수있는 인공 지능을 만들기위한 연구자들의 시도에 대해 서명 한 것을 도왔습니다.

지금까지 연구자들은 "스타 크래프트 II"에 액세스 할 수 없었습니다. 이제 "스타 크래프트 II"의 효과적인 종결에 이어 , DeepMind와 Blizzard는 팀을 구성하여 DeepMind가 주도하는 AI 연구 환경으로 게임을 출시합니다.

DeepMind 연구 과학자 인 Oriol Vinyals는 게임이 인간을 이길 수 있기까지는 시간이 걸릴 것이라고 말했다.

" 연구의 관점에서 볼 때, 우리는 큰 진보를 보일 수는 있지만, 최선을 다할 수 있는지 여부를 알기에는 너무 이르다고 생각합니다 . "라고 Vinyals는 말했습니다 .

다음은 발표 내용입니다.

오늘 캘리포니아 주 애너하임의 BlizzCon 2016에서 Blizzard Entertainment 와의 협력을 발표 하여 전세계의 AI 및 기계 학습 연구원에게 StarCraft II를 개방했습니다.

거의 20 년 동안 스타 크래프트 게임 시리즈는 1 대 1의 경쟁력있는 비디오 게임의 최고봉으로, 그리고 모든 시간대 최고의 PC 게임으로 널리 인정되었습니다. 최초의 스타 크래프트는 e 스포츠의 초기 개척자였으며 90 년대 후반부터 엘리트 프로 선수들의 최고 수준에서 뛰었으며 오늘날에도 엄청나게 경쟁력이 있습니다. 스타 크래프트 시리즈의 경쟁 게임 수명은 블리자드의 디자인과 수년간 게임의 균형을 맞추고 수정하려는 지속적인 노력의 증거입니다. 스타 크래프트 II는이 시리즈의 유명한 eSports 전통을 이어가고 있으며 블리자드와의 작업에서 중점을두고 있습니다.

DeepMind는 인공 지능의 한계를 뛰어 넘는 과학적 사명을 수행하며 복잡한 문제를 해결하는 방법을 알 필요없이 해결할 수있는 프로그램을 개발합니다. 게임은이를 수행 할 수있는 완벽한 환경으로보다 지능적이고 유연한 인공 지능 알고리즘을 빠르고 효율적으로 개발하고 테스트 할 수 있으며 점수를 통해 수행하는 방식에 대한 즉각적인 피드백을 제공 할 수 있습니다.

지난 5 년간 우리는 우리의 기계 학습 및 보강에서 연구를 앞으로 학습 운전하는 AI 연구 환경으로 게임의 사용을 개척 한 아타리의 2D 게임 과 같은 풀 3D 환경, TORCS , 이동의 게임을 마스터 , 또는 우리의 곧 출시 될 DeepMind Labyrinth. 다음은 이러한 연구 환경이 LR, Atari 및 Labyrinth와 어떻게 생겼는지 보여줍니다.

스타 크래프트는 현실 세계의 난장판에 유용한 다리를 제공하기 때문에 현재 인공 지능 연구를위한 흥미로운 테스트 환경입니다. 에이전트가 환경을 통해 진행하고 StarCraft를 잘 수행하는 데 필요한 기술은 궁극적으로 실제 작업에 전달 될 수 있습니다.

스타 크래프트 게임을 시작할 때 플레이어는 3 가지 레이스 중 하나를 선택합니다. 각각의 레이스 능력과 게임 플레이 방식은 다릅니다. 플레이어의 행동은 게임 내 경제의 영향을받습니다. 미네랄 및 가스는 새로운 건물 및 단위를 생산하기 위해 모아야합니다. 상대 플레이어는 자신의베이스를 동시에 구축하지만 각 플레이어는 자신의 유닛 범위 내에서지도의 일부만 볼 수 있습니다. 따라서 플레이어는 상대방에 대한 정보를 얻기 위해 보이지 않는 영역을 스카우트하고 그 정보를 오랜 기간 기억해야합니다. 환경이 부분적으로 관찰 가능 해짐에 따라 Chess 나 Go와 같은 완벽한 정보 게임과는 대조적으로 더욱 복잡한 도전이됩니다. 그리고 이것은 실시간 전략 게임입니다. 두 플레이어가 동시에 플레이하고 있으며,

스타 크래프트를 할 수있는 에이전트는 효과적인 메모리 사용, 오랜 기간 계획 할 수있는 능력, 새로운 정보를 바탕으로 계획을 조정할 수있는 능력 등을 입증해야합니다. 컴퓨터는 매우 빠른 제어가 가능하지만 인텔리전스를 반드시 보여주지는 않습니다. 따라서 에이전트는 "분당 액션"이라는 측면에서 인간의 손재주 한도 내에서 게임과 상호 작용해야합니다. 스타 크래프트의 고차원 적 행동 공간은 이전에 보강 학습 연구에서 조사 된 것들과는 상당히 다릅니다. "기지를 어떤 위치로 확장"과 같은 간단한 작업을 수행하려면 마우스 클릭, 카메라 및 사용 가능한 자원을 조정해야합니다. 이로 인해 액션 및 계획이 계층 적으로 이루어 지므로 강화 학습의 도전적인 측면입니다 .

우리는 블리자드와 함께 작업 한 환경이 내년에 모든 연구원이 사용할 수있게되어 기쁘게 생각합니다. 우리는 최근 몇 년 동안 Brood War 커뮤니티의 개발자와 연구원의 노력을 인정하며 블리자드 팀이 직접 지원하는이 새롭고 현대적이고 유연한 환경이 최신 기술을 발전시키기 위해 널리 사용될 수 있기를 바랍니다. 미술.

우리는 스타 크래프트 II 팀과 긴밀히 협력하여 "스크립팅 된"인터페이스로 작성된 이전 봇과 비슷한 기능을 지원하는 API를 개발하여 개별 장치를 프로그래밍 방식으로 제어하고 전체 게임 상태에 액세스 할 수있게했습니다 (새로운 옵션도 있음) . 궁극적으로 에이전트는 픽셀에서 직접 재생됩니다. 따라서 우리는 거기에 도달하기 위해 맵 및 미니 맵을위한 단순화 된 저해상도 RGB 이미지 데이터를 출력하는 새로운 이미지 기반 인터페이스를 개발했으며, 기능을 별도의 "레이어"로 분리하는 옵션을 제공합니다. , 지형 높이 필드, 유닛 유형, 유닛 상태 등을 나타냅니다. 아래는 기능 레이어 API의 모습입니다.

우리는 블리자드와 협력하여 어느 수준의 연구자라도 에이전트를 설치하고 운영 할 수있는 복잡한 작업을 제시하고 다른 알고리즘과 발전을 벤치마킹하는 "커리큘럼"시나리오를 개발하고 있습니다. 연구원은 기존의 StarCraft II 편집 도구를 사용하여 자신 만의 작업을 만들 수있는 완전한 유연성과 제어력을 갖게됩니다.

블리자드와의 협력을 통해 우리를 이끌어 갈 수있는 곳을 확인하게되어 정말 기쁩니다. 우리는 여전히 스타 크래프트 II 게임에서 전문적인 인간 플레이어에게 도전 할 수있는 먼길을 간다. 그러나 우리는 블리자드에서 한 작업이보다 광범위한 AI 연구 커뮤니티를위한 유용한 테스트 플랫폼이되기를 바랍니다.

 참고 :이 기사는 Google이 게임에서 인간을 때려 고한다고 말하지 않았 음을 수정했습니다.

여기에서 최신 Google 주가를 받으십시오 .


반응형


Posted by 교육자의 길