I.A., jogos de estratégia, e o poder das opções

Uma nova tecnologia de Inteligência Artificial, e como nós poderíamos aprender um pouco mais sobre Magic usando as descobertas recentes em I.A.

Por

18/10/2019 10:05 - 8.325 visualizações - 36 comentários

Há três anos atrás, li um artigo de um grande jogador estrangeiro de Magic, sobre uma nova tecnologia de Inteligência Artificial, e como nós poderíamos aprender um pouco mais sobre Magic usando as descobertas recentes em I.A.

A Tecnologia em questão era na época chamada Alpha Go, uma I.A criada para jogar em alto nível um jogo de estratégia chinês chamado Go, semelhante ao xadrez, porém, consideravelmente mais complexo.

Não usarei nesse artigo nenhum material desse texto gringo de 2016 sobre Magic e Inteligência artificial, pois o mesmo já está consideravelmente desatualizado, e a tecnologia em questão já foi superada e hoje tem outro nome. As informações sobre a referida inteligência artificial contidas aqui podem ser encontradas no site oficial dos desenvolvedores clicando AQUI.

AlphaZero, como agora é chamado, é uma iniciativa da Deep Mind e Google.

Vou tentar resumir alguns anos de história recente:

Alpha Go foi desenvolvido para aprender sozinho a jogar Go, e a partir de um processo de tentativa e erro, jogava contra si próprio milhões de partidas, e usava as experiências para aos poucos, evoluir suas estratégias e subir seu nível como jogador. Nenhum tipo de técnica avançada de Go foi inserida no código de AlphaGo, apenas as regras básicas do jogo, e em pouco tempo, ele não só foi capaz de desenvolver um nível absurdo de jogo, como foi capaz de vencer com pontuações absurdas os melhores jogadores e campeões, tornando-se o maior jogador de Go de todos os tempos.

Mais recentemente, a Deep Mind, num esforço para provar que seu algoritmo auto-didata não era restrito ao Go, e poderia ser útil para outras tarefas, resolveu expandir um pouco mais seu campo de atuação, repetindo o processo com dois outros jogos: o Xadrez, e o Shogi (jogo japonês de estratégia). Assim Surgiu o AlphaZero.

No caso do Xadrez, o AlphaZero foi ligado e lhe ensinaram apenas as regras básicas do jogo, e em 4 horas de atividade, aprendeu (sozinho) o suficiente para vencer dezenas de vezes (vinte e oito a zero) o programa campeão e número um do Ranking de Engines de Xadrez, Stockfish.

Stockfish é um mecanismo hiper-sofisticado de xadrez com anos e anos de evolução, que não pôde evitar ser completamente esmagado por uma inteligência artificial que teve 4 horas para descobrir os segredos do jogo, partindo do zero.

O ponto é que todo o conhecimento embutido em Stockfish foi colocado alí pelo homem, ela não é uma inteligência capaz de aprender sozinha.

AlphaZero, além de ter descoberto sozinho técnicas famosas de xadrez, foi capaz de inventar tantas outras técnicas revolucionárias, que estão sendo estudadas pela comunidade de enxadristas, que já considera o AlphaZero um marco sem precedentes na história do Xadrez.

Mas afinal, qual o segredo do sucesso da I.A?
E o quê um programa de computador, Go e Xadrez podem ter a ver com Magic?

Quero lhes dizer nesse artigo que a maneira como o AlphaZero enxerga jogos de estratégia tem TUDO a ver com Magic: The Gathering, e se você quer descobrir um pouco do que se pode aproveitar desse conhecimento em seu progresso como jogador, aperte o cinto, e vamos nessa.

- O Poder das possibilidades

De acordo com os especialistas em Xadrez, o tipo de jogada mais valorizada pelo AlphaZero ao avaliar seus próximos movimentos, são as jogadas capazes aumentar o número de opções disponíveis, ou que permitam que suas peças se movimentem mais livremente pelo tabuleiro, e também jogadas que diminuam as opções do adversário ou travem a livre movimentação das peças rivais.

A pergunta é: Como nós podemos reproduzir esse comportamento imbatível, enquanto jogadores de Magic? De diversas formas, eu diria.

Jace, the mind sculptor (planeswalker), Deathrite Shaman (criatura), Tampo de adivinhação do sensei (artefato), Brainstorm (Mágica instantânea)... O que todas essas cartas tem em comum, além de serem ícones absolutos em cada uma dessas categorias?

Todas essas cartas, além do óbvio Power level elevado, oferecem possibilidades, escolhas, caminhos diferentes que podem ser explorados de acordo com a necessidade; diferente de um Ball lightning, cujo o único objetivo de sua esférica vida é causar até 6 de dano, essas cartas não são um fim em si mesmas, mas apresentam diversas janelas que levam a outras possibilidades.

O AlphaZero literalmente também não se importa em perder mais peças do que o oponente durante o processo da conquista de seus objetivos, seu foco principal é realizar ações que possibilitem mais escolhas e mais liberdade a cada movimento. Ao assistir jogos do Alphazero, é evidente que muitas vezes ele sacrifica peças em troca de mais liberdade para as restantes, todas as suas peças são extremamente ativas, enquanto o oponente, apesar de ter mais material, logo acaba ficando sufocado, com amontoados de peças, as vezes espremidas nos cantos, quase inúteis.

Imagem de AlphaZero(brancas) vs Stockfish (pretas)

O que quero dizer com tudo isso?

Que esse estilo de jogo, o culto as possibilidades, já é parte presente de Magic, mas é algo que ainda não foi completamente sistematizado.

Imagine o seguinte cenário:

Você tem duas cartas na mão: Uma carta aparentemente "inútil" e um valioso counter, e o oponente joga ThoughtSeize. O quê você faz? Revela sua mão, ou anula a mágica do oponente?

Os jogadores competitivos sabem que você sempre deve gastar a counterspell para anular um ThoughtSeize do oponente, preservando a carta "ruim" em sua mão.

E porquê não deixar que ele escolha e talvez erre, escolhendo descartar o pior card, te deixando com seu querido counter?

A resposta: se você não anular, ele vai olhar sua mão e provavelmente vai tirar o counter de qualquer jeito, mas ele terá também a "opção" de tirar a carta que VOCÊ considera inútil; você não sabe a mão do oponente, não conhece profundamente seus planos, e se por algum motivo a opção de tirar a carta "ruim" ao invés do counter "bom" for melhor para ele, você terá dado mais essa opção para ele ao invés de tentar diminuir suas possibilidades. Esse conceito de, sempre que possível, diminuir as escolhas possíveis para o oponente, mesmo quando a jogada a ser feita possa parecer contra-intuitiva, já foi abordado por muitos outros jogadores, e é conhecido como "Jogadas forçadas".

O Alpha Zero aplica esse conceito, o de jogadas forçadas, de maneira extremamente sistematizada.

Veja o que Matthew Sadler, mestre em xadrez, diz sobre o Alpha Zero:

"A primeira coisa que os jogadores vão notar é o estilo do Alphazero, a maneira como suas peças se espalham com propósito e força ao redor do Rei oponente. É esse jogo dinâmico que maximiza a atividade e mobilidade de suas próprias peças, enquanto minimiza a atividade e mobilidade das peças inimigas. Contra-intuitivamente, AlphaZero também parece não dar tanto valor ao "material", uma ideia popular no xadrez moderno, de que cada peça tem um determinado "valor" e se um dos jogadores tem um número maior de "valor" entre suas peças, comparado ao outro, ele tem "Vantagem de material". Ao contrário disso, AlphaZero está disposto a sacrificar material no começo do jogo em troca de ganhos que só serão resgatados a longo-prazo."
- Sadler, Matthew. Tradução: eu mesmo.

Notaram alguma semelhança com conceitos comuns em Magic? Espero que sim, pois essas afirmações nos levam direto ao nosso próximo tópico.

- Um jogo de 1 ou 20

Essa disposição de sacrificar recursos para atingir um objetivo ou colher frutos posteriores também está presente em diversos aspectos de Magic.

AlphaZero sacrifica recursos de forma indiscriminada, afinal, ele nem sequer sabe sobre essa história de que jogadores humanos teorizaram e atribuíram "valores" a cada peça. Ele faz trocas literalmente sem preconceitos, se baseando não em valores premeditados e sim exclusivamente na utilidade que cada peça tem naquela partida específica.

Um dos muitos exemplos e analogias possíveis é: Nós fomos ensinados a jogar Magic acreditando que devemos ter sempre muito cuidado e preservar nossos pontos de vida com extrema tenacidade. São eles que nos mantém dentro do jogo, e cada ponto perdido é um golpe que nos empurra cada vez mais em direção a derrota, certo? CERTO?

Errado.

Muitas estratégias bem sucedidas mostraram que dogmas como esse não se aplicam a todas as partidas de Magic. O Modern Grixis Death's Shadow, por exemplo, quer perder vida a todo custo, afim de jogar um bicho de poder e resistência absurdos e terminar rapidamente a partida. Se AlphaZero fosse um jogador de Magic, ele saberia que, essencialmente, ganhar uma partida com 20 pontos de vida, ou 1 ponto de vida, desde que tudo esteja dentro de um esquema coerente e arquitetado, são planos igualmente viáveis. Vida, cards em sua mão, cards em seu baralho, todos esses são recursos que podem ser gastos a fim de promover um efeito esperado no final, e o valor de cada um deles não é intrínseco ao jogo, e sim ao contexto de cada partida e situação.

- Um outro tipo de Advantage

A inteligência artificial da deepmind adora ter opções, e Magic é em si um jogo sobre escolhas. No fundo, você também é um pouco como o AlphaZero, gosta de poder escolher, e é por isso que adora Magic, afinal, antes de entrar em um torneio, você já se comprometeu a fazer 75 escolhas para poder registrar um deck. Depois escolherá em algum momento por começar na Play ou na Draw (já falamos sobre isso mês passado), optará por qual land baixar primeiro, qual terreno buscar em seu deck, qual mágica fazer primeiro, e eventualmente poderá fazer escolhas que envolverão inclusive a mão e o baralho do oponente, e assim seguir, fazendo escolhas até eventualmente ganhar ou perder.

Acredito que, se AlphaZero fosse um super pro player de Magic (eu não duvido nada, no futuro) ele diria que Magic é sobre fazer escolhas coerentes que abram ainda mais e mais opções.

Talvez essa seja um novo tipo de "Advantage" ainda não nomeada, onde um jogador pode ter 6 cartas na mão e menos de 6 opções, e você, com apenas 4 cartas na mão, tenha se colocado numa posição de acesso a 8 escolhas.

Se nós resolvermos chamar esse tipo de vantagem como "Choice Advantage", seria bem fácil explicar em quantas situações comuns ela se torna óbvia, por exemplo, quando você e o oponente tem respectivamente um planeswalker em jogo, mas o seu é um Nicol Bolas, Dragon-God. O Seu planeswalker obviamente estaria fornecendo "Choice advantage" possuindo todas as habilidades do PW rival, além de suas próprias 3 habilidades. Na verdade, uma infinidade de outras cartas e jogadas podem fornecer Choice Advantage, como as Fetchlands, Tutores, etc.

O contrário, que seria "Choice Disadvantage" é mais fácil ainda de percebermos em muitas partidas: A maioria dos jogadores já passou pela experiência de ter apenas um de vida e não poder mais utilizar suas Fetchlands, ou ter dois pontos de vida ou menos e não ter a opção de conjurar um ThoughtSeize sem perder o jogo. As vezes ficamos "presos" em determinadas situações, exatamente como as peças dos oponentes do AlphaZero; apesar de termos as peças, elas já não podem desempenhar seu papel, pois nossas opções já foram limitadas.

- Maximizando possibilidades com seu Sideboard

Pra terminar, gostaria de usar esse conceito do culto a maximização de possibilidades, para ilustrar a questão do Sideboard.

A maioria dos jogadores competitivos, sabem por intuição que um Sideboard eficiente se parece bem pouco com isso:

4 Desmembrar
3 Travessuras
3 Perfurar Magica
3 Furia dos Deuses
2 Negar

Para se parecer um pouco mais com isso:

2 Comando de Kolaghan
2 Brutalidade Coletiva
3 Rejeicao Cerimoniosa
1 Furia dos Deuses
1 Engenheiro da Pestilencia
1 Travessuras
1 Liliana do Veu
2 Explosivos Fabricados
1 Piromante Experiente

E porquê? Sabe a resposta?
3,2,1, valendo!

O lance é, de novo, Versatilidade, possibilidades, opções! Haha.

Pense no seu Sideboard como um Kit de sobrevivência para passar um tempo na Selva. Se você levar para a selva 15 frascos de repelente de mosquito, e chegando lá, não encontrar mosquitos, o que vai fazer? E se encontrar um animal perigoso por lá? Não teria sido melhor trazer menos repelente e, economizado espaço para ao menos uma faca?

Esse é o princípio. Constructed, e principalmente o Modern, é literalmente uma Selva. Um GP/MCQ sempre está lotado de todo o tipo de estratégia imaginável, por isso, ao montar seu Sideboard, pense como o AlphaZero, sacrifique um pouco a quantidade em prol de mais possibilidades.

Uma coisa que incomoda muito as pessoas a respeito de registrar decks com apenas uma cópia de uma determinada carta (os famosos one-of) é o fato de que você não vai comprar aquela carta tanto quanto gostaria, ou achar aquele Hate de Sideboard sempre, certo?

Vou explicar o conceito super óbvio que está por trás da atitude de usar one-ofs:

2 é apenas o dobro de 1, mas 1 é infinitamente maior que zero.

Não comprar uma carta tanto quanto gostaria é anos luz melhor do que ter ZERO chances de comprar uma carta que você precisa muito pra um jogo ou situação específica, tudo porque você não a incluiu em nenhuma das suas 75 escolhas.

One-ofss são poderosos, maximizam suas possibilidades, e são a marca de um Sideboard elaborado com esmero.

CONSLUSÃO:

Esse foi um artigo mais especulativo do que teórico, mas se pudermos tirar uma lição, acredito que seja:

Sua postura de jogo deve buscar maximizar suas opções, e diminuir as opções do oponente, utilizando todos os seus recursos. O segredo não está só em Cantrips ou cartas versáteis, mas principalmente na maneira como enxergamos e jogamos Magic.

Por hoje é só, pessoal. Vejo vocês em breve, com mais especulações Magicosas e Teorias (da conspiração).

Forte abraço, e até a próxima quinzena!
Lages

COACHING TEORIA

( edulages)

Comentários

Ops! Você precisa estar logado para postar comentários.

(Quote)

malditasaranhas

- 22/10/2019 13:28:37

melhor artigo que já li na Liga, parabéns!

(Quote)

Stoppa

- 21/10/2019 15:32:56

Belo Artigo.parabéns.

(Quote)

Sr-Androia

- 21/10/2019 09:35:34

Um dos melhores artigos que já li na Liga. Parabéns!

(Quote)

Igoralfa

- 20/10/2019 21:51:42

[quote=Raimek=quote][quote=Pseudomonas=quote]Então, mas vc sabe exatamente quais são as peças. Elas podem não estar em uso no momento, mas o bispo irá se mover na diagonal em qnts casas a qualquer momento. Qnts Spell de dano direto meu adversário tem no baralho pra eu calcular o qnt posso usar da minha vida como recurso? Volto a dizer em jogos onde se conhece todas as peças e movimentos é bem mais fácil. Agora aqui, como? [/quote][/quote]Treine uma IA com deck x contra um deck burn, ela vai saber exatamente a partir de quanto de vida ela deve começar a usar alguns recursos, alem disso, a IA treinada contra um burn iria entender nas primeiras jogadas qual é o deck do oponente, o quao agressivo o oponente esta e o mais legal seria que ela saberia os padrões de jogada, então não é necessario ela saber o deck do oponente uma IA iria perceber os mesmos padrões que sabemos e muito mais.[/quote]

Concordo. E acho que, conforme o texto diz, não é necessário programar todas as inúmeras jogadas conhecidas no momento na IA antes de jogá-la pra uso. Aliás, acho que isso iria contra o propósito do "autoaprendizado" da máquina, que a limitaria com o conhecimento humano (e pequeno, dadas a inúmeras possibilidades e velocidade de aprendizado da máquina). Parece-me que, hoje, bastariam algumas jogadas com determinados decks para aprender as jogadas e mecanismos de cada um, isso sem contar formatos diferentes que tornam uns mais limitados que outros.

(Quote)

Igoralfa

- 20/10/2019 21:45:42

[quote=Pseudomonas=quote]Então, mas vc sabe exatamente quais são as peças. Elas podem não estar em uso no momento, mas o bispo irá se mover na diagonal em qnts casas a qualquer momento. Qnts Spell de dano direto meu adversário tem no baralho pra eu calcular o qnt posso usar da minha vida como recurso? Volto a dizer em jogos onde se conhece todas as peças e movimentos é bem mais fácil. Agora aqui, como? [/quote][/quote]

É um bom ponto. No entanto, acho que está pensando apenas no Xadrez em si. A questão do artigo é uma IA inicialmente projetada para o Go e que teve altas taxas de sucesso (em apenas 4h) em um jogo diferente. Em uma explicação bem simples, o Go é um jogo onde você começa com um tabuleiro completamente vazio e só tem uma peça em todo o jogo. No entanto, as possibilidades de jogada (dependendo do tamanho do tabuleiro) são muitas (para não dizer inúmeras) e muito complexas também. Acho válido dar uma olhada no sistema só para ter uma base de como a IA trabalha com possibilidades, pois o oponente pode jogar a (única) peça dele em qualquer lugar. Isso não tira o mérito de que a IA trabalha com um cenário (mais complexo que o xadrez) em que não tem conhecimento do fluxo do jogo completo, assim como MTG. Este último, por sua vez, também conta com limitações facilmente previstas por uma IA (ou jogador), como por exemplo: Considerando as cartas atuais, meu adversário pode fazer isso, isso e isso no turno 1; ou, sem mana, não pode fazer nada, agora é meu turno de ataque e ele não tem cartas na mão ou trigger para fazer. Com isso, não acho difícil criar uma IA, mesmo que imperfeita, que seja uma ótima jogadora de MTG e aprenda com cada jogo. Assim, ainda acho que o artigo apresenta um ótimo ponto de reflexão sobre o avanço da tecnologia, o crescimento de IA (Jogos outras aplicações) e como elas aprendem, etc.