Gostaria de agradecer expecialmente a duas pessoas importantíssimas: ao Prof. Gil Riela e ao Prof. Joe Garcia pela suas cooperações.
O DILEMA DO PRISIONEIRO E INDISCIPLINA ESCOLAR, A POSSIBILIDADE DE OUTRO DISCURSO.
Ivan Gross
ivangross@yahoo.com.br
Resumo: o atual estudo apresenta uma relação possível entre a teoria dos jogos e indisciplina escolar na busca de uma estratégia de propicie cooperação tanto do professor como do estudante. Entendendo indisciplina escolar como uma série de lances de um jogo, de soma não nula, sem vitoriosos, a probabilidade da emergência da cooperação aumenta quando se escolhe uma estratégia onde não há inveja, há perdão, não se é esperto de mais, e se considera a informação completa do jogo e mais importante inicia-se sempre cooperando com a outra parte. Considera também como a aplicação da teoria dos jogos pode influenciar nos estudos sobre indisciplina escolar na contemporaneidade. Concluímos que a indisciplina escolar deve ser trabalhada com os professores a partir de dois pressupostos, o teórico em seu entendimento de constituição do sujeito; e prático mantendo-se fiel a estratégia escolhida.
Palavras chave: educação, indisciplina escolar, teoria dos jogos, dilema do prisioneiro iterado.
Introdução
A Teoria dos Jogos é a aplicação lógica matemática em tomadas de decisões sendo é utilizada em economia, política, situações de guerra, conflitos de interesse; que busca prever os movimentos do outro jogador, buscando o melhor resultado para ambos.
Almeida (2006, p. 1) afirma que o
objetivo da teoria dos jogos é entender a lógica na hora da decisão e ajudar a responder se é possível haver colaboração entre os jogadores, em quais circunstâncias o mais racional é não colaborar e quais estratégias devem ser adotadas para garantir a colaboração entre os jogadores.
Dessa maneira a Teoria dos Jogos se configura como um conjunto de técnicas para análise de cenários conflituosos (ex: conflitos entre países, entre grupos sociais, mercados financeiros, campanhas eleitorais, dinâmicas de comportamento, práticas esportivas, políticas de preço, entre outros), sempre que há “uma disputa de interesse entre partes que possuem algumas alternativas para tomada de decisão a cada passo, a formalização matemática destes cenários é denominada jogo” (ZUBEN, s.d., p. 3,4); e por que não à indisciplina escolar.
Mesmo que utilizemos a terminologia da Teoria dos Jogos aplicada à indisciplina escolar, o objetivo último é identificar a melhor estratégia nesta relação conflituosa. Em outros termos trata-se de um estudo de probabilidades; quais as variáveis que favorecem o aparecimento da cooperação em prol da minimização da indisciplina escolar.
O Dilema do Prisioneiro Iterado e a Teoria dos Jogos.
O Dilema do Prisioneiro Iterado , um problema clássico na Teoria dos Jogos, foi primeiramente formulado por Merrill Flood e Melvin Dresher em 1950. A variável, tempo de prisão, foi adicionada mais tarde por Albert W. Tucker, que definiu seu formato atual e cunhou o nome Dilema do Prisioneiro pelo qual é conhecido até os dias atuais (SANTOS, 2009, p. 17).
A “teoria dos jogos representa uma forma de modelar problemas que envolvem dois ou mais ‘tomadores de decisão’.” Assim, não se trata de como jogar o jogo e “sim de mecanismos de análise de conflitos de interesse” (ZUBEN, s.d., p. 2).
Existem três formas de realizar uma análise da indisciplina escolar através do Dilema do Prisioneiro: n para n, 1 para n, ou 1 para 1. No primeiro caso diversos professores jogam com diversos alunos, ex: uma campanha anti bully na escola. No segundo caso poderíamos considerar um professor jogando com n alunos presentes em sala de aula; o terceiro caso, que será a forma analisada no presente artigo, a interação se daria entre um professor e um aluno.
Existem várias versões do Dilema com algumas diferenças no tempo de prisão, e como é apresentada a situação aos dois presos, porém a análise dos dados não varia. O Dilema do Prisioneiro funciona da seguinte maneira: dois suspeitos, A e B, são presos pela polícia. A polícia tem provas insuficientes para condená-los, mas, separando os prisioneiros oferece a ambos o mesmo acordo: se um dos prisioneiros testemunhar para contra o outro e o outro permanecer em silêncio, o que colaborar sai livre o cúmplice silencioso cumpre 5 anos de sentença. Se ambos ficarem em silêncio, a polícia só pode condená-los a 1 ano de cadeia cada um. Se ambos se acusarem um ao outro, cada um será condenado a 2 anos de cadeia. Cada prisioneiro faz a sua decisão sem saber o que o outro vai decidir. Nenhum tem certeza de como o outro vai reagir e que decisão irá tomar. A questão que o dilema propõe é: o que vai acontecer? Como reagir?
Esquematicamente:
• Caso A denuncie B e B fique em silêncio: A sai livre e B fica preso por 5 anos (o inverso também é verdadeiro caso B denuncie A e A fique em silêncio: B sai livre e A fica preso por 5 anos).
• Caso A e B fiquem em silêncio: ambos ficam presos por 1 ano.
• Caso A e B se denunciem mutuamente: ambos ficam presos por 2 anos.
O fato é que pode haver dois vencedores neste tipo de jogo, Dilema do Prisioneiro, sendo esta solução a melhor para ambos quando analisada em conjunto. Entretanto, os jogadores confrontam-se com algumas perguntas: confiarão no cúmplice e negarão o crime, mesmo correndo o risco de serem colocados numa situação ainda pior se o outro falar? Ou confessam e esperam ser libertados, apesar de que, se o outro fizer o mesmo, ambos ficarão numa situação pior do que se permanecessem calados?
Dado que nenhum deles pode ter a certeza da cooperação do outro, o resultado final será que ambos irão optar por desertar do colega. Desta forma têm a certeza que terão, na pior das hipóteses, uma pena de 2 anos e, na melhor, sairão em liberdade. No final acabam ambos por ficar bastante pior do que se tivessem cooperado.
Outro ponto interessante no Dilema do Prisioneiro é que mesmo que os presos conversem entre si questionando o que o outro vai fazer e explicitando sua ação futura, isso não alteraria o resultado do jogo, pois não podem estar seguros de confiar mutuamente. E por incrível que possa parecer, “a racionalidade individual leva a um pior resultado para ambos. Daí o dilema” (AXELROD, 2010, p. 9).
Provavelmente a característica mais interessante do Dilema do Prisioneiro, como jogo de soma não nula, é o fato de que como os dois jogadores não são necessariamente adversários o ganho para cada um deles pode ser diferente (ZUBEN, s.d., p. 29).
Terminologia aplicada.
Existe uma terminologia própria à Teoria dos Jogos e por se tratar de termos diferentes dos utilizados em Educação vale aqui sua descrição; apresento aqui suas definições, pois serão utilizadas constantemente no decorrer do texto; baseados em ZUBEN (s.d., p. 9, 10, 11).
Jogador: são os participantes do jogo, e podem ser em número de 2 ou mais.
Lance: todo jogo consiste de uma sequência de lances, algum deles simultâneos, que correspondem ou a decisões dos jogadores ou a resultados de eventos aleatórios.
Utilidade: conceito que reflete sua preferência frente a várias alternativas de resultado de jogo. A função de utilidade deve refletir todos os aspectos vinculados aos possíveis resultados de um jogo, incluindo o sentimento de satisfação de um jogador frente ao que ocorre com seus adversários.
Por ser um termo diferenciado, que influencia na existência ou não do jogo ou na motivação (individual) do lance a ser dado, mas normalmente não aparece nas descrições das equações matemáticas que descrevem o jogo, aqui vale um exemplo descritivo.
Suponha que o resultado do jogo seja B =
Há a possibilidade de estender este conceito para o caso de se analisar o cenário em escola privada ou instituição pública. Seja BI =
Supondo que exista uma chance de bom humor do professor de 50%, então, com a função de utilidade acima, é possível indicar que o jogador é não faz diferença entre escolas privadas e instituições públicas com base na seguinte equação:
1/2 u(BI)+ 1/2 u(CE) = u(C).
Estratégia: a estratégia de um jogador é a descrição das decisões a serem tomadas frente a todas as possíveis situações que podem se apresentar durante o jogo. Portanto a estratégia não depende do que o adversário irá fazer naquele lance. “Ou regra de decisão” (AXELROD, 2010, p. 13). Retornarei a esse conteúdo mais detalhadamente.
Jogos de soma nula: são aqueles para os quais o somatório dos pagamentos efetuados a todos os jogadores é nulo. Nesse caso, o que um jogador ganha corresponde ao que é perdido pelos demais.
Jogos de soma não-nula: são aqueles que não respeitam as condições que caracterizam os jogos de soma nula. O caso do Dilema do Prisioneiro.
Jogos de informação completa: são jogos em que cada jogador tem conhecimento de todos os lances já ocorridos.
Deserção: quando não há a colaboração; quando um “incrimina” o outro para sair livre.
Retaliação: uma forma de punição pelo outro jogador ter desertado no lance anterior.
Parâmetro de desconto: o futuro é menos importante que o passado por dois motivos; os jogadores tendem valorizar menos a recompensa à medida que o tempo de sua obtenção se volta para o futuro, e sempre há a possibilidade dos jogadores não voltarem a se encontrar (AXELROD, 2010, p. 12).
Assim o parâmetro de desconto é a importância ou peso (p) do próximo lance em relação ao lance atual. Em outros termos pode ser entendido como uma diminuição da importância do lance em relação à duração do jogo.
Por exemplo, no caso da indisciplina escolar, em um jogo que dure um ano letivo, esse parâmetro de desconto explica porque a indisciplina escolar tende a aumentar do decorrer do ano, sendo mais controlada pelos professores e minimizada pelos alunos no início do ano letivo, visto que não se conhecem (o desconto de p será maior), e mais frouxa perto do fim do ano (onde o desconto de p será menor); como o aluno sabe da sua condição – aprovado ou reprovado – e o professor já conhece cada aluno, e eles tendem a não vão se encontrar novamente no ano que vem, o p tende a ser elevado (o desconto de p será menor).
Supondo um ano letivo de 200 dias, com uma aula por dia, onde ocorra ao menos um lance ao dia onde p=1/0,02 , a primeira deserção valeria 1, a segunda deserção valeria 1/0,02 , a terceira 1/0,04 e assim sucessivamente no final do ano teríamos o valor exato de 2 pontos para o total das deserções. Para se obter um ponto por lance isso pode corresponder a 1 + p + p2 + p3 ... Caso considerássemos p maior que 0 e menor que 1 o parâmetro de desconto poderia ser descrito como 1/(1-p) (AXELROD, 2010, p. 12).
Porém esse parâmetro de desconto apresenta uma consequência interessante ao aproximar-se do fim do jogo, como cada um dos jogadores sabe que o fim se aproxima a chance de deserção tende a aumentar para que ocorra o aumento de seus ganhos. Essa consequência aplicada no cenário de indisciplina escolar, explica o aumento de sua incidência no decorrer do ano.
O parâmetro de desconto questiona uma peculiaridade importante, que normalmente não se encontra em sala de aula, que é ter um parâmetro forte e constante no que se refere à indisciplina escolar. Se há uma ameaça em terminar o jogo antecipadamente o valor de p será alterado mudando a regra da relação durante a partida, o que altera o resultado, e possivelmente a estratégia. Ou seja, a partir do momento que se decide efetivamente “jogar”, não se deve mudar a estratégia de enfrentamento da indisciplina escolar, e mais ainda, não se deve alterar o seu entendimento frente á ela.
Jogo do Dilema do Prisioneiro Iterado (o utilizado neste estudo): cada jogo consiste em um certo número de partidas (ou lances), ou interações, de forma que o pagamento final seja a soma dos pagamentos de cada lance (CHALUB, s.d., p. 39).
Estratégias.
Essas informações e fórmulas matemáticas elucidam como funciona a probabilidade de resolução da indisciplina escolar, porém não demonstra, qual é a melhor estratégia. Não se deve esquecer que o alvo é a cooperação entre os jogadores. Assim o que se busca é uma estratégia que seja exercida pelos professores que tenha efeito no aluno na intenção de desenvolver a cooperação na resolução da indisciplina escolar.
Quatro propriedades ajudam na escolha, ou desenvolvimento da melhor estratégia. Aquilo que é eficaz depende não apenas das características de uma determinada estratégia, como também da natureza das outras estratégias com as quais deve interagir. Uma estratégia eficaz deve ser gentil, ser capaz de considerar a qualquer ponto o histórico da interação tal como se desenvolveu até o momento , não sentir inveja, e não ser esperto de mais (AXELROD, 2010, p. 29 e 104).
Estratégias desenvolvidas que obtém o melhor resultado de cooperação possuem algumas propriedades em comum. A primeira delas é ser “gentil (nice)”, o que significa nunca ser o primeiro a desertar. “Em outros termos mostrar que você esta disposto a cooperar” (AXELROD, 2010, p. 31). Essa propriedade além de aumentar o ganho minimiza a perda.
Aplicada à indisciplina escolar, essa propriedade, demonstra a importância de desenvolver o vínculo afetivo com o aluno desde o primeiro contato. Independente do histórico de outros jogos que esse aluno tenha realizado com outros professores sendo o primeiro lance entre esses dois novos jogadores, o professor deve ser gentil; isso pode reduzir o ganho do primeiro lance, mas programa a tendência ao desenvolvimento da cooperação no decorrer do tempo.
A segunda propriedade em comum das estratégias mais eficientes é o “perdão” (...) a propensão a colaborar” (AXELROD, 2010, p. 32). Onde se guarda na memória somente o lance anterior, sem levar em conta o histórico de lances do jogador. Por exemplo, em uma sequencia hipotética de 7 lances, onde se encontra uma interação assim:
Tabela de lances hipotéticos onde apareça o perdão após uma retaliação.
Lances- 1 2 3 4 5 6 7
Professor C D C C D C C
Aluno D C C C C D C
Podemos notar que o professor foi gentil e iniciou o jogo (lance 1) colaborando, seu aluno indisciplinado não, consequentemente o professor desertou (no lance 2) em resposta a deserção do aluno (ocorrida no lance 1). No lance 5 quando o professor desertou (digamos que ele estava de mal humor), o aluno revidou com uma deserção no lance 6. Ouve um retorno à cooperação nos lances 3, 4, e 7, isso indica que o perdão ajuda ao retorno a um ambiente cooperativo.
Essa propriedade explica porque professores muito gentis acabam por ser explorados pelos alunos no que se refere à indisciplina escolar. Imaginemos que para cada colaboração ganhe-se 1 ponto e para cada deserção ganhe-se 5 pontos; no exemplo da tabela 1 o resultado seria igual para ambos (15 – duas deserções e cinco cooperações). Caso o aluno sempre desertasse e o professor colaborasse o resultado seria: professor 7 pontos e aluno 35 pontos. Em outros termos o aluno domina o professor.
Essa ideia de “dominação” de um ou de outro explica os subprodutos emocionais envolvidos na indisciplina escolar. Caso o aluno domine o professor há a Síndrome de Bournout, stress, baixa autoestima, faltas, desanimo depressão; caso o professor domine o aluno há a evasão escolar, absenteísmo, baixa autoestima, depressão, notas baixas, entre outros.
Caso houvesse somente uma deserção de um dos dois, a diferença de pontuação seria de 7 (20% do total de pontos possíveis) à 11 (31,42% dos pontos possíveis). Como ambos não podem receber os 35 pontos , a melhor estratégia busca o melhor resultado aos dois jogadores (20%).
A terceira propriedade: não sentir inveja, evita uma sequencia de deserções quanto menor for o valor de p. Em outros termos, quando há a percepção de que o outro está perdendo menos ou ganhando mais, há a tendência em ocorrer mais deserções daquele que esta perdendo em busca do equilíbrio ao fim do jogo.
Ocorre que essas seguidas deserções não levam os lances novamente a uma sequência de cooperação, pois já estando atrás do outro e desertando continuamente a pontuação não irá ser implementada suficientemente para que ocorra ao menos o “empate”, e por outro lado se cooperando com o outro ele também reduz o ganho do primeiro.
Quando o professor percebe que o aluno esta dominando o jogo passa a desertar mais frequentemente na intenção de: educar, transmitir, dificultar, limitar. Isso não retoma a relação equilibrada de cooperação, só demarca mais a diferença de limiar de frustração do professor e de resiliência do aluno. Quando o aluno percebe que o professor esta dominando, também aparecem subprodutos que evitam a emergência da cooperação, como birra, reclamações, má vontade, etc.
Outra propriedade é não ser esperto de mais. Essa propriedade, talvez a mais ética das quatro, lembra que quanto maior a diferença de resultados maior será a derrota de um e vitória do outro o que distancia o resultado da cooperação em ambos. Quando o professor ou aluno percebem que estão dominando também aparece a tendência para desertar frequentemente na intenção de que o outro ganhe menos.
O cerne do problema dessa propriedade é que a maximização dos ganhos vai refletir no comportamento do outro. Assim, se um sempre deserta o outro também irá desertar sempre.
Essas considerações levam a melhor estratégia encontrada, chamada de “Olho por Olho”, que começa sempre cooperando e depois faz o mesmo que o oponente fez na rodada anterior. Há muito tempo conhecida, mas desenvolvida por Anatol Rapoport da Universidade de Toronto (AXELROD, 2010, p. 29).
Segundo Axelrod (2010, p. 52) o que explica a estratégia Olho por Olho como a mais eficiente é:
[...] sua combinação de ser gentil, retaliadora, clemente e clara. Sua gentileza a previne de se colocar em problemas desnecessários, sua retaliação desencoraja o oponente a persistir na deserção, sua clemência ajuda a restaurar a cooperação mútua e sua clareza é compreensível ao oponente, suscitado assim, a cooperação de longo prazo.
Chalub (s.d., p. 68) esquematiza da seguinte maneira as razões comportamentais para o sucesso da estratégia Olho por Olho:
a) Bondade: nunca é a primeira a Trair (sinônimo de Desertar utilizado neste estudo)
b) Retaliação: Joga Trair sempre que o oponente joga Trair
c) Perdoar: tem memória curta (1 iteração), (sinônimo de lance utilizado nesse estudo).
d) Não é invejosa: não se preocupa em ganhar mais que o oponente, mas sim no valor total.
e) Clareza: os oponentes entendem rapidamente que para ganhar muitos pontos devem jogar Cooperar.
Existem 7 proposições que devem ser levadas em conta ao se decidir por uma estratégia (baseado em Axelrod, 2010). A escolha da estratégia também deve levar em conta a estratégia utilizada pelo outro; mesmo que a estratégia Olho por Olho demonstre sempre os melhores resultados.
Proposição 1: não existe absolutamente uma estratégia melhor independente do ambiente. Por exemplo, há grande diferença de ambiente entre mercado financeiro e instituição escolar. Podemos também considerar o número de alunos indisciplinados em relação ao número total de alunos em sala, um, dois ou mais.
Proposição 2: a estratégia Olho por Olho é coletivamente estável se, e somente se, p for elevado. O que acaba por facilitar no aparecimento da cooperação da resolução da indisciplina escolar em situações que considerem um aluno bastante indisciplinado já que haverá diversos lances em uma única aula.
Proposição 3: qualquer estratégia sendo a primeira a cooperar pode ser coletivamente
estável somente quando p é muito elevado. Em outras palavras, o aluno acreditando que o professor esta disposto a cooperar também desenvolve a tendência a cooperar.
Proposição 4: para que uma estratégia gentil seja coletivamente estável, ela deve ser motivada pela primeira deserção do oponente. Alunos disciplinados aparentemente já tem isso desenvolvido, pois tendem a não desertar no decorrer do jogo mantendo seus ganhos elevados e equiparados aos dos professores.
Proposição 5: estratégias que sempre desertam são coletivamente estáveis. Independente de quem escolha a estratégia “Sempre D ”, professor ou aluno, a resposta da outra parte tende a ser também Sempre D, o que acarreta a impossibilidade de um bom andamento da sala de aula.
Proposição 6: estratégias que conseguem suprimir estratégias Sempre D com o menor valor de p são aquelas que são discriminativas máximas como a Olho por Olho. Em outras palavras, mesmo que o aluno Sempre Deserte, a interação dessa estratégia com a Olho por Olho escolhida pelo professor, acaba por ensinar ao aluno que seus ganhos podem ser aumentados em uma relação cooperativa.
Proposição 7: se uma estratégia gentil não pode ser derrotada por uma estratégia cruel também não o pode ser por um grupo. Essa proposição é interessante no sentido em que mesmo que em sala de aula existam dois ou mais indisciplinados a interação é sempre de 1 para 1. O que acelera o aparecimento da cooperação, pois um aluno indisciplinado tem acesso aos ganhos do outro aluno indisciplinado que começa a cooperar.
Essa sétima proposição esta vinculada a terceira propriedade de escolha da melhor estratégia, não ser invejoso quando o p for baixo. Em alunos disciplinados o p tende a ser maior que em alunos indisciplinados (pois haveriam mais lances entre professor – aluno indisciplinado, acarretando uma diminuição de p), porém quando um aluno indisciplinado inicia lances de cooperação com o professor e outro aluno indisciplinado não, aparece a tendência ao desenvolvimento da inveja no segundo aluno consequentemente acarretando o desenvolvimento da cooperação mútua em alunos de difícil lida em sala de aula.
Essas proposições acabam por esclarecer que estratégias gentis conseguem se proteger de uma maneira que as cruéis não conseguem. Porém a cooperação só vai aparecer em um ambiente cruel caso exista uma interação entre dois ou mais indivíduos que colaborem.
Sorley (1919, p. 283 apud AXELROD, 2010, p. 79) afirma que “causar desconforto aos outros é uma forma indireta de causa-lo a si mesmo”, isso é identificado no Dilema do Prisioneiro quando se levanta que estratégias gentis e que perdoam conseguem um resultado mais adequado, a vingança, retaliação, mágoas, ou uma percepção negativa do histórico de lances acarreta em uma série de deserções infindável.
Como promover a cooperação.
A cooperação mútua pode ser estável quando o futuro é muito importante em relação ao presente porque os jogadores podem utilizar uma “ameaça implícita de retaliação contra a deserção do outro, caso a interação tenha duração suficiente para tornar a ameaça eficaz” (AXELROD, 2010, p. 119).
Quanto maior o número de interações entre professor e aluno maior a probabilidade da cooperação ter sua frequência aumentada. Não é a presença no mesmo ambiente que proporciona a interação entre os jogadores, em sala de aula quanto mais o professor fala menos o aluno interage, alterando o valor do parâmetro de desconto.
Provavelmente por isso que os alunos adorem conversar entre si, eles sempre cooperam.
Outra forma de promover a cooperação é alterar as recompensas. Caso a punição pela deserção seja mais elevada que a recompensa pela cooperação, o Dilema do Prisioneiro deixa de existir. “Se as recompensas forem alteradas, a situação pode mudar de um estado não cooperativo para uma situação de cooperação estável” de maneira prática “é necessário apenas fazer com que o incentivo em longo prazo para a cooperação mútua seja maior que o incentivo no curto prazo para a deserção” (AXELROD, 2010, p. 126).
Há uma diferença de percepção do que seja esse futuro, para que serve e quando ele será usado. Professores tendem a considerar um futuro muito distante, que irá aparecer muito depois da interação ter sido encerrada; ex: futuro profissional. O aluno por sua vez prefere um ganho menor e imediato, ao invés de um grande e distante, isso explica porque eles preferem passar horas na internet ao invés de estudar.
Mesmo que seja impossível competir com a brevidade da recompensa encontrada em mídias digitais, se pode aumentar o incentivo pela cooperação em sala de aula contra indisciplina escolar. Novamente não é aumentar a punição pela deserção, mas sim aumentar o ganho pela cooperação.
Axelrod (2010, p. 126) afirma que o altruísmo pode promover a cooperação da seguinte forma:
Pais e professores despendem um esforço tremendo para ensinar às crianças o valor da felicidade dos outros. Em termos da teoria dos jogos, isso significa que os adultos tentam moldar os valores das crianças para o próprio bem-estar individual, mas pelo menos em certa medida, o bem-estar dos outros. Sem dúvida, uma sociedade constituída por pessoas tão atenciosas terá muito mais facilidade em manter a cooperação entre seus membros, mesmo quando se encontram numa situação do Dilema do Prisioneiro Iterado.
Essa afirmação explica porque os alunos indisciplinados formam um grupo e os disciplinados outro (além de outros grupos); pois até se pode ser cooperativo com todos inicialmente, porém quando em interação com alguém que jogue por uma estratégia não cooperativa há a tendência a ser afastar dela.
Aquela citação também acaba por explicar porque os professores tendem a interagir de forma cooperativa mais com alunos disciplinados. Assim, mesmo com um valor de p menor a cooperação emerge; com alunos indisciplinados mesmo com um valor de p elevado há a tendência de abandonar o jogo de ambas as partes devido as constantes deserções.
A melhor forma de promover a cooperação é ensinar a reciprocidade entre os jogadores, como afirma Axelrod (2010, p. 128):
A cooperação incondicional não apenas prejudica o parceiro, mas também outros inocentes com que o explorador bem sucedido irá interagir no futuro. A cooperação incondicional tende a minar o outro jogador, deixando um fardo sobre o restante da comunidade para corrigi-lo, e sugere que uma base melhor para a moralidade é a reciprocidade e não a cooperação incondicional.
No caso, apresentar a consequência da deserção com outra deserção mesmo com valores diferentes ensina ao aluno o valor da cooperação. Isso explica porque quando o E.C.A. entrou em vigor muitos professores questionaram sua validade, eles estavam acostumados a apresentar um formato de consequência pela deserção do aluno, e ainda não encontraram outra forma. Professores ainda participam da ordem do discurso que qualifica a ameaça de uma punição física como a melhor forma de punir a falta de cooperação por parte do aluno.
O sujeito no discurso pedagógico sobre indisciplina escolar e seu entendimento pelo viés do Dilema do Prisioneiro.
Essas considerações sobre o Dilema do Prisioneiro aplicadas à indisciplina escolar visam a cooperação última entre os jogadores, porém como isso pode influenciar algumas teorizações feitas sobre indisciplina escolar até o momento.
Riboulet (1963, p. 175) escreve: ”para que o subordinado chegue a submissão perfeita, que surja uma circunstância extraordinária, uma crise moral, exija intervenção. (...) ao delinquente”. Em Vasconcelos (2003, p. 474) encontramos: “a moral vem do respeito que adquirimos as regras e esse respeito começa no respeito que temos pelas pessoas que nos impõe tais regras”. E Aquino (2003, p. 384) adverte: “que a intervenção pedagógica não está se processando a contento” e que o “efeito mais evidente é o de que as regras de convívio e funcionamento do campo não estão sendo respeitadas, legitimadas pelos alunos”.
Essas três citações, meras instantâneas separadas por quarenta anos de teorização sobre indisciplina escolar nos mostram alguns pontos interessantes de serem considerados à luz da teoria dos jogos.
Considerando Riboulet (1963) através da interação do Dilema do Prisioneiro podemos notar que aquele autor preconiza uma estratégia Sempre D. Em Vasconcelos (2003) não se nota uma estratégia a ser seguida pelo professor, mas há implícita a ideia de que o estudante precisa compactuar com a estratégia do professor em busca de algo maior que a disciplina, a moral; que aparentemente acarreta no estudante o entendimento do porque obedecer; em outros termos é o estudante que precisa responder à estratégia do professor.
Em Aquino (2003) podemos considerar um paralelo entre intervenção pedagógica e estratégia, que para aquele autor também precisa ser legitimada pelo aluno como resposta a estratégia do professor, independente qual seja ela.
Os três autores, em maior ou menor grau, aprofundamento, e sob pontos de vista diferentes, considera o aluno em um nível diferenciado ao do professor, necessitando deste orientação para compreender e adentrar ao mundo adulto. Esta afirmação está ligada a concepção iluminista de sujeito, que, para ser considerado homem civil deve obedecer a razão, “encarnada na vontade geral” (ROUANET, 1996, p. 203).
De maneira implícita podemos considerar que a partir dos princípios iluministas, levando-se em conta aquilo que os constitui, a estratégia preconizada é Sempre D. Ou considera que a não cooperação por parte do aluno em reposta a deserção do professor é responsável pelo não funcionamento da relação entre lances e consequentemente à falta de cooperação.
Conforme afirma Rouanet (1996, p. 302), o que está em jogo não é uma tomada de posição contra ou a favor do Iluminismo, contra ou a favor da razão e da crítica, “é um combate totalmente contemporâneo, em vista da ressurgência da direita, e de um novo irracionalismo que desponta” (p. 302).
Na terminologia da Teoria dos Jogos isso pode ser considerado como a busca de uma relação do tipo de estratégia Olho por Olho, que entendida através de uma lente ideológica não considera possível que haja dois vencedores em um jogo onde que a tomada de posição de um influencie positivamente o outro.
O que fica então é uma frustração pela estratégia Sempre D não funcionar mais pelo simples fato de que quando emerge uma cooperação mútua deixa-se de ser um vencedor para passar a ser um cooperador, saindo de seu lugar de destaque.
Conforme Souza (2003, p. 122), o movimento iluminista “encontra sua força no argumento racionalista que concebe o homem como constituído pela razão”, ou seja, “dotado dos instrumentos necessários a sua autonomia, cabendo a sua consciência organizar a vida associativa de acordo com os princípios da liberdade e da igualdade”.
Aí encontramos uma possível contradição, se o professor espera do aluno uma estratégia Sempre C (cooperar sempre) porque utiliza uma estratégia Sempre D? Se o objetivo é uma “vida associativa de acordo com os princípios da liberdade e da igualdade”, que entendo como sendo a máxima que envolve o Dilema do Prisioneiro, porque o professor não é gentil e perdoa, iniciando uma estratégia Olho por Olho?
Tal contradição se desfaz quando é explicada, pelos “iluminados” como sendo: não é o professor que não possui uma estratégia adequada, é o aluno que não sabe jogar, afinal a educação não é um jogo.
Neste ponto, então, podemos considerar que, indisciplina escolar pela ótica do discurso vinculada ao Dilema do Prisioneiro, se exibe como uma desqualificação ou não aceitação da estratégia do aluno por parte do professor.
Em outros termos o professor parte do princípio de que é o aluno quem precisa cooperar independente se sua estratégia é cooperativa ou não.
Conclusão
Os ganhos da estratégia Olho por Olho em interação com ela mesma pode ser descrita da seguinte maneira: Σ Dpn = D/1-p’ . E o ganho relativo entre a estratégia Sempre D e a estratégia Olho por Olho pode ser expresso assim: T + Σ Dpn+1= T + Dp/1-p’ (CHALUB, s.d., p. 82).
Em outros termos, quando ambos, professor e aluno usam a estratégia Sempre D, o resultado é a soma das interações deserdadas menos a soma das jogadas cooperativas que não foram feitas . O que apresenta um resultado menor que a interação entre estratégias Olho por Olho.
Quando o professor exige a cooperação do aluno gera uma deserção, quando o professor simplesmente coopera promove a cooperação da outra parte. Então o professor peca pelo exagero? Também, pois não podemos nos esquecer da parcela do discurso sobre indisciplina escolar que pressupõe antecipadamente a deserção por parte do aluno.
Será essa então a prova matemática de que a responsabilidade pela manutenção da indisciplina escolar advém do professor pela simples falta de bondade, perdão, não inveja e clareza? Em parte, pois prece que os professores em posição defensiva deixam de retaliar.
Parece-me então, que o que falta ao professor é a explicitação clara de sua estratégia, que não deve ser confundida com os “combinados” de início de ano, que devido ao parâmetro de desconto paulatinamente deixam de ser utilizados, além de serem bem mais confusos que a expressão “eu nunca vou desertar antes que você, você deserta e só então eu deserto”.
Um dos problemas identificados no presente estudo é a constituição do sujeito nas teorias utilizadas no entendimento da indisciplina escolar. Tornam-se prementes duas novas preposições no entendimento desse fenômeno, uma teórica e uma prática.
Uma nova teorização sobre como é constituído o sujeito estudante / aluno. Pois, considerar antecipadamente que ele sempre desertará pela falta de iluminação por não ser adulto inviabiliza a emergência da cooperação.
Um novo posicionamento prático por parte do professor que passa a cooperar sempre que possível e desertar se, e somente se, o aluno não cooperar. Quem sabe resida ai a parcela moral tão esperada pelos teóricos.
Uma pergunta ainda foi deixada de lado, de propósito, o que é cooperação? Essa pergunta não será respondida. Não é um comportamento da outra parte que precisa de cooperação. Cooperação deveria ser princípio de vida.
Referências
ALMEIDA, A. N. Teoria dos Jogos: as origens e os fundamentos da Teoria dos jogos. Disponível em: http://www.ccet.ufrn.br/matematica/lemufrn/Artigos/Texto%20sobre%20TEORIA%20DOS%20JOGOS.pdf . Acesso em: 08/11/2011.
AQUINO, J. G. Disciplina e indisciplina como representações da educação contemporânea. In: BARBOSA, R.L.L. (Org.). Formação de educadores: desafios e perspectivas. São Paulo: UNESP, 2003. p. 377–385.
AXELROD, R. A evolução da cooperação. São Paulo: Leopardo, 2010.
CHALUB, F. A. C. C. Introdução à teoria dos jogos. Disponível em: http://strato.impa.br/videos/BIOMATH/fabio2.pdf . Acesso em: 8/11/2011
RIBOULET, L. Disciplina preventiva. 3. ed. São Paulo: F.T.D., 1963.
ROUANET, S. P. As razões do iluminismo. São Paulo: Companhia das Letras, 1996.
SANTOS, R. R. Modelo estratégico financeiro baseado na teoria dos jogos e no equilíbrio de Nash. Disponível em: http://www.cpgls.ucg.br/ArquivosUpload/1/File/CPGLS/IV%20MOSTRA/NEGCIO/Modelo%20Estrategico%20Financeiro%20Baseado%20va%20Teoria%20Dos%20Jogos%20e%20no%20Equilibrio%20de%20Nash.pdf . Acesso em 08/11/2011.
SOUZA, M. Fios e furos: a trama da subjetividade e a educação. Revista Brasileira de Educação. Rio de Janeiro, n. 26, p. 119 - 133 ago. 2003.
VASCONCELOS, M. S. Disciplina e indisciplina como representações na educação contemporânea: a ética da obediência. In: BARBOSA, R. L. L. (Org.). Formação de educadores: desafios e perspectivas. São Paulo: UNESP, 2003. p. 465 – 477.
ZUBEN, F. J. V. Teoria de Jogos. Disponível em: ftp://ftp.dca.fee.unicamp.br/pub/docs/vonzuben/ea072_2s06/notas_de_aula/topicoP2.7_06.pdf Acesso em: 08/11/2011.