{"id":7070,"date":"2024-11-07T12:28:48","date_gmt":"2024-11-07T11:28:48","guid":{"rendered":"https:\/\/neuronup.com\/br\/?p=7070"},"modified":"2026-01-26T18:17:36","modified_gmt":"2026-01-26T16:17:36","slug":"q-learning-dos-experimentos-de-pavlov-a-neurorreabilitacao-moderna","status":"publish","type":"post","link":"https:\/\/neuronup.com\/br\/novidades-neuronup\/q-learning-dos-experimentos-de-pavlov-a-neurorreabilitacao-moderna\/","title":{"rendered":"Q-learning: Dos experimentos de Pavlov \u00e0 neurorreabilita\u00e7\u00e3o moderna"},"content":{"rendered":"\n<p class=\"has-large-font-size\">O Q-learning evoluiu consideravelmente desde os primeiros experimentos comportamentais, como o condicionamento cl\u00e1ssico de Pavlov, para se tornar uma das t\u00e9cnicas mais importantes no campo do Machine Learning. A seguir exploraremos como tem sido seu desenvolvimento e sua aplica\u00e7\u00e3o na neurorreabilita\u00e7\u00e3o e estimula\u00e7\u00e3o cognitiva.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Experimentos de Pavlov<\/h2>\n\n\n\n<p>Ivan Pavlov, um fisiologista russo do final do s\u00e9culo XIX, \u00e9 conhecido por estabelecer os fundamentos da psicologia comportamental atrav\u00e9s de suas experi\u00eancias com o condicionamento cl\u00e1ssico. Nestas experi\u00eancias, Pavlov demonstrou que os c\u00e3es podiam aprender a associar um est\u00edmulo neutro, como o toque de uma campainha, com um est\u00edmulo incondicionado, como a comida, provocando assim uma resposta incondicionada: a saliva\u00e7\u00e3o.<\/p>\n\n\n<div class=\"wp-block-image image-interface\">\n<figure class=\"aligncenter size-full\"><img decoding=\"async\" width=\"1024\" height=\"640\" src=\"https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/12\/neuronup-labs-experimento-pavlov-BR-1024x640-1-1.webp\" alt=\"Quadros ilustram Pavlov com cachorro, mostrando fases antes, durante e ap\u00f3s, destacando associa\u00e7\u00e3o entre est\u00edmulos.\" class=\"wp-image-33707\" style=\"object-fit:cover\" srcset=\"https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/12\/neuronup-labs-experimento-pavlov-BR-1024x640-1-1-300x188.webp 300w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/12\/neuronup-labs-experimento-pavlov-BR-1024x640-1-1-768x480.webp 768w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/12\/neuronup-labs-experimento-pavlov-BR-1024x640-1-1.webp 1024w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><figcaption class=\"wp-element-caption\">NeuronUP Labs Experimentos de Pavlov.<\/figcaption><\/figure>\n<\/div>\n\n\n<p>Este experimento foi fundamental para demonstrar que o comportamento pode ser adquirido por associa\u00e7\u00e3o, um conceito crucial que mais tarde influenciou o desenvolvimento de teorias de <strong>aprendizagem por refor\u00e7o.<\/strong><\/p>\n\n\n\n<h2 class=\"wp-block-heading\">As teorias de aprendizagem por refor\u00e7o<\/h2>\n\n\n\n<p>Essas teorias se concentram em como humanos e animais aprendem comportamentos a partir das consequ\u00eancias de suas a\u00e7\u00f5es, o que tem sido essencial para projetos de algoritmos como o <strong>Q-learning<\/strong>.<\/p>\n\n\n\n<p>Existem alguns conceitos-chave com os quais precisamos nos familiarizar antes de continuar:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Agente:<\/strong> respons\u00e1vel pela execu\u00e7\u00e3o da a\u00e7\u00e3o.<\/li>\n\n\n\n<li><strong>Ambiente: <\/strong>ambiente onde o agente se movimenta e interage.<\/li>\n\n\n\n<li><strong>Estado: <\/strong>situa\u00e7\u00e3o atual do ambiente.<\/li>\n\n\n\n<li><strong>A\u00e7\u00e3o:<\/strong> poss\u00edveis decis\u00f5es tomadas pelo agente.<\/li>\n\n\n\n<li><strong>Recompensa: <\/strong>recompensas dadas ao agente.<\/li>\n<\/ul>\n\n\n\n<p>Nesse tipo de aprendizagem, um agente realiza ou executa a\u00e7\u00f5es no ambiente, recebe informa\u00e7\u00f5es na forma de recompensa\/penalidade e as utiliza para ajustar seu comportamento ao longo do tempo.<\/p>\n\n\n<div class=\"wp-block-image image-interface\">\n<figure class=\"aligncenter size-large\"><img decoding=\"async\" width=\"1024\" height=\"597\" src=\"https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/12\/neuronup-labs-teoria-aprendizaje-por-refuerzo-BR-1024x597.webp\" alt=\"Diagrama de aprendizagem por refor\u00e7o: agente \u00e0 esquerda, ambiente com estados e a\u00e7\u00f5es; recompensas +1 em verde e -1 em vermelho.\" class=\"wp-image-33709\" style=\"object-fit:cover\" srcset=\"https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/12\/neuronup-labs-teoria-aprendizaje-por-refuerzo-BR-300x175.webp 300w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/12\/neuronup-labs-teoria-aprendizaje-por-refuerzo-BR-768x448.webp 768w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/12\/neuronup-labs-teoria-aprendizaje-por-refuerzo-BR-1024x597.webp 1024w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/12\/neuronup-labs-teoria-aprendizaje-por-refuerzo-BR.webp 1200w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><figcaption class=\"wp-element-caption\">Teoria da aprendizagem por refor\u00e7o. NeuronUP.<\/figcaption><\/figure>\n<\/div>\n\n\n<p>Um experimento cl\u00e1ssico de aprendizagem por refor\u00e7o \u00e9 o experimento da <strong>caixa de Skinner<\/strong>, realizado pelo psic\u00f3logo americano Burrhus Frederic Skinner em 1938. Neste experimento, Skinner demonstrou que ratos poderiam aprender a pressionar uma alavanca para obter comida, usando o refor\u00e7o positivo como meio de moldar o comportamento. <\/p>\n\n\n\n<p>O experimento consiste em colocar um rato em uma caixa com uma alavanca que ele pode pressionar, um dispensador de comida e, \u00e0s vezes, uma luz e um alto-falante.<\/p>\n\n\n\n<p>Cada vez que o rato pressiona a alavanca, um gr\u00e3o de comida \u00e9 liberado no dispensador. A comida atua como um refor\u00e7o positivo, uma recompensa por pressionar a alavanca. Com o tempo, o rato come\u00e7ar\u00e1 a pressionar a alavanca com mais frequ\u00eancia, mostrando que aprendeu o comportamento por meio de refor\u00e7o.<\/p>\n\n\n<div class=\"wp-block-image image-interface\">\n<figure class=\"aligncenter size-large\"><img decoding=\"async\" width=\"1024\" height=\"512\" src=\"https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/12\/neuronup-labs-caja-de-skinner-BR-1024x512.webp\" alt=\"Caixa de Skinner com rato azul acionando a alavanca; inclui alto-falante, luzes, dispensador de comida e rede eletrificada.\" class=\"wp-image-33705\" style=\"object-fit:cover\" srcset=\"https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/12\/neuronup-labs-caja-de-skinner-BR-300x150.webp 300w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/12\/neuronup-labs-caja-de-skinner-BR-768x384.webp 768w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/12\/neuronup-labs-caja-de-skinner-BR-1024x512.webp 1024w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/12\/neuronup-labs-caja-de-skinner-BR.webp 1200w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><figcaption class=\"wp-element-caption\">A caixa de Skinner. NeuronUP.<\/figcaption><\/figure>\n<\/div>\n\n\n<p>Esse tipo de aprendizado serviu de base para algoritmos de aprendizado de <strong>m\u00e1quina<\/strong>, como o <strong>Q-learning<\/strong>, que permite que as m\u00e1quinas aprendam comportamentos ideais de forma aut\u00f4noma por meio de tentativa e erro.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">O que \u00e9 Q-learning?<\/h2>\n\n\n\n<p>O Q-learning foi introduzido por<strong> Christopher Watkins <\/strong>em 1989 como um algoritmo de aprendizagem por refor\u00e7o. Este algoritmo permite que um agente aprenda o valor das a\u00e7\u00f5es num determinado estado, atualizando continuamente o seu conhecimento atrav\u00e9s da experi\u00eancia, tal como o rato na caixa de Skinner.<\/p>\n\n\n\n<p>Ao contr\u00e1rio dos experimentos de Pavlov, nos quais o aprendizado se baseava em associa\u00e7\u00f5es simples, o Q-learning utiliza um m\u00e9todo mais complexo de tentativa e erro. O agente explora diversas a\u00e7\u00f5es e atualiza uma <strong>tabela Q<\/strong> que armazena valores Q, que representam as recompensas futuras esperadas por realizar a melhor a\u00e7\u00e3o em um estado espec\u00edfico.<\/p>\n\n\n\n<p>O Q-learning \u00e9 aplicado em diversas \u00e1reas, como em sistemas de recomenda\u00e7\u00e3o (como os utilizados pela Netflix ou Spotify), em ve\u00edculos aut\u00f3nomos (como drones ou rob\u00f4s) e na otimiza\u00e7\u00e3o de recursos. Exploraremos agora como esta tecnologia pode ser aplicada na neurorreabilita\u00e7\u00e3o.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Q-learning e NeuronUP<\/h2>\n\n\n\n<p>Uma das vantagens da <strong>NeuronUP <\/strong>\u00e9 a possibilidade de customizar atividades de acordo com as necessidades espec\u00edficas de cada usu\u00e1rio. No entanto, personalizar cada atividade pode ser entediante devido ao grande n\u00famero de par\u00e2metros a serem ajustados.<\/p>\n\n\n\n<p>O Q-learning permite automatizar este processo, ajustando os par\u00e2metros com base no desempenho do usu\u00e1rio nas diferentes atividades. Isto garante que os exerc\u00edcios sejam desafiadores, mas alcan\u00e7\u00e1veis, melhorando a efic\u00e1cia e a motiva\u00e7\u00e3o durante a reabilita\u00e7\u00e3o.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Como funciona?<\/h3>\n\n\n\n<p>Neste contexto, o agente, que poderia ser comparado a um usu\u00e1rio interagindo com uma atividade, aprende a tomar decis\u00f5es \u00f3timas em diferentes situa\u00e7\u00f5es para superar corretamente a atividade.<\/p>\n\n\n\n<p>O Q-learning permite que o agente experimente diversas a\u00e7\u00f5es interagindo com seu ambiente, recebendo recompensas ou penalidades e atualizando uma tabela Q que armazena esses valores Q. Esses valores representam as recompensas futuras esperadas por realizar a melhor a\u00e7\u00e3o em um determinado estado. <\/p>\n\n\n\n<p>A regra de atualiza\u00e7\u00e3o do Q-learning \u00e9 a seguinte:<\/p>\n\n\n\n<p class=\"has-text-align-center\"><img decoding=\"async\" src=\"https:\/\/lh7-qw.googleusercontent.com\/docsz\/AD_4nXeWyQbN-jIFOkty23Yzwg5leCQpJmF6OYGp0olrV_7l2pQF7D9E_wrhXYyfggkHyH2-l87KmpPi7nkyB55QBrUdScmsl4c7jC2Yw4aVer4YSzIL8pojFgpIzrFxsTREjDoFjJUhpXrSzOxI19cKu4056Bc?key=G7hgX90qImBR1nHgSgs_dw\" alt=\"Q-learning\" width=\"602\" height=\"69\"><\/p>\n\n\n\n<p>Onde:<\/p>\n\n\n\n<p>\ud835\udec2 &#8211; \u00e9 a taxa de aprendizagem.<\/p>\n\n\n\n<p><strong>r<\/strong> &#8211; \u00e9 a recompensa recebida ap\u00f3s a a\u00e7\u00e3o<strong> a <\/strong>do estado <strong>s<\/strong>.<\/p>\n\n\n\n<p>\ud835\udec4 &#8211; \u00e9 o fator de desconto, que representa a import\u00e2ncia das recompensas futuras.<\/p>\n\n\n\n<p><strong>s\u2019<\/strong> &#8211; \u00e9 o pr\u00f3ximo estado.<\/p>\n\n\n\n<p><img decoding=\"async\" width=\"85\" height=\"20\" src=\"https:\/\/lh7-qw.googleusercontent.com\/docsz\/AD_4nXeyWWj4HQ2aEQj7Kubdu5ampxVkBdzyJ074N8p8_zKdPZOjtBJPZo6brGz7dWJ4MuuN0-rlDZdCm6e2rYXC2VMgih-ICWVQRXLdACp6xkG6o5vYzaOHBfezJEqbw3kzEZ-nu54zk4JzFAFxdFaMziJy67VM?key=G7hgX90qImBR1nHgSgs_dw\">&#8211; \u00e9 o valor m\u00e1ximo de Q para os pr\u00f3ximos estados <strong>s<\/strong>&#8216;.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Exemplo de aplica\u00e7\u00e3o em uma atividade NeuronUP<\/h3>\n\n\n\n<p>Vejamos a atividade da NeuronUP chamada \u201cImagens Embaralhadas\u201d, que trabalha habilidades como planejamento, pr\u00e1xis visual-construtiva e relacionamento espacial. Nesta atividade o objetivo \u00e9 resolver um quebra-cabe\u00e7a que foi misturado e cortado em peda\u00e7os.<\/p>\n\n\n<div class=\"wp-block-image image-interface\">\n<figure class=\"aligncenter size-full\"><img decoding=\"async\" width=\"1024\" height=\"576\" src=\"https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/12\/Imagenes-revueltas-BR-1024x576-1.webp\" alt=\"Quebra-cabe\u00e7a interativo revela uma cena de banheiro ao ser montado, com espelho, arm\u00e1rio, toalhas, pessoa sem camisa e itens coloridos.\" class=\"wp-image-33548\" style=\"object-fit:cover\" srcset=\"https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/12\/Imagenes-revueltas-BR-1024x576-1-300x169.webp 300w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/12\/Imagenes-revueltas-BR-1024x576-1-768x432.webp 768w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/12\/Imagenes-revueltas-BR-1024x576-1.webp 1024w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><figcaption class=\"wp-element-caption\">Atividade NeuronUP &#8220;Imagens confusas&#8221;. NeuronUP.<\/figcaption><\/figure>\n<\/div>\n\n\n<p>As vari\u00e1veis \u200b\u200bque definem a dificuldade desta atividade s\u00e3o o tamanho da matriz (o n\u00famero de linhas e colunas) bem como o valor da desordem das pe\u00e7as (baixa, m\u00e9dia, alta ou muito alta).<\/p>\n\n\n\n<p>Para entrenar al agente a resolver el rompecabezas, se cre\u00f3 una <strong>matriz de recompensas<\/strong> basada en el n\u00famero m\u00ednimo de movimientos necesarios para resolverlo, definido por la siguiente f\u00f3rmula:<\/p>\n\n\n\n<p class=\"has-text-align-center\"><img decoding=\"async\" src=\"https:\/\/lh7-qw.googleusercontent.com\/docsz\/AD_4nXcIyGhuGW2xUXjGQvyER36pZdnp0yNidQfbCYxCHIAQXIWFppziQRjHtuksAcqnnVjjCZPKwieNQ0LfAy_hanjJTc7abjhuphWuWJXUDm4p6-yoMnaiidpeqZWKtDWVW5GNcHvs51PSaOUhoMZxYn-0emhT?key=G7hgX90qImBR1nHgSgs_dw\" alt=\"Q-learning\" width=\"602\" height=\"75\"><\/p>\n\n\n\n<p>A vari\u00e1vel do fator depende da vari\u00e1vel do dist\u00farbio. Uma vez criada a matriz, um algoritmo Q-learning foi aplicado para treinar o agente para resolver o quebra-cabe\u00e7a automaticamente.<\/p>\n\n\n\n<p>Essa integra\u00e7\u00e3o inclui:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Recupera\u00e7\u00e3o do valor Q:<\/strong> A fun\u00e7\u00e3o recupera o valor Q para um par estado-a\u00e7\u00e3o da tabela Q. Se o par estado-a\u00e7\u00e3o n\u00e3o tiver sido treinado antes, ela retorna 0. Esta fun\u00e7\u00e3o procura a recompensa esperada por realizar uma a\u00e7\u00e3o espec\u00edfica em um estado espec\u00edfico.<\/li>\n\n\n\n<li><strong>Atualiza\u00e7\u00e3o do valor Q:<\/strong> A fun\u00e7\u00e3o atualiza o valor Q para um par estado-a\u00e7\u00e3o com base na recompensa recebida e no valor m\u00e1ximo Q do pr\u00f3ximo estado. Esta fun\u00e7\u00e3o implementa a regra de atualiza\u00e7\u00e3o do Q-learning mencionada acima.<\/li>\n\n\n\n<li><strong>Decis\u00e3o sobre a ac\u00e7\u00e3o a tomar:<\/strong> A fun\u00e7\u00e3o decide qual a\u00e7\u00e3o tomar em um determinado estado, usando uma estrat\u00e9gia <strong>epilson-greedy<\/strong>. Esta estrat\u00e9gia equilibra explora\u00e7\u00e3o e aproveitamento:\n<ul class=\"wp-block-list\">\n<li><strong>Explora\u00e7\u00e3o: <\/strong>Consiste em selecionar a melhor a\u00e7\u00e3o conhecida at\u00e9 o momento. Com uma probabilidade \u03b5 (taxa de explora\u00e7\u00e3o, valor entre 0 e 1 que determina a probabilidade de explorar novas a\u00e7\u00f5es em vez de explorar a\u00e7\u00f5es conhecidas), uma a\u00e7\u00e3o aleat\u00f3ria \u00e9 escolhida, permitindo ao agente descobrir a\u00e7\u00f5es potencialmente melhores.&nbsp;<\/li>\n\n\n\n<li><strong>Aproveitamento:<\/strong> Consiste em testar outras a\u00e7\u00f5es al\u00e9m das mais conhecidas para descobrir se elas podem oferecer melhores recompensas no futuro. Com probabilidade 1\u2212\u03b5, o agente seleciona a a\u00e7\u00e3o com o maior valor de Q para o estado atual, utilizando seu conhecimento aprendido: a&#8217; = argmaxaQ(s,a). Onde a&#8217; \u00e9 a a\u00e7\u00e3o que maximiza a fun\u00e7\u00e3o Q em um determinado estado s. Isso significa que, dado um estado s, selecione a a\u00e7\u00e3o a que possui o maior valor de Q.<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n\n\n\n<p>Essas fun\u00e7\u00f5es trabalham juntas para permitir que o algoritmo Q-learning desenvolva uma estrat\u00e9gia ideal para resolver o quebra-cabe\u00e7a.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">An\u00e1lise preliminar da execu\u00e7\u00e3o do algoritmo<\/h3>\n\n\n\n<p>O algoritmo foi aplicado a um quebra-cabe\u00e7a matricial 2&#215;3 com fator de dificuldade 1 (baixo), correspondendo a um n\u00famero m\u00ednimo de tentativas igual a 2. O algoritmo foi executado no mesmo quebra-cabe\u00e7a 20 vezes, aplicando as mesmas configura\u00e7\u00f5es de embaralhamento em cada vez e atualizando a tabela Q ap\u00f3s cada etapa. Ap\u00f3s 20 execu\u00e7\u00f5es, o quebra-cabe\u00e7a foi embaralhado em uma configura\u00e7\u00e3o diferente e o processo foi repetido, resultando em um total de 2.000 itera\u00e7\u00f5es. Os valores iniciais dos par\u00e2metros foram:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Recompensa por resolver o quebra-cabe\u00e7as: 100 pontos&nbsp;<\/li>\n\n\n\n<li>Pena por cada movimento: -1 ponto<\/li>\n<\/ul>\n\n\n\n<p>A cada etapa, uma recompensa ou penalidade adicional era aplicada com base na quantidade correta de pe\u00e7as, permitindo ao agente entender seu progresso na resolu\u00e7\u00e3o do quebra-cabe\u00e7a. Isso foi calculado usando a f\u00f3rmula:<\/p>\n\n\n\n<p class=\"has-text-align-center\"><img decoding=\"async\" src=\"https:\/\/lh7-qw.googleusercontent.com\/docsz\/AD_4nXfNFidyTVuDD3nqjHTrip8yikASBtCfaK3gdhNnC_3wi7_szgWVumF7_---zCp9HJYYIczPHnEjs5fVsOT3i8o7UzSQ-S-hYRbXX9e1n-UTNANeo6noB9Hf2sawA6yQ3vJrcy4m-s12Cwvev_euV6KLJiI?key=G7hgX90qImBR1nHgSgs_dw\" alt=\"Q-learning\" width=\"303\" height=\"63\"><\/p>\n\n\n\n<p>Onde:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>W \u00e9 o fator de peso.<\/li>\n\n\n\n<li><img decoding=\"async\" alt=\"Q-learning\" width=\"97\" height=\"45\" src=\"https:\/\/lh7-qw.googleusercontent.com\/docsz\/AD_4nXc8eu1rfka4zeQnshmTlyFMas4UKs-VzJdD0CKzDemnvpXHkSddQunADAqxY0Veg3UHBbdnrx78PCd3d4ZlqSBVPs1PUBI2xYqiLsdsJLQZMzRXXserSeE6mqHoH981pwex2vrLUt5Dwtn-OWmFT7tvy_M?key=G7hgX90qImBR1nHgSgs_dw\"> \u00e9 o n\u00famero de pe\u00e7as corretas ap\u00f3s a jogada.<\/li>\n\n\n\n<li><img decoding=\"async\" alt=\"Q-learning\" width=\"96\" height=\"44\" src=\"https:\/\/lh7-qw.googleusercontent.com\/docsz\/AD_4nXcANOrZae0I8r4qLbu7UUohKDaMkVaLrL-qYsuTbHHdT7z96P_FFHK2AwmA59qzntUTt6qIy7e1in65JpolRI7r5nB8HF-nityGCO4GkG79Nxh8I9OkQZl_j-bNrEbVd0u0zbdD3qo4hNEKYm972YDvraef?key=G7hgX90qImBR1nHgSgs_dw\">\u00e9 o n\u00famero de pe\u00e7as corretas antes da jogada.<\/li>\n<\/ul>\n\n\n\n<p>O gr\u00e1fico abaixo ilustra o n\u00famero de movimentos necess\u00e1rios por itera\u00e7\u00e3o para o modelo resolver um quebra-cabe\u00e7a de tamanho 2&#215;3. Inicialmente, o modelo exige um grande n\u00famero de movimentos, refletindo sua falta de conhecimento sobre como resolver o quebra-cabe\u00e7a de forma eficiente. Por\u00e9m, \u00e0 medida que o algoritmo Q-learning \u00e9 treinado, observa-se uma tend\u00eancia de queda no n\u00famero de movimentos, sugerindo que o modelo est\u00e1 aprendendo a otimizar seu processo de resolu\u00e7\u00e3o.<\/p>\n\n\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter size-large\"><img decoding=\"async\" width=\"1024\" height=\"512\" src=\"https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/12\/neuronup-labs-rendimiento-q-learning-BR-1024x512.webp\" alt=\"Gr\u00e1fico de desempenho de Q-learning com 3 linhas: verde (movimentos totais), azul (m\u00e9dia por 20 itera\u00e7\u00f5es) e laranja (m\u00e1ximo por 20 itera\u00e7\u00f5es). Eixos: itera\u00e7\u00f5es e movimentos.\" class=\"wp-image-33708\" style=\"object-fit:cover\" srcset=\"https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/12\/neuronup-labs-rendimiento-q-learning-BR-300x150.webp 300w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/12\/neuronup-labs-rendimiento-q-learning-BR-768x384.webp 768w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/12\/neuronup-labs-rendimiento-q-learning-BR-1024x512.webp 1024w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/12\/neuronup-labs-rendimiento-q-learning-BR.webp 1200w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><figcaption class=\"wp-element-caption\">Desempenho de Q-learning. NeuronUP.<\/figcaption><\/figure>\n<\/div>\n\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter size-full\"><img decoding=\"async\" width=\"480\" height=\"480\" src=\"https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/11\/gif-animation.gif\" alt=\"Gif animado ilustrando conceitos de Q-learning e aprendizado por refor\u00e7o, com \u00edcones e gr\u00e1ficos que sugerem evolu\u00e7\u00e3o dos m\u00e9todos.\" class=\"wp-image-34259\"\/><\/figure>\n<\/div>\n\n\n<p>Esta tend\u00eancia \u00e9 uma indica\u00e7\u00e3o positiva do potencial do algoritmo para melhorar ao longo do tempo. No entanto, v\u00e1rias limita\u00e7\u00f5es importantes devem ser consideradas:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Tamanho espec\u00edfico do quebra-cabe\u00e7a: <\/strong>O algoritmo demonstra efic\u00e1cia principalmente em quebra-cabe\u00e7as com tamanho espec\u00edfico, como uma matriz 2&#215;3. Ao alterar o tamanho ou a complexidade do quebra-cabe\u00e7a, o desempenho do algoritmo pode diminuir significativamente.<\/li>\n\n\n\n<li><strong>Tempo de c\u00e1lculo<\/strong>: Quando o algoritmo \u00e9 aplicado a configura\u00e7\u00f5es diferentes ou mais complexas, o tempo necess\u00e1rio para realizar os c\u00e1lculos e resolver o quebra-cabe\u00e7a aumenta consideravelmente. Isso limita sua aplicabilidade em situa\u00e7\u00f5es que exigem respostas r\u00e1pidas ou em quebra-cabe\u00e7as de maior complexidade.<\/li>\n\n\n\n<li><strong>N\u00famero de movimentos ainda elevado:<\/strong> Apesar da melhoria observada, o n\u00famero de movimentos necess\u00e1rios para resolver o quebra-cabe\u00e7a permanece relativamente alto, mesmo ap\u00f3s m\u00faltiplas itera\u00e7\u00f5es. Nas \u00faltimas execu\u00e7\u00f5es, o modelo requer em m\u00e9dia 8 a 10 movimentos, indicando que ainda h\u00e1 espa\u00e7o para melhorar a efici\u00eancia do aprendizado.<\/li>\n<\/ul>\n\n\n\n<p>Estas limitaciones subrayan la necesidad de un refinamiento adicional del algoritmo, ya sea ajustando los par\u00e1metros de aprendizaje, mejorando la estructura del modelo o incorporando t\u00e9cnicas complementarias que permitan un aprendizaje m\u00e1s eficiente y adaptable a diferentes configuraciones de puzzles. A pesar de estas limitaciones, no debemos olvidarnos de las ventajas que ofrece el Q-learning en la neurorrehabilitaci\u00f3n, entre ellas:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Personaliza\u00e7\u00e3o din\u00e2mica de atividades<\/strong>: O Q-learning \u00e9 capaz de ajustar automaticamente os par\u00e2metros das atividades terap\u00eauticas com base no desempenho individual do usu\u00e1rio. Isto significa que as atividades podem ser personalizadas em tempo real, garantindo que cada usu\u00e1rio trabalhe em um n\u00edvel desafiador, mas alcan\u00e7\u00e1vel. Isto \u00e9 especialmente \u00fatil na neurorreabilita\u00e7\u00e3o, onde as capacidades dos utilizadores podem variar consideravelmente e mudar ao longo do tempo.<\/li>\n\n\n\n<li><strong>Um aumento na motiva\u00e7\u00e3o e comprometimento:<\/strong> Como as atividades s\u00e3o constantemente adaptadas ao n\u00edvel de habilidade do usu\u00e1rio, evita-se a frustra\u00e7\u00e3o com tarefas muito dif\u00edceis ou o t\u00e9dio com tarefas muito simples. Isto pode aumentar significativamente a motiva\u00e7\u00e3o e o compromisso do utilizador com o programa de reabilita\u00e7\u00e3o, o que \u00e9 crucial para alcan\u00e7ar resultados bem sucedidos.<\/li>\n\n\n\n<li><strong>Otimizando o processo de aprendizagem<\/strong>: Ao utilizar o Q-learning, o sistema pode aprender com as intera\u00e7\u00f5es anteriores do usu\u00e1rio com as atividades, otimizando o processo de aprendizagem e reabilita\u00e7\u00e3o. Isso permite que os exerc\u00edcios sejam mais eficazes, focando nas \u00e1reas onde o usu\u00e1rio necessita de mais aten\u00e7\u00e3o e reduzindo o tempo necess\u00e1rio para atingir os objetivos terap\u00eauticos.<\/li>\n\n\n\n<li><strong>Efici\u00eancia na tomada de decis\u00e3o cl\u00ednica:<\/strong> Os profissionais podem se beneficiar do Q-learning obtendo recomenda\u00e7\u00f5es baseadas em dados sobre como ajustar as terapias. Isso facilita a tomada de decis\u00f5es cl\u00ednicas mais informadas e precisas, o que por sua vez melhora a qualidade dos cuidados prestados ao utente.<\/li>\n\n\n\n<li><strong>Melhoria cont\u00ednua: <\/strong>Com o tempo, o sistema baseado em Q-learning pode melhorar seu desempenho atrav\u00e9s do ac\u00famulo de dados e da experi\u00eancia do usu\u00e1rio. Isto significa que quanto mais o sistema \u00e9 utilizado, mais eficaz se torna na personaliza\u00e7\u00e3o e otimiza\u00e7\u00e3o dos exerc\u00edcios, oferecendo assim uma vantagem a longo prazo no processo de neurorreabilita\u00e7\u00e3o.<\/li>\n<\/ul>\n\n\n\n<p>Concluindo, o Q-learning evoluiu desde suas ra\u00edzes na psicologia comportamental e se tornou uma ferramenta poderosa em intelig\u00eancia artificial e neurorreabilita\u00e7\u00e3o. A sua capacidade de adaptar atividades de forma aut\u00f3noma torna-o um recurso valioso para melhorar a efic\u00e1cia das terapias de reabilita\u00e7\u00e3o, embora ainda existam desafios a superar para otimizar plenamente a sua aplica\u00e7\u00e3o.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Bibliograf\u00eda<\/h2>\n\n\n\n<ul class=\"wp-block-list has-sm-font-size\">\n<li style=\"font-size:13px\">Bermejo Fern\u00e1ndez, E. (2017). Aplicaci\u00f3n de algoritmos de reinforcement learning a juegos.<\/li>\n\n\n\n<li style=\"font-size:13px\">Gir\u00f3 Gr\u00e0cia, X., &amp; Sancho Gil, J. M. (2022). La Inteligencia Artificial en la educaci\u00f3n: Big data, cajas negras y solucionismo tecnol\u00f3gico.<\/li>\n\n\n\n<li style=\"font-size:13px\">Meyn, S. (2023). Stability of Q-learning through design and optimism. arXiv preprint arXiv:2307.02632.<\/li>\n\n\n\n<li style=\"font-size:13px\">Morinigo, C., &amp; Fenner, I. (2021). Teor\u00edas del aprendizaje. Minerva Magazine of Science, 9(2), 1-36.<\/li>\n\n\n\n<li style=\"font-size:13px\">M.-V. Aponte, G. Levieux y S. Natkin. (2009). Measuring the level of difficulty in single player video games. Entertainment Computing.<\/li>\n\n\n\n<li style=\"font-size:13px\">P. Jan L., H. Bruce D., P. Shashank, B. Corinne J., &amp; M. Andrew P. (2019). The Effect of Adaptive Difficulty Adjustment on the Effectiveness of a Game to Develop Executive Function Skills for Learners of Different Ages. Cognitive Development, pp. 49, 56\u201367.<\/li>\n\n\n\n<li style=\"font-size:13px\">R. Anna N., Z. Matei &amp; G. Thomas L. Optimally Designing Games for Cognitive Science Research. Computer Science Division and Department of Psychology, University of California, Berkeley.<\/li>\n\n\n\n<li style=\"font-size:13px\">Toledo S\u00e1nchez, M. (2024). Aplicaciones del aprendizaje por refuerzo en videojuegos. <\/li>\n<\/ul>\n\n\n\n<h3 class=\"wp-block-heading\">Se voc\u00ea gostou deste artigo sobre Q-learning, <strong>provavelmente se interessar\u00e1 por estes artigos da NeuronUP:<\/strong><\/h3>\n\n\n<div class=\"mai-grid entries entries-grid has-boxed has-image-full\" style=\"--entry-title-font-size:var(--font-size-lg);--align-text:start;--entry-meta-text-align:start;\"><div class=\"entries-wrap has-columns\" style=\"--columns-xs:1\/1;--columns-sm:1\/1;--columns-md:1\/3;--columns-lg:1\/3;--flex-xs:0 0 var(--flex-basis);--flex-sm:0 0 var(--flex-basis);--flex-md:0 0 var(--flex-basis);--flex-lg:0 0 var(--flex-basis);--column-gap:var(--spacing-lg);--row-gap:var(--spacing-lg);--align-columns:start;\"><article class=\"entry entry-grid is-column has-entry-link has-image has-image-first type-post category-novidades-neuronup tag-neuronup2go\" style=\"--entry-index:1;\" aria-label=\"Por que utilizar o NeuronUP2GO?\" itemscope itemtype=\"https:\/\/schema.org\/CreativeWork\"><a class=\"entry-image-link\" href=\"https:\/\/neuronup.com\/br\/novidades-neuronup\/por-que-utilizar-neuronup2go\/\" tabindex=\"-1\" aria-hidden=\"true\"><img decoding=\"async\" width=\"400\" height=\"267\" src=\"https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/12\/neuronup2go-article.webp\" class=\"entry-image size-landscape-sm\" alt=\"Pessoa usando notebook em mesa de madeira, planta ao fundo, tela exibe NeuronUP 2GO, ambiente com parede de tijolos.\" srcset=\"https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/12\/neuronup2go-article-300x200.webp 300w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/12\/neuronup2go-article-768x512.webp 768w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/12\/neuronup2go-article-1024x683.webp 1024w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/12\/neuronup2go-article.webp 1200w\" sizes=\"(max-width:599px) 599px, (min-width:600px) and (max-width: 799px) 799px, (min-width:800px) and (max-width: 999px) 333px, (min-width:1000px) 400px\" \/><\/a><div class=\"entry-wrap entry-wrap-grid\"><h3 class=\"entry-title\" itemprop=\"headline\"><a class=\"entry-title-link\" href=\"https:\/\/neuronup.com\/br\/novidades-neuronup\/por-que-utilizar-neuronup2go\/\" rel=\"bookmark\">Por que utilizar o NeuronUP2GO?<\/a><\/h3>\n<\/div><\/article><article class=\"entry entry-grid is-column has-entry-link has-image has-image-first type-post category-novidades-neuronup tag-personalizacao tag-valor-ecologico\" style=\"--entry-index:2;\" aria-label=\"O que \u00e9 o valor ecol\u00f3gico do NeuronUP?\" itemscope itemtype=\"https:\/\/schema.org\/CreativeWork\"><a class=\"entry-image-link\" href=\"https:\/\/neuronup.com\/br\/novidades-neuronup\/qual-e-o-valor-ecologico-do-neuronup\/\" tabindex=\"-1\" aria-hidden=\"true\"><img decoding=\"async\" width=\"400\" height=\"267\" src=\"https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/12\/freepik__upload__67275.webp\" class=\"entry-image size-landscape-sm\" alt=\"Idoso sorridente preparando salada em cozinha moderna, veste camisa clara e \u00f3culos, com tigela e bancada de m\u00e1rmore.\" srcset=\"https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/12\/freepik__upload__67275-300x200.webp 300w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/12\/freepik__upload__67275-768x512.webp 768w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/12\/freepik__upload__67275-1024x682.webp 1024w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/12\/freepik__upload__67275-1536x1024.webp 1536w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/12\/freepik__upload__67275.webp 2000w\" sizes=\"(max-width:599px) 599px, (min-width:600px) and (max-width: 799px) 799px, (min-width:800px) and (max-width: 999px) 333px, (min-width:1000px) 400px\" \/><\/a><div class=\"entry-wrap entry-wrap-grid\"><h3 class=\"entry-title\" itemprop=\"headline\"><a class=\"entry-title-link\" href=\"https:\/\/neuronup.com\/br\/novidades-neuronup\/qual-e-o-valor-ecologico-do-neuronup\/\" rel=\"bookmark\">O que \u00e9 o valor ecol\u00f3gico do NeuronUP?<\/a><\/h3>\n<\/div><\/article><article class=\"entry entry-grid is-column has-entry-link has-image has-image-first type-post category-novidades-neuronup tag-noticias-da-neuronup\" style=\"--entry-index:3;\" aria-label=\"Marco te\u00f3rico por tr\u00e1s do NeuronUP\" itemscope itemtype=\"https:\/\/schema.org\/CreativeWork\"><a class=\"entry-image-link\" href=\"https:\/\/neuronup.com\/br\/novidades-neuronup\/marco-teorico-atras-do-neuronup\/\" tabindex=\"-1\" aria-hidden=\"true\"><img decoding=\"async\" width=\"400\" height=\"267\" src=\"https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/12\/1386.webp\" class=\"entry-image size-landscape-sm\" alt=\"Pessoa digitando em um laptop, com \u00edcones de documentos e verifica\u00e7\u00e3o ao lado; caneta na tela em ambiente moderno.\" srcset=\"https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/12\/1386-300x200.webp 300w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/12\/1386-768x512.webp 768w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/12\/1386-1024x683.webp 1024w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/12\/1386.webp 1200w\" sizes=\"(max-width:599px) 599px, (min-width:600px) and (max-width: 799px) 799px, (min-width:800px) and (max-width: 999px) 333px, (min-width:1000px) 400px\" \/><\/a><div class=\"entry-wrap entry-wrap-grid\"><h3 class=\"entry-title\" itemprop=\"headline\"><a class=\"entry-title-link\" href=\"https:\/\/neuronup.com\/br\/novidades-neuronup\/marco-teorico-atras-do-neuronup\/\" rel=\"bookmark\">Marco te\u00f3rico por tr\u00e1s do NeuronUP<\/a><\/h3>\n<\/div><\/article><article class=\"entry entry-grid is-column has-entry-link has-image has-image-first type-post category-novidades-neuronup tag-noticias-da-neuronup\" style=\"--entry-index:4;\" aria-label=\"Viagem pela neurorreabilita\u00e7\u00e3o: O Calend\u00e1rio do Advento da NeuronUP\" itemscope itemtype=\"https:\/\/schema.org\/CreativeWork\"><a class=\"entry-image-link\" href=\"https:\/\/neuronup.com\/br\/novidades-neuronup\/um-viagem-pela-neurorrehabilitacao-o-calendario-do-advento-do-neuronup\/\" tabindex=\"-1\" aria-hidden=\"true\"><img decoding=\"async\" width=\"400\" height=\"140\" src=\"https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/12\/Captura-de-pantalla-2024-12-01-a-las-10.05.16-scaled-1.webp\" class=\"entry-image size-landscape-sm\" alt=\"An\u00fancio de Advento sobre neurorehabilita\u00e7\u00e3o com neve ao fundo, destacando tend\u00eancias em estimula\u00e7\u00e3o cognitiva e NeuronUP.\" srcset=\"https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/12\/Captura-de-pantalla-2024-12-01-a-las-10.05.16-scaled-1-300x105.webp 300w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/12\/Captura-de-pantalla-2024-12-01-a-las-10.05.16-scaled-1-768x269.webp 768w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/12\/Captura-de-pantalla-2024-12-01-a-las-10.05.16-scaled-1-1024x359.webp 1024w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/12\/Captura-de-pantalla-2024-12-01-a-las-10.05.16-scaled-1-1536x539.webp 1536w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/12\/Captura-de-pantalla-2024-12-01-a-las-10.05.16-scaled-1-2048x718.webp 2048w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/12\/Captura-de-pantalla-2024-12-01-a-las-10.05.16-scaled-1.webp 2560w\" sizes=\"(max-width:599px) 599px, (min-width:600px) and (max-width: 799px) 799px, (min-width:800px) and (max-width: 999px) 333px, (min-width:1000px) 400px\" \/><\/a><div class=\"entry-wrap entry-wrap-grid\"><h3 class=\"entry-title\" itemprop=\"headline\"><a class=\"entry-title-link\" href=\"https:\/\/neuronup.com\/br\/novidades-neuronup\/um-viagem-pela-neurorrehabilitacao-o-calendario-do-advento-do-neuronup\/\" rel=\"bookmark\">Viagem pela neurorreabilita\u00e7\u00e3o: O Calend\u00e1rio do Advento da NeuronUP<\/a><\/h3>\n<\/div><\/article><article class=\"entry entry-grid is-column has-entry-link has-image has-image-first type-post category-novidades-neuronup tag-noticias-da-neuronup\" style=\"--entry-index:5;\" aria-label=\"Conv\u00eanio de est\u00e1gios UNIR Latam e NeuronUP\" itemscope itemtype=\"https:\/\/schema.org\/CreativeWork\"><a class=\"entry-image-link\" href=\"https:\/\/neuronup.com\/br\/novidades-neuronup\/convenio-de-praticas-unir-latam-e-neuronup\/\" tabindex=\"-1\" aria-hidden=\"true\"><img decoding=\"async\" width=\"212\" height=\"300\" src=\"https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/11\/convenio-UNIR-2.webp\" class=\"entry-image size-landscape-sm\" alt=\"Convite da UNIR Latam para rede de parceiros, promovendo colabora\u00e7\u00e3o entre institui\u00e7\u00f5es, com edif\u00edcios e gr\u00e1ficos.\" srcset=\"https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/11\/convenio-UNIR-2-212x300.webp 212w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/11\/convenio-UNIR-2-724x1024.webp 724w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/11\/convenio-UNIR-2-768x1087.webp 768w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/11\/convenio-UNIR-2-1086x1536.webp 1086w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/11\/convenio-UNIR-2.webp 1200w\" sizes=\"(max-width:599px) 599px, (min-width:600px) and (max-width: 799px) 799px, (min-width:800px) and (max-width: 999px) 333px, (min-width:1000px) 400px\" \/><\/a><div class=\"entry-wrap entry-wrap-grid\"><h3 class=\"entry-title\" itemprop=\"headline\"><a class=\"entry-title-link\" href=\"https:\/\/neuronup.com\/br\/novidades-neuronup\/convenio-de-praticas-unir-latam-e-neuronup\/\" rel=\"bookmark\">Conv\u00eanio de est\u00e1gios UNIR Latam e NeuronUP<\/a><\/h3>\n<\/div><\/article><article class=\"entry entry-grid is-column has-entry-link has-image has-image-first type-post category-novidades-neuronup tag-noticias-da-neuronup\" style=\"--entry-index:6;\" aria-label=\"Efeitos psicol\u00f3gicos da DANA e de outras cat\u00e1strofes em pessoas com comprometimento cognitivo\" itemscope itemtype=\"https:\/\/schema.org\/CreativeWork\"><a class=\"entry-image-link\" href=\"https:\/\/neuronup.com\/br\/novidades-neuronup\/efeitos-psicologicos-da-dano-e-outras-catastrofes-em-pessoas-com-afetacao-cognitiva\/\" tabindex=\"-1\" aria-hidden=\"true\"><img decoding=\"async\" width=\"400\" height=\"267\" src=\"https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/11\/Efectos-de-la-DANA-NeuronUP.webp\" class=\"entry-image size-landscape-sm\" alt=\"Pessoa de costas sentada em rua alagada at\u00e9 os joelhos, com mochila, cabelo cacheado, em ambiente urbano com detritos na \u00e1gua.\" srcset=\"https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/11\/Efectos-de-la-DANA-NeuronUP-300x200.webp 300w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/11\/Efectos-de-la-DANA-NeuronUP-768x512.webp 768w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/11\/Efectos-de-la-DANA-NeuronUP-1024x683.webp 1024w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/11\/Efectos-de-la-DANA-NeuronUP.webp 1200w\" sizes=\"(max-width:599px) 599px, (min-width:600px) and (max-width: 799px) 799px, (min-width:800px) and (max-width: 999px) 333px, (min-width:1000px) 400px\" \/><\/a><div class=\"entry-wrap entry-wrap-grid\"><h3 class=\"entry-title\" itemprop=\"headline\"><a class=\"entry-title-link\" href=\"https:\/\/neuronup.com\/br\/novidades-neuronup\/efeitos-psicologicos-da-dano-e-outras-catastrofes-em-pessoas-com-afetacao-cognitiva\/\" rel=\"bookmark\">Efeitos psicol\u00f3gicos da DANA e de outras cat\u00e1strofes em pessoas com comprometimento cognitivo<\/a><\/h3>\n<\/div><\/article><\/div><\/div>","protected":false},"excerpt":{"rendered":"<p>O Q-learning evoluiu consideravelmente desde os primeiros experimentos comportamentais, como o condicionamento cl\u00e1ssico de Pavlov, para se tornar uma das t\u00e9cnicas mais importantes no campo do Machine Learning. A seguir exploraremos como tem sido seu desenvolvimento e sua aplica\u00e7\u00e3o na neurorreabilita\u00e7\u00e3o e estimula\u00e7\u00e3o cognitiva. Experimentos de Pavlov Ivan Pavlov, um fisiologista russo do final do &hellip;<\/p>\n","protected":false},"author":7,"featured_media":33706,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"_genesis_hide_title":false,"_genesis_hide_breadcrumbs":false,"_genesis_hide_singular_image":false,"_genesis_hide_footer_widgets":false,"_genesis_custom_body_class":"","_genesis_custom_post_class":"","_genesis_layout":"","footnotes":""},"categories":[580],"tags":[551,581],"class_list":{"2":"type-post","7":"category-novidades-neuronup","8":"tag-estimulacao-cognitiva","9":"tag-novidades-neuronup","10":"entry"},"acf":[],"_links":{"self":[{"href":"https:\/\/neuronup.com\/br\/wp-json\/wp\/v2\/posts\/7070","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/neuronup.com\/br\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/neuronup.com\/br\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/neuronup.com\/br\/wp-json\/wp\/v2\/users\/7"}],"replies":[{"embeddable":true,"href":"https:\/\/neuronup.com\/br\/wp-json\/wp\/v2\/comments?post=7070"}],"version-history":[{"count":0,"href":"https:\/\/neuronup.com\/br\/wp-json\/wp\/v2\/posts\/7070\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/neuronup.com\/br\/wp-json\/wp\/v2\/media\/33706"}],"wp:attachment":[{"href":"https:\/\/neuronup.com\/br\/wp-json\/wp\/v2\/media?parent=7070"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/neuronup.com\/br\/wp-json\/wp\/v2\/categories?post=7070"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/neuronup.com\/br\/wp-json\/wp\/v2\/tags?post=7070"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}