{"id":32297,"date":"2026-05-04T10:25:13","date_gmt":"2026-05-04T08:25:13","guid":{"rendered":"https:\/\/neuronup.com\/?p=32297"},"modified":"2026-05-04T10:25:13","modified_gmt":"2026-05-04T08:25:13","slug":"q-learning-dos-experimentos-de-pavlov-a-neurorreabilitacao-moderna","status":"publish","type":"post","link":"https:\/\/neuronup.com\/br\/investigacao\/linhas-de-investigacao\/q-learning-dos-experimentos-de-pavlov-a-neurorreabilitacao-moderna\/","title":{"rendered":"Q-learning: Dos experimentos de Pavlov \u00e0 neurorehabilita\u00e7\u00e3o moderna"},"content":{"rendered":"\n<p class=\"has-xl-font-size\"><em>O Q-learning (aprendizado Q em castelhano) evoluiu consideravelmente desde os primeiros experimentos comportamentais como o <\/em><strong><em>condicionamento cl\u00e1ssico de Pavlov,<\/em><\/strong><em> at\u00e9 chegar a se tornar uma das t\u00e9cnicas mais importantes no \u00e2mbito do Machine Learning (aprendizado de m\u00e1quina). A seguir, exploraremos como foi seu desenvolvimento e&nbsp;sua aplica\u00e7\u00e3o na neurorreabilita\u00e7\u00e3o e estimula\u00e7\u00e3o cognitiva.<\/em><\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Os experimentos de Pavlov<\/h2>\n\n\n\n<p>Ivan Pavlov, um fisiologista russo do final do s\u00e9culo XIX, \u00e9 reconhecido por estabelecer as bases da <strong>psicologia <\/strong>comportamental por meio de seus experimentos sobre o <strong>condicionamento cl\u00e1ssico<\/strong>. Nestes experimentos, Pavlov demonstrou que os c\u00e3es podiam aprender a associar um est\u00edmulo neutro, como o som de um sino, a um est\u00edmulo incondicionado, como a comida, provocando assim uma resposta incondicionada: a saliva\u00e7\u00e3o.<\/p>\n\n\n\n<div style=\"height:50px\" aria-hidden=\"true\" class=\"wp-block-spacer\"><\/div>\n\n\n<div class=\"wp-block-image image-interface\">\n<figure class=\"aligncenter size-large is-resized\"><img decoding=\"async\" width=\"1024\" height=\"640\" src=\"https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/08\/neuronup-labs-experimento-pavlov-1024x640.webp\" alt=\"Diagrama do experimento de Pavlov: c\u00e3o, comida e campainha, ilustrando condicionamento cl\u00e1ssico.\" class=\"wp-image-32300\" style=\"width:800px;height:auto\" srcset=\"https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/08\/neuronup-labs-experimento-pavlov-300x188.webp 300w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/08\/neuronup-labs-experimento-pavlov-768x480.webp 768w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/08\/neuronup-labs-experimento-pavlov-1024x640.webp 1024w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/08\/neuronup-labs-experimento-pavlov.webp 1200w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><figcaption class=\"wp-element-caption\">Experimentos de Pavlov. NeuronUP.<\/figcaption><\/figure>\n<\/div>\n\n\n<div style=\"height:50px\" aria-hidden=\"true\" class=\"wp-block-spacer\"><\/div>\n\n\n\n<p>Este experimento foi fundamental para demonstrar que o comportamento pode ser adquirido por associa\u00e7\u00e3o, um conceito crucial que posteriormente influenciou o desenvolvimento das teorias de <strong>aprendizado por refor\u00e7o<\/strong>.&nbsp;<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">As teorias do aprendizado por refor\u00e7o<\/h2>\n\n\n\n<p>Essas teorias se concentram em como os seres humanos e os animais aprendem comportamentos a partir das consequ\u00eancias de suas a\u00e7\u00f5es, o que tem sido essencial para o desenho de algoritmos como o<strong> Q-learning<\/strong>.<\/p>\n\n\n\n<p>H\u00e1 alguns conceitos-chave com os quais devemos nos familiarizar antes de continuar:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Agente: <\/strong>respons\u00e1vel por realizar a a\u00e7\u00e3o.<\/li>\n\n\n\n<li><strong>Ambiente: <\/strong>entorno onde o agente se move e interage.&nbsp;<\/li>\n\n\n\n<li><strong>Estado:<\/strong> situa\u00e7\u00e3o atual do ambiente.&nbsp;<\/li>\n\n\n\n<li><strong>A\u00e7\u00e3o:<\/strong> poss\u00edveis decis\u00f5es tomadas pelo agente.<\/li>\n\n\n\n<li><strong>Recompensa: <\/strong>pr\u00eamios que s\u00e3o concedidos ao agente.<\/li>\n<\/ul>\n\n\n\n<p>Nesse tipo de aprendizado, um agente realiza a\u00e7\u00f5es no ambiente, recebe informa\u00e7\u00e3o na forma de recompensa\/penaliza\u00e7\u00e3o e a utiliza para ajustar seu comportamento ao longo do tempo.<\/p>\n\n\n\n<div style=\"height:50px\" aria-hidden=\"true\" class=\"wp-block-spacer\"><\/div>\n\n\n<div class=\"wp-block-image image-interface\">\n<figure class=\"aligncenter size-large\"><img decoding=\"async\" width=\"1024\" height=\"597\" src=\"https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/08\/neuronup-labs-teoria-aprendizaje-por-refuerzo-1024x597.webp\" alt=\"Diagrama do aprendizado por refor\u00e7o Q-learning para neurorreabilita\u00e7\u00e3o: agente, ambiente, estados, a\u00e7\u00f5es e recompensas.\" class=\"wp-image-32301\" srcset=\"https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/08\/neuronup-labs-teoria-aprendizaje-por-refuerzo-300x175.webp 300w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/08\/neuronup-labs-teoria-aprendizaje-por-refuerzo-768x448.webp 768w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/08\/neuronup-labs-teoria-aprendizaje-por-refuerzo-1024x597.webp 1024w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/08\/neuronup-labs-teoria-aprendizaje-por-refuerzo.webp 1200w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><figcaption class=\"wp-element-caption\">Teoria do aprendizado por refor\u00e7o. NeuronUP.<\/figcaption><\/figure>\n<\/div>\n\n\n<div style=\"height:50px\" aria-hidden=\"true\" class=\"wp-block-spacer\"><\/div>\n\n\n\n<p>Um experimento cl\u00e1ssico do aprendizado por refor\u00e7o \u00e9 o experimento da <strong>caixa de Skinner<\/strong>, realizado pelo psic\u00f3logo norte-americano Burrhus Frederic Skinner no ano de 1938. Nesse experimento, Skinner demonstrou que os ratos podiam aprender a pressionar uma alavanca para obter comida, utilizando o refor\u00e7o positivo como meio para modelar o comportamento.&nbsp;<\/p>\n\n\n\n<p>O experimento consiste em introduzir um rato em uma caixa com uma alavanca que possa pressionar, um dispensador de comida, e, em ocasi\u00f5es, uma luz e um alto-falante.&nbsp;<\/p>\n\n\n\n<p>Cada vez que o rato pressiona a alavanca, \u00e9 liberado um gr\u00e3o de comida no dispensador. A comida atua como um refor\u00e7o positivo, uma recompensa por pressionar a alavanca. Com o tempo, o rato come\u00e7ar\u00e1 a pressionar a alavanca com mais frequ\u00eancia, demonstrando que aprendeu o comportamento por meio do refor\u00e7o.<\/p>\n\n\n\n<div style=\"height:50px\" aria-hidden=\"true\" class=\"wp-block-spacer\"><\/div>\n\n\n<div class=\"wp-block-image image-interface\">\n<figure class=\"aligncenter size-large\"><img decoding=\"async\" width=\"1024\" height=\"512\" src=\"https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/08\/neuronup-labs-caja-de-skinner-1024x512.webp\" alt=\"Ilustra\u00e7\u00e3o de uma caixa de Skinner com alto-falante, luzes, alavanca e comedouro, em ambiente de neurorreabilita\u00e7\u00e3o cognitiva.\" class=\"wp-image-32302\" srcset=\"https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/08\/neuronup-labs-caja-de-skinner-300x150.webp 300w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/08\/neuronup-labs-caja-de-skinner-768x384.webp 768w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/08\/neuronup-labs-caja-de-skinner-1024x512.webp 1024w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/08\/neuronup-labs-caja-de-skinner.webp 1200w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><figcaption class=\"wp-element-caption\">A caixa de Skinner. NeuronUP.<\/figcaption><\/figure>\n<\/div>\n\n\n<div style=\"height:50px\" aria-hidden=\"true\" class=\"wp-block-spacer\"><\/div>\n\n\n\n<p>Esse tipo de aprendizado serviu como base para algoritmos de <strong>machine learning,<\/strong> como o <strong>Q-learning<\/strong>, que permite \u00e0s m\u00e1quinas aprender comportamentos \u00f3timos de maneira aut\u00f4noma mediante o m\u00e9todo de tentativa e erro.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">O que \u00e9 o Q-learning?<\/h2>\n\n\n\n<p>O Q-learning foi introduzido por <strong>Christopher Watkins <\/strong>em 1989 como um algoritmo de aprendizado por refor\u00e7o. Esse algoritmo permite a um agente aprender o valor das a\u00e7\u00f5es em um estado determinado, atualizando continuamente seu conhecimento por meio da experi\u00eancia, assim como o rato da caixa de Skinner.<\/p>\n\n\n\n<p>Ao contr\u00e1rio dos experimentos de Pavlov, nos quais o aprendizado se baseava em associa\u00e7\u00f5es simples, o Q-learning utiliza um m\u00e9todo mais complexo de tentativa e erro. O agente explora diversas a\u00e7\u00f5es e atualiza uma <strong>tabela<\/strong> <strong>Q<\/strong> que armazena os valores Q, os quais representam as recompensas futuras esperadas por tomar a melhor a\u00e7\u00e3o em um estado espec\u00edfico.<\/p>\n\n\n\n<p>O Q-learning \u00e9 aplicado em diversos \u00e2mbitos, como por exemplo em sistemas de recomenda\u00e7\u00e3o (como os utilizados por Netflix ou Spotify), em ve\u00edculos aut\u00f4nomos (como drones ou rob\u00f4s) e na otimiza\u00e7\u00e3o de recursos. Agora exploraremos como essa tecnologia pode ser aplicada na neurorreabilita\u00e7\u00e3o.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Q-learning e NeuronUP<\/h2>\n\n\n\n<p>Uma das vantagens de <strong>NeuronUP, <\/strong>\u00e9 a capacidade de personalizar as atividades segundo as necessidades espec\u00edficas de cada usu\u00e1rio. No entanto, personalizar cada atividade pode ser tedioso devido ao elevado n\u00famero de par\u00e2metros a ajustar.&nbsp;<\/p>\n\n\n\n<p>O Q-learning permite automatizar esse processo, ajustando os par\u00e2metros em fun\u00e7\u00e3o do desempenho do usu\u00e1rio nas diferentes atividades. Isso garante que os exerc\u00edcios sejam exigentes mas alcan\u00e7\u00e1veis, melhorando a efic\u00e1cia e a motiva\u00e7\u00e3o durante a reabilita\u00e7\u00e3o.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Como funciona?<\/h3>\n\n\n\n<p>Nesse contexto, o agente, que poderia ser comparado a um usu\u00e1rio interagindo com uma atividade, aprende a tomar decis\u00f5es \u00f3timas em diferentes situa\u00e7\u00f5es para completar corretamente a atividade.&nbsp;<\/p>\n\n\n\n<p>O Q-learning permite ao agente experimentar com diversas a\u00e7\u00f5es interagindo com seu ambiente, recebendo recompensas ou penaliza\u00e7\u00f5es, e atualizando uma tabela Q que armazena esses valores Q. Esses valores representam as recompensas futuras esperadas por tomar a melhor a\u00e7\u00e3o em um estado espec\u00edfico.&nbsp;<\/p>\n\n\n\n<p>A regra de atualiza\u00e7\u00e3o de Q-learning \u00e9 a seguinte:<\/p>\n\n\n\n[Q(s,a) leftarrow Q(s,a) + alphabigl(r + gamma cdot max_{a&#8217;}bigl(Q(s&#8217;,a&#8217;)bigr) &#8211; Q(s,a)bigr)]\n\n\n\n<p>Onde:<\/p>\n\n\n\n<p>\ud835\udec2 &#8211; \u00e9 a taxa de aprendizado.<\/p>\n\n\n\n<p><strong>r<\/strong> &#8211; \u00e9 a recompensa recebida ap\u00f3s tomar a a\u00e7\u00e3o <strong>a<\/strong> desde o estado <strong>s.<\/strong><\/p>\n\n\n\n<p>\ud835\udec4 &#8211; \u00e9 o fator de desconto, que representa a import\u00e2ncia de las recompensas futuras.<\/p>\n\n\n\n<p><strong>s\u2019<\/strong> &#8211; \u00e9 o estado seguinte.<\/p>\n\n\n\n<p>(max_{a&#8217;}bigl(Q(s&#8217;,a&#8217;)bigr)) &#8211; \u00e9 o valor Q m\u00e1ximo para o estado seguinte <strong>s\u2019<\/strong>.<\/p>\n\n\n\n<div style=\"height:50px\" aria-hidden=\"true\" class=\"wp-block-spacer\"><\/div>\n\n\n\n<div class=\"wp-block-group br-0111 has-primary-background-color has-background has-dark-background has-sm-padding-top has-sm-padding-left has-sm-padding-right has-xxl-margin-top\"><div class=\"wp-block-group__inner-container is-layout-constrained wp-block-group-is-layout-constrained\">\n<div class=\"wp-block-columns is-layout-flex wp-container-core-columns-is-layout-9d6595d7 wp-block-columns-is-layout-flex\">\n<div class=\"wp-block-column is-layout-flow wp-block-column-is-layout-flow\">\n<figure class=\"wp-block-image size-full desktop-position-absolute desktop-bottom-0 mobile-width-50 mobile-m-inline-auto has-xl-margin-top\"><img decoding=\"async\" width=\"292\" height=\"338\" src=\"https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/10\/certificado-de-produto.webp\" alt=\"\" class=\"wp-image-31568\" srcset=\"https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/10\/certificado-de-produto-259x300.webp 259w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/10\/certificado-de-produto.webp 292w\" sizes=\"(max-width: 292px) 100vw, 292px\" \/><\/figure>\n<\/div>\n\n\n\n<div class=\"wp-block-column is-layout-flow wp-block-column-is-layout-flow\">\n<h2 class=\"wp-block-heading has-white-color has-text-color\"><strong>Inscreva-se<\/strong> <br>na nossa <br>Newsletter<\/h2>\n\n\n\n<div class=\"wp-block-buttons is-layout-flex wp-block-buttons-is-layout-flex\">\n<div class=\"wp-block-button--1\" style=\"--button-outline-color:var(--color-white);--button-outline-color-hover:rgba(0,0,0,0.8);\"><a class=\"wp-block-button__link button button-outline   wp-element-button\" href=\"https:\/\/neuronup.com\/br\/newsletter\/\">Inscreva-se<\/a><\/div>\n\n<\/div>\n\n\n\n<div style=\"height:40px\" aria-hidden=\"true\" class=\"wp-block-spacer\"><\/div>\n<\/div>\n<\/div>\n<\/div><\/div>\n\n\n\n\n<div style=\"height:50px\" aria-hidden=\"true\" class=\"wp-block-spacer\"><\/div>\n\n\n\n<h3 class=\"wp-block-heading\">Exemplo de aplica\u00e7\u00e3o em uma atividade de NeuronUP<\/h3>\n\n\n\n<p>Vamos pegar a atividade do NeuronUP chamada &#8220;Imagens misturadas&#8221;, que trabalha habilidades como o planejamento, as praxias visoconstrutivas e a rela\u00e7\u00e3o espacial. Nesta atividade, o objetivo \u00e9 resolver um quebra-cabe\u00e7a que foi misturado e cortado em pe\u00e7as.&nbsp;<\/p>\n\n\n\n<div style=\"height:50px\" aria-hidden=\"true\" class=\"wp-block-spacer\"><\/div>\n\n\n<div class=\"wp-block-image image-interface\">\n<figure class=\"aligncenter size-large is-resized\"><img decoding=\"async\" width=\"1024\" height=\"576\" src=\"https:\/\/neuronup.com\/wp-content\/uploads\/2021\/09\/Actividades-NeuronUP-Imagenes-revueltas-Musicos-1024x576.webp\" alt=\"Colagem musical de reabilita\u00e7\u00e3o cognitiva para crian\u00e7as com TDAH: baixista com \u00f3culos, saxofonista e notas flutuantes.\" class=\"wp-image-45487\" style=\"width:800px;height:auto\" srcset=\"https:\/\/neuronup.com\/br\/wp-content\/uploads\/2021\/09\/Actividades-NeuronUP-Imagenes-revueltas-Musicos-300x169.webp 300w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2021\/09\/Actividades-NeuronUP-Imagenes-revueltas-Musicos-768x432.webp 768w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2021\/09\/Actividades-NeuronUP-Imagenes-revueltas-Musicos-1024x576.webp 1024w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2021\/09\/Actividades-NeuronUP-Imagenes-revueltas-Musicos.webp 1200w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><figcaption class=\"wp-element-caption\">Atividade de NeuronUP &#8220;Imagens misturadas&#8221;. NeuronUP.<\/figcaption><\/figure>\n<\/div>\n<div style=\"height:50px\" aria-hidden=\"true\" class=\"wp-block-spacer\"><\/div>\n\n\n\n<p>As vari\u00e1veis que definem a dificuldade desta atividade s\u00e3o o tamanho da matriz (o n\u00famero de linhas e de colunas) bem como o valor da desordem das pe\u00e7as (baixo, m\u00e9dio, alto ou muito alto).&nbsp;<\/p>\n\n\n\n<p>Para treinar o agente a resolver o quebra-cabe\u00e7a, foi criada uma <strong>matriz de recompensas<\/strong> baseada no n\u00famero m\u00ednimo de movimentos necess\u00e1rios para resolv\u00ea-lo, definido pela seguinte f\u00f3rmula:<\/p>\n\n\n\n[mathrm{Min_Attempts} ;=;leftlceil frac{mathrm{factor} * mathrm{rows} * mathrm{columns}}{5}rightrceil,quad mathrm{factor}in{1,3,5,7}]\n\n\n\n<p>A variable factor depende da vari\u00e1vel de desordem. Uma vez criada a matriz, foi aplicado um algoritmo de Q-learning para treinar o agente a resolver o quebra-cabe\u00e7a automaticamente.&nbsp;<\/p>\n\n\n\n<p>Esta integra\u00e7\u00e3o inclui:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Recuperaci\u00f3n del valor Q:<\/strong> A fun\u00e7\u00e3o recupera o valor Q para um par estado-a\u00e7\u00e3o da tabela Q. Se o par estado-a\u00e7\u00e3o n\u00e3o tiver sido treinado antes, retorna 0. Esta fun\u00e7\u00e3o busca a recompensa esperada ao tomar uma a\u00e7\u00e3o espec\u00edfica em um estado espec\u00edfico.<\/li>\n\n\n\n<li><strong>Actualizaci\u00f3n del valor Q: <\/strong>A fun\u00e7\u00e3o atualiza o valor Q para um par estado-a\u00e7\u00e3o com base na recompensa recebida e no valor Q m\u00e1ximo do pr\u00f3ximo estado. Esta fun\u00e7\u00e3o implementa a regra de atualiza\u00e7\u00e3o de Q-learning mencionada anteriormente.<\/li>\n\n\n\n<li><strong>Decisi\u00f3n sobre la acci\u00f3n a tomar:<\/strong> A fun\u00e7\u00e3o decide qual a\u00e7\u00e3o tomar em um dado estado, usando uma estrat\u00e9gia <strong>epsilon-greedy<\/strong>. Essa estrat\u00e9gia equilibra a explora\u00e7\u00e3o e o aproveitamento:&nbsp;\n<ul class=\"wp-block-list\">\n<li><strong>Exploraci\u00f3n: <\/strong>Consiste em selecionar a melhor a\u00e7\u00e3o conhecida at\u00e9 o momento. Com uma probabilidade \u03b5 (taxa de explora\u00e7\u00e3o, um valor entre 0 e 1 que determina a probabilidade de explorar novas a\u00e7\u00f5es em vez de aproveitar as a\u00e7\u00f5es conhecidas), escolhe-se uma a\u00e7\u00e3o aleat\u00f3ria, permitindo ao agente descobrir a\u00e7\u00f5es potencialmente melhores.&nbsp;<\/li>\n\n\n\n<li><strong>&nbsp;Explotaci\u00f3n:<\/strong> Consiste em testar a\u00e7\u00f5es diferentes das melhores conhecidas para descobrir se podem oferecer melhores recompensas no futuro. Com uma probabilidade 1\u2212\u03b5, o agente seleciona a a\u00e7\u00e3o com o valor Q mais alto para o estado atual, utilizando seu conhecimento aprendido: <em>a&#8217; = argmaxaQ(s,a).<\/em> Onde <strong>a\u2019<\/strong> \u00e9 a a\u00e7\u00e3o que maximiza a fun\u00e7\u00e3o <strong>Q<\/strong> em um estado <strong>s<\/strong> dado. Isso significa que, dado um estado <strong>s<\/strong>, selecione a a\u00e7\u00e3o a que tem o valor <strong>Q<\/strong> mais alto.<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n\n\n\n<p>Essas fun\u00e7\u00f5es trabalham juntas para permitir que o algoritmo de Q-learning desenvolva uma estrat\u00e9gia \u00f3tima para resolver o quebra-cabe\u00e7a.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">An\u00e1lisis preliminar de la ejecuci\u00f3n del algoritmo <\/h3>\n\n\n\n<p>O algoritmo foi aplicado a um quebra-cabe\u00e7a de matriz 2&#215;3 com um fator de dificuldade de&nbsp; 1 (baixo), correspondente a um n\u00famero m\u00ednimo de tentativas igual a 2. O algoritmo foi executado no mesmo quebra-cabe\u00e7a 20 vezes, aplicando a mesma configura\u00e7\u00e3o de embaralhamento em cada ocasi\u00e3o e atualizando a tabela Q depois de cada passo. Ap\u00f3s 20 execu\u00e7\u00f5es, o quebra-cabe\u00e7a foi embaralhado em uma configura\u00e7\u00e3o diferente e o processo se repetiu, resultando em um total de 2000 itera\u00e7\u00f5es. Os valores iniciais dos par\u00e2metros foram:&nbsp;<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Recompensa por resolver o quebra-cabe\u00e7a: 100 pontos&nbsp;<\/li>\n\n\n\n<li>Penalidade por cada movimento: -1 ponto<\/li>\n<\/ul>\n\n\n\n<p>A cada passo, era aplicada uma recompensa ou penalidade adicional baseada no n\u00famero de pe\u00e7as corretas, permitindo ao agente compreender seu progresso em dire\u00e7\u00e3o \u00e0 resolu\u00e7\u00e3o do quebra-cabe\u00e7a. Isso era calculado utilizando a f\u00f3rmula:<\/p>\n\n\n\n[W times bigl(N_{mathrm{correct}}^i ;-; N_{mathrm{correct}}^{,i-1}bigr)]\n\n\n\n<p>Onde:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>W \u00e9 o fator de peso.<\/li>\n\n\n\n<li>(N_{mathrm{correct}}^{,i}) \u00e9 o n\u00famero de pe\u00e7as corretas ap\u00f3s o movimento.<\/li>\n\n\n\n<li>(N_{mathrm{correct}}^{,i-1}) \u00e9 o n\u00famero de pe\u00e7as corretas antes do movimento.<\/li>\n<\/ul>\n\n\n\n<p>O gr\u00e1fico a baixo ilustra o n\u00famero de movimentos necess\u00e1rios por itera\u00e7\u00e3o para que o modelo resolva um quebra-cabe\u00e7a de tamanho 2&#215;3. No in\u00edcio, o modelo requer um grande n\u00famero de movimentos, o que reflete sua falta de conhecimento sobre como resolver o quebra-cabe\u00e7a de maneira eficiente. No entanto, \u00e0 medida que o algoritmo de Q-learning \u00e9 treinado, observa-se uma tend\u00eancia de queda no n\u00famero de movimentos, o que sugere que o modelo est\u00e1 aprendendo a otimizar seu processo de resolu\u00e7\u00e3o.<\/p>\n\n\n\n<div style=\"height:50px\" aria-hidden=\"true\" class=\"wp-block-spacer\"><\/div>\n\n\n<div class=\"wp-block-image image-interface\">\n<figure class=\"aligncenter size-large\"><img decoding=\"async\" width=\"1024\" height=\"512\" src=\"https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/08\/neuronup-labs-rendimiento-q-learning-1024x512.webp\" alt=\"Gr\u00e1fico de desempe\u00f1o do Q-learning em neurorreabilita\u00e7\u00e3o com tr\u00eas linhas (azul, verde e amarela) que mostram movimentos e itera\u00e7\u00f5es.\" class=\"wp-image-32304\" srcset=\"https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/08\/neuronup-labs-rendimiento-q-learning-300x150.webp 300w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/08\/neuronup-labs-rendimiento-q-learning-768x384.webp 768w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/08\/neuronup-labs-rendimiento-q-learning-1024x512.webp 1024w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/08\/neuronup-labs-rendimiento-q-learning.webp 1200w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><figcaption class=\"wp-element-caption\">Desempenho do Q-learning. NeuronUP.<\/figcaption><\/figure>\n<\/div>\n\n\n<div style=\"height:50px\" aria-hidden=\"true\" class=\"wp-block-spacer\"><\/div>\n\n\n\n<p class=\"has-text-align-center\"><img decoding=\"async\" src=\"https:\/\/lh7-qw.googleusercontent.com\/docsz\/AD_4nXcBZ87Nq6EsZMfGfT7bIVHRcL25mCmThP2EVJqioz5Ko31rdgVykRZyTH_Uy_LeWoEB2VWm_H__mXFvnHkcf7Q35gzH5tCNCLOyx0_7qM3aROpnatJx7A0-C9YVQfSPN7tVlWnQHgak_QoY0Jba9QHrHJlN?key=G7hgX90qImBR1nHgSgs_dw\" width=\"396\" height=\"396\"><\/p>\n\n\n\n<div style=\"height:50px\" aria-hidden=\"true\" class=\"wp-block-spacer\"><\/div>\n\n\n\n<p>Essa tend\u00eancia \u00e9 um ind\u00edcio positivo do potencial do algoritmo para melhorar com o tempo. No entanto, v\u00e1rias limita\u00e7\u00f5es importantes devem ser consideradas:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Tamanho espec\u00edfico do quebra-cabe\u00e7a<\/strong>: O algoritmo demonstra efic\u00e1cia principalmente em quebra-cabe\u00e7as com um tamanho espec\u00edfico, como o de matriz 2&#215;3. Ao alterar o tamanho ou a complexidade do quebra-cabe\u00e7a, o desempenho do algoritmo pode diminuir significativamente.<\/li>\n\n\n\n<li><strong>Tempo de c\u00e1lculo<\/strong>: Quando o algoritmo \u00e9 aplicado a configura\u00e7\u00f5es diferentes ou mais complexas, o tempo necess\u00e1rio para realizar os c\u00e1lculos e resolver o quebra-cabe\u00e7a aumenta consideravelmente. Isso limita sua aplicabilidade em situa\u00e7\u00f5es que exigem respostas r\u00e1pidas ou em quebra-cabe\u00e7as com maior complexidade.<\/li>\n\n\n\n<li><strong>N\u00famero de movimentos ainda alto<\/strong>: Apesar da melhoria observada, o n\u00famero de movimentos necess\u00e1rios para resolver o quebra-cabe\u00e7a continua relativamente alto, mesmo ap\u00f3s m\u00faltiplas itera\u00e7\u00f5es. Nas \u00faltimas execu\u00e7\u00f5es, o modelo requer uma m\u00e9dia de 8 a 10 movimentos, o que indica que ainda h\u00e1 margem para melhorar a efici\u00eancia do aprendizado.<\/li>\n<\/ul>\n\n\n\n<p>Essas limita\u00e7\u00f5es ressaltam a necessidade de um refinamento adicional do algoritmo, seja ajustando os par\u00e2metros de aprendizagem, melhorando a estrutura do modelo ou incorporando t\u00e9cnicas complementares que permitam um aprendizado mais eficiente e adapt\u00e1vel a diferentes configura\u00e7\u00f5es de quebra-cabe\u00e7as. Apesar dessas limita\u00e7\u00f5es, n\u00e3o devemos esquecer as vantagens que o Q-learning oferece na neurorreabilita\u00e7\u00e3o, entre elas:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>A personaliza\u00e7\u00e3o din\u00e2mica das atividades<\/strong>: O Q-learning \u00e9 capaz de ajustar automaticamente os par\u00e2metros das atividades terap\u00eauticas com base no desempenho individual do usu\u00e1rio. Isso significa que as atividades podem ser personalizadas em tempo real, garantindo que cada usu\u00e1rio trabalhe em um n\u00edvel que seja desafiador, mas alcan\u00e7\u00e1vel. Isso \u00e9 especialmente \u00fatil na neurorreabilita\u00e7\u00e3o, onde as capacidades dos usu\u00e1rios podem variar consideravelmente e mudar ao longo do tempo.<\/li>\n\n\n\n<li><strong>Um aumento da motiva\u00e7\u00e3o e do engajamento<\/strong>: \u00c0 medida que as atividades se adaptam constantemente ao n\u00edvel de habilidade do usu\u00e1rio, evita-se a frustra\u00e7\u00e3o por tarefas demasiado dif\u00edceis ou o t\u00e9dio por tarefas demasiado simples. Isso pode aumentar significativamente a motiva\u00e7\u00e3o do usu\u00e1rio e seu engajamento com o programa de reabilita\u00e7\u00e3o, o que \u00e9 crucial para alcan\u00e7ar resultados bem-sucedidos.<\/li>\n\n\n\n<li><strong>A otimiza\u00e7\u00e3o do processo de aprendizagem<\/strong>: Ao utilizar Q-learning, o sistema pode aprender com as intera\u00e7\u00f5es anteriores do usu\u00e1rio com as atividades, otimizando o processo de aprendizagem e reabilita\u00e7\u00e3o. Isso permite que os exerc\u00edcios sejam mais eficazes, concentrando-se nas \u00e1reas em que o usu\u00e1rio precisa de mais aten\u00e7\u00e3o e reduzindo o tempo necess\u00e1rio para alcan\u00e7ar os objetivos terap\u00eauticos.<\/li>\n\n\n\n<li><strong>Efici\u00eancia na tomada de decis\u00f5es cl\u00ednicas<\/strong>: Os profissionais podem se beneficiar do Q-learning ao obter recomenda\u00e7\u00f5es baseadas em dados sobre como ajustar as terapias. Isso facilita a tomada de decis\u00f5es cl\u00ednicas mais informadas e precisas, o que, por sua vez, melhora a qualidade do atendimento fornecido ao usu\u00e1rio.<\/li>\n\n\n\n<li><strong>Melhoria cont\u00ednua<\/strong>: Ao longo do tempo, o sistema baseado em Q-learning pode melhorar seu desempenho por meio do ac\u00famulo de dados e da experi\u00eancia do usu\u00e1rio. Isso significa que, quanto mais o sistema for usado, mais eficaz ele se torna na personaliza\u00e7\u00e3o e otimiza\u00e7\u00e3o dos exerc\u00edcios, oferecendo assim uma vantagem a longo prazo no processo de neurorreabilita\u00e7\u00e3o.<\/li>\n<\/ul>\n\n\n\n<p>Concluindo, o Q-learning evoluiu desde suas ra\u00edzes na psicologia comportamental at\u00e9 se tornar uma ferramenta poderosa na intelig\u00eancia artificial e na neurorreabilita\u00e7\u00e3o. Sua capacidade de adaptar atividades de forma aut\u00f4noma o torna um recurso valioso para melhorar a efic\u00e1cia das terapias de reabilita\u00e7\u00e3o, embora ainda existam desafios a superar para otimizar completamente sua aplica\u00e7\u00e3o.<\/p>\n\n<h2 class=\"wp-block-heading\">Bibliografia<\/h2>\n\n\n\n<ul class=\"wp-block-list\">\n<li class=\"has-sm-font-size\">Bermejo Fern\u00e1ndez, E. (2017). Aplica\u00e7\u00e3o de algoritmos de aprendizado por refor\u00e7o a jogos.<\/li>\n\n\n\n<li class=\"has-sm-font-size\">Gir\u00f3 Gr\u00e0cia, X., &amp; Sancho Gil, J. M. (2022). A Intelig\u00eancia Artificial na educa\u00e7\u00e3o: Big data, caixas-pretas e solucionismo tecnol\u00f3gico.<\/li>\n\n\n\n<li class=\"has-sm-font-size\">Meyn, S. (2023). Estabilidade do Q-learning por meio do design e do otimismo. arXiv preprint arXiv:2307.02632.<\/li>\n\n\n\n<li class=\"has-sm-font-size\">Morinigo, C., &amp; Fenner, I. (2021). Teorias da aprendizagem. Minerva Magazine of Science, 9(2), 1-36.<\/li>\n\n\n\n<li class=\"has-sm-font-size\">M.-V. Aponte, G. Levieux e S. Natkin. (2009). Medindo o n\u00edvel de dificuldade em videogames para jogador \u00fanico. Entertainment Computing.<\/li>\n\n\n\n<li class=\"has-sm-font-size\">P. Jan L., H. Bruce D., P. Shashank, B. Corinne J., &amp; M. Andrew P. (2019). O Efeito do Ajuste de Dificuldade Adaptativa na Efic\u00e1cia de um Jogo para Desenvolver Habilidades de Fun\u00e7\u00e3o Executiva em Aprendizes de Diferentes Idades. Cognitive Development, pp. 49, 56\u201367.<\/li>\n\n\n\n<li class=\"has-sm-font-size\">R. Anna N., Z. Matei &amp; G. Thomas L. Projetando Jogos Otimizados para Pesquisa em Ci\u00eancia Cognitiva. Computer Science Division and Department of Psychology, University of California, Berkeley.<\/li>\n\n\n\n<li class=\"has-sm-font-size\">Toledo S\u00e1nchez, M. (2024). Aplica\u00e7\u00f5es do aprendizado por refor\u00e7o em videogames. <\/li>\n<\/ul>\n\n\n\n<h3 class=\"wp-block-heading\">Se voc\u00ea gostou deste artigo sobre o <strong>Q-learning<\/strong>, provavelmente se interessar\u00e1 por estes artigos da NeuronUP:<\/h3>\n\n\n\n<div class=\"mai-grid entries entries-grid has-boxed has-image-full\" style=\"--entry-title-font-size:var(--font-size-lg);--align-text:start;--entry-meta-text-align:start;\"><div class=\"entries-wrap has-columns\" style=\"--columns-xs:1\/1;--columns-sm:1\/1;--columns-md:1\/3;--columns-lg:1\/3;--flex-xs:0 0 var(--flex-basis);--flex-sm:0 0 var(--flex-basis);--flex-md:0 0 var(--flex-basis);--flex-lg:0 0 var(--flex-basis);--column-gap:var(--spacing-lg);--row-gap:var(--spacing-lg);--align-columns:start;\"><article class=\"entry entry-grid is-column has-entry-link has-image has-image-first type-post category-depoimentos tag-dano-cerebral tag-testemunhos\" style=\"--entry-index:1;\" aria-label=\"Transforma\u00e7\u00e3o digital de terapias neurol\u00f3gicas na UEN gra\u00e7as ao NeuronUP\" itemscope itemtype=\"https:\/\/schema.org\/CreativeWork\"><a class=\"entry-image-link\" href=\"https:\/\/neuronup.com\/br\/noticias-de-estimulacao-cognitiva\/depoimentos\/transformacao-digital-de-terapias-neurologicas-na-uen-gracas-ao-neuronup\/\" tabindex=\"-1\" aria-hidden=\"true\"><img decoding=\"async\" width=\"225\" height=\"300\" src=\"https:\/\/neuronup.com\/br\/wp-content\/uploads\/2025\/07\/Transformacion-digital-de-terapias-neurologicas-en-la-UEN-gracias-a-NeuronUP.webp\" class=\"entry-image size-landscape-sm\" alt=\"Profissional de neuropsicologia da UEN supervisiona a reabilita\u00e7\u00e3o no NeuronUP com um tablet, mostrando exerc\u00edcios na tela.\" srcset=\"https:\/\/neuronup.com\/br\/wp-content\/uploads\/2025\/07\/Transformacion-digital-de-terapias-neurologicas-en-la-UEN-gracias-a-NeuronUP-225x300.webp 225w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2025\/07\/Transformacion-digital-de-terapias-neurologicas-en-la-UEN-gracias-a-NeuronUP-768x1024.webp 768w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2025\/07\/Transformacion-digital-de-terapias-neurologicas-en-la-UEN-gracias-a-NeuronUP-1152x1536.webp 1152w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2025\/07\/Transformacion-digital-de-terapias-neurologicas-en-la-UEN-gracias-a-NeuronUP.webp 1200w\" sizes=\"(max-width:599px) 599px, (min-width:600px) and (max-width: 799px) 799px, (min-width:800px) and (max-width: 999px) 333px, (min-width:1000px) 400px\" \/><\/a><div class=\"entry-wrap entry-wrap-grid\"><h3 class=\"entry-title\" itemprop=\"headline\"><a class=\"entry-title-link\" href=\"https:\/\/neuronup.com\/br\/noticias-de-estimulacao-cognitiva\/depoimentos\/transformacao-digital-de-terapias-neurologicas-na-uen-gracas-ao-neuronup\/\" rel=\"bookmark\">Transforma\u00e7\u00e3o digital de terapias neurol\u00f3gicas na UEN gra\u00e7as ao NeuronUP<\/a><\/h3>\n<\/div><\/article><article class=\"entry entry-grid is-column has-entry-link has-image has-image-first type-post category-noticias-de-estimulacao-cognitiva tag-actividades-de-estimulacion-cognitiva tag-estimulacion-cognitiva tag-ninos tag-testemunhos\" style=\"--entry-index:2;\" aria-label=\"Estimula\u00e7\u00e3o cognitiva para crian\u00e7as no \u00e2mbito cl\u00ednico e acad\u00eamico\" itemscope itemtype=\"https:\/\/schema.org\/CreativeWork\"><a class=\"entry-image-link\" href=\"https:\/\/neuronup.com\/br\/noticias-de-estimulacao-cognitiva\/estimulacao-cognitiva-para-criancas-no-contexto-clinico-e-academico\/\" tabindex=\"-1\" aria-hidden=\"true\"><img decoding=\"async\" width=\"400\" height=\"246\" src=\"https:\/\/neuronup.com\/br\/wp-content\/uploads\/2022\/09\/Actividades-para-ninos.webp\" class=\"entry-image size-landscape-sm\" alt=\"Menino diante de um computador com dois monitores, um com gr\u00e1fico de pizza; ao fundo, Otaduy Centro de Educa\u00e7\u00e3o e Sa\u00fade.\" srcset=\"https:\/\/neuronup.com\/br\/wp-content\/uploads\/2022\/09\/Actividades-para-ninos-300x185.webp 300w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2022\/09\/Actividades-para-ninos-768x473.webp 768w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2022\/09\/Actividades-para-ninos-1024x631.webp 1024w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2022\/09\/Actividades-para-ninos.webp 1205w\" sizes=\"(max-width:599px) 599px, (min-width:600px) and (max-width: 799px) 799px, (min-width:800px) and (max-width: 999px) 333px, (min-width:1000px) 400px\" \/><\/a><div class=\"entry-wrap entry-wrap-grid\"><h3 class=\"entry-title\" itemprop=\"headline\"><a class=\"entry-title-link\" href=\"https:\/\/neuronup.com\/br\/noticias-de-estimulacao-cognitiva\/estimulacao-cognitiva-para-criancas-no-contexto-clinico-e-academico\/\" rel=\"bookmark\">Estimula\u00e7\u00e3o cognitiva para crian\u00e7as no \u00e2mbito cl\u00ednico e acad\u00eamico<\/a><\/h3>\n<\/div><\/article><article class=\"entry entry-grid is-column has-entry-link has-image has-image-first type-post category-transtorno-de-linguagem tag-afasia tag-linguagem\" style=\"--entry-index:3;\" aria-label=\"Cuidados com pessoas com afasia: diretrizes cruciais para cuidadores\" itemscope itemtype=\"https:\/\/schema.org\/CreativeWork\"><a class=\"entry-image-link\" href=\"https:\/\/neuronup.com\/br\/noticias-de-estimulacao-cognitiva\/transtorno-de-linguagem\/cuidando-de-pessoas-com-afasia-orientacoes-fundamentais-para-os-cuidadores\/\" tabindex=\"-1\" aria-hidden=\"true\"><img decoding=\"async\" width=\"400\" height=\"260\" src=\"https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/01\/como-ayudar-a-una-persona-con-afasia-Cuidado-de-Personas-con-Afasia.webp\" class=\"entry-image size-landscape-sm\" alt=\"Homem mais velho e mulher jovem sentados juntos; ele segura um tablet, ela lhe explica; fundo com luz natural e plantas.\" srcset=\"https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/01\/como-ayudar-a-una-persona-con-afasia-Cuidado-de-Personas-con-Afasia-300x195.webp 300w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/01\/como-ayudar-a-una-persona-con-afasia-Cuidado-de-Personas-con-Afasia-768x500.webp 768w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/01\/como-ayudar-a-una-persona-con-afasia-Cuidado-de-Personas-con-Afasia-1024x666.webp 1024w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2024\/01\/como-ayudar-a-una-persona-con-afasia-Cuidado-de-Personas-con-Afasia.webp 1200w\" sizes=\"(max-width:599px) 599px, (min-width:600px) and (max-width: 799px) 799px, (min-width:800px) and (max-width: 999px) 333px, (min-width:1000px) 400px\" \/><\/a><div class=\"entry-wrap entry-wrap-grid\"><h3 class=\"entry-title\" itemprop=\"headline\"><a class=\"entry-title-link\" href=\"https:\/\/neuronup.com\/br\/noticias-de-estimulacao-cognitiva\/transtorno-de-linguagem\/cuidando-de-pessoas-com-afasia-orientacoes-fundamentais-para-os-cuidadores\/\" rel=\"bookmark\">Cuidados com pessoas com afasia: diretrizes cruciais para cuidadores<\/a><\/h3>\n<\/div><\/article><article class=\"entry entry-grid is-column has-entry-link has-image has-image-first type-post category-linhas-de-investigacao tag-dano-cerebral-adquirido tag-estimulacion-cognitiva tag-investigacion\" style=\"--entry-index:4;\" aria-label=\"Fun\u00e7\u00e3o cognitiva em adultos com dano cerebral adquirido: rela\u00e7\u00e3o com a atividade f\u00edsica e o sedentarismo\" itemscope itemtype=\"https:\/\/schema.org\/CreativeWork\"><a class=\"entry-image-link\" href=\"https:\/\/neuronup.com\/br\/investigacao\/linhas-de-investigacao\/funcao-cognitiva-em-adultos-com-dano-cerebral-adquirido-relacao-com-a-atividade-fisica-e-o-sedentarismo\/\" tabindex=\"-1\" aria-hidden=\"true\"><img decoding=\"async\" width=\"400\" height=\"267\" src=\"https:\/\/neuronup.com\/br\/wp-content\/uploads\/2023\/02\/Adultos-con-dano-cerebral-adquirido.webp\" class=\"entry-image size-landscape-sm\" alt=\"Dois idosos em um parque praticando exerc\u00edcios; um homem pula corda enquanto uma mulher o observa, sob c\u00e9u claro.\" srcset=\"https:\/\/neuronup.com\/br\/wp-content\/uploads\/2023\/02\/Adultos-con-dano-cerebral-adquirido-300x200.webp 300w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2023\/02\/Adultos-con-dano-cerebral-adquirido-768x512.webp 768w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2023\/02\/Adultos-con-dano-cerebral-adquirido-1024x683.webp 1024w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2023\/02\/Adultos-con-dano-cerebral-adquirido.webp 1200w\" sizes=\"(max-width:599px) 599px, (min-width:600px) and (max-width: 799px) 799px, (min-width:800px) and (max-width: 999px) 333px, (min-width:1000px) 400px\" \/><\/a><div class=\"entry-wrap entry-wrap-grid\"><h3 class=\"entry-title\" itemprop=\"headline\"><a class=\"entry-title-link\" href=\"https:\/\/neuronup.com\/br\/investigacao\/linhas-de-investigacao\/funcao-cognitiva-em-adultos-com-dano-cerebral-adquirido-relacao-com-a-atividade-fisica-e-o-sedentarismo\/\" rel=\"bookmark\">Fun\u00e7\u00e3o cognitiva em adultos com dano cerebral adquirido: rela\u00e7\u00e3o com a atividade f\u00edsica e o sedentarismo<\/a><\/h3>\n<\/div><\/article><article class=\"entry entry-grid is-column has-entry-link has-image has-image-first type-post category-formacao tag-discapacidad-intelectual tag-ponencia-de-neuronup-academy tag-sindrome-de-down\" style=\"--entry-index:5;\" aria-label=\"Jornada de Defici\u00eancia Intelectual: Avan\u00e7os e Desafios para o Futuro\" itemscope itemtype=\"https:\/\/schema.org\/CreativeWork\"><a class=\"entry-image-link\" href=\"https:\/\/neuronup.com\/br\/formacao\/jornada-de-deficiencia-intelectual-avancos-e-desafios-do-futuro\/\" tabindex=\"-1\" aria-hidden=\"true\"><img decoding=\"async\" width=\"400\" height=\"225\" src=\"https:\/\/neuronup.com\/br\/wp-content\/uploads\/2022\/09\/ponentes-jornada-discapacidad-intelectual.webp\" class=\"entry-image size-landscape-sm\" alt=\"An\u00fancio da jornada Avan\u00e7os e Desafios do Futuro sobre defici\u00eancia intelectual, com data de 4 de outubro, online e palestrantes confirmados.\" srcset=\"https:\/\/neuronup.com\/br\/wp-content\/uploads\/2022\/09\/ponentes-jornada-discapacidad-intelectual-300x169.webp 300w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2022\/09\/ponentes-jornada-discapacidad-intelectual-768x432.webp 768w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2022\/09\/ponentes-jornada-discapacidad-intelectual-1024x576.webp 1024w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2022\/09\/ponentes-jornada-discapacidad-intelectual.webp 1201w\" sizes=\"(max-width:599px) 599px, (min-width:600px) and (max-width: 799px) 799px, (min-width:800px) and (max-width: 999px) 333px, (min-width:1000px) 400px\" \/><\/a><div class=\"entry-wrap entry-wrap-grid\"><h3 class=\"entry-title\" itemprop=\"headline\"><a class=\"entry-title-link\" href=\"https:\/\/neuronup.com\/br\/formacao\/jornada-de-deficiencia-intelectual-avancos-e-desafios-do-futuro\/\" rel=\"bookmark\">Jornada de Defici\u00eancia Intelectual: Avan\u00e7os e Desafios para o Futuro<\/a><\/h3>\n<\/div><\/article><article class=\"entry entry-grid is-column has-entry-link has-image has-image-first type-post category-psicologia tag-rehabilitacion-cognitiva tag-salud-mental\" style=\"--entry-index:6;\" aria-label=\"A sa\u00fade mental dos profissionais de sa\u00fade\" itemscope itemtype=\"https:\/\/schema.org\/CreativeWork\"><a class=\"entry-image-link\" href=\"https:\/\/neuronup.com\/br\/psicologia\/a-saude-mental-dos-trabalhadores-de-saude\/\" tabindex=\"-1\" aria-hidden=\"true\"><img decoding=\"async\" width=\"400\" height=\"267\" src=\"https:\/\/neuronup.com\/br\/wp-content\/uploads\/2022\/04\/Trabajadores-sanitarios-cansados.webp\" class=\"entry-image size-landscape-sm\" alt=\"Dois profissionais de sa\u00fade com m\u00e1scaras e luvas em um hospital; uma pessoa sentada com a cabe\u00e7a entre as m\u00e3os.\" srcset=\"https:\/\/neuronup.com\/br\/wp-content\/uploads\/2022\/04\/Trabajadores-sanitarios-cansados-300x200.webp 300w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2022\/04\/Trabajadores-sanitarios-cansados-768x512.webp 768w, https:\/\/neuronup.com\/br\/wp-content\/uploads\/2022\/04\/Trabajadores-sanitarios-cansados.webp 1000w\" sizes=\"(max-width:599px) 599px, (min-width:600px) and (max-width: 799px) 799px, (min-width:800px) and (max-width: 999px) 333px, (min-width:1000px) 400px\" \/><\/a><div class=\"entry-wrap entry-wrap-grid\"><h3 class=\"entry-title\" itemprop=\"headline\"><a class=\"entry-title-link\" href=\"https:\/\/neuronup.com\/br\/psicologia\/a-saude-mental-dos-trabalhadores-de-saude\/\" rel=\"bookmark\">A sa\u00fade mental dos profissionais de sa\u00fade<\/a><\/h3>\n<\/div><\/article><\/div><\/div>","protected":false},"excerpt":{"rendered":"<p>O Q-learning (aprendizado Q em castelhano) evoluiu consideravelmente desde os primeiros experimentos comportamentais como o condicionamento cl\u00e1ssico de Pavlov, at\u00e9 chegar a se tornar uma das t\u00e9cnicas mais importantes no \u00e2mbito do Machine Learning (aprendizado de m\u00e1quina). A seguir, exploraremos como foi seu desenvolvimento e&nbsp;sua aplica\u00e7\u00e3o na neurorreabilita\u00e7\u00e3o e estimula\u00e7\u00e3o cognitiva. Os experimentos de Pavlov &hellip;<\/p>\n","protected":false},"author":7,"featured_media":32300,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"_genesis_hide_title":false,"_genesis_hide_breadcrumbs":false,"_genesis_hide_singular_image":false,"_genesis_hide_footer_widgets":false,"_genesis_custom_body_class":"","_genesis_custom_post_class":"","_genesis_layout":"","footnotes":""},"categories":[684],"tags":[761,757],"class_list":{"2":"type-post","7":"category-linhas-de-investigacao","8":"tag-estimulacion-cognitiva","9":"tag-noticias-de-neuronup","10":"entry"},"acf":[],"_links":{"self":[{"href":"https:\/\/neuronup.com\/br\/wp-json\/wp\/v2\/posts\/32297","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/neuronup.com\/br\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/neuronup.com\/br\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/neuronup.com\/br\/wp-json\/wp\/v2\/users\/7"}],"replies":[{"embeddable":true,"href":"https:\/\/neuronup.com\/br\/wp-json\/wp\/v2\/comments?post=32297"}],"version-history":[{"count":1,"href":"https:\/\/neuronup.com\/br\/wp-json\/wp\/v2\/posts\/32297\/revisions"}],"predecessor-version":[{"id":49956,"href":"https:\/\/neuronup.com\/br\/wp-json\/wp\/v2\/posts\/32297\/revisions\/49956"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/neuronup.com\/br\/wp-json\/wp\/v2\/media\/32300"}],"wp:attachment":[{"href":"https:\/\/neuronup.com\/br\/wp-json\/wp\/v2\/media?parent=32297"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/neuronup.com\/br\/wp-json\/wp\/v2\/categories?post=32297"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/neuronup.com\/br\/wp-json\/wp\/v2\/tags?post=32297"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}