Otimização de Política Proximal (em inglês Proximal Policy Optimization (PPO)) é uma família de algoritmos de aprendizado por reforço sem modelo desenvolvido...
1 KB (131 words) - 06:24, 13 May 2023
inteligência artificial (IA) que envolve o uso de algoritmos para encontrar padrões ou estruturas em conjuntos de dados não rotulados. Isso significa que, ao...
2 KB (282 words) - 15:02, 8 April 2023
aprendizado de máquina, a aprendizagem de características ou aprendizagem de representações é um processo que aprende automaticamente a representação de dados...
3 KB (311 words) - 16:41, 9 August 2023
aprendizado de máquina, vazamento (do inglês leakage, também conhecido como vazamento de dados ou vazamento de alvo) é o uso de informações no processo de treinamento...
7 KB (670 words) - 23:42, 17 September 2022
Word embedding (category Processamento de linguagem natural)
processamento de linguagem natural (PLN), word embedding é uma representação de uma palavra. A incorporação (embedding) é usada na análise de texto. Tipicamente...
30 KB (3,302 words) - 02:33, 31 August 2024
uma penalidade de regularização na otimização. A penalidade de regularização pode ser vista como a implementação de uma forma de navalha de Occam que prefere...
24 KB (3,317 words) - 17:32, 9 September 2022
Naive Bayes (category Algoritmos de classificação)
simples de redes bayesianas, mas podem, em certas condições, atingir altos níveis de precisão, em especial quando associados a métodos de estimativa de densidade...
15 KB (1,994 words) - 12:56, 21 August 2023
Função softmax (category !CS1 alemão-fontes em língua (de))
função exponencial normalizada, converte um vetor de K números reais em uma distribuição de probabilidade de K resultados possíveis. É uma generalização da...
33 KB (4,902 words) - 22:48, 16 July 2024
uma biblioteca de aprendizado de máquina baseada na biblioteca Torch, usada para aplicações como visão computacional e processamento de linguagem natural...
13 KB (1,331 words) - 16:05, 14 June 2024
ChatGPT (category !Artigos que carecem de notas de rodapé sem indicação de tema)
criar "modelos de recompensa" que foram usados para ajustar ainda mais o modelo usando várias iterações de Otimização de Política Proximal. A revista Time...
182 KB (17,943 words) - 16:00, 28 October 2024
controle de versão de características e políticas que regem as circunstâncias em que as características podem ser usadas. Os repositórios de características...
16 KB (1,749 words) - 18:52, 5 November 2023
mineração de dados e estatística, o agrupamento hierárquico (também chamado de análise de agrupamento hierárquico ou HCA) é um método de análise de agrupamento...
26 KB (2,897 words) - 10:06, 27 December 2023
Long short-term memory (category Algoritmos de aprendizado de máquina)
LSTM pode ser treinada de forma supervisionada em um conjunto de sequências de treinamento, usando um algoritmo de otimização como descida do gradiente...
52 KB (6,018 words) - 21:15, 1 January 2024
de decisão globalmente ótima. Para reduzir o efeito guloso da otimização local, foram propostos alguns métodos, como a árvore de distâncias duplas de...
44 KB (5,615 words) - 21:52, 25 July 2023
_{i=1}^{n}w_{i}} . Essa configuração é um caso especial de otimização estocástica, um problema bem conhecido em otimização. Na prática, pode-se realizar múltiplas passagens...
27 KB (4,904 words) - 07:11, 17 April 2023
Aprendizado por reforço com feedback humano (category !CS1 manut: Nomes múltiplos: lista de autores)
através de um algoritmo de otimização como Proximal Policy Optimization. O modelo de recompensa é treinado antecipadamente para que a política seja otimizada...
13 KB (1,430 words) - 21:43, 30 September 2024
capacidade de carreamento de oxigênio pode ser melhorada pela otimização da contratilidade cardíaca, por enchimento adequado e manutenção dos níveis de hemoglobina...
29 KB (3,737 words) - 13:21, 13 May 2024