Otimização_de_Política_Proximal Search Results

Otimização de Política Proximal

Otimização de Política Proximal (em inglês Proximal Policy Optimization (PPO)) é uma família de algoritmos de aprendizado por reforço sem modelo desenvolvido...

1 KB (131 words) - 06:24, 13 May 2023

Aprendizagem não supervisionada

inteligência artificial (IA) que envolve o uso de algoritmos para encontrar padrões ou estruturas em conjuntos de dados não rotulados. Isso significa que, ao...

2 KB (282 words) - 15:02, 8 April 2023

Vazamento de dados (aprendizagem de máquina)

aprendizado de máquina, vazamento (do inglês leakage, também conhecido como vazamento de dados ou vazamento de alvo) é o uso de informações no processo de treinamento...

7 KB (670 words) - 23:42, 17 September 2022

Aprendizagem de características

aprendizado de máquina, a aprendizagem de características ou aprendizagem de representações é um processo que aprende automaticamente a representação de dados...

3 KB (311 words) - 16:41, 9 August 2023

Função softmax (category !CS1 alemão-fontes em língua (de))

função exponencial normalizada, converte um vetor de K números reais em uma distribuição de probabilidade de K resultados possíveis. É uma generalização da...

33 KB (4,902 words) - 22:48, 16 July 2024

Word embedding (category Processamento de linguagem natural)

processamento de linguagem natural (PLN), word embedding é uma representação de uma palavra. A incorporação (embedding) é usada na análise de texto. Tipicamente...

30 KB (3,302 words) - 02:33, 31 August 2024

PyTorch

uma biblioteca de aprendizado de máquina baseada na biblioteca Torch, usada para aplicações como visão computacional e processamento de linguagem natural...

13 KB (1,331 words) - 16:05, 14 June 2024

Aprendizagem supervisionada (section Complexidade da função e quantidade de dados de treinamento)

uma penalidade de regularização na otimização. A penalidade de regularização pode ser vista como a implementação de uma forma de navalha de Occam que prefere...

24 KB (3,317 words) - 17:32, 9 September 2022

Engenharia de características

controle de versão de características e políticas que regem as circunstâncias em que as características podem ser usadas. Os repositórios de características...

16 KB (1,749 words) - 18:52, 5 November 2023

Naive Bayes (category Algoritmos de classificação)

bastante simples de construção de classificadores: modelos que designam labels de classe para instâncias de problema, representados como valores de atributos...

15 KB (1,994 words) - 12:56, 21 August 2023

ChatGPT (category !Artigos que carecem de notas de rodapé sem indicação de tema)

criar "modelos de recompensa" que foram usados para ajustar ainda mais o modelo usando várias iterações de Otimização de Política Proximal. A revista Time...

182 KB (17,937 words) - 16:24, 26 September 2024

Agrupamento hierárquico (section Exemplo de Agrupamento Aglomerativo)

mineração de dados e estatística, o agrupamento hierárquico (também chamado de análise de agrupamento hierárquico ou HCA) é um método de análise de agrupamento...

26 KB (2,897 words) - 10:06, 27 December 2023

Aprendizagem de árvore de decisão

de decisão globalmente ótima. Para reduzir o efeito guloso da otimização local, foram propostos alguns métodos, como a árvore de distâncias duplas de...

44 KB (5,615 words) - 21:52, 25 July 2023

Long short-term memory (category Algoritmos de aprendizado de máquina)

LSTM pode ser treinada de forma supervisionada em um conjunto de sequências de treinamento, usando um algoritmo de otimização como descida do gradiente...

52 KB (6,018 words) - 21:15, 1 January 2024

Aprendizagem de máquina online

_{i=1}^{n}w_{i}} . Essa configuração é um caso especial de otimização estocástica, um problema bem conhecido em otimização. Na prática, pode-se realizar múltiplas passagens...

27 KB (4,904 words) - 07:11, 17 April 2023

Aprendizado por reforço com feedback humano (category !CS1 manut: Nomes múltiplos: lista de autores)

através de um algoritmo de otimização como Proximal Policy Optimization. O modelo de recompensa é treinado antecipadamente para que a política seja otimizada...

13 KB (1,430 words) - 11:29, 18 April 2024

Toracotomia de emergência

capacidade de carreamento de oxigênio pode ser melhorada pela otimização da contratilidade cardíaca, por enchimento adequado e manutenção dos níveis de hemoglobina...

29 KB (3,737 words) - 13:21, 13 May 2024