• Otimização de Política Proximal (em inglês Proximal Policy Optimization (PPO)) é uma família de algoritmos de aprendizado por reforço sem modelo desenvolvido...
    1 KB (131 words) - 06:24, 13 May 2023
  • inteligência artificial (IA) que envolve o uso de algoritmos para encontrar padrões ou estruturas em conjuntos de dados não rotulados. Isso significa que, ao...
    2 KB (282 words) - 15:02, 8 April 2023
  • aprendizado de máquina, vazamento (do inglês leakage, também conhecido como vazamento de dados ou vazamento de alvo) é o uso de informações no processo de treinamento...
    7 KB (670 words) - 23:42, 17 September 2022
  • aprendizado de máquina, a aprendizagem de características ou aprendizagem de representações é um processo que aprende automaticamente a representação de dados...
    3 KB (311 words) - 16:41, 9 August 2023
  • Função softmax (category !CS1 alemão-fontes em língua (de))
    função exponencial normalizada, converte um vetor de K números reais em uma distribuição de probabilidade de K resultados possíveis. É uma generalização da...
    33 KB (4,902 words) - 22:48, 16 July 2024
  • Word embedding (category Processamento de linguagem natural)
    processamento de linguagem natural (PLN), word embedding é uma representação de uma palavra. A incorporação (embedding) é usada na análise de texto. Tipicamente...
    30 KB (3,302 words) - 02:33, 31 August 2024
  • uma biblioteca de aprendizado de máquina baseada na biblioteca Torch, usada para aplicações como visão computacional e processamento de linguagem natural...
    13 KB (1,331 words) - 16:05, 14 June 2024
  • uma penalidade de regularização na otimização. A penalidade de regularização pode ser vista como a implementação de uma forma de navalha de Occam que prefere...
    24 KB (3,317 words) - 17:32, 9 September 2022
  • controle de versão de características e políticas que regem as circunstâncias em que as características podem ser usadas. Os repositórios de características...
    16 KB (1,749 words) - 18:52, 5 November 2023
  • Naive Bayes (category Algoritmos de classificação)
    bastante simples de construção de classificadores: modelos que designam labels de classe para instâncias de problema, representados como valores de atributos...
    15 KB (1,994 words) - 12:56, 21 August 2023
  • ChatGPT (category !Artigos que carecem de notas de rodapé sem indicação de tema)
    criar "modelos de recompensa" que foram usados para ajustar ainda mais o modelo usando várias iterações de Otimização de Política Proximal. A revista Time...
    182 KB (17,937 words) - 16:24, 26 September 2024
  • mineração de dados e estatística, o agrupamento hierárquico (também chamado de análise de agrupamento hierárquico ou HCA) é um método de análise de agrupamento...
    26 KB (2,897 words) - 10:06, 27 December 2023
  • de decisão globalmente ótima. Para reduzir o efeito guloso da otimização local, foram propostos alguns métodos, como a árvore de distâncias duplas de...
    44 KB (5,615 words) - 21:52, 25 July 2023
  • Long short-term memory (category Algoritmos de aprendizado de máquina)
    LSTM pode ser treinada de forma supervisionada em um conjunto de sequências de treinamento, usando um algoritmo de otimização como descida do gradiente...
    52 KB (6,018 words) - 21:15, 1 January 2024
  • _{i=1}^{n}w_{i}} . Essa configuração é um caso especial de otimização estocástica, um problema bem conhecido em otimização. Na prática, pode-se realizar múltiplas passagens...
    27 KB (4,904 words) - 07:11, 17 April 2023
  • Aprendizado por reforço com feedback humano (category !CS1 manut: Nomes múltiplos: lista de autores)
    através de um algoritmo de otimização como Proximal Policy Optimization. O modelo de recompensa é treinado antecipadamente para que a política seja otimizada...
    13 KB (1,430 words) - 11:29, 18 April 2024
  • capacidade de carreamento de oxigênio pode ser melhorada pela otimização da contratilidade cardíaca, por enchimento adequado e manutenção dos níveis de hemoglobina...
    29 KB (3,737 words) - 13:21, 13 May 2024