Este livro est??? estruturado em cinco unidades, oferecendo uma experi???ncia de aprendizagem hol???stica. A viagem come???a com uma introdu??????o aos algoritmos bandit, explorando conceitos fundamentais como os algoritmos Upper Confidence Bound (UCB) e Probably Approximately Correct (PAC). A unidade seguinte introduz a estrutura completa da Aprendizagem por Refor???o (RL), indo al???m dos algoritmos bandit para considerar as interac??????es agente-ambiente ao longo de v???rios passos de tempo. Os processos de decis???o de ...
Read More
Este livro est??? estruturado em cinco unidades, oferecendo uma experi???ncia de aprendizagem hol???stica. A viagem come???a com uma introdu??????o aos algoritmos bandit, explorando conceitos fundamentais como os algoritmos Upper Confidence Bound (UCB) e Probably Approximately Correct (PAC). A unidade seguinte introduz a estrutura completa da Aprendizagem por Refor???o (RL), indo al???m dos algoritmos bandit para considerar as interac??????es agente-ambiente ao longo de v???rios passos de tempo. Os processos de decis???o de Markov (MDP) s???o introduzidos como um quadro fundamental para modelar tarefas de tomada de decis???o sequenciais. A quarta unidade abrange m???todos de programa??????o din???mica, m???todos de diferen???a temporal (TD) e a equa??????o de optimalidade de Bellman em RL. Estes conceitos permitem aos agentes planear, aprender e otimizar eficazmente as suas ac??????es. A unidade final explora t???cnicas avan???adas de RL, como tra???os de elegibilidade, aproxima??????o de fun??????es, m???todos de m???nimos quadrados, Q-learning ajustado, Deep Q-Network (DQN) e algoritmos de gradiente de pol???tica.
Read Less
Choose your shipping method in Checkout. Costs may vary based on destination.
Seller's Description:
Fine. Text in Portuguese. Trade paperback (US). Glued binding. 140 p. In Stock. 100% Money Back Guarantee. Brand New, Perfect Condition, allow 4-14 business days for standard shipping. To Alaska, Hawaii, U.S. protectorate, P.O. box, and APO/FPO addresses allow 4-28 business days for Standard shipping. No expedited shipping. All orders placed with expedited shipping will be cancelled. Over 3, 000, 000 happy customers.
Choose your shipping method in Checkout. Costs may vary based on destination.
Seller's Description:
New. Text in Portuguese. Trade paperback (US). Glued binding. 140 p. In Stock. 100% Money Back Guarantee. Brand New, Perfect Condition, allow 4-14 business days for standard shipping. To Alaska, Hawaii, U.S. protectorate, P.O. box, and APO/FPO addresses allow 4-28 business days for Standard shipping. No expedited shipping. All orders placed with expedited shipping will be cancelled. Over 3, 000, 000 happy customers.