Технические науки
Пассивное обучение с подкреплением интеллектуальных агентов
Сухляк Р.Д. 1
1. Санкт-Петербургский государственный электротехнический университет «ЛЭТИ» им. В.И. Ульянова (Ленина) (СПбГЭТУ «ЛЭТИ»)
Резюме:
В современном быстро развивающемся мире все чаще можно встретиться с устройствами и программами, заменяющими труд обычного человека. Например, в интернете существует множество программ, анализирующих поисковые запросы и упрощающие с помощью полученной информации поиск по глобальной сети. Существуют специальные роботы, упрощающие сборку, сварку и другие виды деятельности на заводах. Возможно, в скором времени появятся самоуправляемые автомобили. Обучение с подкреплениями является одной из ключевых направлений машинного обучения. В данной статье рассмотрен один из его методов, названный пассивным обучением с подкреплением.
Ключевые слова: пассивное бучение с подкреплением, интеллектуальный агент, среда, полез-ность состояний
Комментарии (0)
|