Технические науки
Пассивное обучение с подкреплением интеллектуальных агентов
Сухляк Р.Д. 1

1. Санкт-Петербургский государственный электротехнический университет «ЛЭТИ» им. В.И. Ульянова (Ленина) (СПбГЭТУ «ЛЭТИ»)

Резюме:

В современном быстро развивающемся мире все чаще можно встретиться с устройствами и программами, заменяющими труд обычного человека. Например, в интернете существует множество программ, анализирующих поисковые запросы и упрощающие с помощью полученной информации поиск по глобальной сети. Существуют специальные роботы, упрощающие сборку, сварку и другие виды деятельности на заводах. Возможно, в скором времени появятся самоуправляемые автомобили. Обучение с подкреплениями является одной из ключевых направлений машинного обучения. В данной статье рассмотрен один из его методов, названный пассивным обучением с подкреплением.

Ключевые слова: пассивное бучение с подкреплением, интеллектуальный агент, среда, полез-ность состояний


Комментарии (0)