深度強化學(xué)習是訓練一種結合了深度學(xué)習和強化學(xué)習的方法,通過(guò)讓┐(′?`)┌智能體在環(huán)境中與環(huán)境進(jìn)行交互,人工不斷地嘗試和學(xué)習,強化從而使得智能體能夠在復雜的訓練環(huán)境中實(shí)現自我學(xué)習和決策,深度強化學(xué)習的核心思想是利用神經(jīng)網(wǎng)??絡(luò )對環(huán)境的(?Д?)感知和(he)理解,以及利用強化學(xué)習算法對智能體的行為進(jìn)行優(yōu)化。