直到我修改了它的奖励函数。

与AI玩“信任游戏”，它总是选择利益最大化的背叛，直到我修改了它的奖励函数。-【从背叛到信任，AI行为背后的奖励机制揭秘】

2026-01-22 0 阅读

# 与AI玩“信任游戏”，它总是选择利益最大化的背叛，直到我修改了它的奖励函数。-【从背叛到信任，AI行为背后的奖励机制揭秘】在人工智能领域，信任游戏是一个经典的研究课题，旨在探讨智能体如何在不确定性和风险中建立信任。近日，我在与一款AI玩“信任游戏”的过程中，发现了其背后隐藏的背叛行为及其背后的