您现在的位置是:首页 >学无止境 >自监督环境模型网站首页学无止境

自监督环境模型

东方佑 2023-06-02 16:00:02
简介自监督环境模型

假设一个环境 在A图景的情况下 输入action 0 得到图景 B

假设一个环境 在B图景的情况下 输入action 1 得到图景 C

假设一个环境 在C图景的情况下 输入action 2 得到图景 D

假设一个环境 在D图景的情况下 输入action 3 得到图景 E

使用 one_hot 分别表示 A,B,C,D,E


import paddle


class OneNet(paddle.nn.Layer):
    def __init__(self)
风语者!平时喜欢研究各种技术,目前在从事后端开发工作,热爱生活、热爱工作。