𝗥𝗟 𝗖𝗮𝘂𝘀𝗮𝗹 𝗘𝘅𝗽𝗹𝗶𝗰𝗮𝗯𝗹𝗲 𝗽𝗮𝗿𝗮 𝗹𝗮 𝗥𝗲𝘀𝗽𝘂𝗲𝘀𝘁𝗮 𝗮𝗻𝘁𝗲 𝗔𝗻𝗼𝗺𝗮𝗹𝗶́𝗮𝘀 𝗲𝗻 𝗦𝗮𝘁𝗲́𝗹𝗶𝘁𝗲𝘀

El Aprendizaje por Refuerzo (RL) estándar actúa como una