强化学习实验

倒双摆的DDPG mujoco是一个物理引擎，全称为Multi-Joint dynamics with Contact，gym可以调。这里实验一个倒双摆： import gymnasium as gym env = gym.make('InvertedDoublePendulum-v5') state_dim = env.observation_space.shape[0] # 9 a...

2025/07/10 机器学习

一个简单的手指游戏和逆向归纳法

小时候，即使是一个非常简单的游戏，也能沉浸其中。反倒是今天对游戏挑剔了起来，却也发现玩游戏的心情不在了，时间不在了，朋友不在了，快乐也不在了。我倒是想起以前玩过的一个非常简单的小游戏，掰着指头两个人就能玩一局。规则如下：甲乙两人伸出双手，分别摆一个“1”的手势。轮流进行，其中一方将自己任意一只手的数字与对方任意一只手的数字相加，替换掉自己原先的数字，如果超出了10，则减去10。变成0...

2025/07/03 其他, 杂记

强化学习回顾

强化学习算法 Q-Learning DQN PG AC TRPO PPO DDPG Gym Q-Learning DQN PG AC PPO DDPG 强化学习算法 ...

2025/06/29 机器学习

LeetCode 101

贪心算法 455. 分发饼干假设你是一位很棒的家长，想要给你的孩子们一些小饼干。但是，每个孩子最多只能给一块饼干。对每个孩子 i ，都有一个胃口值 g[i] ，这是能让孩子们满足胃口的饼干的最小尺寸；并且每块饼干 j ，都有一个尺寸 s[j] 。如果 s[j] >= g[i] ，我们可以将这个饼干 j 分配给孩子 i ，这个孩子会得到满足。你的目标是满足尽可能多的孩子，并...

2025/06/18 计算机, 数据结构与算法

《烈幻入》背后的Ren'py

楔子 renpy的基础脚本标签变量角色文本标签对话气泡动画和变换图片变换特性 transform 动画 animation和function 事件和on 可视组件 ...

2025/06/16 计算机, Python

Unity简单入门

C#基础备忘常用API 在Unity里编写代码 VS快捷键 Unity基础 Unity生命周期 GameObject组件 Transform组件游戏对象的显示 C#基础备忘大多数略，以下为备忘。枚举 enum Day...

2025/06/05 计算机, Unity

Unity实战

U2D 角色角色的物理动画摄像机 UI DOTween 音乐 U3D 新建工程后处理场景布置角色移动射线检测数据对象游戏切换场景保存 shad...

2025/06/05 计算机, Unity

日语汉字音读推断

引言日语《常用汉字表》（以下简称表，《常用汉字表》收录和未收录的汉字称为表内汉字和表外汉字），是日本文化厅发表的，用于规范公共领域，如法律文书、新闻杂志的汉字。总计2136个汉字。这2136个汉字中，绝大多数都是中国人所认识的汉字，这也是日语看起来很容易学的原因。日语汉字的读音主要分为音读和训读两大类。音读是模仿古代汉语的发音，因而和现代汉语读音有一定相似性。训读是古代日本人为日语的...

2025/02/14 日语

三余拾遗集

劳动价值论参考古希腊哲学家柏拉图：任何商品存在一个客观的价值，价格不会和价值完全一致。亚里士多德：所有商品的价值是同质的。同质才能比量。古希腊哲学家没能将价值的等同性归结为劳动。价值的等同性只有在人类平等概念深入人心时才能揭示出来。古典经济学古典经济学：资本主义初期代表资本主义同封建主义斗争的资产主义经济学。庸俗经济学：在资本主义后期为资本主义辩护的经济学。 ...

2025/01/27 其他, 杂记

破事一堆

用conda装pytorch装不上 TLNR：最后用pip装的。用conda装pytorch conda install pytorch torchvision torchaudio pytorch-cuda=12.1 -c pytorch -c nvidia 报错，估计是连不上pytorch和nvidia的网 Collecting package metadata (repo...

2024/06/21 计算机, 笔记