Zhangzhe's Blog
The projection of my life.
Home
Tags
Categories
Search
0%
Great! 138 posts in total. Keep on posting.
2024
12-13
上手训练大模型(2)——以LlamaFactory视角看大模型微调全流程
12-13
上手训练大模型(1)——用Alpaca-cleaned指令微调Llama-3.2-3B
11-28
强化学习(6)——Actor-Critic系列算法
11-19
强化学习(5)——DQN的变体们
11-15
强化学习(4)——用DQN算法训练Agent玩Taxi游戏
11-11
强化学习(3)——强化学习算法分类
11-08
强化学习(2)——用Q Learning算法训练Agent玩Blackjack
11-06
强化学习(1)——用REINFORCE算法训练Agent玩倒立摆游戏
10-29
大模型量化/部署——在AX650上部署Qwen模型
10-22
用 transformers 推理 Qwen2-0.5B-Instruct
1
2
3
…
14