Avatar

Qianqiu

Master in PKU Research Direction: VLM, RLHF, MLsys Hobbies: Game, Web novel, Anime

  1. WeChat
  1. Home
  2. Diary
  3. Research
  4. Entertain
  5. Search
  6. Archives
  7. About
    1. Dark Mode Light Mode

Table of contents

    1. 在线演示
    2. 项目结构
Featured image of post 强化学习经典算法可视化
Research

强化学习经典算法可视化

Dec 22, 2025

郁老师的算法课程的强化学习六次作业以及重构。

非科班,靠着AI和花时间,还是做完了这些对我有些吃力的作业。

在线演示

🌐 访问在线演示页面

项目结构

  • based - 可以独立运行的六次平时作业
  • integrated - 重构后的期末大作业
  • web - 网页展示,展示了重构后的项目的一部分功能

虽然很吃力,但是感谢郁老师,这门课还是学到了很多东西的。

Research

Related content

Featured image of post Qwen3 GRPO验证实验

Qwen3 GRPO验证实验

Featured image of post Qwen 1.5B LoRA微调 中文情感识别

Qwen 1.5B LoRA微调 中文情感识别

© 2025 - 2026 Qianqiu
Built with Hugo
Theme Stack designed by Jimmy