2026 June
6.1 ~ 6.28
📖 Theme:模型 类Agent 三次大迭代 -> Fine Tuning Model
🧠 Cognition
- 小模型不适合多轮 agent,轮次越多也难拿到可靠信息
- 小模型的随机性也大,如若建立 workflow 由 harness 控制依然会出现过程随机性导致整个 workflow 不可靠
- Z3 或 SMT 这类输入敏感性工具不适合模型提取语义,后续也许可以作为一个课题,专门提取函数纯度信息给这类工具使用
- 模型不同精度通过大规模试验发现同样 prompt 输出结果各有特色,如有些较激进判断,有些保守
- 容易陷入跟着模型跑出来的数据调 agent 或者 workflow,方案通用性不行,如果只是对某个模型做特调还行
🖊️ Boundary
- ✔ 环境搭建 + 数次大规模实验:Prompt 工程数据实验 -> 多轮反馈 Agent -> 证据系统 Workflow
- ✔ 关于模型微调与Agent调研报告
- ✔ llamafactory 框架学习 + 环境搭建 + Fine Tuning Workflow 搭建
- ✔ Go 语言逆向书稿
- ✔ 关于区块链逆向与大模型综述开题
- ✔ 🏊深水区畅游 x5
🎉 Next Theme:微调模型数据实验
- 自媒体以科研为主题开号
- 语言逆向书稿
- 指挥AI把综述写完
- 某APP逆向
2026 六月记
好快,六月就要过完了,从回国到搬家,再到三次工位搬迁,加入0RAYS♾️,中间各种聚餐差不多有十次,一下子就来到了月末,有一句好话,我要把考研失去的都要补回来。
对我来说聚餐当然不是只是为了吃饭,更多还是交流,也终于结束2G冲浪🏄的考研生活了,我的不少认知都需要更新,体验到了0RAYS的大一小登都好厉害,才意识到比他们大了五岁了555,随着很多比赛都变成了路边依托,但他们的实际能力着实让我感到震惊,没有什么小镇做题家,也是终于加入了一个线下协会,而不是我从头开始创建一个,身在其中享受资源以及与他们互相交流的感觉真好。
月中还有大学同学端午露营⛺️,应该是第一次体验了一次没有任何计划的旅游,唯一的计划就是出来再说,永远不知道下一个目的地在哪,永远不知道这场聚餐何时结束,也是难得体验到了假期综合症,有些希望那场聚会永远不会结束,仿佛回到了当年刚上大学的时光,真是怀念啊。
这整个月各种聚餐中灵感最大的还是昨天和无名侠聚餐了,我真的很久没感受到那种 idea 满满交流了,听到他手上的各种工作我简直不敢想象是一个人在干活,给我最直接的影响就是我对未来的轮廓更清晰了一些🧠。
当然除了这十次聚餐之外的时间大部分都在工位,说实话这次适应一个新环境似乎更慢了一些,我也意识到了这次工位中我没有同辈,所以融入的不是很快,公寓中没有叶子🐈,养了三年是真的很想他,也是一次真正意义的独居了,哎,真是不适应,这次把windows游戏机也是直接搬工位了,不管是和老同学还是工位上的新同学一起game🎮都让我感觉san值plus plus,意识到终于不用像考研时一直隔绝自己了,这两年的考研在某种方面上真是身心摧残,我要奖励自己再也不用考研了。
这个月也是正式适应新时代学习工作流的第一个月,其实上手还是蛮快的,不过这个月主要还是在干工程,学的东西不多,主要是各种搭环境以及接触一些新东西,倒都是能力范围之内,不过要是遇到一些知识盲区还是要系统学习才可以,干活目前有大模型🤖都能多线程了,不过学习新知识点确实得好好单线程认真学,不然容易越来越浮躁。
下个月也决定开始小红书做内容了,内容就以科研🧐为主了,其实这一个月下来已经有几个科研的idea的通用点能分享出去,流量啥的纯随缘,就如当年B站一样,可以通过自媒体认识圈子里的许多人,也是对新圈子的一个期待了,也终于不用为了考研而封闭自己了。
All right,尽管是适应的第一个月,而且没适应过来,又大量接触了非常多的新事物,感觉整个人都没适应过来,但也依然对接下来的科研生活产生了期待,有很多想法想去做,有很多人想去聚,也有很多挑战等着我完成,又续上了三年大学生活

About this Post
This post is written by P.Z, licensed under CC BY-NC 4.0.