上的大模型想要正常运行,除了其核心代码之外还需要各种的配套功能的代码,这些加起来几万行都算是少的了。
他在这方面的,不管是经验还是知识都很欠缺,所以第一步就是——看文献,至少要熟知多模态大模型领域所有的先进技术之后,他才会开始计划怎么将现有参数量不大的模型进行升级。
其实这一步应该是在谈项目之前就做的,只不过周昀那个模型的性能实在太优秀了,
再加上他在和汇金的人谈判的时候表现得太过淡定,这让别人以为他在这方面有了一定的积累,这才直接敲定了项目。
不过这都无伤大雅,凭他现在的英语水平和理解能力一天刷个十几篇论文不是问题,最多一个月,他就能把大模型领域的技术摸得差不多。
时间来到了七月底,距离周昀和汇金的谈判已经过去了两周时间。
周一,周昀照常来到实验室。
正当他打开电脑准备刷一刷今日份的论文时,沈瑞抱着个笔记本电脑走到他身边。
“周昀师弟,有件事我想找你帮个忙。”他有些不好意思地笑了笑。
“你说。”
“是这样,我之前不是把论文初稿给邓老师看了吗?改了几次他都不满意,说是创新点没有,模型性能没有提升,工作做的再多也没用,
但是他给的几个建议我都试了,没什么进展,上周组会我汇报的时候不还是被骂了一顿吗?”
一说起这个他就头大,也不知道自己当初为什么来读这个研究生,和周昀相比,他感觉自己笨的就像是个草履虫。
“行,我先看看论文?”
反正看一篇论文他也花不了多长时间,都是同门,而且平时师兄对他也都不错,经常请他喝咖啡奶茶,还时不时请他出去吃饭。
“太谢谢你了,真是不好意思,我也知道你最近很忙,我这也是实在没办法了,要是再这样下去,我感觉肯定是要延毕了。”沈瑞一边感谢一边打开电脑。
周昀接过电脑,快速的滚动鼠标,沈瑞的研究方向是网络流量的概念漂移,
所谓概念漂移简单来说就是,一年前微信的流量在网络中的样子是a形态,但是过了一年之后因为相关协议,软件升级,他在网络中的样子变成了b形态,
这种变化导致了现有的网络流量检测模型无法做出准确的判断,这个变化的过程就能大概理解成概念漂移。