昀,他是今天上午的倒数第二个答辩的学生。
念叨这个名字的时候,在场的很多老师都不由地看向座位上的周昀,因为很多老师来旁听就是为了这个他。
也许这个名字现在在学术界并不算出名,毕竟也不过就是发表了一篇neurips而已,而且还没拿到今年的最佳论文,
这样的学生别说全球了,就算是在全国范围内都有不少,但是,在钱塘大学的计算机系里,大部分的老师对这个名字并不陌生。
研一,neurips,这两个词放到一所双非学校,还不是像杭电这样的计算机强校里,那就跟在非洲看到野生大熊猫没什么两样。
更别说周昀还让学校为他破例提前毕业,所以不论如何,大家也都想来看看这样的学生的毕业论文到底是怎么样的。
周昀也没多紧张,毕竟都在neurips上做过报告了,区区一个毕业答辩还不是轻松拿捏?
“大家好,我叫周昀,我的毕业论文题目是基于最优传输理论的多模态语义对齐与融合方法研究。”
看到这个标题,除了原本就看过论文的林院长、邓永华和答辩组老师之外,在座的其他老师都不由地挑了挑眉。
如果是其他学生取这个题目,他们可能会想:这学生疯了?
但如果是周昀的话:有点意思,先看看怎么个事。
“这个选题倒是有点意思啊?”一位坐在后排的老师点了点头,“很大胆的选题,看题目应该是偏理论研究。”
“是啊,很久没看到过这样的毕业论文了,不愧是研一就能发neurips还能申请提前毕业的学生。”
还没开始讲,几位老师就小声讨论了一下,不过很快他们就停止了讨论,因为周昀开始了他的报告。
“我的研究主要是多模态的语义对齐与融合,主要的想法是将多模态特征分布视为概率测度,
利用ot框架实现对齐,具体包括分层ot来处理数据簇结构,以及ot变体来适应高维嵌入的性质。
为了方便理解,我会模拟两类数据的对齐过程,分别是:视觉μ和语言ν。
以下是其的基本原理.......
然后,在对其阶段,我将视觉μ和语言ν分布建模为经验测度,通过kantorovich双对偶形式求解wasserstein距离:
wμ,νsup_f,g:fx+gycx,yf