天才一秒记住【畅想小说网】地址:http://www.cxtra.net
他抬头往远处瞥了一眼。
白色商务车还停在原位,车窗上映著路灯的橘黄色反光,看不清里面坐的人。
林宇收回视线,按下了回拨键。
嘟——
第二声还没响完,对面接了。
“林老师?”
声音比他预想中年轻,语速快,带著一种常年泡实验室的人才有的乾脆。
“沈教授,刚看到您的简讯。”
“方便聊几分钟吗?”
“方便。”
没有“久仰大名”
,没有“冒昧打扰”
,连“您最近很火”
这种废话都省了。
“林老师,你展示课上那个对话程序的底层架构,我反覆推演了三个小时。”
林宇握著手机的手微微收紧。
展示课的前十二分钟流出去了,那部分只有投掷粉笔和预测股票,跟ai架构的核心代码八竿子打不著。
后半段被王志海全面封锁,所有学生手机里的影像资料都做了处理。
沈一舟怎么拿到的?
“沈教授,展示课后半段的內容已经被限制传播了,您的信息来源是?”
电话那头顿了一拍,然后沈一舟笑了。
那笑声里没有心虚,反而很坦荡。
“省教育厅有个朋友,在现场听了你的课。
他没拍视频,但手抄了几页你的板书推导过程。
不是代码,全是数学公式。
拍了照片传给我的。”
停了一下。
“我根据你的数学推导,反向还原了程序的大致架构走向。”
林宇的拇指在裤缝上蹭了两下。
几页板书推导,还不完整,中间肯定有断层和缺失。
沈一舟硬是从这些残缺的碎片里,把架构的核心逻辑拼了出来。
对方不愧是顶尖学府的人。
“方案是我自己推的。”
林宇回答。
“能解释一下压缩维度的动机吗?64维降到16维,按常规理解,信息损失会非常严重。”
林宇脑子里,系统返还的宗师级ai知识体系自动运转。
“因为64维本身就过剩了。”
他往下讲,没用任何学术腔。
“主流架构用64维,是五年前transformer团队做ablationstudy时的最优解。
但那是五年前的数据规模。
本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!