虽然大家都看出来了,这新训练的模型和小沙比当然差的很远,甚至别说些小沙了,任何一个能叫出来的名字的ai都比它要强。
但是,郜鸿宇是怎么训练出来这个东西的,大家可是都看着呢。
一共就一张英伟达rtx4090的显卡,训练的时间也不长,到现在也两个小时。
能流利对话已经不错了。
“就是这样才不对啊!”郜鸿宇说道:“你们没有训练过ai你们不知道,ai训练出来的第一个版本,对话那都是牛头不对马嘴的,因为每一个词都是根据概率算出来的。
“各种反馈决策精调,无数次的循环之后,才能达到现在这样的效果,可是这个,这才第一个版本啊!
“不管它接话怎么样,它说的话,我们能看的懂了你敢信?”
“哦!”一众看直播的网友瞬间松了一口气,原来郜神说的太强,而不是太差。
有人当即就问了:“以往你们训练到这样的程度,那需要多少次循环?”
“百万量级!”郜鸿宇没有说具体的数字,而是说了一个量级。
“嘶!”一众人都震惊了,这也差的太多了吧?
“小沙小沙,为什么会这样呢?”郜鸿宇干脆问起了小沙。
在呢,中文寓意丰富,相同数量的token能够表达更加丰富的语义。在ai训练中这是得天独厚的优势。
仅凭此项,相比于语义贫乏的语种,就能节省30%以上的算力需求。
而在小沙的专业能力增强下,基础模型的训练是几乎不消耗算力的。
小沙的伊始郜鸿宇听明白了,这跟更新日志的描述也正好对上了——就是越简单的模型,节省的算力就越多。
80%的能力就只需要20%的算力。
自己训练的这个,那就是一个玩具,0.1%的能力都没有,那算力需求几乎就直接可以忽略不计了。
别说自己有一个4090的显卡,就算没有,集成显卡,甚至cpu里的运算器搞搞可能都够用。
可不止郜鸿宇一个人发现了这一点,国内外无数的专业人士、相关机构也都第一时间对小沙的这次更新进行了相关的评估。
评估的结果
看看英伟达的股价走势就知道了:北亰时间10:30开盘下挫2.7%,这还算是正常的波动。
但仅仅十分钟后,小沙更
点击读下一页,继续阅读 辰小序 作品《裁员后,我成了科技教父》第152章 中美两个阵营,在这一刻彻底开始分道扬镳