免费阅读
返回
菜单
上一章查看最新章节下一章

437. 傲慢的代价

作品:重生之AI教父作者:CloseAI
如果本章错误,请点击报错10秒纠正

直接支持这一功能。

长期居于龙头位置的closeai程序员们并没有选择下苦工用其他的方式实现这一功能,而是选择了与英伟达沟通,以求让英伟达在下代硬件框架中支持细粒度缩放格式。

孟繁岐回忆起那个时候,欲言又止。

这称得上是错误吗?其实也不见得。

因为closeai的建议为英伟达提供了重要参考。

下一代硬件框架中支持该功能无疑是非常正确的决定。

但...没有它真的就做不了吗?很显然,DS回答了这个问题,现有的条件之下,技术并不是无法实现的。

另一件让孟繁岐感到扼腕叹息的事情,是双方在“稀疏”这一概念上的分歧。

在FP8问题上,孟繁岐与DS是一致的。

在稀疏这一方向上,孟繁岐选择了细粒度,矩阵层面的稀疏。

DS则选择了通道层面的MoE,混合专家模型。

简单来说,DS选择把模型拆分为16/32个专家,就像是把一块蛋糕均分切成16/32块。

每一块都是不同的味道,每一个专家更加专注于不同的知识。

根据具体的情况,会有一个门控系统,来决定哪些专家参与计算。

而孟繁岐的野心更甚,他想要从根本上将整个模型在原子级别拆分,细粒度地对所有权重进行大刀阔斧地裁减,直到原本大小的16/32分之一。

从理论上说,这种方式的上限更高,MoE的稀疏更显得粗糙。

另一方面,孟繁岐也有愿景,想要增强国内硬件的竞争力。

因为英伟达的设备,是无法支持这种细粒度稀疏计算的。

倘若能够先发展国内计算设备,适配这种技术,就能够在制程等诸多硬件技术落后的情况下,达到更快的推理效果。

换言之,孟繁岐又一次将希望寄予了发展周期更长的硬件厂商,那么在这方面被其他人赶上,倒也不是什么奇怪的事情了。

虽然具体实现上稍显不同,但总体来说,DS完成了孟繁岐在技术上的两点宏观展望。

从其余的许多技术细节当中,孟繁岐可以很强烈地读到,他们的开发之路走得也并不顺利。

比如说混合专家MoE,很容易让一两个专家变成懂王,什么都要参与,很多其他的专家渐渐变成了挂件,貌似在参与,其实完全就是围观的观众。

如果增加额外的损失

…。。
   本章没完,请点击下—页继续阅读!如果被转码了请退出转码或者更换浏揽器即可。
  温馨提示:亲爱的读者,如果你觉得本站还好,为了避免丢失和转马,请勿依赖搜索访问,建议你使用[华为刘揽器]或[Firefox火狐刘揽器]访问并收蔵【北京小说】 m.beijingxiaochou.com。我们将会持续为你更新,还建议你注册会员使用书架功能追书阅读更方便。
上一页 123下一页
上一章查看最新章节下一章
临时书架加入书签回顶部↑

看了《重生之AI教父》的书友还喜欢看

儒道至上?我在异界背唐诗!
作者:张亦安
简介: 汉语言专业大学生词宋穿越异界,来到了一个儒道之上的奇特世界,在这里,只有文人才能掌控...
更新时间:2026-03-04 21:13:28
最新章节:第 1876 章 帝子危
武道崛起
作者:小仙梦蝶
简介: 开局小家族之子…看柳辰如何一步步做大做强,带领修仙世界屹立星界之巅不一样的修仙体系仙...
更新时间:2026-03-04 21:29:38
最新章节:第三百九十一章 圣之森野战役(十)
芙莉莲:词条勇者的冒险旅行
作者:不能没肉
简介: “一件普通的亚麻衬衫,要500金币?”

“物超所值,我的朋...
更新时间:2026-03-04 21:05:00
最新章节:第85章 嗜血的诅咒(3/5 求首订)
玄幻:创造怪物暗杀军团
作者:九把火
简介: 【叮,本系统可提取万物特性,编辑虫族怪物!】顾长青穿越玄幻世界,意外激活虫族编辑系统...
更新时间:2026-03-04 21:32:59
最新章节:第一卷 第669章 滴水不漏
娘子,你不会真的给我下药了吧
作者:桃公旺
简介: 大乾末年,恶霸横行,战乱四起,民不聊生。陈解穿越而来,发现自己竟然是个嗜酒的烂赌鬼,...
更新时间:2026-03-04 20:00:00
最新章节:第七百六十四章 宿命之战
晚明风华
作者:戈昔
简介: 沈一贯:“寅儿,你对着这浙水,给为师起个誓吧。”朱寅:“先生要学生起个什么誓?”沈一...
更新时间:2026-03-04 21:18:15
最新章节:番外篇3 一堂课!
书名:

本站若有图片广告属于第三方接入,非本站所为,广告内容与本站无关,不代表本站立场,请谨慎阅读。

Copyright © 2020 北京小说 All Rights Reserved.kk

SiteMap