传神语联何恩培:依赖Scaling Law的大模型路线已遇瓶颈
11月19日消息,传神近日,语联遇瓶传神语联推出“任度数推分离大模型”,何恩唐山市某某教育科技厂模型采用双网络架构实现数推分离,培依把推理网络与数据学习网络分开。的大模
据介绍,型路线已可将其理解为两个协同联动的传神大脑:一个是客户数据学习网络大脑,专注于数据的语联遇瓶动态管理与迭代训练,为模型持续注入知识;一个是何恩推理网络大脑,作为经大量数据预训练的培依基础网络,有良好的的大模唐山市某某教育科技厂推理和泛化能力。
随着AI技术进入规模化应用阶段,型路线已传统大模型的传神开发逐渐暴露出成本高昂、效率低下的语联遇瓶难题。尤其在参数规模不断扩大的何恩背景下,Scaling Law(规模定律)的局限性愈发显著。
传神语联创始人何恩培认为,仅依赖Scaling Law的大模型路线已遇瓶颈,要真正突破需依靠算法与架构。
![]()
双网络通过共享嵌入层和中间表示层协同工作,形成类似“主脑”与“辅脑”的高效配合模式,既支持独立训练,也支持联合推理。
这一双网络架构通过共享嵌入层和中间表示层,实现灵活独立训练与高效联合推理,提升模型性能的同时显著降低成本。
据悉,相比传统大模型,“任度双脑大模型”架构在多个关键领域实现突破:一是实时学习: 数据学习网络支持上下文无限制输入,可动态处理海量数据,缩短训练时间至分钟级;二是数据隐私保护: 客户数据本地完成训练,无需上传至云端;三是成本优化:减少模型参数规模,大幅降低算力需求与硬件投入成本。
何恩培坚信,“算法制胜”是具有中国特色的技术路径之一,在以大模型为代表的AI时代尤为重要。相信中国有很多像传神这样的团队在默默耕耘,正在以独特理念引领智能创新。(袁宁)
延伸阅读 (责任编辑:知识)
-
据日本朝日电视台12月27日报道,根据协议,日本和歌山县冒险世界游乐园的大熊猫“良浜”“彩浜”“枫浜”和“结浜”今年6月返回中国,大量日本民众对大熊猫感到不舍。为吸引游客,冒险世界游乐园上个月11
...[详细]
-
当地时间10日凌晨,韩国大部分地区出现破纪录的极端降雨天气,截至目前已造成4人死亡、1人失踪。当天,除首尔市、韩国首都圈北部和江原道北部等局部地区之外,韩国大部分地区出现暴雨天气。位于韩国中西部地区的
...[详细]
-
河南省气象台7月16日日18时30分升级发布暴雨红色预警:预计未来24小时,河南黄淮之间及焦作、济源、新乡南部有大到暴雨,其中济源、焦作南部、郑州西部、三门峡北部、洛阳北部、南阳北部、平顶山南部、
...[详细]
-
选择专业是一道难题对于性格“内向”的同学来说更难很多同学因为自己性格的原因不敢去做专业所面向的职业下面就推荐7类就业前景好且适合“内向”的同学就读的专业哦~一、计算机类专业计算机专业是指计算机硬件与软
...[详细]
-
北京时间12月21日,国际篮联官方公布了2026年国际篮联名人堂名单,中国男篮名宿王治郅入选,他也成为继牟作云、郑海霞、姚明、苗立杰之后第五位入选国际篮联名人堂的中国球员。 2026年国际篮联名
...[详细]
-
新华社快讯:国际货币基金组织16日发布《世界经济展望报告》更新内容,预计2024年中国经济增长5%,较今年4月份报告的预期上调0.4个百分点。
...[详细]
-
当地时间7月17日,荷兰国防大臣布雷克尔曼斯在接受乌克兰国家通讯社采访时表示,荷兰的F-16战斗机将于近期抵达乌克兰,但他拒绝透露更多细节。 荷兰此前追加拨款3亿欧元,用于购买F-16战斗机的弹
...[详细]
-
来源:深圳卫视直新闻 当地时间7月16日,美国彭博社发布了一篇对美国前总统、共和党总统候选人特朗普于6月25日进行的专访,在以商业和全球经济为重点的讨论中,特朗普提及半导体芯片产业以及台湾地区。
...[详细]
-
近两年来,我国呈现研究生报考人数的下降的趋势,2023年全国研究生招生考试报名人数达到空前的474万人之后,开始逐年下降,2026的报名人数为343万人,较前一年又回落了45万人。但与此同时,2025
...[详细]
-
文 | 田哲编辑 | 李勤 杨轩36氪汽车独家获悉,截止今年7月初,2024年华为智能汽车解决方案BU的收入达到100亿元。对比往年,华为车BU收入已翻倍增长。华为年报显示,2022-2023年,华为
...[详细]

扎哈罗娃生日当天,普京向其颁发勋章,二人互赠礼物
法国巴黎一汽车冲入餐馆室外座位区 已致1人死亡
美国伊利诺伊州一大坝发生溃坝 当地居民开始疏散
