首页 > 快报 > 互联网

华人研究员朱泽园提出“伽利略时刻”般的创新——Canon层,旨在大幅提升模型的推理深度和广度,引领大模型研究的新纪元。

小编 互联网 2025-05-05 14:03:05


随着人工智能技术的飞速发展,“大模型设计”正迎来前所未有的变革。近日,华人研究员朱泽园在Meta公司提出了一种名为“Canon层”的轻量级结构,为大模型推理能力的提升提供了新的可能。朱泽园表示,这项研究如同“伽利略时刻”,揭示了大模型架构的真正极限,或将重新定义大模型的研究方向。该研究不仅提升了无位置编码模型的性能,还显著降低了对旋转位置编码的依赖,增强了模型的长程泛化能力。通过在多种架构中应用Canon层,研究人员发现其能够显著提升模型的推理深度和广度,从而实现更高效的信息流动和更深层次的推理。这一突破性进展有望推动大模型训练流程的持续进步,开启人工智能领域的全新篇章。


TAg

加载中~

本网站LOGO受版权及商标保护,版权登记号:国作登字-2022-F-10126915,未经湖南木星科技官方许可,严禁使用。
Copyright © 2012-2022 湖南木星科技有限公司(木星网)版权所有
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源,商业媒体及纸媒请先联系:aishangyiwan@126.com

工信部备案号:湘ICP备19012813号-5