苹果、英伟达强强联手：LLM 推理加速利器 ReDrafter 开源，AI 性能提升 2.7 倍

文 / 小亚 2024-12-19 08:02:21 来源:亚汇网

苹果公司表示ReDrafter已集成到NVIDIATensorRT-LLM推理加速框架中，在NVIDIAGPU上，每秒生成tokens速度最高提升2.7倍，有效降低了用户延迟和计算成本。苹果的机器学习研究人员指出，LLM越来越多地用于驱动生产应用程序，提高推理效率对降低计算成本和用户延迟至关重要。亚汇网援引苹果官方博文，ReDrafter使用RNN草稿模型，结合波束搜索（beamsearch）与动态树注意力（dynamictreeattention），可以让开源模型每步生成最多3.5个tokens，超越了先前推测性解码技术的性能。为将ReDrafter应用于生产环境，苹果与NVIDIA展开合作，将其集成到NVIDIATensorRT-LLM框架中。英伟达为此添加了新的运算符并公开了现有运算符，增强了TensorRT-LLM对复杂模型和解码方法的适应性。基准测试结果显示，在NVIDIAGPU上使用集成了ReDrafter的TensorRT-LLM框架，数百亿参数规模的生产模型的解码速度提升了2.7倍。这不仅降低了用户体验延迟，还减少了GPU使用数量和功耗。亚汇网附上参考地址广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，亚汇网所有文章均包含本声明。

更多行情分析及广告投放合作加微信: hollowandy
请用微信扫一扫

本文地址: https://www.yahui.hk/shares/qt/3812524-1.htm，转载请注明出处。

分享到：

【免责声明】本文仅代表作者本人观点，与亚汇网无关，且不构成任何投资建议，仅供参考，并自行承担全部风险与责任。本站部分文章信息来源于自由投稿人或网络转载，出于传递更多信息之目的，如对文章内容有疑议或侵权，请及时与我们联系处理。

关键词：外汇交易平台 外汇平台正规排行榜 嘉盛外汇 XM外汇 FXTM

相关新闻

加载更多...

热门推荐

今日汇率更多+

名家策略

曹向阳：无需极力唱空金价

曹向阳今天13:42
贺博生：12.19黄金原油暴跌最新行情走势分析及今日独家操作建议指导

贺博生今天09:31
郑氏点银：今年最后一次利率公布，预计黄金冲高回落

郑氏点银 12月18日 19:09

排行榜日排行 | 周排行

110年期国债收益率创新低，未来怎么走？多家机构研判

12月03日 11:32
2特朗普还没上任就舞起“关税大棒”，36万亿美元的美债撑得住吗？

11月26日 15:41
3小心债务风暴！财政债务是美联储调查中的头号金融稳定风险

11月25日 11:17
4美债“末日循环”风险未除！美联储或被迫提早QE？

11月08日 10:10
5日股收评：70年来首次调整！日经225强势反弹美国大选前波动率

11月05日 16:37
62024年11月5日固定收益日报

11月05日 14:34
72024年11月1日固定收益日报

11月01日 14:10
82024年10月30日固定收益日报

10月30日 11:53
92024年10月28日固定收益周报

10月28日 13:03
102024年10月25日固定收益日报

10月25日 13:01

热门标签

每日汇市报告

美联储加息

黑马股推荐

美联储降息

更多信息，请关注：

关于亚汇网 | 版权申明 | 广告服务 | 合作伙伴 | 诚聘英才 | 征稿启事 | 网站律师 | 网站地图

广告合作:it@yahui.hk 永久域名：www.yahuinews.cn CopyRight©2001-2024 all Rights Reserved

特此声明：广告商的言论与行为均与亚汇网无关 | 版权所有 ©亚汇网

扫一扫，关注亚汇公众号

微信
公众号

扫一扫，关注公众号
APP

扫一扫，下载亚汇通
QQ
咨询

欢迎咨询广告投放
返回
顶部