热点：

苹果推出OpenELM高效语言模型，开放源代码、预训练模型和配置

2024-04-25 01:41:25 [ 中关村在线原创 ] 作者：海是天的倒影

苹果推出OpenELM高效语言模型，开放源代码、预训练模型和配置

在WWDC24之前，苹果公司发布了一款名为OpenELM的高效语言模型，这款模型是开源的，并且其源代码、预训练模型和训练配方都可以在苹果的Github库中获取。官方介绍如下：大型语言模型的可重复性和透明度对于推进开放研究、确保结果的可信度以及调查数据和模型偏差以及潜在风险至关重要。因此，我们推出了一个最先进的开源语言模型——OpenELM。

OpenELM采用了分层缩放策略来有效地分配Transformer模型每一层的参数，从而提高了准确率。例如，在参数量约为10亿的情况下，与OLMo相比，OpenELM的准确率提升了2.36%，同时所需的预训练tokens数量仅有原来的50%。

与以往只提供模型权重和推理代码并在私有数据集上进行预训练的做法不同，我们发布的版本包含了在公开数据集上训练和评估语言模型的完整框架，包括训练日志、多个检查点和预训练配置。

此外，我们还发布了将模型转换为MLX库的代码，以便在苹果设备上进行推理和微调。通过全面发布这些内容，我们的目标是增强和巩固开放研究社区，并为未来的开放研究工作铺平道路。

参考文献：

[2404.14619] OpenELM: An Efficient Language Model Family with Open-source Training and Inference Framework

本文属于原创文章，如若转载，请注明来源：苹果推出OpenELM高效语言模型，开放源代码、预训练模型和配置https://dcdv.zol.com.cn/867/8679671.html

猜你喜欢
最新
精选
相关

手机版阅读即时更新

点击加载更多内容

中关村在线首页数码影音首页

数码摄像机品牌大全热门数码摄像机上升最快的数码摄像机

数码摄像机报价

热门搜索

潮好玩嘉年华苹果发布会 AWE Chinajoy IFA mwc CES Asia CES

热词：镜头卡西欧佳能

24小时热文
本周热评

推荐视频
精品图赏

高性能+高颜值海能达S1 Pro对讲机评测

推荐经销商

投诉欺诈商家: 010-83417888-9185

北京
上海
广州

数码摄像机
新品上市

1索尼 FX3￥32000

参考报价：￥32000
去购买>
2索尼 FDR-AX60￥6999

参考报价：￥6999
去购买>
3索尼 FDR-AX700￥11998

参考报价：￥11998
去购买>
4索尼 PXW-Z280￥38800

参考报价：￥38800
去购买>
5佳能 PowerShot V10￥2999

参考报价：￥2999
去购买>
6松下 AG-UX90MC￥11199

参考报价：￥11199
去购买>
7索尼 ILME-FX30￥12938

参考报价：￥12938
去购买>
8索尼 ILME-FX6VK￥59000

参考报价：￥59000
去购买>
9索尼 HXR-NX100￥11900

参考报价：￥11900
去购买>
10索尼 PXW-Z150￥21999

参考报价：￥21999
去购买>

推荐问答

提问

论坛精选
最热回答

摄影
手机
硬件
笔电
平板

0

下载ZOL APP
秒看最新热品

内容纠错