马斯克旗下的人工智能公司xAI近日宣布推出Grok-1.5大语言模型,这是一款经过改进的推理能力和128k上下文长度的模型。Grok-1.5在MATH和GSM8K基准测试中取得了令人瞩目的成绩,同时在代码生成和解决问题能力的HumanEval基准测试中得分为74.1%。这款模型的长上下文理解方面也有了重大突破,能够处理多达128ktokens的长上下文。
据悉,Grok-1.5构建在基于JAX、Rust和Kubernetes的自定义分布式训练框架之上,并且还进行了优化检查点、数据加载和训练作业重新启动等环节,以最大限度地减少故障时停机时间。此外,在官方测试对比表中可以看出,在不同测试项目下Grok-1.5都有不错的成绩表现。
马斯克旗下的xAI公司在人工智能领域有着一定的知名度,其最新推出的Grok-1.5大语言模型也有着引人注目的功能和性能提升。该款产品可能会成为人们关注的焦点并带来可观收益。
本文属于原创文章,如若转载,请注明来源:马斯克公司推出Grok-1.5大语言模型:推理能力大幅提升https://dcdv.zol.com.cn/863/8631142.html