在最近几周席卷AI世界后,DeepSeek现在在扩大其先进推理模型的可访问性方面取得了显著进展。

该公司宣布,其旗舰产品DeepSeek R1模型现已在多个平台上推出,包括Nvidia、AWS和GitHub。
DeepSeek的开源特性允许开发者基于其架构构建模型,目前在协作AI模型开发平台Hugging Face上,已有3,374个基于DeepSeek的模型可用。
Nvidia、AWS、GitHub和Azure现已提供DeepSeek
在AWS上,DeepSeek-R1模型现在可以通过Amazon Bedrock访问,这简化了 API 集成,并通过Amazon SageMaker支持高级定制和训练,借助AWS Trainium和Inferentia实现优化的成本效益。
AWS还通过Amazon Bedrock Custom Model Import提供了DeepSeek-R1-Distill,这是一个精简版。此无服务器部署简化了基础设施管理,同时保持可扩展性。
Nvidia也已将DeepSeek-R1集成到NIM微服务中,利用其Hopper架构和FP8 Transformer Engine加速器,提供实时高质量的响应。
该模型具有6710亿个参数和128,000个令牌的上下文长度,并利用测试时扩展来提高准确性。