DeepSeek R1现已在Nvidia、AWS和GitHub上推出,且在Hugging Face上可用的模型数量突破3000

在最近几周席卷AI世界后,DeepSeek现在在扩大其先进推理模型的可访问性方面取得了显著进展。

DeepSeek R1现已在Nvidia、AWS和GitHub上推出,且在Hugging Face上可用的模型数量突破3000

该公司宣布,其旗舰产品DeepSeek R1模型现已在多个平台上推出,包括Nvidia、AWS和GitHub。

DeepSeek的开源特性允许开发者基于其架构构建模型,目前在协作AI模型开发平台Hugging Face上,已有3,374个基于DeepSeek的模型可用。

Nvidia、AWS、GitHub和Azure现已提供DeepSeek

在AWS上,DeepSeek-R1模型现在可以通过Amazon Bedrock访问,这简化了 API 集成,并通过Amazon SageMaker支持高级定制和训练,借助AWS Trainium和Inferentia实现优化的成本效益。

AWS还通过Amazon Bedrock Custom Model Import提供了DeepSeek-R1-Distill,这是一个精简版。此无服务器部署简化了基础设施管理,同时保持可扩展性。

Nvidia也已将DeepSeek-R1集成到NIM微服务中,利用其Hopper架构和FP8 Transformer Engine加速器,提供实时高质量的响应。

该模型具有6710亿个参数和128,000个令牌的上下文长度,并利用测试时扩展来提高准确性。

TechRadar的头像TechRadar认证作者

相关推荐

  • NVIDIA 加入道琼斯工业平均指数 取代 Intel 原有位置

    近几年 NVIDIA 随着 AI 需求上升而股价暴涨,同时 Intel 则一直下跌,美国道琼斯工业平均指数昨天就宣佈,将会以 NVIDIA 取代 Intel 的位置。 根据 S&P Dow Jones 的声明,NVIDIA 将於 11 月 8 日取代 Intel 加入道琼斯工业平均指数,反映 AI 的蓬勃发展和半导体产业的重大变化。消息公布后,Int…

    2024年11月3日
    135
  • 忘记每天充电?一加声称Watch 3最长可续航16天

    一加在去年迅速扩展了其智能手表系列,推出了期待已久的一加Watch 2 和更具性价比的一加Watch 2R。现在,不到一年后,公司正式宣布了其继任者——一加Watch 3,并将在发布后一周内正式上市。 一加Watch 3:单次充电最长可达16天的电池续航 一加Watch 2凭借其大容量电池和混合操作系统,显著提升了电池续航,结合了谷歌的Wear OS和一加的…

    2025年2月11日
    102
  • 最新泄露似乎为我们展示了Nintendo Switch 2底座的最终设计

    关于Nintendo Switch 2的新外观似乎已经泄露,展示了看起来像是最终版的底座设计。 任天堂终于在1月的长期期待的宣传视频中揭示了Switch继任者的首次亮相,尽管视频中展示了控制台的底座,但看起来最终设计与最初公布的略有不同。 根据wwftech的报道,之前发布过该系统图片的泄密者现在分享了全新的底座3D模型,包括从正面、背面角度、俯视图和底部的…

    2025年2月28日
    109
  • 苹果正准备在其 App Store 中推出人工智能驱动的增强功能

    苹果正准备在其 App Store 中推出人工智能驱动的增强功能,其中一项突出功能旨在改进应用程序评论摘要。通过利用人工智能,苹果公司旨在通过更有效地检测不相关或欺诈性应用程序,使应用程序商店更加用户友好和值得信赖。 苹果最近推出的人工智能驱动功能之一是写作工具功能,它可以总结长文档和文本——类似的功能很快就会扩展到应用商店。这种集成将使苹果能够通过提供人工…

    2024年10月31日
    170
  • 英伟达RTX 5090:规格、价格与发布日期

    消费者对英伟达GeForce RTX 5090的期待值很高,因为大家预期这款显卡将打破记录,而我们终于迎来了它的揭晓。以下是关于这款即将发布的显卡的所有已知信息,包括价格、规格和发布日期。 英伟达GeForce RTX 4090一度是市场上最快的消费级显卡,因此它的继任者面临着巨大的挑战。RTX 5090作为RTX 4090的备受期待的后续产品,消费者可以根…

    2025年1月29日
    183

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注