DeepSeek R1现已在Nvidia、AWS和GitHub上推出,且在Hugging Face上可用的模型数量突破3000

在最近几周席卷AI世界后,DeepSeek现在在扩大其先进推理模型的可访问性方面取得了显著进展。

DeepSeek R1现已在Nvidia、AWS和GitHub上推出,且在Hugging Face上可用的模型数量突破3000

该公司宣布,其旗舰产品DeepSeek R1模型现已在多个平台上推出,包括Nvidia、AWS和GitHub。

DeepSeek的开源特性允许开发者基于其架构构建模型,目前在协作AI模型开发平台Hugging Face上,已有3,374个基于DeepSeek的模型可用。

Nvidia、AWS、GitHub和Azure现已提供DeepSeek

在AWS上,DeepSeek-R1模型现在可以通过Amazon Bedrock访问,这简化了 API 集成,并通过Amazon SageMaker支持高级定制和训练,借助AWS Trainium和Inferentia实现优化的成本效益。

AWS还通过Amazon Bedrock Custom Model Import提供了DeepSeek-R1-Distill,这是一个精简版。此无服务器部署简化了基础设施管理,同时保持可扩展性。

Nvidia也已将DeepSeek-R1集成到NIM微服务中,利用其Hopper架构和FP8 Transformer Engine加速器,提供实时高质量的响应。

该模型具有6710亿个参数和128,000个令牌的上下文长度,并利用测试时扩展来提高准确性。

TechRadar的头像TechRadar认证作者

相关推荐

  • 谷歌的新人工智能功能可让您立即将文档变成工作视频

    谷歌正在扩大对其人工智能驱动的视频生成器Google Vids的访问范围,通过其Google Workspace和高级Gemini计划向全球更多用户提供该服务。这款由Gemini提供支持的生产力工具使用户能够使用现有文档和简单的提示直接在浏览器中创建引人入胜的视频。 与Google的独立视频生成器Veo不同,Google Vids专门为Workspace客户…

    2024年11月10日
    91
  • 好消息:Android 16 预计将于明年初推出

    谷歌最近发布的 Android 操作系统通常会在夏季发布,但Android 15打破了这一趋势,由于延迟而推迟发布。为了抵消这一影响,谷歌已确认 Android 16 将于明年比平常更早发布,并计划发布两次。 在一篇针对开发人员的博客文章中,谷歌分享了下一个主要 Android 操作系统的路线图。根据时间表,Android 16 的第一个版本将于 2025 …

    2024年11月3日
    136
  • AMD的RX 9070 GPU可能会在3月6日发售,也就是Nvidia RTX 5070发布后的第二天——而我并不担心关于900W电源的传闻

    AMD的Radeon RX 9070显卡将于2月28日举行正式发布活动,这一消息已得到Team Red确认,而根据传闻,预计这些GPU将在3月6日开始发售。 这个传闻中的发售日期来源于VideoCardz的消息来源,且得到了中国科技网站Benchlife的支持。尽管这两个传闻一致,但我们仍需保持谨慎。 尽管如此,AMD已经告诉我们,RX 9070系列将于3月…

    2025年2月16日
    30
  • 谷歌已经停止销售Chromecast with Google TV——但我绝对不会更换我的设备

    在推出四年半后,Chromecast with Google TV不再由谷歌销售——它加入了像Google Daydream和Nexus Q(还记得吗?)这样的产品,成为谷歌硬件产品“墓地”的一员。 9to5Google等媒体注意到,这款设备已从官方Google商店下架,4K和HD版本都不再供应。HD版本于2022年推出,比原版晚了两年。 尽管你或许还能通过…

    2025年2月22日
    2
  • 专门做家务的 AI 机械人模型 π0 影片示范洗衣服、折叠衣服、收拾凌乱桌面

    AI在围棋对弈、医学研发等复杂领域中,屡次展现出超越人类的能力,但在简单的日常任务上,机器仍面对挑战。为了解决此一难题,专注于基盘模型和学习演算法开发的公司 Physical Intelligence,经过 8 个月的研究,推出一项帆用机械人基盘模型「π0」,目标是支援多种任务的机械人操作需求。今次他们就示范了利用机械人来折叠衣服、收拾台面、组装箱子。 Ph…

    2024年11月3日
    229

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注