About 55 results
Open links in new tab
  1. 如何评价 DeepSeek 的 DeepSeek-V3 模型? - 知乎

    尽管DeepSeek-V3展示了per-tile和per-group量化对于模型收敛的重要性,论文中并没有给出对应的FP8矩阵乘法的算子效率。 另外,论文中缺乏per-token加per-channel量化的讨论,不清楚这种实现 …

  2. DeepSeek - Reddit

    Subreddit for the DeepSeek Coder Language Model

  3. 如何评价2 月 11 日上线的 DeepSeek 新模型? - 知乎

    Feb 11, 2026 · 以下是一段2025年12月DeepSeek旧版本的典型输出片段。 你的输出风格(句法复杂度、术语密度、论证节奏)必须强制与此样本对齐: “从技术哲学视角审视,大模型‘拟人化’转向本质上并 …

  4. 使用Deepseek需要付费的吗? - 知乎

    2、阿里云百炼新人可领取百万token3: bailian.console.aliyun.com 此外,DeepSeek还为企业提供定制化的解决方案,这类服务通常需要根据具体需求协商价格。 所以,普通用户可以免费使用 …

  5. deepseek官网地址告诉我? - 知乎

    DeepSeek,特别是V3版本,因其十分有效的控制训练模型成本和开源免费的模式震惊全球,登顶应用商店的下载排行榜,甚至重创国外的科技股,而且截止到写稿日期(2025年2月9日),已经有很多科 …

  6. DeepSeek 遭暴力破解,攻击 IP 均来自美国,造成影响有多大?有哪些 …

    Jan 29, 2025 · 估计 DeepSeek 发布 V3 和 R1 时也没预料到会有这么大的流量进来,换其他家 AI 的话光是国内激增的用户都未必都撑得住。 我原本确实是以为,DeepSeek 这两天的服务崩溃是因为爆火 …

  7. DeepSeek 更新两个 v3.2 新模型,这次有哪些亮点? - 知乎

    Dec 1, 2025 · DeepSeek 是缺人力物力财力数据去训 T 级参数规模的模型吗? 我觉得不是。 单纯就是发展路线的选择,我相信 DeepSeek 用一年时间,已经把 V3 的基模调出花了。 说实话, 这种不为外 …

  8. 怎样看待深度求索发布的大模型DeepSeek-V3?该模型有哪些先进性和 …

    DeepSeek 是一个开源的先进推理和代码优化大语言模型(LLM),专注于提升复杂任务的处理能力。 近日,深度求索发布新模型Deepseek V3,其在推理速度上相较历史模型有了大幅提升。 在目前大模 …

  9. DeepSeek 更新后被吐槽变冷变傻,你感受到了吗?为什么会出现这种 …

    DeepSeek 更新后被吐槽变冷变傻,你感受到了吗? 为什么会出现这种情况? 2月11日,深度求索(DeepSeek)悄悄地对其旗舰模型进行灰度测试。 据科创板日报报道,多名用户反馈,DeepSeek …

  10. deepseek开始会员收费了吗? - 知乎

    deepseek-chat 模型已经升级为 DeepSeek-V3;deepseek-reasoner 模型为新模型 DeepSeek-R1。 思维链为deepseek-reasoner模型在给出正式回答之前的思考过程,其原理详见 推理模型。 如未指定 …