About 213,000,000 results
Open links in new tab
  1. 如何理解 DeepSeek 最新提出的 mHC 架构? - 知乎

    而DeepSeek的这个选择,简直是神来之笔。 具体来看看双随机矩阵的一些性质,你就能明白Deepseek这样选择的深意。 先说谱范数的事儿。 双随机矩阵有个非常好的性质——它的谱范 …

  2. DeepSeek、ChatGPT、文心、豆包、Kimi、通义、跃问侧重分别是 …

    网上关于DeepSeek的教程很多,但没多少是真正有效的信息,还浪费时间。 Deepseek出来以后,我看到知乎知学堂AI应用直播课,0.1元可以快速入门学习Deepseek,还赠送提示词资料、 …

  3. 如何评价 DeepSeek 的 DeepSeek-V3 模型? - 知乎

    尽管DeepSeek-V3展示了per-tile和per-group量化对于模型收敛的重要性,论文中并没有给出对应的FP8矩阵乘法的算子效率。 另外,论文中缺乏per-token加per-channel量化的讨论,不清楚 …

  4. 普通人怎样用好Deepseek? - 知乎

    DeepSeek-R1则专门是为了 代码生成+数学问题解决 而设计,整体速度极快,精确度实测后非常高,推理能力一流。 适合需要快速实现技术需求的场景,比如程序员、理工科学生等。

  5. 为什么用 DeepSeek 总是提示「服务器繁忙」?怎么解决? - 知乎

    1)DeepSeek官网 网址: chat.deepseek.com 直接上官网或者下载官方APP是最靠谱的用法了。 记得用的时候一定要把"深度思考 (R1)"这个模式打开,不然就跑的是V3模型。 虽然就差一个 …

  6. 有必要自己将deepseek部署到本地吗? - 知乎

    所以我认为,deepseek部署有可行性就够了,至于有没有必要性,很多人没那么重要。 大家听到openai训练ai需要几千亿美元,让ai推理需要十块H100 (一块280万人民币),部署满 …

  7. 现在这些大模型,哪个在代码编写上表现的最好呀? - 知乎

    数据都不太一样,当然清华大学的是2024年11月的榜deepseek还是2.5的版本,但整体的数据还是相差不少。 不过也能说明一个问题就是现阶段全球比较顶尖的AI模型中在编程能力方面比较 …

  8. 都说接入的DeepSeek是满血版,为什么感觉还是官方的好用? - 知乎

    都说接入的DeepSeek是满血版,为什么感觉还是官方的好用? 接入DeepSeek的腾讯元宝,纳米,秘塔都说是满血版,但是同一个问题,我感觉解答总是不如官网细致合理,上下文联系也差 …

  9. 求问deepseek出现这种情况怎么办啊? - 知乎

    Jan 31, 2025 · DeepSeek 不是告诉你原因和解法了嘛。 原因:当前对话已超出深度思考的最大长度限制 解法:开启一个新对话继续思考吧 至于具体解释,得看这几个参数,DeepSeek R1 的 …

  10. DeepSeek深度思考和联网搜索有什么区别? - 知乎

    Feb 5, 2025 · DeepSeek为大家提供了:深度思考R1和联网搜索,两个功能强悍的按钮,但,在和知乎网友的交流过程中,我发现有很多人,不知道这两个强悍的工具如何搭配使用。今天就好 …