Betterjoy Setup

About 213,000,000 results

Open links in new tab

Any time

zhihu.com
https://www.zhihu.com › question
如何理解 DeepSeek 最新提出的 mHC 架构？ - 知乎
而DeepSeek的这个选择，简直是神来之笔。具体来看看双随机矩阵的一些性质，你就能明白Deepseek这样选择的深意。先说谱范数的事儿。双随机矩阵有个非常好的性质——它的谱范 …
zhihu.com
https://www.zhihu.com › question
DeepSeek、ChatGPT、文心、豆包、Kimi、通义、跃问侧重分别是 …
网上关于DeepSeek的教程很多，但没多少是真正有效的信息，还浪费时间。 Deepseek出来以后，我看到知乎知学堂AI应用直播课，0.1元可以快速入门学习Deepseek，还赠送提示词资料、 …
zhihu.com
https://www.zhihu.com › question
如何评价 DeepSeek 的 DeepSeek-V3 模型？ - 知乎
尽管DeepSeek-V3展示了per-tile和per-group量化对于模型收敛的重要性，论文中并没有给出对应的FP8矩阵乘法的算子效率。另外，论文中缺乏per-token加per-channel量化的讨论，不清楚 …
zhihu.com
https://www.zhihu.com › question
普通人怎样用好Deepseek? - 知乎
DeepSeek-R1则专门是为了代码生成+数学问题解决而设计，整体速度极快，精确度实测后非常高，推理能力一流。适合需要快速实现技术需求的场景，比如程序员、理工科学生等。
zhihu.com
https://www.zhihu.com › question
为什么用 DeepSeek 总是提示「服务器繁忙」？怎么解决？ - 知乎
1）DeepSeek官网网址： chat.deepseek.com 直接上官网或者下载官方APP是最靠谱的用法了。记得用的时候一定要把"深度思考 (R1)"这个模式打开，不然就跑的是V3模型。虽然就差一个 …
zhihu.com
https://www.zhihu.com › question
有必要自己将deepseek部署到本地吗？ - 知乎
所以我认为，deepseek部署有可行性就够了，至于有没有必要性，很多人没那么重要。大家听到openai训练ai需要几千亿美元，让ai推理需要十块H100 (一块280万人民币)，部署满 …
zhihu.com
https://www.zhihu.com › question
现在这些大模型，哪个在代码编写上表现的最好呀？ - 知乎
数据都不太一样，当然清华大学的是2024年11月的榜deepseek还是2.5的版本，但整体的数据还是相差不少。不过也能说明一个问题就是现阶段全球比较顶尖的AI模型中在编程能力方面比较 …
zhihu.com
https://www.zhihu.com › question
都说接入的DeepSeek是满血版，为什么感觉还是官方的好用？ - 知乎
都说接入的DeepSeek是满血版，为什么感觉还是官方的好用？接入DeepSeek的腾讯元宝，纳米，秘塔都说是满血版，但是同一个问题，我感觉解答总是不如官网细致合理，上下文联系也差 …
zhihu.com
https://www.zhihu.com › question
求问deepseek出现这种情况怎么办啊？ - 知乎
Jan 31, 2025 · DeepSeek 不是告诉你原因和解法了嘛。原因：当前对话已超出深度思考的最大长度限制解法：开启一个新对话继续思考吧至于具体解释，得看这几个参数，DeepSeek R1 的 …
zhihu.com
https://www.zhihu.com › question
DeepSeek深度思考和联网搜索有什么区别？ - 知乎
Feb 5, 2025 · DeepSeek为大家提供了：深度思考R1和联网搜索，两个功能强悍的按钮，但，在和知乎网友的交流过程中，我发现有很多人，不知道这两个强悍的工具如何搭配使用。今天就好 …

Pagination
- Next
- Next