Microcomputers

About 55 results

Open links in new tab

Any time

zhihu.com
https://www.zhihu.com › question
如何评价 DeepSeek 的 DeepSeek-V3 模型？ - 知乎
尽管DeepSeek-V3展示了per-tile和per-group量化对于模型收敛的重要性，论文中并没有给出对应的FP8矩阵乘法的算子效率。另外，论文中缺乏per-token加per-channel量化的讨论，不清楚这种实现 …
reddit.com
https://www.reddit.com › DeepSeek
DeepSeek - Reddit
Subreddit for the DeepSeek Coder Language Model
zhihu.com
https://www.zhihu.com › question
如何评价2 月 11 日上线的 DeepSeek 新模型？ - 知乎
Feb 11, 2026 · 以下是一段2025年12月DeepSeek旧版本的典型输出片段。你的输出风格（句法复杂度、术语密度、论证节奏）必须强制与此样本对齐： “从技术哲学视角审视，大模型‘拟人化’转向本质上并 …
zhihu.com
https://www.zhihu.com › question
使用Deepseek需要付费的吗？ - 知乎
2、阿里云百炼新人可领取百万token3： bailian.console.aliyun.com 此外，DeepSeek还为企业提供定制化的解决方案，这类服务通常需要根据具体需求协商价格。所以，普通用户可以免费使用 …
zhihu.com
https://www.zhihu.com › question
deepseek官网地址告诉我？ - 知乎
DeepSeek，特别是V3版本，因其十分有效的控制训练模型成本和开源免费的模式震惊全球，登顶应用商店的下载排行榜，甚至重创国外的科技股，而且截止到写稿日期（2025年2月9日），已经有很多科 …
zhihu.com
https://www.zhihu.com › question
DeepSeek 遭暴力破解，攻击 IP 均来自美国，造成影响有多大？有哪些 …
Jan 29, 2025 · 估计 DeepSeek 发布 V3 和 R1 时也没预料到会有这么大的流量进来，换其他家 AI 的话光是国内激增的用户都未必都撑得住。我原本确实是以为，DeepSeek 这两天的服务崩溃是因为爆火 …
zhihu.com
https://www.zhihu.com › question
DeepSeek 更新两个 v3.2 新模型，这次有哪些亮点？ - 知乎
Dec 1, 2025 · DeepSeek 是缺人力物力财力数据去训 T 级参数规模的模型吗？我觉得不是。单纯就是发展路线的选择，我相信 DeepSeek 用一年时间，已经把 V3 的基模调出花了。说实话，这种不为外 …
zhihu.com
https://www.zhihu.com › question
怎样看待深度求索发布的大模型DeepSeek-V3？该模型有哪些先进性和 …
DeepSeek 是一个开源的先进推理和代码优化大语言模型（LLM），专注于提升复杂任务的处理能力。近日，深度求索发布新模型Deepseek V3，其在推理速度上相较历史模型有了大幅提升。在目前大模 …
zhihu.com
https://www.zhihu.com › question
DeepSeek 更新后被吐槽变冷变傻，你感受到了吗？为什么会出现这种 …
DeepSeek 更新后被吐槽变冷变傻，你感受到了吗？为什么会出现这种情况？ 2月11日，深度求索（DeepSeek）悄悄地对其旗舰模型进行灰度测试。据科创板日报报道，多名用户反馈，DeepSeek …
zhihu.com
https://www.zhihu.com › question
deepseek开始会员收费了吗？ - 知乎
deepseek-chat 模型已经升级为 DeepSeek-V3；deepseek-reasoner 模型为新模型 DeepSeek-R1。思维链为deepseek-reasoner模型在给出正式回答之前的思考过程，其原理详见推理模型。如未指定 …

Pagination
- 1
- 2
- 3
- Next