YC科技资讯网

团团谈美好科技的文章

我的单3090显卡在llama.cpp的256K上下文跑出51 token/s:

我的单3090显卡在llama.cpp的256K上下文跑出51 token/s:

我的单3090显卡在llama.cpp的256K上下文跑出51 token/s:
lm studio的Beta版已经支持MTP加速:
1.相比于llama.cpp

lm studio的Beta版已经支持MTP加速: 1.相比于llama.cpp

lm studio的Beta版已经支持MTP加速: 1.相比于llama.cpp
llama.cpp的MTP方式真的值得部署:
1.我的硬件配置RTX3090 微

llama.cpp的MTP方式真的值得部署: 1.我的硬件配置RTX3090 微

llama.cpp的MTP方式真的值得部署: 1.我的硬件配置RTX3090 微
Openclaw2026.5.18版本:
1.全新能力(Android 语音模式

Openclaw2026.5.18版本: 1.全新能力(Android 语音模式

Openclaw2026.5.18版本: 1.全新能力(Android 语音模式
iPhone 16Pro的电池现状:
1.还有三个月就两年了,电池干到89%了,

iPhone 16Pro的电池现状: 1.还有三个月就两年了,电池干到89%了,

iPhone 16Pro的电池现状: 1.还有三个月就两年了,电池干到89%了,
推荐使用国产大模型而不是受限制的国外模型:
1.其实发现身边很多的公司和程序员都

推荐使用国产大模型而不是受限制的国外模型: 1.其实发现身边很多的公司和程序员都

推荐使用国产大模型而不是受限制的国外模型: 1.其实发现身边很多的公司和程序员都
Deepseek的V4版本写代码有点烧钱:
1.我用opencode 调用Dee

Deepseek的V4版本写代码有点烧钱: 1.我用opencode 调用Dee

Deepseek的V4版本写代码有点烧钱: 1.我用opencode 调用Dee
Qwen3.6-27B:编程能力得到提升

Qwen3.6-27B:编程能力得到提升

Qwen3.6-27B:编程能力得到提升
Qwen3.6-35B-A3B:智能体编程利器深度对比分析

Qwen3.6-35B-A3B:智能体编程利器深度对比分析

Qwen3.6-35B-A3B:智能体编程利器深度对比分析
听说Qwen3.6-35B-A3B有点强:
1.最近qwen3.6系列亮相,只开

听说Qwen3.6-35B-A3B有点强: 1.最近qwen3.6系列亮相,只开

听说Qwen3.6-35B-A3B有点强: 1.最近qwen3.6系列亮相,只开
openclaw小龙虾最近更新很频繁:
1.近两周连续多天快速更新,出现过两次打

openclaw小龙虾最近更新很频繁: 1.近两周连续多天快速更新,出现过两次打

openclaw小龙虾最近更新很频繁: 1.近两周连续多天快速更新,出现过两次打
Minimax-M2.7大模型开源了:
1.这款大模型在国外很火,现在开放本地部

Minimax-M2.7大模型开源了: 1.这款大模型在国外很火,现在开放本地部

Minimax-M2.7大模型开源了: 1.这款大模型在国外很火,现在开放本地部
使用RTX3090的24G显存测试Gemma-4-31B:
1.环境是Windo

使用RTX3090的24G显存测试Gemma-4-31B: 1.环境是Windo

使用RTX3090的24G显存测试Gemma-4-31B: 1.环境是Windo
谷歌正式发布了Gemma 4系列:
1.包含 E2B、E4B、26B-A4B、3

谷歌正式发布了Gemma 4系列: 1.包含 E2B、E4B、26B-A4B、3

谷歌正式发布了Gemma 4系列: 1.包含 E2B、E4B、26B-A4B、3
新技能Claude code+CCSwitch+国产模型:
1.注册Claude

新技能Claude code+CCSwitch+国产模型: 1.注册Claude

新技能Claude code+CCSwitch+国产模型: 1.注册Claude