Chaofa Yuan

Chaofa Yuan

没有故事，写点技术，同时打点酱油。

访问博客

从打点酱油到袁朝发（2026-05-月度小结）
2026-06-01
Harness Engineering — Agent 不好用，也许不是模型的问题
2026-03-15
Kimi K2.5 技术解读：原生多模态联合训练与并行 Agent 编排训练
2026-03-01
2025，浪潮与拧巴
2026-02-24
Agent 系统中的 Prompt Caching 设计（下）：上下文管理与子代理架构
2026-02-22
Agent 系统中的 Prompt Caching 设计（上）：Cache 破坏、Prompt 布局与工具管理
2026-02-22
理解 KV Cache 与 Prompt Caching：LLM 推理加速的核心机制
2026-02-21
DPO 算法原理与代码实现：让 LLM 对齐变得简单
2026-01-10
DPO 算法原理与代码实现：让 LLM 对齐变得简单
2026-01-10
从零手写 RoPE 位置编码：原理、PyTorch 源码实现与可视化理解
2026-01-02
从零手写 RoPE 位置编码：原理、PyTorch 源码实现与可视化理解
2026-01-02
Keep Looking, Don't Settle：重听乔布斯演讲（25-11-月度小结）
2025-12-07
Keep Looking, Don't Settle：重听乔布斯演讲（25-11-月度小结）
2025-12-07
Kimi-K2 和 Kimi-K2-Thinking 深度解读：从预训练优化到 Agentic 能力训练的完整流程（含MuonClip优化、Agentic 数据合成等）
2025-11-10
Kimi-K2 和 Kimi-K2-Thinking 深度解读：从预训练优化到 Agentic 能力训练的完整流程（含MuonClip优化、Agentic 数据合成等）
2025-11-10
影视飓风TIM成功背后：一个程序员对自媒体商业化的深度复盘（25年10月月度小结）
2025-11-03
影视飓风TIM成功背后：一个程序员对自媒体商业化的深度复盘（25年10月月度小结）
2025-11-03
2025-09-合法赚钱就是高尚的（月度小结）
2025-10-05
2025-09-合法赚钱就是高尚的（月度小结）
2025-10-05
RAG 进化之路：传统 RAG 到工具与强化学习双轮驱动的 Agentic RAG
2025-10-03
RAG 进化之路：传统 RAG 到工具与强化学习双轮驱动的 Agentic RAG
2025-10-03
2025-08-孙宇晨真的很值得学习（八月小结）
2025-09-11
2025-07-忙碌与充实的七月（月度小结）
2025-08-11
Gemini 2.5 Pro 是怎么炼成的？-- gemini 2.5 技术报告阅读笔记与思考
2025-07-14 读书
2025-06-念头通达
2025-07-06
2025-05-35岁之前赚不到一千万是我的错吗？
2025-06-02
自适应快慢思考推理模型（Adaptive Reasoning Model）：Qwen3混合思考->字节AdaCoT->清华AdaptThinking
2025-05-26
LLM MOE的进化之路，从普通简化 MOE，到 sparse moe，再到 deepseek 使用的 share_expert sparse moe
2025-01-28
LLM activate function激活函数的进化之路，从 ReLU，GELU 到 SwiGLU(swishGLU)
2025-01-28
2024，公开表达元年
2024-12-29
手写大模型组件之Group Query Attention，从 MHA，MQA 到 GQA
2024-12-09
LoRA 原理和 PyTorch 代码实现
2024-11-10
手写 transformer decoder（CausalLM）
2024-08-18
手写 Self-Attention 的四重境界，从 self-attention 到 multi-head self-attention
2024-08-18
2020年过去了，我不怀念它
2021-01-01