<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Large_models on Peng Tan's AI Blog</title><link>https://68e49aad.hobbytp-github-io.pages.dev/zh/categories/large_models/</link><description>一个关注 AI 各领域的专题博客</description><atom:link href="https://68e49aad.hobbytp-github-io.pages.dev/zh/categories/large_models/index.xml" rel="self" type="application/rss+xml"/><item><title>DeepSeekMath-V2 技术白皮书：迈向自验证数学推理</title><link>https://68e49aad.hobbytp-github-io.pages.dev/zh/deepseek/deepseekmath_v2/</link><pubDate>Sat, 29 Nov 2025 12:10:00 +0800</pubDate><guid>https://68e49aad.hobbytp-github-io.pages.dev/zh/deepseek/deepseekmath_v2/</guid><description>本文介绍了DeepSeekMath-V2，旨在克服传统上依赖最终答案的数学推理奖励机制的局限性。其核心创新在于通过训练一个专门的证明验证器来评估推导的逻辑严谨性，从而实现自我可验证的数学推理能力。该系统引入了元验证过程，以确保验证器识别的错误是准确的，并利用此验证器作为奖励模型来训练生成器进行自我评估和迭代优化。这种生成与验证的协同作用创建了一个循环，通过扩展计算规模来自动标注难以验证的新证明，从而提高了系统的能力。</description></item><item><title>Gemini Nano Banana Pro：技术奇点、生态重构与行业影响全景解析</title><link>https://68e49aad.hobbytp-github-io.pages.dev/zh/google/gemini_nano_banana_pro/</link><pubDate>Sat, 22 Nov 2025 20:10:00 +0800</pubDate><guid>https://68e49aad.hobbytp-github-io.pages.dev/zh/google/gemini_nano_banana_pro/</guid><description>Google Gemini Nano Banana Pro（Gemini 3 Pro Image）把图像生成从“凭感觉出图”提升为“有推理、有规划的工业级生产工具”：它基于 Gemini 3 的多模态推理和实时搜索能力，在生成前先理解语义与布局、保证细节一致性，同时支持 4K 画质、强文本渲染和多图参考控制，重点服务品牌物料、信息图表、教育与游戏等专业生产场景，并通过云端算力、Workspace/Vertex AI/Adobe 等生态整合与合规水印，把 AI 出图真正变成企业级内容生产基础设施。</description></item><item><title>DeepSeek-OCR：重塑AI长文本处理</title><link>https://68e49aad.hobbytp-github-io.pages.dev/zh/deepseek/deepseek_ocr/</link><pubDate>Tue, 21 Oct 2025 20:10:00 +0800</pubDate><guid>https://68e49aad.hobbytp-github-io.pages.dev/zh/deepseek/deepseek_ocr/</guid><description>本文介绍了DeepSeek-OCR，一种革命性的AI模型，能够将长文本处理效率提升数十倍，从而实现对超长文档的快速处理。</description></item><item><title>Gemini 2.5 Computer Use Model</title><link>https://68e49aad.hobbytp-github-io.pages.dev/zh/google/gemini_computer_use/</link><pubDate>Tue, 07 Oct 2025 00:00:00 +0800</pubDate><guid>https://68e49aad.hobbytp-github-io.pages.dev/zh/google/gemini_computer_use/</guid><description>Gemini 2.5 Computer Use Model 是基于视觉理解的AI代理，通过持续的感知-行动循环实现自动化任务处理。</description></item><item><title>Meta颠覆代码AI：新模型CWM不只“读”代码，更能“执行”它</title><link>https://68e49aad.hobbytp-github-io.pages.dev/zh/meta/cwm_code_world_model/</link><pubDate>Sun, 28 Sep 2025 21:19:00 +0800</pubDate><guid>https://68e49aad.hobbytp-github-io.pages.dev/zh/meta/cwm_code_world_model/</guid><description>Meta发布的一项名为“代码世界模型”（Code World Model, CWM）的全新研究，正试图从根本上解决当前代码AI面临的一大痛点。</description></item><item><title>通义千问（Qwen）系列模型概览</title><link>https://68e49aad.hobbytp-github-io.pages.dev/zh/qwen/qwen_overview/</link><pubDate>Sun, 07 Sep 2025 10:10:00 +0800</pubDate><guid>https://68e49aad.hobbytp-github-io.pages.dev/zh/qwen/qwen_overview/</guid><description>通义千问（Qwen）系列模型概览</description></item><item><title>Google Gemini Nano Banana 图像的创意应用案例</title><link>https://68e49aad.hobbytp-github-io.pages.dev/zh/google/gemini_nano_banana/</link><pubDate>Sat, 06 Sep 2025 22:10:00 +0800</pubDate><guid>https://68e49aad.hobbytp-github-io.pages.dev/zh/google/gemini_nano_banana/</guid><description>本文介绍Google Gemini Nano Banana模型的创意应用案例。</description></item><item><title>FastVLM-WebGPU 技术报告解读</title><link>https://68e49aad.hobbytp-github-io.pages.dev/zh/apple/fastvlm/</link><pubDate>Tue, 02 Sep 2025 20:10:00 +0800</pubDate><guid>https://68e49aad.hobbytp-github-io.pages.dev/zh/apple/fastvlm/</guid><description>本文介绍了苹果公司开源的FastVLM-WebGPU模型，并对其技术原理、主要贡献、论文方法、评估结果和局限性进行了详细解读。</description></item><item><title>Gemini 2.5 Pro 在 IMO 2025 中的高级数学推理能力评估</title><link>https://68e49aad.hobbytp-github-io.pages.dev/zh/imo/imo_2025_gemini_2.5pro/</link><pubDate>Thu, 14 Aug 2025 22:10:00 +0800</pubDate><guid>https://68e49aad.hobbytp-github-io.pages.dev/zh/imo/imo_2025_gemini_2.5pro/</guid><description>Gemini 2.5 Pro 在 IMO 2025 数学奥林匹克竞赛中取得优异成绩，关键在于结合了强大的数学推理能力与自我验证迭代流程，有效避免逻辑错误和表面化思维，实现了接近人类专家的严谨解题表现。</description></item><item><title>AudioLLM - 李沐亲自解说语音大模型训练的底层思路</title><link>https://68e49aad.hobbytp-github-io.pages.dev/zh/large_models/audiollm/</link><pubDate>Tue, 29 Jul 2025 17:10:00 +0800</pubDate><guid>https://68e49aad.hobbytp-github-io.pages.dev/zh/large_models/audiollm/</guid><description>李沐亲自解说语音大模型AudioLLM训练的底层思路</description></item><item><title>Kimi-K2 简介和有意思的用法</title><link>https://68e49aad.hobbytp-github-io.pages.dev/zh/kimi/kimi_k2/</link><pubDate>Sat, 19 Jul 2025 22:10:00 +0800</pubDate><guid>https://68e49aad.hobbytp-github-io.pages.dev/zh/kimi/kimi_k2/</guid><description>本文介绍了MoonshotAI公司Kimi-K2模型简介和相关有意思的用法。</description></item><item><title>ERNIE 4.5 技术报告解读</title><link>https://68e49aad.hobbytp-github-io.pages.dev/zh/baidu/ernie4.5_open_now/</link><pubDate>Mon, 30 Jun 2025 22:10:00 +0800</pubDate><guid>https://68e49aad.hobbytp-github-io.pages.dev/zh/baidu/ernie4.5_open_now/</guid><description>本文介绍了百度开源的ERNIE 4.5模型，并对其技术原理、主要贡献、论文方法、评估结果和局限性进行了详细解读。</description></item><item><title>Qwen3 Tech Report解读</title><link>https://68e49aad.hobbytp-github-io.pages.dev/zh/qwen/qwen3/</link><pubDate>Tue, 13 May 2025 23:03:00 +0800</pubDate><guid>https://68e49aad.hobbytp-github-io.pages.dev/zh/qwen/qwen3/</guid><description>全方位解读Qwen3的论文技术报告</description></item><item><title>Llama 4 模型系列</title><link>https://68e49aad.hobbytp-github-io.pages.dev/zh/llama/llama4/</link><pubDate>Thu, 03 Apr 2025 16:10:00 +0800</pubDate><guid>https://68e49aad.hobbytp-github-io.pages.dev/zh/llama/llama4/</guid><description>本文介绍了Llama 4 模型系列详细解读。</description></item><item><title>QwQ-32B Qwen推理大模型解读</title><link>https://68e49aad.hobbytp-github-io.pages.dev/zh/qwen/qwq32b/</link><pubDate>Thu, 06 Mar 2025 20:21:00 +0800</pubDate><guid>https://68e49aad.hobbytp-github-io.pages.dev/zh/qwen/qwq32b/</guid><description>本文介绍了深度求索（DeepSeek）公司推出的新一代推理模型QwQ-32B，并对其技术原理、主要贡献、论文方法、评估结果和局限性进行了详细解读。</description></item><item><title>DeepSeek FlashMLA 代码解读</title><link>https://68e49aad.hobbytp-github-io.pages.dev/zh/deepseek/deepseek_flashmla/</link><pubDate>Mon, 24 Feb 2025 16:10:00 +0800</pubDate><guid>https://68e49aad.hobbytp-github-io.pages.dev/zh/deepseek/deepseek_flashmla/</guid><description>本文介绍了深度求索（DeepSeek）公司FlashMLA代码详细解读。</description></item><item><title>DeepSeek V3 论文解读</title><link>https://68e49aad.hobbytp-github-io.pages.dev/zh/deepseek/deepseek_v3/</link><pubDate>Fri, 14 Feb 2025 18:10:00 +0800</pubDate><guid>https://68e49aad.hobbytp-github-io.pages.dev/zh/deepseek/deepseek_v3/</guid><description>本文介绍了深度求索（DeepSeek）公司推出的新一代推理模型DeepSeek-V3，并对其技术原理、主要贡献、论文方法、评估结果和局限性进行了详细解读。</description></item><item><title>DeepSeek 微调</title><link>https://68e49aad.hobbytp-github-io.pages.dev/zh/deepseek/deepseek-finetuning/</link><pubDate>Fri, 14 Feb 2025 18:10:00 +0800</pubDate><guid>https://68e49aad.hobbytp-github-io.pages.dev/zh/deepseek/deepseek-finetuning/</guid><description>本文介绍了如何使用合成推理数据集微调DeepSeek-R1模型.</description></item><item><title>DeepSeek R1 论文解读</title><link>https://68e49aad.hobbytp-github-io.pages.dev/zh/deepseek/deepseek_r1/</link><pubDate>Mon, 10 Feb 2025 20:10:00 +0800</pubDate><guid>https://68e49aad.hobbytp-github-io.pages.dev/zh/deepseek/deepseek_r1/</guid><description>本文介绍了深度求索（DeepSeek）公司推出的新一代推理模型DeepSeek-R1，并对其技术原理、主要贡献、论文方法、评估结果和局限性进行了详细解读。</description></item></channel></rss>