大模型笔记
  • Home

0.inbox

  • [Read]2025 04
  • [Read]2025 09
  • [Read]2026 01
  • [Read]2026 02
  • Alg interview faq

1.[基建]数据

  • Data

3.[基建]效率

  • Env
  • Inference
  • Train

4.[模型]文本

  • CodeLLM
  • Embedding
  • PostTraining
  • PreTraining

5.[模型]多模态

  • MultiModalEmbedding
  • T2V
  • VLA
  • VLM

6.[模型]评测

  • Benchmark
  • LMM Benchmark
  • Metric

7.[应用]产品

  • Agent
  • Context
  • Product
  • VibeCoding
大模型笔记
  • 0.inbox
  • [Read]2026 01

2026-01#

应用#

  • [2026.01] Terminal-Bench: Benchmarking Agents on Hard, Realistic Tasks in Command Line Interfaces Agent 在命令行环境的 benchmark

文本#

  • [2026.01] Stable-DiffCoder: Pushing the Frontier of Code Diffusion Large Language Model 代码扩散模型
  • Positive-Unlabeled Learning with Non-Negative Risk Estimator
    • nnPUlearning
  • A mathematical trivium
  • [细读经典]Megatron论文和代码详细分析(2)
  • youre-the-os
  • Merlin HugeCTR 分级参数服务器简介 参数服务器
  • 「2026·AI加速键」重塑未来世界
    • 核心:scaling、端到端、可验证的环境
    • 趋势:世界模型、具身智能
  • Agentic_Design_Patterns
  • 特斯拉Grok语音系统拆解
  • 一文看懂2025年Agent六大最新趋势|AI专栏 Prompt chaining、Routing、Parallelization、Orchestrator-workers、Evaluator-optimizer
Previous Next

Built with MkDocs using a theme provided by Read the Docs.
« Previous Next »