2026-01#
应用#
- [2026.01] Terminal-Bench: Benchmarking Agents on Hard, Realistic Tasks in Command Line Interfaces Agent 在命令行环境的 benchmark
文本#
- [2026.01] Stable-DiffCoder: Pushing the Frontier of Code Diffusion Large Language Model 代码扩散模型
- Positive-Unlabeled Learning with Non-Negative Risk Estimator
- A mathematical trivium
- [细读经典]Megatron论文和代码详细分析(2)
- youre-the-os
- Merlin HugeCTR 分级参数服务器简介 参数服务器
- 「2026·AI加速键」重塑未来世界
- 核心:scaling、端到端、可验证的环境
- 趋势:世界模型、具身智能
- Agentic_Design_Patterns
- 特斯拉Grok语音系统拆解
- 一文看懂2025年Agent六大最新趋势|AI专栏 Prompt chaining、Routing、Parallelization、Orchestrator-workers、Evaluator-optimizer