内容摘要
大模型缓存命中不是玄学优惠,而是复用已计算过的输入前缀:把稳定上下文放在前面,重复请求就能显著降低成本并提升响应速度。
大模型缓存命中不是玄学优惠,而是复用已计算过的输入前缀:把稳定上下文放在前面,重复请求就能显著降低成本并提升响应速度。
text-to-cad 把 CAD、机器人描述和硬件设计流程包装成 Agent Skills:先写可追溯源码,再导出 STEP/STL/URDF 等工程文件。
HeyGen 开源 Hyperframes,把 HTML/CSS/JS 变成可预览、可渲染、可自动化的视频生成流水线,让 AI 智能体可以写 HTML 导出 MP4。
大模型像大脑,智能体像会做事的人。用通俗语言讲清二者的区别、关系,以及 AI 应用为何正从会回答走向能完成任务。
ByteDance 开源的 UI-TARS Desktop 把视觉语言模型、截图识别和鼠标键盘控制组合成原生桌面 Agent。它不只是“会聊天”的助手,而是开始接管浏览器、VS Code 和本地软件里的真实操作。本文用一篇文章看懂它的定位、能力边界和适合上手的场景。