迭代模型

PPO经验碎片

PPO的过程就像所有的强化学习一样，从原始的采样分布出发，不断循环3个步骤：采样...

1 年前 0 0 57

技术贴 | SQL 执行 – 执行器优化

本期技术贴主要介绍查询执行引擎的优化。查询执行引擎负责将 SQL 优化器生成的执...

1 年前 0 0 35

文心一言迭代数据曝光，QPS提升10倍，留给大模型创业玩家的涌现时间不多了

杨净发自凹非寺量子位 | 公众号 QbitAI 文心一言上线内测一个月后，...

2 年前 0 0 98