【在线回放】NVIDIA GTC 2024 大会 | 如何降低 AI 工程成本?蚂蚁从训练到推理的全栈实践 在 GTC 2024 大会 China AI Day 线上专场的演讲。在演讲中张... 9 月前 0 0 39
使用NVIDIA TensorRT-LLM支持CodeFuse-CodeLlama-34B上的int4量化和推理优化实践 CodeFuse是由蚂蚁集团开发的代码语言大模型,旨在支持整个软件开发生命周期,... 11 月前 0 0 337