有 CPU 就能跑大模型,性能甚至超过 NPU / GPU! 没错,为了优化模型端侧部署,微软亚洲研究院提出了一种新技术 —— T-MAC。 ...

关注我们的公众号

微信公众号