首页 > 标签:惊人发现40分钟训练模型仅需8GB显存300B参数规模的GPT核心机密遭微软论文意外曝光