【网易科技1月16日报道】今日,MiniMax宣布国内首个MoE大语言模型abab6上线,经过了半个月的内测和部分客户反馈,该模型在MoE结构下,拥有处理复杂任务的能力,并在单位时间内提升了训练效率。 … Continue reading MiniMax 国内首个 MoE 大语言模型上线 拥有处理复杂任务能力
标签: 推理
ASC24超算竞赛挑战大模型推理,大学生直面大模型落地考验
2024 ASC世界大学生超级计算机竞赛(ASC24)已进入预赛阶段,通过预赛选拔的队伍将参加4月9日-13日在上海大学举行的总决赛。来自全球各地的300多支高校队伍正在挑战一道人工智能难题——大语言 … Continue reading ASC24超算竞赛挑战大模型推理,大学生直面大模型落地考验
微软推出 “从错误中学习” 模型训练法,号称可“模仿人类学习过程,改善 AI 推理能力”
11 月 7 日消息,微软亚洲研究院联合北京大学、西安交通大学等高校,提出了一项名为“从错误中学习(Learning from Mistake,LeMA)”的 AI 训练方法,号称可以通过模仿人类学习 … Continue reading 微软推出 “从错误中学习” 模型训练法,号称可“模仿人类学习过程,改善 AI 推理能力”
零犀科技联合集智俱乐部发布子品牌“因果派”
7月3日消息,零犀科技携手集智俱乐部共同发布了聚焦于因果AI“产学研”方向的子品牌“因果派”。双方表示,此次联合共创,将整合双方资源与能力,探索因果科学的产业落地。 零犀科技创始人、CEO夏仲璞表示, … Continue reading 零犀科技联合集智俱乐部发布子品牌“因果派”
李飞飞团队将 ViT 用在机器人身上,规划推理最高提速 512 倍,还 cue 了何恺明的 MAE
人类的预测能力 + ViT,会产生什么样的化学反应?会让机器人的行动规划能力又快又准。 这是李飞飞团队的最新研究 ——MaskViT,通过 MVM,掩码视觉建模对 Transformer 进行预训练, … Continue reading 李飞飞团队将 ViT 用在机器人身上,规划推理最高提速 512 倍,还 cue 了何恺明的 MAE
上海交大发布「人类行为理解引擎」:深度学习 + 符号推理,AI 逐帧理解大片中每个动作
看图看片,对现在的 AI 来说早已不是什么难事。不过让 AI 分析视频中的人类动作时,传统基于目标检测的方法会碰到一个挑战:静态物体的模式与行为动作的模式有很大不同,现有系统效果很不理想。 现在,来自 … Continue reading 上海交大发布「人类行为理解引擎」:深度学习 + 符号推理,AI 逐帧理解大片中每个动作
燧原科技发布全新一代“邃思”云端AI推理芯片,拥有高吞吐、低延时等性能
12月7日消息,今日,燧原科技发布第二代云端人工智能推理加速卡“云燧i20”。据悉,这是时隔仅五个月,继今年7月发布云端人工智能训练加速卡“云燧T20”之后,燧原科技又推出的全新一代针对云端推理场景的 … Continue reading 燧原科技发布全新一代“邃思”云端AI推理芯片,拥有高吞吐、低延时等性能
时代变了!NVIDIA A100 GPU推理性能237倍碾压CPU
MLPerf组织今天发布最新的推理基准测试(Benchmark)MLPerf Inference v0.7结果,总共有23个组织提交了结果,相比上一个版本(MLPerf Inference v0.5) … Continue reading 时代变了!NVIDIA A100 GPU推理性能237倍碾压CPU
GPT家族又壮大了!OpenAI首次推出数学定理推理模型GPT-f
最近,GPT家族又添了一位新成员—GPT-f 提到GPT家族,首先想到了必然是今年大火的GPT-3,这款基于Transformer架构的语言模型,在文本生成方面的能力,已经可以达到以假乱真,欺骗人类的 … Continue reading GPT家族又壮大了!OpenAI首次推出数学定理推理模型GPT-f
阿里与浙大共建认知智能实验室
日前,阿里巴巴与浙江大学宣布成立“认知智能实验室”,并首次公布第二代AI系统认知智能计算平台。该平台包含基础数据层、推理引擎层和用户交互层:基础数据层构建起全球最大的电商知识 … Continue reading 阿里与浙大共建认知智能实验室