推理 – 风君子博客

MiniMax 国内首个 MoE 大语言模型上线拥有处理复杂任务能力

【网易科技1月16日报道】今日，MiniMax宣布国内首个MoE大语言模型abab6上线，经过了半个月的内测和部分客户反馈，该模型在MoE结构下，拥有处理复杂任务的能力，并在单位时间内提升了训练效率。 … Continue reading MiniMax 国内首个 MoE 大语言模型上线拥有处理复杂任务能力

ASC24超算竞赛挑战大模型推理，大学生直面大模型落地考验

2024 ASC世界大学生超级计算机竞赛（ASC24）已进入预赛阶段，通过预赛选拔的队伍将参加4月9日-13日在上海大学举行的总决赛。来自全球各地的300多支高校队伍正在挑战一道人工智能难题——大语言 … Continue reading ASC24超算竞赛挑战大模型推理，大学生直面大模型落地考验

微软推出 “从错误中学习” 模型训练法，号称可“模仿人类学习过程，改善 AI 推理能力”

11 月 7 日消息，微软亚洲研究院联合北京大学、西安交通大学等高校，提出了一项名为“从错误中学习（Learning from Mistake，LeMA）”的 AI 训练方法，号称可以通过模仿人类学习 … Continue reading 微软推出 “从错误中学习” 模型训练法，号称可“模仿人类学习过程，改善 AI 推理能力”

零犀科技联合集智俱乐部发布子品牌“因果派”

7月3日消息，零犀科技携手集智俱乐部共同发布了聚焦于因果AI“产学研”方向的子品牌“因果派”。双方表示，此次联合共创，将整合双方资源与能力，探索因果科学的产业落地。零犀科技创始人、CEO夏仲璞表示， … Continue reading 零犀科技联合集智俱乐部发布子品牌“因果派”

李飞飞团队将 ViT 用在机器人身上，规划推理最高提速 512 倍，还 cue 了何恺明的 MAE

人类的预测能力 + ViT，会产生什么样的化学反应？会让机器人的行动规划能力又快又准。这是李飞飞团队的最新研究 ——MaskViT，通过 MVM，掩码视觉建模对 Transformer 进行预训练， … Continue reading 李飞飞团队将 ViT 用在机器人身上，规划推理最高提速 512 倍，还 cue 了何恺明的 MAE

上海交大发布「人类行为理解引擎」：深度学习 + 符号推理，AI 逐帧理解大片中每个动作

看图看片，对现在的 AI 来说早已不是什么难事。不过让 AI 分析视频中的人类动作时，传统基于目标检测的方法会碰到一个挑战：静态物体的模式与行为动作的模式有很大不同，现有系统效果很不理想。现在，来自 … Continue reading 上海交大发布「人类行为理解引擎」：深度学习 + 符号推理，AI 逐帧理解大片中每个动作

燧原科技发布全新一代“邃思”云端AI推理芯片，拥有高吞吐、低延时等性能

12月7日消息，今日，燧原科技发布第二代云端人工智能推理加速卡“云燧i20”。据悉，这是时隔仅五个月，继今年7月发布云端人工智能训练加速卡“云燧T20”之后，燧原科技又推出的全新一代针对云端推理场景的 … Continue reading 燧原科技发布全新一代“邃思”云端AI推理芯片，拥有高吞吐、低延时等性能

时代变了！NVIDIA A100 GPU推理性能237倍碾压CPU

MLPerf组织今天发布最新的推理基准测试（Benchmark）MLPerf Inference v0.7结果，总共有23个组织提交了结果，相比上一个版本（MLPerf Inference v0.5） … Continue reading 时代变了！NVIDIA A100 GPU推理性能237倍碾压CPU

GPT家族又壮大了！OpenAI首次推出数学定理推理模型GPT-f

最近，GPT家族又添了一位新成员—GPT-f 提到GPT家族，首先想到了必然是今年大火的GPT-3，这款基于Transformer架构的语言模型，在文本生成方面的能力，已经可以达到以假乱真，欺骗人类的 … Continue reading GPT家族又壮大了！OpenAI首次推出数学定理推理模型GPT-f

阿里与浙大共建认知智能实验室

日前，阿里巴巴与浙江大学宣布成立“认知智能实验室”，并首次公布第二代AI系统认知智能计算平台。该平台包含基础数据层、推理引擎层和用户交互层：基础数据层构建起全球最大的电商知识 … Continue reading 阿里与浙大共建认知智能实验室