感谢网友 Skyraver 的线索投递! 11 月 28 日消息,月之暗面 Kimi 和清华大学 MADSys 实验室 2024 年 6 月联合发布了 Kimi 底层的 Mooncake 推理系统设计 … Continue reading 月之暗面 Kimi 联合清华大学等开源大模型推理架构 Mooncake
标签: 大模型
提升 1.5~20 倍吞吐量,字节豆包大模型团队与香港大学发布并开源全新 RLHF 框架
11 月 3 日消息,字节跳动豆包大模型团队与香港大学公开联合研究成果 —— HybridFlow。 官方宣称,HybridFlow(开源项目名:veRL)是一个灵活且高效的大模型 RL 训练框架,兼 … Continue reading 提升 1.5~20 倍吞吐量,字节豆包大模型团队与香港大学发布并开源全新 RLHF 框架
谷歌出品:大模型生成 RPG 游戏,情节角色全自定义
现在,大模型能生成 RPG 角色扮演游戏了。根据初始用户输入,它能设置游戏模拟环境,并在环境中生成角色动作。 来自谷歌,北卡罗来纳大学教堂山分校新研究,他们尝试的第一款游戏叫作 Unbounded,灵 … Continue reading 谷歌出品:大模型生成 RPG 游戏,情节角色全自定义
智谱与中国三星官宣战略合作:AI 手机与 GLM 大模型相结合
10 月 23 日消息,中国三星与智谱华章(简称“智谱”)昨日宣布战略合作,双方称将在 AI 手机领域展开深度共创,共同打造卓越体验的 AI 产品。 三星电子大中华区用户体验战略副总裁许元默表示:“此 … Continue reading 智谱与中国三星官宣战略合作:AI 手机与 GLM 大模型相结合
让AI像人类一样操作电脑!Anthropic上新Claude 3.5 Sonnet模型新能力
风君子博客10月23日消息,OpenAI竞争对手Anthropic宣布推出升级版的Claude 3.5 Sonnet和新款Claude 3.5 Haiku。 根据Anthropic介绍,升级版Clau … Continue reading 让AI像人类一样操作电脑!Anthropic上新Claude 3.5 Sonnet模型新能力
相关人士回应字节大模型遭实习生攻击:破坏训练属实,损失金额及处理方式被夸大
IT之家 10 月 19 日消息,据“证券时报・e 公司”报道,接近字节跳动的人士今日就“字节大模型遭实习生攻击”一事表示,确有实习生破坏 AI 模型训练,但损失金额和处理方式被夸大。 IT之家附前情 … Continue reading 相关人士回应字节大模型遭实习生攻击:破坏训练属实,损失金额及处理方式被夸大
李彦宏:过去18个月,大模型领域最大变化是回答的准确性
风君子博客10月17日消息,16日晚,百度创始人李彦宏在《HBR Live:商业未来》与哈佛商业评论英文版总编辑殷阿笛(Adi Ignatius)进行了对谈。李彦宏谈及AI近期发展趋势、是否存在泡沫、 … Continue reading 李彦宏:过去18个月,大模型领域最大变化是回答的准确性
苹果推出300亿参数多模态AI大模型MM1.5:拥有图像识别、自然语言推理能力
快科技10月13日消息,近日,苹果公司推出了300亿参数的多模态AI大模型MM1.5,该版本是在前代MM1的架构基础上发展而来的。 该模型继续遵循数据驱动的训练原则,着重探究在不同训练周期中混合各类数 … Continue reading 苹果推出300亿参数多模态AI大模型MM1.5:拥有图像识别、自然语言推理能力
陈睿:B站已上线自研大模型 index 并应用于 AI 字幕,具备近 10 种语言实时翻译能力
感谢网友 西窗旧事 的线索投递! 9 月 26 日消息,据澎湃新闻报道,在今天的 2024 年中国国际智能传播论坛上,哔哩哔哩董事长兼 CEO 陈睿表示,B站上线了自研大语言模型 index,并将其应 … Continue reading 陈睿:B站已上线自研大模型 index 并应用于 AI 字幕,具备近 10 种语言实时翻译能力
豆包视频生成大模型发布:支持多风格多比例的一致性多镜头生成
新浪科技讯 9月24日下午消息,火山引擎总裁谭待正式发布豆包视频生成大模型。其特性包括高效的DiT融合计算单元、全新设计的扩散模型训练方法和深度优化的Transformer结构,可以实现更 … Continue reading 豆包视频生成大模型发布:支持多风格多比例的一致性多镜头生成