大模型 – 第 2 页 – 风君子博客

月之暗面 Kimi 联合清华大学等开源大模型推理架构 Mooncake

感谢网友 Skyraver 的线索投递！ 11 月 28 日消息，月之暗面 Kimi 和清华大学 MADSys 实验室 2024 年 6 月联合发布了 Kimi 底层的 Mooncake 推理系统设计 … Continue reading 月之暗面 Kimi 联合清华大学等开源大模型推理架构 Mooncake

11 月 3 日消息，字节跳动豆包大模型团队与香港大学公开联合研究成果 —— HybridFlow。官方宣称，HybridFlow（开源项目名：veRL）是一个灵活且高效的大模型 RL 训练框架，兼 … Continue reading 提升 1.5~20 倍吞吐量，字节豆包大模型团队与香港大学发布并开源全新 RLHF 框架

现在，大模型能生成 RPG 角色扮演游戏了。根据初始用户输入，它能设置游戏模拟环境，并在环境中生成角色动作。来自谷歌，北卡罗来纳大学教堂山分校新研究，他们尝试的第一款游戏叫作 Unbounded，灵 … Continue reading 谷歌出品：大模型生成 RPG 游戏，情节角色全自定义

10 月 23 日消息，中国三星与智谱华章（简称“智谱”）昨日宣布战略合作，双方称将在 AI 手机领域展开深度共创，共同打造卓越体验的 AI 产品。三星电子大中华区用户体验战略副总裁许元默表示：“此 … Continue reading 智谱与中国三星官宣战略合作：AI 手机与 GLM 大模型相结合

风君子博客10月23日消息，OpenAI竞争对手Anthropic宣布推出升级版的Claude 3.5 Sonnet和新款Claude 3.5 Haiku。根据Anthropic介绍，升级版Clau … Continue reading 让AI像人类一样操作电脑！Anthropic上新Claude 3.5 Sonnet模型新能力

风君子博客10月17日消息，16日晚，百度创始人李彦宏在《HBR Live：商业未来》与哈佛商业评论英文版总编辑殷阿笛（Adi Ignatius）进行了对谈。李彦宏谈及AI近期发展趋势、是否存在泡沫、 … Continue reading 李彦宏：过去18个月，大模型领域最大变化是回答的准确性

快科技10月13日消息，近日，苹果公司推出了300亿参数的多模态AI大模型MM1.5，该版本是在前代MM1的架构基础上发展而来的。该模型继续遵循数据驱动的训练原则，着重探究在不同训练周期中混合各类数 … Continue reading 苹果推出300亿参数多模态AI大模型MM1.5：拥有图像识别、自然语言推理能力

感谢网友西窗旧事的线索投递！ 9 月 26 日消息，据澎湃新闻报道，在今天的 2024 年中国国际智能传播论坛上，哔哩哔哩董事长兼 CEO 陈睿表示，B站上线了自研大语言模型 index，并将其应 … Continue reading 陈睿：B站已上线自研大模型 index 并应用于 AI 字幕，具备近 10 种语言实时翻译能力

新浪科技讯 9月24日下午消息，火山引擎总裁谭待正式发布豆包视频生成大模型。其特性包括高效的DiT融合计算单元、全新设计的扩散模型训练方法和深度优化的Transformer结构，可以实现更 … Continue reading 豆包视频生成大模型发布：支持多风格多比例的一致性多镜头生成