6 月 19 日消息,在加拿大温哥华昨日举行的全球最大计算机视觉会议 CVPR 2023 上,LG 人工智能研究所公开了该公司首个生成式 AI 商业化服务 Captioning AI,为需要管理大量图片的客户提供了更高效的解决方案。
LG 介绍,Captioning AI 基于零次学习技术,使 AI 可以像人类一样利用其先前积累的经验和知识来解释它第一次看到的物体或场景。平均而言,该服务能在 10 秒内为一张图片生成 5 个完整的描述性句子和 10 个关键词。如果将图片数量扩大到 1 万张,这些工作将在两天内完成,从而在短时间内建立定制化的图片搜索和管理系统。
LG 表示,Captioning AI 是 LG 人工智能研究所与全球最大的图库之一 Shutterstock 深度合作研发,后者在图像标签方面拥有丰富的专业知识。此外,双方还进行了学习数据的过滤和筛选等 AI 伦理验证,以确保版权透明度。
Shutterstock 首席技术官 Sezal Amin 表示:“目前,我们正在通过为全球 10 家客户开展早期访问(Early Access)计划来进一步开发这种服务。这项服务意在帮助人们关注更重要的内容和具有创造性的任务,而不是重复性的机械任务。”
此前报道,韩国政府为进一步加强新兴技术领域发展,本月初已决定加大对人工智能技术研发的投入,投资约 5000 亿韩元(备注:当前约 26.9 亿元人民币)推进韩国 AI 项目发展。